您的当前位置:首页第四章 几种重要的分布

第四章 几种重要的分布

2020-03-25 来源:乌哈旅游
第四章 几种重要的分布

在这一章,我们要介绍几种重要的分布 首先介绍离散型随机变量的分布

§4.1 常用的离散型随机变量的分布

一、退化分布

在所有分布中,最简单的分布是退化分布,即一个随机变量X以概率1取一常数,即 P(Xa)1

则称X服从a处的退化分布。

EXEaa,DXDa0

二、0-1分布

前面我们学习了贝努力试验。对于贝努力试验,只有两个结果:成功或失败(A和A),如抛一枚银币(正、反);检查一件产品(合格、不合格);一次射击(命中、不命中),都可看做一个贝努力试验。 在一次试验中,设成功的概率为p,P(A)p,P(A)1pq,不同的p表示

(合格品)=0.9,P(不合格品)=0.1。 不同的贝努力试验。如检查一批产品中,P用来描述贝努力试验的随机变量分布为0-1分布,0,1代表将试验的两个结果定义为0,1.即随机变量X只可能取0,1两个值,它的分布律为

P(Xi)pi(1p)1i(i0,1)

P(X0)(1p) P(X1)p

称X服从(0-1)分布。 0 1 X P 1p p EXp DXp(1p)

三、二项分布

由n个相同的独立的贝努力试验组成的随机试验称为n重贝努力试验。如抛硬币3次,检查7个产品,打100次靶等都属于多重贝努力试验。

1.定义:在n重贝努力试验中,每次试验事件A发生的概率都为p(0p1),设

X为n次试验中事件A发生的次数,则X的可能取值为0,1,2,

kkP(Xk)Cnp(1p)nk,k0,1,,n

,n

不难验证(1)P(Xk)0 (2)k0P(Xk)1n

称随机变量X服从参数为n和p的二项分布,记作X~B(n,p)

nk(px+q)展开式中第k1项x的系数。因此我们称该分布为P(Xk)的值恰好是二项式

二项分布。

其中,当n1时,P(Xi)p(1p)(i0,1)称X服从(0-1)两点分布 事件A至多出现m次的概率是

kn-kP{0Xm}=Ck nPqk=0mi1i事件A出现次数不小于不大于 的概率是

kn-kP{lXm}=Ck nPqk=lm例 已知100个产品中有5个次品,现从中有放回地取3次,每次任取1个,求在所取的3个中恰有2个次品的概率.

解: 因为这是有放回地取3次,因此这3 次试验的条件完全相同且独立,它是贝努里试验. 依题意,每次试验取到次品的概率为0.05. 设X为所取的3个中的次品数,则X~B(3,0.05)

22于是,所求概率为:P(X2)C3(0.05)(0.95)0.007125

例:一个袋子中装有N个球,其中N1个白球,N2个黑球(N1N2N),每次从中任取一个球,查看完颜色后再放回去,一共取了n次,求取到白球数X的分布。

解:由于是放回试验,每次取球为1次试验,n次取球可视为n重贝努力试验,每次取到白球的概率为pN1N,故X~B(n,1)分布为 NNNkN1kP(Xk)Cn()(11)nk,k0,1,,n

NN贝努里概型对试验结果没有等可能的要求,但有下述要求:

(1)每次试验条件相同;

(2)每次试验只考虑两个互逆结果A或A,P(A)p,P(A)1pq

(3)各次试验相互独立

简单的说:二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布.

例:某类灯泡使用时数在1000小时以上的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.

解: 设X为三个灯泡在使用1000小时已坏的灯泡数 X~B(3,0.8)

P(Xk)C3k(0.8)k(0.2)3k,

P(X1)P(X0)P(X1)0.104

把观察一个灯泡的使用时数看作一次试验,“使用到1000小时已坏”视为“成功”.每次试验, “成功”的概率为0.8

2.二项分布的期望和方差

nn期望:E(X)k0nkP{Xk}k0nkCnk pk(1-p)

np(n1)!pk-1q(n-1)-(k-1)

(k1)![(n1)(k1)]!n-kkn!kpk(1k!(nk)!0np)n-k k1 k1nnp(n1)!pk-1q(n-1)-(k-1)

(k1)![(n1)(k1)]!(n1)!pk-1q(n-1)-(k-1)

(k1)![(n1)(k1)]!Cnk11pk1(1nnpk1n1npk10p)(n1)(k1)np(pq)n1np.

nn!kn!knkp(1p)pk(1p)nk 方差:E(X)kk!(nk)!k0k1(k1)!(nk)!22n(k11)n!k(k11)n!knkp(1p)p(1p)nk k1(k1)!(nk)!k1(k1)!(nk)!n(k1)n!n!knkp(1p)pk(1p)nk k1(k1)!(nk)!k1(k1)!(nk)!nn!n!knkp(1p)pk(1p)nk k2(k2)!(nk)!k1(k1)!(nk)!n2l0n1nnnn(n1)Cn(n1)Cl02n2ln2pl2(1p)n2lnCnj1pj1(1p)n1j

j0ln2pl2(1p)n2l nCnj1pj1(1p)n1j

j0n1=n(n1)pCl0n2ln2p(1p)ln2lnpCnj1pj(1p)n1jn(n1)p2np

j0n1D()n(n1)p2npn2p2np(1p)

3.二项分布最可能的值

二项分布中X可以取值0,1,2,二项分布的最可能值。

,n。使概率P(Xk)取最大值的k,记作k0,称k0为

P(=k0)P(=k-1)1 (1)0 P(=k)01 (2) P(=k0+1)k0nk00P(=k0)(nk01)PCknPq1 k1k1nk1=1

000P(=k0-1)CnPqk0q(nk01)pk0q npk0ppk0q  k0npp

k0nk00P(=k0)(k01)qCkPq1 kn=1

01k01nk01P(=k0+1)CnPq(n-k0)p(k01)q(n-k0)p  k0npp-1  np+p-1k0npp

npp和np+p-1 当np+p为整数时  k0=np+p 其他而且从二项分布的图形特点也可以看出来:对于固定n及p,当k增加时 ,概率P(X=k) 先

是随之增加直至 达到最大值, 随后单调减少.

例:某批产品中有80%的一等品,对它们进行重复抽样检验,共取出4个样品,求其中一等品数ξ的最可能值,并用贝努里公式验证。 解 X服从二项分布,X~B(4,0.8)

npp3.20.84是整数,所以k04和k03时P(Xk0)为最大。即取出4个样品时,一等品个数最可能是3或4。 用贝努公式计算X的分布律下 X P 0 0.0016 1 0.0256 2 0.1536 3 0.4096 4 0.4096 例:某人进行射击,命中率为0.02,射击400次,至少击中2次的概率。 解:由题意。设击中次数为X, X~B(400,0.02)

kP(Xk)C400(0.02)k(0.98)400k,k0,1,2,,400

1P(X2)1P(X0)P(X1)10.98400C4000.02•0.983990.9972

可以看出计算量非常大。因此必须寻求近似方法。 说明:尽管每一次射击的命中率非常小,但如果射击的次数很大,命中目标的概率就非常大。

四、普哇松分布

在历史上普哇松分布是作为二项分布的近似函数,于1837年有法国数学家普哇松(Poisson)首次提出。 1.定义

如果随机变量X的概率函数为

X~P{Xk}其中

kk!e,k0,1,2,...

0 ,则称X 服从普哇松(Poisson) 分布。

xkxkk=ee=1 利用级数=e,e=ek=0k!k=0k!k=0k!近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一。

在实际中,许多随机现象服从或近似服从普哇松分布。像某电话交换台收到的电话呼叫数;到某机场降落的飞机数;一个售货员接待的顾客数;一台纺纱机的断头数;一匹布上的疵点个数;一本书中的错别字个数等等都可近似服从普哇松分布。由此普哇松分布总与计数过程有关,且在一定时间内,一定区域内或一定单位内的前提下进行的。

普哇松分布的方便之处在于其概率的计算可以利用普哇松分布表。查表练习。

2.普哇松定理:

在n重贝努力试验中,事件A在每次试验中发生的概率为pn(这里与n有关),如果n时,npn(为常数),则对任意的k,有

limb(k;n,pn)nkk!e

定理的条件意味着当 n很大时,npn 必定很小. 因此,泊松定理表明,当 n 很大,p 很小时有以下近似式:Cp(1p)knknkkek! 其中np

在实际中,当n20,p0.05时,该近似公式适用。当n100,np10效果比较好,可通过查表进行计算。

如例题中可用普哇松分布来计算:n400,p0.02,np8

8k8X~P{Xk}e,k0,1,2,... 400

k!P(X0)e8,P(X1)8e8

P(X2)1P(X0)P(X1)0.997(查表计算)

可进行比较,与精确计算很接近,说明近似效果良好。

3.期望和方差的计算 期望E(X)kk!ek0m0ke(k1)!;

k1k1方差:E()2m2mm!emme=2 m1(m1)!D()

例1 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?

解:设该商品每月的销售数为X,已知X服从参数λ=5的泊松分布.

设商店在月底应进某种商品m件,求满足P(Xm)0.95的最小的m。

5k5P(Xm)e0.95

k0k!me55k0.968, 通过查表可得 k!k09e55k0.932 k!k08因此,m9

例:设某城市每年因交通事故死亡的人数服从普哇松分布,据统计在一年中交通事故死亡一人的概率是死亡两人概率的0.5倍,计算一年中因交通事故至少死亡3人的概率。 解:X表示一年中因交通事故死亡的人数。由此X服从参数的普哇松分布

X~P{Xk}kk!e,k0,1,2,...

121e 4 P(X1)P(X2) e222P(X3)1P(X0)P(X1)P(X2)0.323323

五、几何分布

例:某射手连续向一目标射击,直到命中为止,已知他每发命中的概率为p,求所需

射击发数X的概率函数。

解:显然,X的可能取值为1,2,

为计算P(Xk),设Ak第k发命中,k1,2,

P(X1)P(A1)p;P(X2)P(A1A2)p(1p);

P(X3)P(A1A2A3)p(1p)2,

P(Xk)p(1p)k1,k1,2,

这就是所需射击发数X的概率函数。

若随机变量的概率函数如上式,则称X具有几何分布。

1.定义:在独立重复试验中,事件A发生的概率为p,设X为直到A发生为止所进行的试验的次数, (X的可能取值为全体正整),

P(Xk)pqk1p(1p)k1,k1,2,

2.期望和方差

则称X服从参数为p的几何分布.

EXkqk1k1ppkqk1

k123令S1kqk1k112q3q4q qS1qkqk1k1q2q23q34q4

(1q)S11qq211 S12 1qpEX1 p2同理验证 EX2q1qDX 22ppp例:设X服从几何分布,则对任何两个正整数m,n,有

P(XmnXm)P(Xn)

证明:P(Xm)km1qk1qmppqm

1qP(Xmn)qmnP(XmnXm)mqnP(Xn)

P(Xm)q该性质称为几何分布的无记忆性,指几何分布对过去的m次失败的信息在后面的计算

中被遗失了。

六、超几何分布

例1 某班有学生20名,其中有5名女同学,今从班上任选4名学生去参观展览,被选到的女同学数ξ是一个随机变量,求ξ的分布。 解 ξ可以取0,1,2,3,4这5个值,

k4kC5C15P(=k)= (k=0,1,2,3,4) 4C20计算结果列成概率分布表如下: ξ 0 1 p 0.2817 0.4696 2 0.2167 3 0.0310 4 0.0010 例:一个袋子中装有N个球,其中N1个白球,N2个黑球(N1N2N),从中不放回的取了n个球,求取到白球数X的分布。 解:

P(Xk)knkCNCN21CnN,k0,1,,n

1.定义:设N个元素分为两类,有N1个属于第一类,N2个属于第二类(N1N2N)。从中按不重复抽样取n个,令X表示这n个中第一(或二)类元素的个数,则X的分布称为超几何分布。其概率函数是

P(Xk)当nknkCNCN21CnN,k0,1,,n

N1改变很小,这N时 不放回抽样等同于放回抽样,即超几何分布可近似为二项分布。

N(即抽取个数远远小于总数N)每次抽取后,总体中pP(X=k)=nkCkN1CN2CnN1N2knk Ck npq例3 一大批种子的发芽率为90%,今从中任取10粒,求播种后,

(1)恰有8粒发芽的概率;(2)不少于8粒发芽的概率。

解 设10粒种子中发芽的种子数目为X。因10粒种子是由一大批种子中抽取的,这是一个N很大,n相对于N很小的情况下的超几何分布问题,可用二项分布公式近似计算。

X~B(10,0.9)

8(1) P(X=8)=C100.980.120.1937

89(2) P(X8)=C100.980.12C100.990.110.9100.9298

2.期望和方差

E=n

N1NNN-n D=n12 NNNN-1§4.1 常用的连续型随机变量的分布

一、均匀分布

例:某办事员处理一份护照申请书,时间X(单位:分)是一连续型随机变量,若X的概率密度有如下形式:

c,4x6 f(x)0,其他这表明,办一份护照申请书的时间至少4分钟,至多6分钟,c为待定常数。 解:由f(x)为X的概率密度,则有 (1)f(x)0 即c0 (2)

f(x)dx1 即cdx1 c1

246见图形:

f(x0.5 0 4 6 x

现求4-4.5,5-5.5间处理一份护照申请书的概率,即为图中这两个区间的面积

11P(4X4.5)0.50.25 P(5X5.5)0.50.25

22由此,可知这两个概率相等。

从图中可看出,底边相等的矩形面积,即X在两个相等区间上取值机会也相同,即体现了均匀的含义,且称这样的分布为均匀分布。

1.定义:一个随机变量X,如果其概率密度函数为

1,axb,称X服从a,b上的均匀分布,记为X~U(a,b) f(x)ba0,其他服从均匀分布的X,具有一种等可能性,即它落入a,b中任意等长度的子区间的可能性相同,或者说它落入等长度区间内的概率相同,与区间位置无关。 即P(cXcl)clcf(x)dxclc1l dxbaba0,xaxa分布函数:F(x),axb

ba1,xb2.期望和方差

ab(ba)2EX,DX (学生练习证明)

2123.应用和计算

均匀分布的应用如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差; 公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.

例1 某公共汽车站从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30, 7:45 等时刻有汽车到达此站,如果乘客到达此站时间 X 是7:00 到 7:30 之间的均匀随机变量, 试求他候车时间少于5 分钟的概率。 解:以7:00为起点0,以分为单位 依题意, X ~ U ( 0, 30 )

1,0x30 f(x)30其它0,从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30等时刻有汽车到达汽车站,为使

候车时间X少于 5 分钟,乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30 之间到达车站。所求概率为:

P{10X15}P{25X30}151030111dxdx2530303

即乘客候车时间少于5 分钟的概率是1/3。

二、指数分布 1.定义

若随机变量X的概率密度为

exf(x)0x0,其中0,则称X服从参数为的指数分布. x0易知

+-f(x)dx=+0exdx=exd(x)=ex0+0=1

它的分布函数为

0 当x0时 F(x)=P(Xx)=x1e 当x0时对任何实数a,b (0≤aP(a2.期望和方差

xE(X)xe0dxxde0xxex0exdx01

3.应用

指数分布常用来作为各种“寿命”分布的近似。如随机服务系统中的服务时间,某些消耗性产品(电子元件等)的寿命等等,都常被假定服从指数分布。

假若产品的失效率为λ,则产品在t( t>0) 时间失效的分布函数:

F(t)=P(Xt)=1et

而产品的可靠度为:R(t)=P(X>t)=1F(t)=e1t

例: 某元件寿命X服从参数为( =1000)的指数分布。3个这样的元件使用1000小时后,都没有损坏的概率是多少? 解:参数为的指数分布的分布函数为

x1000F(x)=P(Xx)=1e

P(X>1000)=1P(X1000)=1F(1000)=e1

各元件寿命相互独立,因此3个这样的元件使用1000小时都未损坏的概率为

[P(X1000)]3=[e1]3=e30.05

例 .电子元件的寿命ξ(年)服从参数为3的指数分布 (1)求该电子元件寿命超过2年的概率。

(2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少?

3e3x解:(x)0x0 x0,3x(1)p{X2}3edxe3xd(3x)e3x22+2=e6,.

p{X3.5,X1.5}(2)p{X3.5|X1.5}p{X1.5}3.53e3e3xdxe6 dx3x1.5由这个例子,可以看出P(XatXa)P(Xt)这表明,已知寿命长于a年,则再活t年的概率与年龄无关,故又可将指数分布称为“永远年青”的分布。 实际应用与保险中。

三、正态分布

正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。它是由十九世纪前叶数学家高斯加以推广,所以也称为高斯分布。 许多事件问题中的变量,如年降雨量,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;某地区成年男子的身高、体重;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.即具有“中间大、两头小”的特点。 (一)正态分布的定义及图形特点

1.定义:如果连续型随机变量X的概率密度为

(x)1e22

(x)222,x

其中和都是常数,任意,>0,则称X服从参数为 和2的正态分布。 记作X~N(,)

2(x)所确定的曲线叫作正态曲线.

1可以证明 e2(x)222dx1,

t22证明思路:做变量替换tt22u22x 即证Iedt2 先证I2edtedu--e-(t2u2)/2dtdu2

转化为极坐标:

r2trcos2 Ide2rdr2 00ursin22.图形特点:

正态分布的密度曲线是一条关于对称的钟形曲线,特点是“两头小,中间大,左右对称”。 1)对任意的h,P(hX)P(Xh)

2)当x时,(x)取最大值 ()1 23)x距越远,f(x)值越小,这表明,对同样的长度区间,当区间离越远,x落在该区间上的概率越小

4)决定了图形的中心位置,决定了图形中峰的陡峭程度。 越大,曲线越平坦, 越小,曲线越陡峻,。

3.分布函数

设X~N(,),它的分布函数为:

2(x)12xe(t)222dt,x

4.期望和方差

EX,DX2

(二)标准正态分布

0,1的正态分布称为标准正态分布.

其密度函数和分布函数常用0(x)和0(x)表示

1x210(x)e,x 0(x)22记作X~N(0,1)

2xedt

t22标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。

它的依据是下面的定理:

(x)(x)

(x)(x) 1 2

 O x x O  12图2.7 正态分布曲线(12,12)

书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表.

0(1)0.8413,0(1.64)0.9495,0(0)0.5

表中给出x0的概率值,当x0,该如何查表? 由图形可知,0(x)10(x)

0(1)10(1)10.84130.1587

例1:设X~N(0,1),求(1)P(X1.96),P(X-1.96),P(X1.96),P(-1X2)

(2)已知P(Xa)0.7019,P(Xb)0.9242,P(Xc)0.2981,求a,b,c

解:(1)P(X1.96)0(1.96)0.975

P(X1.96)0(1.96)10(1.96)10.9750.025

P(X1.96)P(1.96X1.96)0(1.96)0(1.96)20(1.96)10.95

P(1X2)0(2)0(1)0(2)0(1)10.8185

(2)查表得 0(a)0.7019,a0.53

P(Xb)P(bXb)0(b)0(b)20(b)10.9242

0(b)0.9621,b1.78

0(c)10(c)0.2981,0(c)0.7019c0.53

总结:若X~N(0,1)P(aXb)0(b)0(a)

P(Xb)P(bXb)20(b)1

(三)一般正态分布与标准正态分布的关系 定理 如果~N(,) ,~N(0,1)

其概率密度分别记为(x)及0(x),分布函数分别记为(x)及0(x)

22(1) (x)=10x-x- (2) (x)= 0 证明:(1) (x)1e2(x)222=11e21x22=10x-  (x)10x- x(2) (x)P(x)=1-1e2(t)222dt令y=t-x- -1e2y22dy

= 0(x-)  (x)0(2x-)

~N(0,1)

定理 :设X~N(,),则Y称随机变量函数Y=X(X-) 为标准化变换。

根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题. 证:

FY(x)=P(Yx)=P(X-x)=P(Xx)=(x)

=0(x-)=0(x)  Y~N(0,12)

例:X~N(8 , 0.5),求P(X821)及P(X10)

解:

X~N(8 , 0.52) X8~N(0 , 12) 0.5P(X8X81)=P0.52=20(2)1=20.97725-1=0.9545 X8P(X10)=P0.52108=0(4)=0.999 968 33 0.5例:~N(,),P(5)=0.045,P(3)=0.618,求及。 解:P(-5)=0(-5)=0.045 0(-5-)=0(-5)=1-0(5)=0.045

得 0(53)=1-0.045=0.955 P(3)=0=0.618

5=1.7=0.8 3=4=0.3

总结:若X~N(,),Y2X~N(0,1) )0(bP(aXb)P(aYb)0(a)

(四)3准则

由标准正态分布的查表计算可以求得

当X~N(0,1) P(X1)20(1)10.6826

P(X2)20(2)10.9544,P(X3)20(3)10.9974

这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%. 将上述结论推广到一般的正态分布,Y~N(,)时

2P(|Y|)0.6826 P(|Y|2)0.9544 P(|Y|3)0.9974

可以认为,Y 的取值几乎全部集中[3,3]区间内,这在统计学上称为3准则 例:公共汽车车门的高度是按男子与车门顶头碰头机会在0.01以下来设计的.设男子 身高X~N(170,6),问车门高度应如何确定? 解: 设车门高度为h cm,按设计要求

2

P(Xh)0.01 或P(Xh)0.99

下面我们来求满足上式的最小的h. 因为X~N(170,6),

2X170~N(0,1) 6P(Xh)0(所以

h170)0.99,查表得0(2.33)0.99010.99 6h1702.33,即h1702.336184 6设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01。

例:某重点大学招收研究生800人,按考试成绩从高分至低分依次录取。

设报考该大学的考生共3000人,且考试成绩服从正态分布,已知这些考生中成绩在600分以上的有200人,重点线(500分)以下的2075人,问该大学的实录线(即录取最低分)是多少?

分析 设学生考试成绩 X~N(,2) ,首先应求出及2之值,然后根据录取人数占总人数的比例,再应用正态分布概率公式算出实录最低分。

解 设学生成绩X~N(,2),由题设知应有

200P(X600)0.06673000 2075P(X500)0.69173000从而得1(即(600)0.0667,(以及(500500)0.6917 )0.6917

600)0.93336001.5450查表得 解之得 

1005000.5故知,X~N(450,1002)

又设该大学实录线为a,由题设知:

800a450P(Xa)0.2667即1()0.2667

3000100a450于是可得()0.7333

100a4500.623,解之得a512.3. 查表得

100即是说该大学的实录线约为512分。

如果二维随机变量(X,Y)的联合密度函数为

p(x,y)1212(x1)2(x1)(y2)(y2)21exp{[2]},x,y22222(1)1112222则称(X,Y)服从二维正态分布,记为(X,Y)~N(1,2,1,2,).其中五个参数的取值范

围分别是:1,2;1,20;11.

22以后将指出:1,2分别是X与Y的均值,1,2分别是X与Y的方差,是X与

Y的相关系数。

因篇幅问题不能全部显示,请点此查看更多更全内容