在这一章,我们要介绍几种重要的分布 首先介绍离散型随机变量的分布
§4.1 常用的离散型随机变量的分布
一、退化分布
在所有分布中,最简单的分布是退化分布,即一个随机变量X以概率1取一常数,即 P(Xa)1
则称X服从a处的退化分布。
EXEaa,DXDa0
二、0-1分布
前面我们学习了贝努力试验。对于贝努力试验,只有两个结果:成功或失败(A和A),如抛一枚银币(正、反);检查一件产品(合格、不合格);一次射击(命中、不命中),都可看做一个贝努力试验。 在一次试验中,设成功的概率为p,P(A)p,P(A)1pq,不同的p表示
(合格品)=0.9,P(不合格品)=0.1。 不同的贝努力试验。如检查一批产品中,P用来描述贝努力试验的随机变量分布为0-1分布,0,1代表将试验的两个结果定义为0,1.即随机变量X只可能取0,1两个值,它的分布律为
P(Xi)pi(1p)1i(i0,1)
P(X0)(1p) P(X1)p
称X服从(0-1)分布。 0 1 X P 1p p EXp DXp(1p)
三、二项分布
由n个相同的独立的贝努力试验组成的随机试验称为n重贝努力试验。如抛硬币3次,检查7个产品,打100次靶等都属于多重贝努力试验。
1.定义:在n重贝努力试验中,每次试验事件A发生的概率都为p(0p1),设
X为n次试验中事件A发生的次数,则X的可能取值为0,1,2,
kkP(Xk)Cnp(1p)nk,k0,1,,n
,n
不难验证(1)P(Xk)0 (2)k0P(Xk)1n
称随机变量X服从参数为n和p的二项分布,记作X~B(n,p)
nk(px+q)展开式中第k1项x的系数。因此我们称该分布为P(Xk)的值恰好是二项式
二项分布。
其中,当n1时,P(Xi)p(1p)(i0,1)称X服从(0-1)两点分布 事件A至多出现m次的概率是
kn-kP{0Xm}=Ck nPqk=0mi1i事件A出现次数不小于不大于 的概率是
kn-kP{lXm}=Ck nPqk=lm例 已知100个产品中有5个次品,现从中有放回地取3次,每次任取1个,求在所取的3个中恰有2个次品的概率.
解: 因为这是有放回地取3次,因此这3 次试验的条件完全相同且独立,它是贝努里试验. 依题意,每次试验取到次品的概率为0.05. 设X为所取的3个中的次品数,则X~B(3,0.05)
22于是,所求概率为:P(X2)C3(0.05)(0.95)0.007125
例:一个袋子中装有N个球,其中N1个白球,N2个黑球(N1N2N),每次从中任取一个球,查看完颜色后再放回去,一共取了n次,求取到白球数X的分布。
解:由于是放回试验,每次取球为1次试验,n次取球可视为n重贝努力试验,每次取到白球的概率为pN1N,故X~B(n,1)分布为 NNNkN1kP(Xk)Cn()(11)nk,k0,1,,n
NN贝努里概型对试验结果没有等可能的要求,但有下述要求:
(1)每次试验条件相同;
(2)每次试验只考虑两个互逆结果A或A,P(A)p,P(A)1pq
(3)各次试验相互独立
简单的说:二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布.
例:某类灯泡使用时数在1000小时以上的概率是0.2,求三个灯泡在使用1000 小时以后最多只有一个坏了的概率.
解: 设X为三个灯泡在使用1000小时已坏的灯泡数 X~B(3,0.8)
P(Xk)C3k(0.8)k(0.2)3k,
P(X1)P(X0)P(X1)0.104
把观察一个灯泡的使用时数看作一次试验,“使用到1000小时已坏”视为“成功”.每次试验, “成功”的概率为0.8
2.二项分布的期望和方差
nn期望:E(X)k0nkP{Xk}k0nkCnk pk(1-p)
np(n1)!pk-1q(n-1)-(k-1)
(k1)![(n1)(k1)]!n-kkn!kpk(1k!(nk)!0np)n-k k1 k1nnp(n1)!pk-1q(n-1)-(k-1)
(k1)![(n1)(k1)]!(n1)!pk-1q(n-1)-(k-1)
(k1)![(n1)(k1)]!Cnk11pk1(1nnpk1n1npk10p)(n1)(k1)np(pq)n1np.
nn!kn!knkp(1p)pk(1p)nk 方差:E(X)kk!(nk)!k0k1(k1)!(nk)!22n(k11)n!k(k11)n!knkp(1p)p(1p)nk k1(k1)!(nk)!k1(k1)!(nk)!n(k1)n!n!knkp(1p)pk(1p)nk k1(k1)!(nk)!k1(k1)!(nk)!nn!n!knkp(1p)pk(1p)nk k2(k2)!(nk)!k1(k1)!(nk)!n2l0n1nnnn(n1)Cn(n1)Cl02n2ln2pl2(1p)n2lnCnj1pj1(1p)n1j
j0ln2pl2(1p)n2l nCnj1pj1(1p)n1j
j0n1=n(n1)pCl0n2ln2p(1p)ln2lnpCnj1pj(1p)n1jn(n1)p2np
j0n1D()n(n1)p2npn2p2np(1p)
3.二项分布最可能的值
二项分布中X可以取值0,1,2,二项分布的最可能值。
,n。使概率P(Xk)取最大值的k,记作k0,称k0为
P(=k0)P(=k-1)1 (1)0 P(=k)01 (2) P(=k0+1)k0nk00P(=k0)(nk01)PCknPq1 k1k1nk1=1
000P(=k0-1)CnPqk0q(nk01)pk0q npk0ppk0q k0npp
k0nk00P(=k0)(k01)qCkPq1 kn=1
01k01nk01P(=k0+1)CnPq(n-k0)p(k01)q(n-k0)p k0npp-1 np+p-1k0npp
npp和np+p-1 当np+p为整数时 k0=np+p 其他而且从二项分布的图形特点也可以看出来:对于固定n及p,当k增加时 ,概率P(X=k) 先
是随之增加直至 达到最大值, 随后单调减少.
例:某批产品中有80%的一等品,对它们进行重复抽样检验,共取出4个样品,求其中一等品数ξ的最可能值,并用贝努里公式验证。 解 X服从二项分布,X~B(4,0.8)
npp3.20.84是整数,所以k04和k03时P(Xk0)为最大。即取出4个样品时,一等品个数最可能是3或4。 用贝努公式计算X的分布律下 X P 0 0.0016 1 0.0256 2 0.1536 3 0.4096 4 0.4096 例:某人进行射击,命中率为0.02,射击400次,至少击中2次的概率。 解:由题意。设击中次数为X, X~B(400,0.02)
kP(Xk)C400(0.02)k(0.98)400k,k0,1,2,,400
1P(X2)1P(X0)P(X1)10.98400C4000.02•0.983990.9972
可以看出计算量非常大。因此必须寻求近似方法。 说明:尽管每一次射击的命中率非常小,但如果射击的次数很大,命中目标的概率就非常大。
四、普哇松分布
在历史上普哇松分布是作为二项分布的近似函数,于1837年有法国数学家普哇松(Poisson)首次提出。 1.定义
如果随机变量X的概率函数为
X~P{Xk}其中
kk!e,k0,1,2,...
0 ,则称X 服从普哇松(Poisson) 分布。
xkxkk=ee=1 利用级数=e,e=ek=0k!k=0k!k=0k!近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一。
在实际中,许多随机现象服从或近似服从普哇松分布。像某电话交换台收到的电话呼叫数;到某机场降落的飞机数;一个售货员接待的顾客数;一台纺纱机的断头数;一匹布上的疵点个数;一本书中的错别字个数等等都可近似服从普哇松分布。由此普哇松分布总与计数过程有关,且在一定时间内,一定区域内或一定单位内的前提下进行的。
普哇松分布的方便之处在于其概率的计算可以利用普哇松分布表。查表练习。
2.普哇松定理:
在n重贝努力试验中,事件A在每次试验中发生的概率为pn(这里与n有关),如果n时,npn(为常数),则对任意的k,有
limb(k;n,pn)nkk!e
定理的条件意味着当 n很大时,npn 必定很小. 因此,泊松定理表明,当 n 很大,p 很小时有以下近似式:Cp(1p)knknkkek! 其中np
在实际中,当n20,p0.05时,该近似公式适用。当n100,np10效果比较好,可通过查表进行计算。
如例题中可用普哇松分布来计算:n400,p0.02,np8
8k8X~P{Xk}e,k0,1,2,... 400
k!P(X0)e8,P(X1)8e8
P(X2)1P(X0)P(X1)0.997(查表计算)
可进行比较,与精确计算很接近,说明近似效果良好。
3.期望和方差的计算 期望E(X)kk!ek0m0ke(k1)!;
k1k1方差:E()2m2mm!emme=2 m1(m1)!D()
例1 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?
解:设该商品每月的销售数为X,已知X服从参数λ=5的泊松分布.
设商店在月底应进某种商品m件,求满足P(Xm)0.95的最小的m。
5k5P(Xm)e0.95
k0k!me55k0.968, 通过查表可得 k!k09e55k0.932 k!k08因此,m9
例:设某城市每年因交通事故死亡的人数服从普哇松分布,据统计在一年中交通事故死亡一人的概率是死亡两人概率的0.5倍,计算一年中因交通事故至少死亡3人的概率。 解:X表示一年中因交通事故死亡的人数。由此X服从参数的普哇松分布
X~P{Xk}kk!e,k0,1,2,...
121e 4 P(X1)P(X2) e222P(X3)1P(X0)P(X1)P(X2)0.323323
五、几何分布
例:某射手连续向一目标射击,直到命中为止,已知他每发命中的概率为p,求所需
射击发数X的概率函数。
解:显然,X的可能取值为1,2,
为计算P(Xk),设Ak第k发命中,k1,2,
P(X1)P(A1)p;P(X2)P(A1A2)p(1p);
P(X3)P(A1A2A3)p(1p)2,
P(Xk)p(1p)k1,k1,2,
这就是所需射击发数X的概率函数。
若随机变量的概率函数如上式,则称X具有几何分布。
1.定义:在独立重复试验中,事件A发生的概率为p,设X为直到A发生为止所进行的试验的次数, (X的可能取值为全体正整),
P(Xk)pqk1p(1p)k1,k1,2,
2.期望和方差
则称X服从参数为p的几何分布.
EXkqk1k1ppkqk1
k123令S1kqk1k112q3q4q qS1qkqk1k1q2q23q34q4
(1q)S11qq211 S12 1qpEX1 p2同理验证 EX2q1qDX 22ppp例:设X服从几何分布,则对任何两个正整数m,n,有
P(XmnXm)P(Xn)
证明:P(Xm)km1qk1qmppqm
1qP(Xmn)qmnP(XmnXm)mqnP(Xn)
P(Xm)q该性质称为几何分布的无记忆性,指几何分布对过去的m次失败的信息在后面的计算
中被遗失了。
六、超几何分布
例1 某班有学生20名,其中有5名女同学,今从班上任选4名学生去参观展览,被选到的女同学数ξ是一个随机变量,求ξ的分布。 解 ξ可以取0,1,2,3,4这5个值,
k4kC5C15P(=k)= (k=0,1,2,3,4) 4C20计算结果列成概率分布表如下: ξ 0 1 p 0.2817 0.4696 2 0.2167 3 0.0310 4 0.0010 例:一个袋子中装有N个球,其中N1个白球,N2个黑球(N1N2N),从中不放回的取了n个球,求取到白球数X的分布。 解:
P(Xk)knkCNCN21CnN,k0,1,,n
1.定义:设N个元素分为两类,有N1个属于第一类,N2个属于第二类(N1N2N)。从中按不重复抽样取n个,令X表示这n个中第一(或二)类元素的个数,则X的分布称为超几何分布。其概率函数是
P(Xk)当nknkCNCN21CnN,k0,1,,n
N1改变很小,这N时 不放回抽样等同于放回抽样,即超几何分布可近似为二项分布。
N(即抽取个数远远小于总数N)每次抽取后,总体中pP(X=k)=nkCkN1CN2CnN1N2knk Ck npq例3 一大批种子的发芽率为90%,今从中任取10粒,求播种后,
(1)恰有8粒发芽的概率;(2)不少于8粒发芽的概率。
解 设10粒种子中发芽的种子数目为X。因10粒种子是由一大批种子中抽取的,这是一个N很大,n相对于N很小的情况下的超几何分布问题,可用二项分布公式近似计算。
X~B(10,0.9)
8(1) P(X=8)=C100.980.120.1937
89(2) P(X8)=C100.980.12C100.990.110.9100.9298
2.期望和方差
E=n
N1NNN-n D=n12 NNNN-1§4.1 常用的连续型随机变量的分布
一、均匀分布
例:某办事员处理一份护照申请书,时间X(单位:分)是一连续型随机变量,若X的概率密度有如下形式:
c,4x6 f(x)0,其他这表明,办一份护照申请书的时间至少4分钟,至多6分钟,c为待定常数。 解:由f(x)为X的概率密度,则有 (1)f(x)0 即c0 (2)
f(x)dx1 即cdx1 c1
246见图形:
f(x0.5 0 4 6 x
现求4-4.5,5-5.5间处理一份护照申请书的概率,即为图中这两个区间的面积
11P(4X4.5)0.50.25 P(5X5.5)0.50.25
22由此,可知这两个概率相等。
从图中可看出,底边相等的矩形面积,即X在两个相等区间上取值机会也相同,即体现了均匀的含义,且称这样的分布为均匀分布。
1.定义:一个随机变量X,如果其概率密度函数为
1,axb,称X服从a,b上的均匀分布,记为X~U(a,b) f(x)ba0,其他服从均匀分布的X,具有一种等可能性,即它落入a,b中任意等长度的子区间的可能性相同,或者说它落入等长度区间内的概率相同,与区间位置无关。 即P(cXcl)clcf(x)dxclc1l dxbaba0,xaxa分布函数:F(x),axb
ba1,xb2.期望和方差
ab(ba)2EX,DX (学生练习证明)
2123.应用和计算
均匀分布的应用如在数值计算中,由于四舍五 入,小数点后某一位小数引入的误差; 公交线路上两辆公共汽车前后通过某汽车停车站的时间,即乘客的候车时间等.
例1 某公共汽车站从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30, 7:45 等时刻有汽车到达此站,如果乘客到达此站时间 X 是7:00 到 7:30 之间的均匀随机变量, 试求他候车时间少于5 分钟的概率。 解:以7:00为起点0,以分为单位 依题意, X ~ U ( 0, 30 )
1,0x30 f(x)30其它0,从上午7时起,每15分钟来一班车,即 7:00,7:15,7:30等时刻有汽车到达汽车站,为使
候车时间X少于 5 分钟,乘客必须在 7:10 到 7:15 之间,或在7:25 到 7:30 之间到达车站。所求概率为:
P{10X15}P{25X30}151030111dxdx2530303
即乘客候车时间少于5 分钟的概率是1/3。
二、指数分布 1.定义
若随机变量X的概率密度为
exf(x)0x0,其中0,则称X服从参数为的指数分布. x0易知
+-f(x)dx=+0exdx=exd(x)=ex0+0=1
它的分布函数为
0 当x0时 F(x)=P(Xx)=x1e 当x0时对任何实数a,b (0≤aP(a xE(X)xe0dxxde0xxex0exdx01 3.应用 指数分布常用来作为各种“寿命”分布的近似。如随机服务系统中的服务时间,某些消耗性产品(电子元件等)的寿命等等,都常被假定服从指数分布。 假若产品的失效率为λ,则产品在t( t>0) 时间失效的分布函数: F(t)=P(Xt)=1et 而产品的可靠度为:R(t)=P(X>t)=1F(t)=e1t 例: 某元件寿命X服从参数为( =1000)的指数分布。3个这样的元件使用1000小时后,都没有损坏的概率是多少? 解:参数为的指数分布的分布函数为 x1000F(x)=P(Xx)=1e P(X>1000)=1P(X1000)=1F(1000)=e1 各元件寿命相互独立,因此3个这样的元件使用1000小时都未损坏的概率为 [P(X1000)]3=[e1]3=e30.05 例 .电子元件的寿命ξ(年)服从参数为3的指数分布 (1)求该电子元件寿命超过2年的概率。 (2)已知该电子元件已使用了1.5年,求它还能使用两年的概率为多少? 3e3x解:(x)0x0 x0,3x(1)p{X2}3edxe3xd(3x)e3x22+2=e6,. p{X3.5,X1.5}(2)p{X3.5|X1.5}p{X1.5}3.53e3e3xdxe6 dx3x1.5由这个例子,可以看出P(XatXa)P(Xt)这表明,已知寿命长于a年,则再活t年的概率与年龄无关,故又可将指数分布称为“永远年青”的分布。 实际应用与保险中。 三、正态分布 正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,故它在概率统计中占有特别重要的地位。它是由十九世纪前叶数学家高斯加以推广,所以也称为高斯分布。 许多事件问题中的变量,如年降雨量,在正常条件下各种产品的质量指标,如零件的尺寸;纤维的强度和张力;某地区成年男子的身高、体重;农作物的产量,小麦的穗长、株高;测量误差,射击目标的水平或垂直偏差;信号噪声等等,都服从或近似服从正态分布.即具有“中间大、两头小”的特点。 (一)正态分布的定义及图形特点 1.定义:如果连续型随机变量X的概率密度为 (x)1e22 (x)222,x 其中和都是常数,任意,>0,则称X服从参数为 和2的正态分布。 记作X~N(,) 2(x)所确定的曲线叫作正态曲线. 1可以证明 e2(x)222dx1, t22证明思路:做变量替换tt22u22x 即证Iedt2 先证I2edtedu--e-(t2u2)/2dtdu2 转化为极坐标: r2trcos2 Ide2rdr2 00ursin22.图形特点: 正态分布的密度曲线是一条关于对称的钟形曲线,特点是“两头小,中间大,左右对称”。 1)对任意的h,P(hX)P(Xh) 2)当x时,(x)取最大值 ()1 23)x距越远,f(x)值越小,这表明,对同样的长度区间,当区间离越远,x落在该区间上的概率越小 4)决定了图形的中心位置,决定了图形中峰的陡峭程度。 越大,曲线越平坦, 越小,曲线越陡峻,。 3.分布函数 设X~N(,),它的分布函数为: 2(x)12xe(t)222dt,x 4.期望和方差 EX,DX2 (二)标准正态分布 0,1的正态分布称为标准正态分布. 其密度函数和分布函数常用0(x)和0(x)表示 1x210(x)e,x 0(x)22记作X~N(0,1) 2xedt t22标准正态分布的重要性在于,任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。 它的依据是下面的定理: (x)(x) (x)(x) 1 2 O x x O 12图2.7 正态分布曲线(12,12) 书末附有标准正态分布函数数值表,有了它,可以解决一般正态分布的概率计算查表. 0(1)0.8413,0(1.64)0.9495,0(0)0.5 表中给出x0的概率值,当x0,该如何查表? 由图形可知,0(x)10(x) 0(1)10(1)10.84130.1587 例1:设X~N(0,1),求(1)P(X1.96),P(X-1.96),P(X1.96),P(-1X2) (2)已知P(Xa)0.7019,P(Xb)0.9242,P(Xc)0.2981,求a,b,c 解:(1)P(X1.96)0(1.96)0.975 P(X1.96)0(1.96)10(1.96)10.9750.025 P(X1.96)P(1.96X1.96)0(1.96)0(1.96)20(1.96)10.95 P(1X2)0(2)0(1)0(2)0(1)10.8185 (2)查表得 0(a)0.7019,a0.53 P(Xb)P(bXb)0(b)0(b)20(b)10.9242 0(b)0.9621,b1.78 0(c)10(c)0.2981,0(c)0.7019c0.53 总结:若X~N(0,1)P(aXb)0(b)0(a) P(Xb)P(bXb)20(b)1 (三)一般正态分布与标准正态分布的关系 定理 如果~N(,) ,~N(0,1) 其概率密度分别记为(x)及0(x),分布函数分别记为(x)及0(x) 22(1) (x)=10x-x- (2) (x)= 0 证明:(1) (x)1e2(x)222=11e21x22=10x- (x)10x- x(2) (x)P(x)=1-1e2(t)222dt令y=t-x- -1e2y22dy = 0(x-) (x)0(2x-) ~N(0,1) 定理 :设X~N(,),则Y称随机变量函数Y=X(X-) 为标准化变换。 根据定理1,只要将标准正态分布的分布函数制成表,就可以解决一般正态分布的概率计算问题. 证: FY(x)=P(Yx)=P(X-x)=P(Xx)=(x) =0(x-)=0(x) Y~N(0,12) 例:X~N(8 , 0.5),求P(X821)及P(X10) 解: X~N(8 , 0.52) X8~N(0 , 12) 0.5P(X8X81)=P0.52=20(2)1=20.97725-1=0.9545 X8P(X10)=P0.52108=0(4)=0.999 968 33 0.5例:~N(,),P(5)=0.045,P(3)=0.618,求及。 解:P(-5)=0(-5)=0.045 0(-5-)=0(-5)=1-0(5)=0.045 得 0(53)=1-0.045=0.955 P(3)=0=0.618 5=1.7=0.8 3=4=0.3 总结:若X~N(,),Y2X~N(0,1) )0(bP(aXb)P(aYb)0(a) (四)3准则 由标准正态分布的查表计算可以求得 当X~N(0,1) P(X1)20(1)10.6826 P(X2)20(2)10.9544,P(X3)20(3)10.9974 这说明,X的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%. 将上述结论推广到一般的正态分布,Y~N(,)时 2P(|Y|)0.6826 P(|Y|2)0.9544 P(|Y|3)0.9974 可以认为,Y 的取值几乎全部集中[3,3]区间内,这在统计学上称为3准则 例:公共汽车车门的高度是按男子与车门顶头碰头机会在0.01以下来设计的.设男子 身高X~N(170,6),问车门高度应如何确定? 解: 设车门高度为h cm,按设计要求 2 P(Xh)0.01 或P(Xh)0.99 下面我们来求满足上式的最小的h. 因为X~N(170,6), 2X170~N(0,1) 6P(Xh)0(所以 h170)0.99,查表得0(2.33)0.99010.99 6h1702.33,即h1702.336184 6设计车门高度为184厘米时,可使男子与车门碰头机会不超过0.01。 例:某重点大学招收研究生800人,按考试成绩从高分至低分依次录取。 设报考该大学的考生共3000人,且考试成绩服从正态分布,已知这些考生中成绩在600分以上的有200人,重点线(500分)以下的2075人,问该大学的实录线(即录取最低分)是多少? 分析 设学生考试成绩 X~N(,2) ,首先应求出及2之值,然后根据录取人数占总人数的比例,再应用正态分布概率公式算出实录最低分。 解 设学生成绩X~N(,2),由题设知应有 200P(X600)0.06673000 2075P(X500)0.69173000从而得1(即(600)0.0667,(以及(500500)0.6917 )0.6917 600)0.93336001.5450查表得 解之得 1005000.5故知,X~N(450,1002) 又设该大学实录线为a,由题设知: 800a450P(Xa)0.2667即1()0.2667 3000100a450于是可得()0.7333 100a4500.623,解之得a512.3. 查表得 100即是说该大学的实录线约为512分。 如果二维随机变量(X,Y)的联合密度函数为 p(x,y)1212(x1)2(x1)(y2)(y2)21exp{[2]},x,y22222(1)1112222则称(X,Y)服从二维正态分布,记为(X,Y)~N(1,2,1,2,).其中五个参数的取值范 围分别是:1,2;1,20;11. 22以后将指出:1,2分别是X与Y的均值,1,2分别是X与Y的方差,是X与 Y的相关系数。 因篇幅问题不能全部显示,请点此查看更多更全内容