第五章 大数定律及中心极限定理_第5章中心极限定理
第五章 大数定律及中心极限定理由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“第5章中心极限定理”。
第五章
大数定律及中心极限定理
概率统计是研究随机变量统计规律性的数学学科,而随机现象的规律只有在对大量随机现象的考察中才能显现出来。研究大量随机现象的统计规律,常常采用极限定理的形式去刻画,由此导致对极限定理进行研究。极限定理的内容非常广泛,本章中主要介绍大数定律与中心极限定理。
5.1 切比雪夫Chebyshev不等式
一个随机变量离差平方的数学期望就是它的方差,而方差又是用来描述随机变量取值的分散程度的。下面我们研究随机变量的离差与方差之间的关系式。
定理5-1(切比雪夫不等式)设随机变量X的期望E(X)及方差D(X)存在,则对任意小正数ε>0,有:
或:
[例5-1]设X是抛掷一枚骰子所出现的点数,若给定ε=2,2.5,实际计算P{|X-E(X)|≥ε},并验证切比雪夫不等式成立。
解 X的分布律为
所以
当ε=2时,当ε=2.5时,可见,切比雪夫不等式成立。
[例5-2]设电站供电网有10 000盏灯,夜晚每一盏灯开灯的概率都是0.7,而假定所有电灯开或关是彼此独立的。试用切比雪夫不等式估计夜晚同时开着的灯数在6 800~7 200的概率。
解:设X表示在夜晚同时开着的电灯的数目,它服从参数n=10 000,p=0.7的二项分布。于是有
E(X)=np=10 000×0.7=7 000,D(X)=npq=10 000×0.7×0.3=2100,P{6 800
可见,虽然有10 000盏灯,但是只要有供应7 000盏灯的电力就能够以相当大的概率保证够用。
[例5-3补充] 用切比雪夫不等式估计
解:的三倍的可能性极
可见,随机变量X取值与期望EX的差的绝对值大于其均方差小。
5.2 大数定律
在第一章中曾经提到过,事件发生的频率具有稳定性,即随着试验次数增多,事件发生的频率将逐渐稳定于一个确定的常数值附近。另外,人们在实践中还认识到大量测量值的算术平均值也具有稳定性,即平均结果的稳定性。大数定律以严格的数学形式表示证明了在一定的条件下,大量重复出现的随机现象呈现的统计规律性,即频率的稳定性与平均结果的稳定性。
5.2.1 贝努利大数定律
定理5-2 设m是n次独立重复试验中事件A发生的次数,p是事件A的概率,则对任意正数ε,有
贝努利大数定律说明,在大量试验同一事件A时,事件A的概率是A的频率的稳定值。
5.2.2 独立同分布随机变量序列的切比雪夫大数定律
先介绍独立同分布随机变量序列的概念。
称随机变量序列X1,X2,…Xn,…是相互独立的,若对任意的n>1,X1,X2,…Xn是相互独立的。此时,若所有的Xi又具有相同的分布,则称X1,X2,…Xn,…是独立同分布随机变量序列。
定理5-3 设X1,X2,…Xn,…是独立同分布随机变量序列E(Xi)=μ,D(Xi)=σ2(i=1,2…)均存在,则对于任意ε>0有
这一定理说明:经过算术平均后得到的随机变量在统计上具有一种稳定性,它的取值将比较紧密聚集在它的期望附近。这正是大数定律的含义。在概率论中,大数定律是随机现象的统计稳定性的深刻描述;同时,也是数理统计的重要理论基础。
5.3 中心极限定理
5.3.1独立同分布序列的中心极限定理
定理5-4 设X1,X2,…Xn,…是独立同分布的随机变量序列,且具有相同数学期望和方差E(Xi)=μ,D(Xi)=σ2(i=1,2,…)。记随机变量的分布函数为Fn(x),则对于任意实数x,有
(不证)
其中φ(x)为标准正态分布函数。
由这一定理知道下列结论:
(1)当n充分大时,独立同分布的随机变量之和的分布近似于正态分布N2(nμ,nσ)。我们知道,n个独立同分布的正态随机变量之和服从正态分布。中心极限定理进一步告诉我们。
不论X1,X2,…Xn,…独立同服从什么分布,当n充分大时,其和Zn近似服从正态分布。
(2)考虑X1,X2,…Xn,…的平均值,有
它的标准化随机变量为,即为上述Yn。因此的分布函数即是上述的F(,nx)因而有
由此可见,当n充分大时,独立同分布随机变量的平均值的分布近似于正态分布
[例5-3]对敌人的防御地段进行100次射击,每次射击时命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率。解 设Xi为第i次射击时命中目标的炮弹数(i=1,2,…,100),则中命中目标的炮弹总数,而且X1,X2,…X100同分布且相互独立。
为100次射击
由定理5-4可知,随机变量近似服从标准正态分布,故有
[例5-4]某种电器元件的寿命服从均值为100(单位:小时)的指数分布。现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命的总和大于1 920小时的概率。
解 设第i只电器元件的寿命为Xi=(i=1,2,…16),E(Xi)=100,D(Xi)=1002=10 000,则是这16只元件的寿命的总和。
E(Y)=100×16=1 600,D(Y)= 160 000,则所求概率为:
5.3.2 棣莫弗(De Moivre)-拉普拉斯(Laplace)中心极限定理
下面介绍另一个中心极限定理,它是定理5-4的特殊情况。
定理5-5(棣莫弗-拉普拉斯中心极限定理)设随机变量Zn是n次独立重复试验中事件A发生的次数,p是事件A发生的概率,则对于任意实数x
其中q=1-p,φ(x)为标准正态分布函数。由棣莫弗-拉普拉斯中心极限定理得到下列结论:
(1)在贝努利试验中,若事件A发生的概率为p。又设Zn为n次独立重复试验中事件A发生的频数,则当n充分大时,Zn近似服从正态分布N(np,npq)。
(2)在贝努利试验中,若事件中A发生的概率为p,发生的频率,则当n充分大时,近似服从正态分布
【例5-5】用中心极限定理得到求解5.1例5-2的概率。
解 设同时开着的灯数为X,则
X-B(1000,0.7),np=1000×0.7=7000,为n次独立重复试验中事件A
【例5-6】设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用?
解:把观察每一台分机是否使用外线作为一次试验,则各次试验相互独立,设X为1000台分机中同时使用外线的分机数,则
X~B(1000,0.05),np=1000×0.05=50,根据题意,设N为满足条件的最小正整数
由于φ(-7.255)≈0,故有
查标准正态分布表得φ(1.65)=0.9505,故有
由此
N≥61.37
即该单位总机至少需要62条外线,才能以95%以上的概率保证每台分机在使用外线时不被占用。
小结 本章考核要求
(一)知道切比雪夫不等式
或
并且会用切比雪夫不等式估计事件|X-EX|≥ε或|X-EX|
(二)知道贝努利大数定律
其中n是试验次数,m是A发生次数,p是A的概率,它说明试验次数很多时,频率近似于概率。
(三)知道切比雪夫不等式大数定律
取值稳定在期望附近。
它说明在大量试验中,随机变量
(四)知道独立同分布中心极限定理
若
记Yn~Fn(x),则有
它说明当n很大时,独立同分布的随机变量之和近似服从正态N(nμ,nσ2)所以,无论n个独立同分布的X1,X2,…Xn服从何种分布,n很大时,X1+X2+…Xn却近似正态N(nμ,nσ2).(五)知道棣莫弗—拉普拉斯中心极限定理
若Zn表示n次独立重复事件发生次数,即
Zn~B(n,p),则有
即Zn近似正态N(np,np(1-p)2)。并会用中心极限定理计算简单应用问题。