中心极限定理_极限中心定理发展
中心极限定理由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“极限中心定理发展”。
第五章
中心极限定理
教学要求
1.掌握切比雪夫不等式.
2.了解切比雪夫、伯努里、辛钦大数定律成立的条件及结论理解其直观意义.
3.掌握棣莫弗—拉普拉斯中心极限定理和列维—林德伯格叫心极限定理(独立同分布中心极限定理)的结论和应用条件,并会用相关定理近似计算有关随机事件的概率. 本章重点:运用中心极限定理近似计算有关随机事件的概率 教学手段:讲练结合 课时分配:4课时
本课程一开始引入事件与概率的概念时,我们就知道就一次试验而言,一个随机事件可以出现也可不出现,但作大量的重复试验则呈现出明显的规律性——统计规律性。即,任一事件出现的频率是稳定于某一固定数的,这固定数就是该事件在一次试验下发生的概率,这里说的“频率稳定于概率”实质上是频率依某种收敛意义趋于概率,“大数定律”就是解释这一问题的。
另外在前一章介绍正态分布时,我们一再强调正态分布在概率统计中的重要地位和作用,为什么实际上有许多随机现象会遵循正态分布?这仅仅是一些人的经验猜测还是确有理论依据,“中心极限定理”正是讨论这一问题的。
§5.1随机变量序列的两种收敛性
假设1(),2(),,n(),是定义在同一概率空间(,F, P)上的一列随机变量,显然,其中每个r.v,k()可以看成是定义在概率空间上的一个有限可测函数,因此,我们可以象在实变函数论中对可测函数列定义收敛性一样,给出随机变量列{k()}的收敛性概念。
以下我们讨论时,总假定r.v列{n}和r.v.都是定义在同一概率空间(,F,P)上的,对于某样本点0,显然{n(0)}可视为一普通实数列,(0)则可看作一实数,此时若有limn(0)(0),则称随机变量列{n}在点0收敛到。若对任意n,均有
limn()(),则称{n}在上点点收敛到。但在本章的讨论中,我们没有必n要对{n}要求这么高,一般是考虑下面给出的收敛形式。
定义5.1 设有一列随机变量,1,2,,如对任意的>0,有
limP{:n()()}0
(5.1)
n则称{n}依概率收敛到,并记作
P
(5.2)
limn
nP或
n ,
(5.3)(5.1)式也等价于limP{n}}0
n
从定义可见,依概率收敛就是实函中的依测度收敛。
P
我们知道,随机变量的统计规律由它的分布函数完全刻划,当n时,其相应的分布函数Fn(x)与F(x)之间的关系怎样呢?
例5.1 设n(n1)及都服从退化分布:
1P{n}1,n1,2, nP{0}11对任给>0,当n>时,有P{n}P{n}0
P所以
n,(n)
10n 而n的d.f为
Fn(x)
1x1n0x0
的d.f为
F(x)
x01易验证 当x0时,有Fn(x)→F(x)(n→)
x但x0时,Fn(0)1不趋于F(0)0
上例表明,一个随机变量依概论收敛到某随机变量,相应的分布函数不是在每一点都收敛,但如果仔细观察这个例,发现不收敛的点正是F(x)的不连续点,类似的例子可以举出很多,使人想到要求Fn(x)在每一点都收敛到F(x)是太苛刻了,可以去掉F(x)的不连续点来考虑。
定义5.2设{Fn(x)}为一分布函数序列,如存在一个函数F(x),使在F(x)的每一连续点x,都有limFn(x)F(x)
n则称分布函数列{Fn(x)}弱收敛于F(x),并
W记作Fn(x) F(x)
n
(5.4)定义5.3
设r.v.n(n1)和的分布函数分别为Fn(x),F(x),若
WLFn(x)F(x)n,则称n按分布收敛于,并记作 n(n)PL定理5.1 若n,则n 证
对于xR,任取xx,因有
(x)(nx,x)(nx,x)(nx)(nx,x)故
P(x)P(nx)P(nx,x)
即 F(x)Fn(x)P(nxx)
P因
n,故P(nxx)0
Fn(x)所以有 F(x)limn同理可证,对xx
有F(x)limFn(x)
n于是对任意
xxx有F(x)limFn(x)limFnF(x)
nn令xx,xx,有F(x0)limFn(x)limFnF(x0)
nn若x是F(x)的连续点,就有limFn(x)F(x)。
证毕。此定理的逆不真。
n例5.2 抛掷一枚均匀硬币,记1=“出现正面”,2=“出现反面”
1则P(1)P(2)
211令
n()
n=1,2,……
022
1()
10因Fn(x)与F(x)完全相同,显然有Fn(x)→F(x)对xR1成立。但 P{n12}P(n0,1)P(n1,1)
11111
=。
对n1成立
22222P∴
n不成立。
一般来说,按分布收敛不能推出依概率收敛,但在特殊情况下,却有下面的结果。
PL定理5.2
设C是一常数,P(C)1,则nn,CnC)(即n,PL证()由定理4.1推得()(不妨就设C)对任给0,有
P{nC}P(nC)P(nC)1Fn(C)Fn(C0)
(5.5)因
C的分布函数为
0xCW只在xc处不连续,而c处都是连续的,由Fn(x)F(x)
F(x)
1xC令n得
limP(nc)1100
n本章将要向大家介绍的大数定律实际上就是随机变量列依概率收敛于常数的问题,由定理5.2知,它可归结为相应的分布函数列弱收敛于一退化分布,而中心极限定理就是随机变量的分布函数列弱收敛问题,可见分布函数列的弱收敛在本章讨论中占重要地位。然而,要直接判断一个分布函数列是否弱收敛是很困难的上一章我们就知道,分布函数与特征函数一一对应,而特征函数较之分布函数性质优良很多,故判断特征函数的收敛一般较易,那么是否有
WFnxF(x)相应的n(t)(t)答案是肯定的。
定理5.3 分布函数列{Fn(x)}弱收敛于分布函数F(x)的充要条件是相应的特征函数列{n(t)}收敛于F(x)的特征函数(t)
例5.4 若~P()证明 limP(1x)2ext22dt
随机变量到依pr收敛具有如下性质。
PP定理5.4(斯鲁茨基)若na,nb
Pab 则有
(1)nnaP
(2)b0时,n nbP书P220习题4.8 n,f(x)为连续函数
P则有
f(n) f()
(5.6)
§5.2 大数定律
本章一开始我们就指出大数定律是从讨论“频率稳定于概率”这件事引入的,概率的发展史上,这件事又是从贝努里试验这个概型入手的。
设事件A在一次试验中发生的概率为P,将试验独立重复地进行n次,如果其中事
件A发生的次数为n,则n就是这n次试验中事件A发生的频率。所谓频率n稳定
nn到概率P,是指当n增大时,n依某种收敛意义向P逼近。很容易验证,这里的收敛
n意义不是普通的收敛。
limnP
(5.7)nn事实上,(4.1)意味着,对任给0,能找到N,当nN时,有
nn我们知道,在n重贝努里试验中,不管n多大,{A出现n次}这一结果都是可能发生的,当这个结果发生时,nn,即
P
(5.8)
nnP1P,因此,对于01P,不管N取多
大,也不能保证nN时(4.1)′成立。但可以想见,当n很大时,nP不发
nPP。这生的可能性很小了,比如Pn1Pn0(n)。于是猜想可能有nnn个猜想是正确的,其证明暂放后一步。现不妨先承认有事实
nPP
(5.9)n1,第k次试验A发生若令k
k1,2,则(5.8)意味着
0,第k次试验A不发生1n1nPE(k)knk1nk1上式反映出大量随机现象的平均结果具有的一种稳定性,我们称之为大数定律。定义5.3设k为一随机变量序列,它们具有有限的数学期望Ek,k1,2。
1nPP0)令nk,若n,则称随机序列k服从大En(或(nEn)nk1数定律。
下面的定理给出随机序列服从大数律的一个充分条件。定理5.5(契贝晓夫大数定律)设k是一列两两不相关的随机变量序列,其中每一随机变量都有有限的数学期望和方差,且方差有公共上界:DkC,(C为常数);K1,2,则k服从大数定律。
证明:只须证,对任给0,均有
1n1n P{kEk}0
(0)
(5.10)nk1nk1由契贝晓夫不等式
1nD(k)1n1nCnk10PkEk0 22nk1nnk1(n)下面我们来证明(5.9)式
定理5.6(贝努里大数定律)设n是n重贝努重试验中事件A出现的次数,每次试PP。验都有P(A)P,则nn1[证明]照(5.3)定义随机序列k,则EkP,DkP(1P),k1,2,
4由定理5.2知,k服从大数律,因此从大数律的一个充分条件是
D(k)k12nk1nkPEkk1nnnn上面所述的两个大数定律,后一个是前一个的特款,从定理5.5的证明看出,k服,这就是nPP,n(5.11)所示的条件常称为马尔可夫条件,由此得如下的马尔可夫大数定律)若随机变量序列k满足(5.11)所示的马尔可夫条件,则它服从大数定律。0(n)
(5.11)证:对任给0,由契贝晓夫不等式,有
D(k)nn11k10PkEk再由(4.4)立得结论。22nnnk1k1我们注意到,马尔可夫大数律并没有附加k相互独立的条件。另方面,显然定理5.2又是它的特款。因此,上面所述的三个大数定律,马尔可夫大数律才是最基本的,当然,它的条件也是充分而非必要的。
我们还注意到上面的三个大数定律,其证明都要依靠契贝晓夫不等式,所以要求随
n机变量的方差存在。但进一步的研究表明,方差存在这个条件并不一定必要。比如在独立同分布的场合,就可去掉这个条件。著名的俄国数学家XИНЧИН证明了这点。
定理5.7(辛钦大数定律)设k为相互独立,同分布的随机序列,具有有限的数学期望Eka(a为常数),则k服从大数定律。
证:因1,2,同分布,故有相同的特征函数(t),又Eka(0)i,将(t)在t=0处展开,有
(t)(0)(0)t0(t)1iat0(t)
1n由1,2,相互独立,得nk的特征函数为
nk1tttgn(t)[()]n[1ia0()]n
nnnttL对于任意tR1,limgn(t)lim[1ia0()]neiat,由定理4.6知na,再由定nnnnP理5.5得nk服从大数定理。a,即贝努里大数定律显然是辛钦大数定律的特款。
例5.5 设k为独立同分布随机变量序列,存在Ena,Dn2,令
1n1n2nk, Sn(kn)2
nk1nk1P2证明
Sn2
2证:i·d 则 {nki·}亦i·i·d
1n2P由辛钦大数律 n(2a2)a,knk1PP由(5.9),(n)2a2
1n2P由斯鲁茨基定理 Sk(n)22
(5.12)
nk1
2n§5.3 中心极限定理
大数定律仅仅从定性的角度解决了频率量地估计用频率
nP稳定于概率p,即np,为了定nnn估计概率P(A)(记为p)的误差,历史上DeMoivre、Laplace等数学家n经过许多努力,证明了n的标准化随机变量渐近于N(0,1)分布:
定理5.8(德莫佛—拉普拉斯)在n重贝努里试验中,事件A在每次试验中出现的概率为p(0p1),n为n次试验中A出现的次数,则对任意xR1,一致地有,limP{nnnpnpqx}12xet22dt
(5.13)
本定理的原始证明较复杂,但它是下面要证明的定理5.9的特例,现在来看定理5.8的重要意义。定理5.8在实际的数值计算中有重要作用主要表现在(1)较为精确地估计出用频率估计概率的误差。当n充分大时
P{2(nnP}P{npnnpqnpqn} pqn)(5.13)pq由上式,.,n中已知其二,可求另一
(2)较好地解决了二项分布的近似近计算。
当~B(n,p)而n较大时,无论p是否接近0或1,均由(4.10)得
xnpnpx2npx2npx1np P{x1x2}P{1}()()
(5.14)npqnpqnpqnpqnpq另方面,定理5.8在理论研究上也有很大价值,这里仅指出这样一个事实
nnpnnp(这时称(0,1)依分布收敛于标准正态变量渐近于正态分布Nnpqnpq第k试验A出现,1,若令
k
k1,2
0,第k次试验A不出现则上面的事实等价于k有渐近正态分布,这一重要发现具有普遍意义。
k1n前面我们介绍正态分布时曾说过,已发现许多随机现象,比如测量误差,射击偏差等都可用正态分布来描述。经过长期观察、总结、发现那些服从正态分布的随机现象往往是由许多彼此无关,谁也不起突出作用,只均匀地起微小作用的随机因素共同作用而产生。换句话说,这类随机现象往往可视为独立(或弱相依)随机变量之和k,在k1n什么条件下有渐近正态分布的问题,在长达两个世纪的时间内成为概率论讨论的中心课题,为使问题规范化,数学家们将问题归结为讨论规范和。
.k1nkE(k)k1nn有渐近分布N(0,1)的条件。
D(k)k1
并称有此结论的随机序列k服从中心极限定理。
下面是勒维(Levy)和林德贝尔格(Lindeberg)的成果
定理5.9 若1,2,是一列独立同分布的随机变量,且Eka,Dk2(20), 则有
limP{k1nnknax}(x)
(5.15)
n对一切实数x成立 证: 略
在定理5.8中,由于n可看作独立同贝努里分布的一列随机变量的部分和,因此定理5.8是定理5.9的特例。在处理近似计算时,定理5.9较之定理5.8有更广泛的应用。在实际应用中,只要n较大,便可把独立同分布的随机变量之和近似当作正态变量。这种处理方法对于解决大子样问题非常方便。常用的近似计算式为:
x2naxnaxna })(1)(5.16)(2nnnnnk1例5.6 某单位有260架电话分机,每个分机有4%的时间要用外线通话,可以认为各个电话分机用不用外线是相互独立的,问总机要备多少条外线才能以95%的把握保证各个分机在需用外线时不必等候。
例5.7(近似数定点运算的误差分析)数值计算时,任何数x都只能用一定数位的有限小数y来近似,这就产生了一个误差xy,在下面讨论中,我们假定参加运算的数都用十进制定点表示,每个数都用四舍五入的方法取到小数点后五位,这时相应的P{x1kx2}P{k1nx1na(nka)四舍五入误差可以看作是[0.5105,0.5105]上的均匀分布。
如果要求n个数xi(i1,2,,n)的和S,在数值计算中就只能求出相应的有限位小数,y2(i1,2,,n)的和T,并用T作S的近似值,现在问,这样做造成的误差ST是多少?
因为
Sxi(yii)yii
i1i1i1i1nnnn故
i.i1n传统的估计方法是,根据i0.5105 得 in0.5105
i1n以n10000为例,所得误差估计为0.05
今用(5.16)估计。
如果假定舍入误差i是相互独立的,这里。
aEi0,Di有
n0.51053
P{iKn}(k)(k)
i1若取k3,则上面的概率约为0.997,即能以99.7%的概率断言
3这只及传统估计上限的60分之一。31000.51050.866105