第五章大数定理与中心极限定理_第5章中心极限定理
第五章大数定理与中心极限定理由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“第5章中心极限定理”。
第五章 大数定律与中心极限定理
§1大数定律
概率论中用来阐明大量随机变量现象平均结果的稳定性的一系列定理统称大数定律。大数定律是一种表现必然性与偶然性之间的辨证关系的规律。由于大数定理的作用,大量的随机因素的总合作用必然导致某种不依赖个别随机事件的结果。
为了证明一系列关于大数定律的定理,我们首先介绍切贝谢夫不等式。
一、切贝谢夫不等式
设随机变量X的数学期望为E(X)及方差D(X),若对于任意的正数,有下列不等式成立:即 PXE(X)D(X)
2,或PXE(X)1D(X)2。
证设X是连续随机变量,其密度函数为f(x),则由P(XE(X))f(x)dx
XE(X)(xE(x))2XE(x)2f(x)dx12(XE(X))f(x)dx
2=D(X)
2,所以有PXE(X)D(X)2。由对立事件,PXE(X)1D(X)
2。
切贝谢夫不等式的作用就在于在不知道分布,而仅知道期望和方差的情况下,可以估计随机变量的概率。
例在每次试验中,事件A发生的概率为0.5。利用切贝谢夫不等式估计:在1000次试验中的事件。
因为和式中的每一项都是非负数,所以如果扩大求和范围至随机变量X一切可能值xi,则只能增大和式的值。因此A发生的次数在450至550次之间的概率。
解 设X表示在1000次试验中事件A发生的次数,则X~B(1000,0.5)的二项分布,且有E(X)np500,D(X)npq250,P450X550=PX500501250
5020.9450X550450500X500550500X50050,所以有P450X5500.9。
特别是当3,则有PXE(x)30.8887,若知道X~N(,2)的正态分布,则有PXE(x)30.9974。
二切贝谢夫大数定理
设Xn为独立随机变量序列,具有有限的期望为EXi,(i1,2,,n)
及方差DXi2,(i1,2,,n)若对于任意的 正数,恒有
1limP
nn
n
i1
Xi
n
n
i1
1E(Xi)1。或limP
nn
n
i1
Xi
n
n
i1
E(Xi)0
.证因为E(11n
n
i1n
Xi)
1n
n
EXi
i1
,D(n
Xi)n
i1
1n
n
DXi
i1
n。
对随机变量
Xi应用切贝谢夫不等式得 n
i1
n
1
P
n
i1
Xi
1n
n
EXi
i1
1
2n。
当n时,得到
1
limP
nn
1
limP
nn
n
i1n
Xi
1n1
n
i1n
EX
i
1。但概率不能大于一,所以我们有
1。
XinEXi
i1
i1
切贝谢夫定理的意义可以作如下解释: 独立随机变量X1,X2,,Xn的算术平均值X
1n
n
i1
Xi,当n时,与其真值是相同的。
推论设独立随机变量X1,X2,,Xn服从同一分布,并且有数学期望a及方差2,则
X1,X2,,Xn的算术平均值,当n
时,按概率收敛于数学期望a,即对于任何正数,恒有
1
limP
nn
n
i1
Xia1。(5.4)
三、贝努里大数定律
在n次独立试验中,事件A发生的频数为nA,P(A)p,P(A)q,0p
1nAlimPp当试验次数无限增大时(n),频率按概率收敛于它的概率。即n1。n
n
证设在第i次试验中事件A发生的次数Xi(i1,2,,n,)。由贝努里试验知,X
1n
i1,2,,n。EA
nn
n
Xi,i1
EXip,DX
i
pq,EXi
i1
n
n
pnp,i1
1n
又 DA
2nn
n
i1
pq
p(1p)
n
nn
2Pp1
所以有 由切贝谢夫不等式,则有A
limPp1。这就在理论上证明了频率收敛于概率,也就是我们在第一章中用频率nn
n
来代替概率计算的理论根据。
§2中心极限定理
概率论中有关论证明随机变量和的极限分布是正态分布的一系列定理,叫做中心极限定理。
一、独立同分布中心极限定理
设X1,X2,,Xn,是独立同分布的随机变量,具有有限的期望EXi,及方差D(Xi)
2n
n
n
i1,2,,n。设随机变量 n
nn
n
i
1Xi,则有En
i1
n,Dn
i1
n。
设n,En0,Dn1。
若对任意的实数x,有limPnx
n
12
x
e
t
dt,当n时,有nN(0,1)标准正态分布。
二、棣莫佛-拉普拉斯中心极限定理
设随机变量n(n1,2,)服从参数为n,p(0p1)的二项分布,对任意的区间(a,b),恒有limPan
nnp
npq
n
b
12
a
b
e
t
dt(b)(a)。
证:设n
i
11,第i次A发生
Xi,而Xi
0,第i次A不发生,EXip,DX
i
pq,i1,2,,n
将随机变量n(n1,2,)标准化,Yn
nnp
xlimP
nnpq
x
t
nnpnpq,则由独立同分布中心极限定理,有
e
dt(x),t
nnp
b若对任意的区间(a,b)有limPa
nnpq
12
ae
b
dt。
更一般地Px1Xx2P
x1np
npq
Xnpnpq
x2npx1npx2np
()(),
npqnpqnpq
称这个公式为棣莫佛-拉普拉斯中心极限定理。
例 某运输公司有500辆汽车参加保险,在一年内汽车出事故的概率为0.006,参加保险的汽车每年交800元的保险费,若出事故最多可得保险费50000元,求在一年内保险公司赚钱不小于20000元的概率。
解 设X表示500辆汽车中出事故的车辆数,则X~B(500,0.006)的二项分布,而
np5000.0063,npq30.9942.98
2,保险公司赚钱不小于20000元的事件
X4,即求P(0X4),12.982
32.982)
500
80050080050000X20000
03
2.982
X32.982
事件0
因此P(0X4)P
43
(2.982)(=(0.579)(1.737)0.7190.959110.7781.所以保险公司赚钱不小于20000元的概率为0.7781。
例假设生产线上组装每件成品的时间服从指数分布,统计资料表明该生产线每件成品的组装时间平均为10分钟,各件产品的组装时间相互独立。
(1)试求组装100件成品需要15至20小时的概率;
(2)以95% 的概率在16小时之内最多可以组装多少成品?
解设Xi(i1,2,,100)是第i件成品的组装时间,由条件知:X1,,X100服从独立指数分布,且EXi10(分钟),DXi102
(1)由于n100充分大,根据中心极限定理定理,100件成品的组装时间Xi近似服从
i1
正态分布N(10010,100102),因此,有
Xi1200P1
P900
i1
Xi1001010
i1
2
(2)(1)0.9772(10.8413)0.818
5其中 9001560,12002060,(x)是N(0,1)分布函数。
(2)16小时即960分钟,要求确定n,使
n
PXi9600.95
i1
n
由于当n充分大时,Xi近似服从正态分布N(10n,102n),可见
i1
NxI10n
96010n96010ni1
0.95P
n10n10n
另一方面,查表可求(1.645)0.95于是,有
96010n10
n
1.645(*)
由此,得方程
100n219470.6025n96020
其解为n181.18,n2113.53,其中n2不满足(*),为增根。于是,在16个小时之内以概率 0.95最多组装81或82件产品。
习题
五、2;4;6;9;13;15。