中心极限定理

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA

10,000 次抛掷硬币实验中出现正面的平均比率,每次抽樣(实验)的樣本數為 200(抛掷 200 次硬币)

中心极限定理(英语:central limit theorem,簡作 CLT)是概率论中的一组定理。在概率论中,中心极限定理 (CLT) 確定的为,在许多情况下,对于独立并同样分布的随机变量,即使原始变量本身不是正态分布,标准化样本均值的抽样分布也趋向于标准正态分布。这组定理是数理统计学误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。

历史

Tijms (2004, p.169) 写到: Template:Cquote

棣莫佛-拉普拉斯定理

用正态分布逼近二项分布

棣莫佛-拉普拉斯定理(De Moivre–Laplace theorem)是中央极限定理的最初版本,讨论了服从二项分布的随机变量序列。它指出,参数为n, p的二项分布以np为均值、np(1-p) 为方差的正态分布为极限。

内容

XB(n,p)n伯努利实验中事件 A 出现的次数,每次試驗成功的機率為 p,且 q=1p,则对任意有限区间 [a,b]

xkknpnpq,當n

(i) P(X=k)1npq12πe12xk2

(ii) P(aXnpnpqb)abφ(x)dx,其中φ(x)=12πex22(<x<).

在高尔顿板问题上的应用

高尔顿绘制的高尔顿板模型,其中的小球显出钟形曲线。

棣莫弗-拉普拉斯定理指出二项分布的极限为正态分布。高尔顿板可以看作是伯努利试验的实验模型。如果我们把小球碰到钉子看作一次实验,而把从右边落下算是成功,从左边落下看作失败,就有了一次p=12的伯努利试验。小球从顶端到底层共需要经过n排钉子,这就相当于一个n次伯努利试验。小球的高度曲线也就可以看作二项分布随机变量的概率密度函数。因此,中央极限定理解释了高尔顿板小球累积高度曲线为什么是正态分布独有的钟形曲线。

林德伯格-莱维定理

中央极限定理的动态展示,独立同分布随机变量之和趋近正态分布。

Template:En-link-莱维(Lindeberg-Levy)定理,是棣莫佛-拉普拉斯定理的扩展,讨论独立同分布随机变量序列的中央极限定理。它表明,独立同分布(i.i.d., 即 independent and identically distributed)、且数学期望和方差有限的随机变量序列的标准化和以标准正态分布为极限:

内容

设随机变量X1,X2,,Xn独立同分布, 且具有有限的数学期望方差E(Xi)=μD(Xi)=σ20(i=1,2,,n)。记

X¯=1ni=1nXiζn=X¯μσ/n,则 limnP(ζnz)=Φ(z)

其中Φ(z)是标准正态分布的分布函数。

证明

Xkμ特征函数φ(t),根据傅里叶变换,样本空间中的卷积在特征函数空间变为乘积,因此ζn的特征函数为[φ(tσn)]n.由于E(Xk)=μ,D(Xk)=σ2φ(0)=0,φ(0)=σ2.因此

φ(t)=112σ2t2+o(t2)

所以

[φ(tσn)]n=[112nt2+o(t2n)]net2/2

由于et2/2是连续函数,它对应的分布函数为Φ(Z),因此由逆极限定理

limnP(ζnz)Φ(z)

定理证毕。

林德伯格-费勒定理

Template:En-link-费勒(Lindeberg-Feller)定理,是中心极限定理的高级形式,是对林德伯格-莱维定理的扩展,讨论独立的,但不同分布的情况下的随机变量和。它表明,满足一定条件时,独立的,但不同分布的随机变量序列的标准化和依然以标准正态分布为极限:

内容

记随机变量序列XiXi独立但不一定同分布,E[Xi]=0且有有限方差)部分和为

Sn=i=1nXi

si2=Var(Xi)

σn2=i=1nsi2=Var(Sn).

如果对每个ϵ>0,序列满足

limn1σn2i=1nE[Xi2;{|Xi|>ϵσn}]=0

则称它满足林德伯格(Lindeberg)条件。

满足此条件的序列趋向于正态分布,即

Sn/σndN(0,1)

同时,该条件也是期望为零、方差有限的独立变量之和趋于正态分布的必要条件。

与之相关的是李亚普诺夫(Lyapunov)条件:

E[|Xi|3]<,limn1σn3i=1nE[|Xi|3]=0

满足李亚普诺夫条件的序列,必满足林德伯格条件。

证明

在此只对较强的李亚普诺夫条件给出证明。

以下证明对每一实数t,特征函数满足φSn/σn(t)et2/2

|φSn/σn(t)et2/2|=|k=1nφXk(t/σn)k=1net2sk2/2σn2|k=1n|φXk(t/σn)et2sk2/2σn2|

泰勒展开,上式可近似为

k=1n|i3t3E[Xk3]6σn3+t4sk48σn4||t|36σn3k=1nE[|Xk|3]+t48σn4k=1nsk4|t|36σn3k=1nE[|Xk|3]+t48max1knsk2σn2

由李亚普诺夫条件,当n时,第一项收敛于零。

kn=argmax1knsk2/σn2,则由李亚普诺夫不等式

(skn/σn)3/2E[|Xkn/σn|3]1σn3k=1nE[|Xk|3]

因此第二项也收敛于零。

证毕。

广义的定理

Template:Main 中心极限定理指出,随着随机变量数量的增加,许多具有有限方差的独立的且相同分布的随机变量的总和将趋于正态分布。

参阅

参考文献

  • 李贤平,概率论基础(第二版),高等教育出版社
  • Olav Kallenberg,现代概率论基础(第二版),Springer(2002)。

外部链接

Template:統計學 Template:Authority control