切比雪夫不等式

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA Template:Otheruses

切比雪夫不等式Template:Lang-en),是概率论中的一个不等式,顯示了隨機變量的「幾乎所有」值都會「接近」平均。在20世纪30年代至40年代刊行的书中,其被称为比奈梅不等式(Template:Lang)或比奈梅-切比雪夫不等式(Template:Lang)。切比雪夫不等式对任何分布数据都适用。

切比雪夫不等式可表示为以下形式:对于任何随机变量 X 和实数 b>0,都有 P(|XE(X)|b)Var(X)b2,其中 E(X) 表示 X数学期望Var(X)X方差

概念

這個不等式以數量化這方式來描述,究竟「幾乎所有」是多少,「接近」又有多接近:

  • 與平均相差2個標準差以上的值,數目不多於1/4
  • 與平均相差3個標準差以上的值,數目不多於1/9
  • 與平均相差4個標準差以上的值,數目不多於1/16

……

  • 與平均相差k個標準差以上的值,數目不多於1/k2

舉例說,若一班有36個學生,而在一次考試中,平均分是80分,標準差是10分,我們便可得出結論:少於50分或多於110分(與平均相差3個標準差以上)的人,數目不多於4個(=36*1/9)。
公式:P(μkσ<X<μ+kσ)11k2

推论

測度論說法

設(X,Σ,μ)為一測度空間f為定義在X上的廣義實可測函數。對於任意實數t > 0,

μ({xX:|f(x)|t})1t2Xf2dμ.

一般而言,若g是非負廣義實值可測函數,在f的定義域非降,則有

μ({xX:f(x)t})1g(t)Xgfdμ.

上面的陳述,可透過以|f|取代f,再取如下定義而得:

g(t)={t2if t00otherwise,

概率論說法

X為隨機變量,期望值μ标准差σ。對於任何實數k>0,

Pr(|Xμ|kσ)1k2.

改進

一般而言,切比雪夫不等式給出的上界已無法改進。考慮下面例子:

Pr(X=1)=Pr(X=1)=1/(2k2)
Pr(X=0)=11/k2

這個分布的標準差σ=1/kμ=0

对于任意分布形态的数据,根据切比雪夫不等式,至少有 11/k2 的数据落在k个标准差之内。其中k>1,但不一定是整数。

當只求其中一邊的值的時候,有Cantelli不等式

Pr(Xμkσ)11+k2.[1] Template:Wayback

證明

定義At:={xXf(x)t},設1At為集At指示函数,有

0g(t)1Atgf1Atgf,
g(t)μ(At)=Xg(t)1AtdμAtgfdμXgfdμ.

又可從馬爾可夫不等式直接證明:馬氏不等式說明對任意隨機變量Y和正數aPr(|Y|>a)E(|Y|)/a。取Y=(Xμ)2a=(kσ)2

亦可從概率論的原理和定義開始證明:

Pr(|Xμ|kσ)=E(I|Xμ|kσ)=E(I[(Xμ)/(kσ)]21)
E((Xμkσ)2)=1k2E((Xμ)2)σ2=1k2.

參見

参考来源

  • 《基本統計學 觀念與應用二版》,林惠玲 陳正倉 著
  • 《應用統計學 第四版》 修訂版,林惠玲 陳正倉 著


Template:統計學