顺序统计量

来自testwiki
跳转到导航 跳转到搜索

Template:Expand统计学中,样本的第k顺序统计量Template:Lang-en)即它从小到大排列时的第k个值,常用于非参数估计推断中。常见的顺序统计量包括样本的最大值最小值中位数等。

记号

任给样本x1,x2,,xn,将其从小到大排成一列,记为:x(1),x(2),,x(n).则其第一顺序统计量(即最小值)为x(1),第n顺序统计量(即最大值)为x(n)

概率

随机变量X(k)累积分布函数Fk(x)由下式给出[1]Fk(x)=j=kn(nj)(F(x))j(1F(x))nj,x, 将累积分布函数求导可得其概率密度函数fk(x)fk(x)=n!(k1)!(nk)!(F(x))k1(1F(x))nkf(x),x.

連續均勻樣本

单位区间上的連續型均勻分布取得的樣本,其各順序統計量的边缘分布屬於Β分布族。此外,任意幾個順序統計量的联合分布也有簡單的表示。本節將作介紹。藉賴累积分布函数(cdf),該些結果亦可推廣到任意連續分佈。

本節中,X1,X2,,Xn表示以FX為cdf的一組隨機樣本。記Ui=FX(Xi),則U1,,Un是從標準連續均勻分布抽取的對應樣本。由FX的單調性,後者的順序統計量為U(i)=FX(X(i))

順序統計量U(k)的概率密度函數(pdf)等於[2]

fU(k)(u)=n!(k1)!(nk)!uk1(1u)nk.

換言之,均勻分佈的第k順序統計量遵循Β分布[2][3]

U(k)Beta(k,n+1k).

證明如下:欲使U(k)介乎uu+du之間,樣本須恰有k1個元素小於u,並至少有一個介乎uu+du之間。該區間包含多於一個元素的概率已是O(du2)(使用了大O符號),故衹需計算(0,u)(u,u+du)(u+du,1)三區間分別恰有k11nk個元素的概率。此即Template:Link-en概率

n!(k1)!(nk)!uk1du(1udu)nk,

故上述pdf公式成立。該分佈的平均值為k/(n+1)

参考文献

Template:Reflist

Template:算法