估计量的偏差

来自testwiki
跳转到导航 跳转到搜索

Template:About

Template:NoteTA

统计学中,估计量偏差(或偏差函数)是此估计量的期望值与估计参数的真值之差。偏差为零的估计量或决策规则称为无偏的。否则该估计量是有偏的。在统计中,“偏差”是一个函数的客观陈述。

偏差也可以相对于中位數来衡量,而非相对于均值(期望值),在这种情况下为了与通常的“均值”无偏性区别,称作“中值”无偏。偏差与一致性相关联,一致估计量都是收敛并且渐进无偏的(因此会收敛到正确的值),虽然一致序列中的个别估计量可能是有偏的(只要偏差收敛于零);参见偏差与一致性

当其他量相等时,无偏估计量比有偏估计量更好一些,但在实践中,并不是所有其他统计量的都相等,于是也经常使用有偏估计量,一般偏差较小。当使用一个有偏估计量时,也会估计它的偏差。有偏估计量可能用于以下原因:由于如果不对总体进一步假设,无偏估计量不存在或很难计算(如Template:Le);由于估计量是中值无偏的,却不是均值无偏的(或反之);由于一个有偏估计量较之无偏估计量(特别是Template:Le)可以减小一些损失函数(尤其是均方差);或者由于在某些情况下,无偏的条件太强,这种情况无偏估计量不是必要的。此外,在非线性变换下均值无偏性不会保留,不过中值无偏性会保留(参见变换的效应);例如样本方差是总体方差的无偏估计量,但它的平方根標準差则是总体标准差的有偏估计量。下面会进行说明。

定义

设我们有一个参数为实数 θ概率模型,产生观测数据的概率分布 Pθ(x)=P(xθ),而统计量 θ^ 是基于任何观测数据 xθ估计量。也就是说,我们假定我们的数据符合某种未知分布 Pθ(x)=P(xθ)(其中 θ 是一个固定常数,而且是该分布的一部分,但具体值未知),于是我们构造估计量 θ^,该估计量将观测数据与我们希望的接近 θ 的值对应起来。因此这个估量的(相对于参数 θ的)偏差定义为

Biasθ[θ^]=Eθ[θ^]θ=Eθ[θ^θ],

其中 Eθ 表示分布 Pθ(x)=P(xθ)期望值,即对所有可能的观测值 x 取平均。由于 θ 对于条件分布 P(xθ) 是可测的,就有了第二个等号。

对于参数 θ 的所有值的偏差都等于零的估计量称为无偏估计量。

在一次关于估计量性质的模拟实验中,估计量的偏差可以用Template:Le来评估。

例子

样本方差

Template:Main 随机变量的样本方差从两方面说明了估计量偏差:首先,自然估计量(Template:Lang)是有偏的,可以通过比例因子校正;其次,无偏估计量的均方差(MSE)不是最优的,可以用一个不同的比例因子来最小化,得到一个比无偏估计量的MSE更小的有偏估计量。

具体地说,自然估计量就是将离差平方和加起来然后除以 n,是有偏的。不过除以 n − 1 会得到一个无偏估计量。相反,MSE可以通过除以另一个数来最小化(取决于分布),但这会得到一个有偏估计量。这个数总会比 n − 1 大,所以这就叫做Template:Le,因为它把无偏估计量向零“收缩”;对于正态分布,最佳值为 n + 1。

X1, ..., Xn期望μ方差σ2独立同分布(i.i.d.)随机变量。如果样本均值与未修正样本方差定义为

X=1ni=1nXi,S2=1ni=1n(XiX)2,

S2σ2 的一个有偏估计量,因为

E[S2]=E[1ni=1n(XiX)2]=E[1ni=1n((Xiμ)(Xμ))2]=E[1ni=1n((Xiμ)22(Xμ)(Xiμ)+(Xμ)2)]=E[1ni=1n(Xiμ)22n(Xμ)i=1n(Xiμ)+1n(Xμ)2i=1n1]=E[1ni=1n(Xiμ)22n(Xμ)i=1n(Xiμ)+1n(Xμ)2n]=E[1ni=1n(Xiμ)22n(Xμ)i=1n(Xiμ)+(Xμ)2]

换句话说,未修正的样本方差的期望值不等于总体方差 σ2,除非乘以归一化因子。而样本均值是总体均值 μ 的无偏[1]估计量。

S2 是有偏的原因源于样本均值是 μTemplate:Le(OLS)估计量这个事实:X 是令 i=1n(XiX)2 尽可能小的数。也就是说,当任何其他数代入这个求和中时,这个和只会增加。尤其是,在选取 μX 就会得出,

1ni=1n(XiX)2<1ni=1n(Xiμ)2,

于是

E[S2]=E[1ni=1n(XiX)2]<E[1ni=1n(Xiμ)2]=σ2.

注意到,通常的样本方差定义为

s2=1n1i=1n(XiX)2,

而这时总体方差的无偏估计量。可以由下式看出:

E[(Xμ)2]=1nσ2.

方差的有偏(未修正)与无偏估计之比称为Template:Le

参见

Template:Portal box

参考文献

  • Brown, George W. "On Small-Sample Estimation." The Annals of Mathematical Statistics, vol. 18, no. 4 (Dec., 1947), pp. 582–585. Template:JSTOR.
  • Template:Tsl "A General Concept of Unbiasedness" The Annals of Mathematical Statistics, vol. 22, no. 4 (Dec., 1951), pp. 587–592. Template:JSTOR.
  • Template:Tsl, 1961. "A Unified Theory of Estimation, I", The Annals of Mathematical Statistics, vol. 32, no. 1 (Mar., 1961), pp. 112–135.
  • Van der Vaart, H. R., 1961. "Some Extensions of the Idea of Bias" The Annals of Mathematical Statistics, vol. 32, no. 2 (June 1961), pp. 436–447.
  • Pfanzagl, Johann. 1994. Parametric Statistical Theory. Walter de Gruyter.
  • Template:Cite book.
  • Template:Cite book
  • Template:Cite book
  • Template:Cite book

外部链接

Template:認知偏誤