U-统计量

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA U-统计量是统计学中一类特定的、具有对称性的统计量,它在估计理论中扮演重要角色。名称中的“ U”为无偏(unbiased)之意。在初等统计学中,U-统计量与最小方差无偏估计量 (UMVUE) 有密切联系。

U-统计量的一个重要性是,对概率分布来说,其可估计参数的最小方差无偏估计量 是一个U-统计量。 [1][2] 因此通过研究U-统计量的一般性质,可以系统地了解这些估计量的统计学性质。[3]

U-统计量在非参数统计中尤其重要,不少用于估计和统计检验的统计量,在形式上都是U-统计量。U-统计量通常具有良好的渐近正态性,这方便了基于它的统计推断。 近年来,U-统计量在研究复杂的随机过程随机网络类型数据的随机性质方面,发挥了作用。[4][5][6]

目前,统计学家们对U-统计量性质的了解,几乎全都基于Hoeffding发表于1948年的经典论文[7]。在这篇论文里,Hoeffding给出了U-统计量最重要的性质——它的ANOVA分解

定义

定义 h(x1,,xr):r 为一个函数,其具有对称性,即交换任意 xi,xj 的位置,h 的值保持不变。对随机变量 X1,,Xn ,基于 h 的U-统计量定义如下:

Un=1(nr)1i1<<irnh(Xi1,,Xir)

这里,h() 称为U-统计量的核函数(Kernel function),而核函数的维数 r 称为该U-统计量的度(degree)Template:R

两样本U-统计量

定义 h(x1,,xr;y1,,ys):r+s 为一个函数,其对 XY 分别具有对称性,即交换任意 xi1,xi2 的位置或交换任意 yj1,yj2 的位置,h 的值保持不变(但不能随意交换 xi,yj )。对随机变量 X1,,Xm;Y1,,Yn ,基于 h 的两样本U-统计量定义如下:

Um,n=1(mr)(ns)1i1<<irm1j1<<jsnh(X1,,Xr;Y1,,Ys)

目前在机器学习中,最常见的情形是 r=s=1,例如能量距离最大平均差异(MMD)

Hoeffding的ANOVA分解定理

定理表述

Hoeffding的ANOVA分解定理是现代U-统计量理论的基础。[8]为表述该定理,定义:μ=𝔼[h(X1,,Xr)]。 对所有 1kr ,定义投影函数

ak(x1,,xk)=𝔼[h(X1,,Xr)|X1=x1,,Xk=xk]μ

然后定义正交化投影函数

g1(x1)=a1(x1)g2(x1,x2)=a2(x1,x2)g1(x1)g1(x2),等等,每一个 gk 都定义为相应的 ak减去之前定义过的所有 g1,,gk1,直至最后一个函数 gr

gr(x1,,xr)=ar(x1,,xr)j=1r11i1<<ijrgj(xi1,,xij)

Hoeffding的ANOVA分解定理的内容是:

Unμ=(nr)1k=1r(nkrk)1i1<<ikngk(Xi1,,Xik)

分解项的性质

所有的正交化投影函数 gk 都满足:

𝔼[gk(X1,,Xk)|X1,,Xk1]=0

因此,所有的分解项之间是互不相关的Template:R,并且度为 k 的分解项之平均的阶为 Op(nk/2).

在大多数应用中,一个U-统计量的ANOVA分解中最重要的是前一项或前两项。根据分解项的性质,可以得到如下的两项ANOVA分解式:

Unμ=rni=1ng1(Xi)+r(r1)n(n1)1i<jng2(Xi,Xj)+Op(n3/2)

定理应用

  • U-统计量的渐近正态性是Hoeffding的ANOVA分解定理的简单推论。具体而言,有如下结论:记 ξ12=Var(g1(X1)) ,则:
n1/2(Unμ) d N(0,r2ξ12)

同时,分解定理也指出了应该如何正确地一阶逼近U-统计量的方差,和对其进行t-标准化

  • 由该定理出发,在不同强度的假设条件下,可以用一项或两项的Edgeworth展开来高精度地逼近U-统计量的分布。[9][10][11][12]


具体例子

  • 度为1的例子:令 h(x)=x ,则U-统计量 1ni=1nh(Xi)=X¯n是样本均值。
  • 度为2的例子:令 h(x1,x2)=|x1x2| ,则U-统计量
1(n2)1i<jnh(Xi,Xj)

称为“平均成对偏差”。

  • 另一个度为2的例子:令 h(x1,x2)=(x1x2)2/2 ,则U-统计量有如下变形:
1(n2)1i<jnh(Xi,Xj)=(XiX¯)2/(n1)

这正是人们熟知的样本方差 Sn2

  • 度为3的例子:样本偏度定义中的分子项:
1ni=1n(XiX¯)3

展开后可以写成一个U-统计量。

参见

参考文献

Template:Reflist