格鲁布斯检验法

来自testwiki
跳转到导航 跳转到搜索

格拉布斯检验法Template:Lang),有时也被称为最大归一化残差检验,是一种在统计学中用于分析异常值的方法,因发明者Template:Tsl而得名[1]

定义

格拉布斯检验法基于数据服从正态分布的假设,用于检验Template:Tsl数据集内的离群值。因此,在使用格拉布斯检验法时,必须先检验数据的分布是否可以用正态分布进行近似[2]

格拉布斯检验法定义于如下假设之上:

H0:数据集中没有异常值;
Ha:数据集中只有一个异常值。

定义格拉布斯检验统计量为:

G=maxi=1,,N|XiX¯|s

其中,Xs分别指代的是样本的均值标准偏差

如果采用Template:Tsl的方法,则格拉布斯检验可按照以下步骤进行:

将数据集中的n个数值由最小排列到最大,则最小值X1或最大值Xn为可能的可疑数值。若要检验最小值是否为离群值,则可以按如下公式计算:

G=X¯X1s

检验最大值时,则为:

G=XnX¯s

对该双边检验,若下式成立,则在置信度α处,无偏差值的假设不成立:

G>N1Ntα/(2N),N22N2+tα/(2N),N22

其中,tα/(2N),N22表示t-分布中当自由度N2、显著性水平为α2N时的上临界值。如果采用单边检验方式,则应该将显著性水平改为αN

参考文献

Template:Reflist

参见

延伸阅读