内曼-皮尔逊引理

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA

统计学中,内曼-皮尔逊引理Template:Lang-en)是假设检验的基本引理,由耶日·内曼埃贡·皮尔逊于1933年提出。引理指出当零假设备择假设均为简单假设时,Template:Link-en在所有显著性水平相同的检验中统计功效最大。

假设检验是根据样本的观察结果,判断关于总体的命题真伪的方法。若要对某一命题的真伪做出判断,两种错误可能会发生:在命题为真时判断它为假,和在命题为假时判断它为真,两者分别称为第一类错误与第二类错误。发生第一类错误的概率即称作显著性水平,而不发生第二类错误的概率称作统计功效。尽管理想的判断方法应该同时最小化两种错误,但这一点很难实现。内曼-皮尔逊引理给出了,在发生第一类错误的概率上限固定时,能尽量减少第二类错误的检验方法。

背景

工厂验收、飞机试飞、新药研发等场合会从总体抽样进行检查。总体的某一性质,比如合格品的占比、药品的效力,可被视作拥有未知概率分布随机变量X,比如期望值方差不明确的正态分布。对样本中这一性质的观察结果可视为X的取值,记为x。通过这些观察结果,对有关X的假设做出判断,例如分布的期望值是否大于某一特定值,便是假设检验的目标。这种判断称作接受或拒绝这一假设。Template:SfnX有两种可能的分布P0P1,记X服从分布P0这一假设为H0,而X不服从分布P0,亦即服从分布P1这一假设为H1。用ϕ表示对假设的检验,其中ϕ(x)=0表示根据x的值接受了假设H0,而ϕ(x)=1则代表拒绝了假设H0。两种假设称作零假设备择假设Template:Sfn

内曼和皮尔逊认为,仅靠概率论无法证实或证伪单一的假设。然而,可以建立一套用于判断一系列假说的规则,使得长远来看依靠这一规则做出的判断大多数时候是正确的。Template:Sfn在判断观测到的数据x来自于哪一种分布时,正如预算有限的消费者在购物时会分析商品的性价比,时间紧迫的旅客会思考不同交通方式的速度,一种可能的检验方法在于计算两种分布下出现这一观测结果的概率之比

P1(x)P0(x).

比值中的两种概率称作似然,而该检验方法称作似然比检验。Template:Sfn

无论对假设作出怎样的判断,不可避免地会出现第一类错误与第二类错误:在假设为真时拒绝假设,和在假设为假时接受假设。取决于假设检验运用的场合,两种错误的结果会相当不同。若是用假设检验判断患者是否患有某一疾病,则第一类错误代表着患者没有患病时仍进行治疗,可能造成患者的不适和金钱损失;第二类错误则代表患者患病但没有诊出,若病情因而恶化可能导致患者死亡。在样本大小固定的情况下,无法同时控制这两种错误。发生第一类错误的概率称作显著性水平统计功效则指不发生第二类错误的概率。Template:Sfn似然比检验即是显著性水平上限固定时,统计功效最大的检验方法。Template:Sfn

陈述

Template:Link-en使用拉东-尼科迪姆导数定义概率分布的概率密度函数,对引理的表述为:Template:Sfn

Template:Math theorem

上述表述中的E0(ϕ(X))表示假设H0为真时ϕ(X)的期望值。

另一种简化后的表述则只包含了充分条件部分:Template:Sfn

Template:Math theorem

Template:Math proof

例子

x取自期望值为μ,方差为σ2的正态分布,其中σ2已知但μ为未知。如果假设H0μ=0,假设H1μ=μ1>0,则似然比为

p1(x)p0(x)=exp[(xμ1)2/(2σ2)]exp[x2/(2σ2)]=exp(μ1xσ2μ122σ2).

由于指数函数单调递增,似然比p1(x)/p0(x)>k等价于x大于另一常数,即x>k

显著性水平为α的检验需要满足P0(X>k)=α,因此k=σz1α,其中z1α表示标准正态分布的第(1α)分位数。因此,对这一问题统计功效最大的检验方法为在X>σz1α时拒绝H0Template:SfnTemplate:Sfn

参见

注释

Template:Reflist

参考文献

书籍

期刊论文

Template:统计学