内曼-皮尔逊引理
在统计学中,内曼-皮尔逊引理(Template:Lang-en)是假设检验的基本引理,由耶日·内曼和埃贡·皮尔逊于1933年提出。引理指出当零假设和备择假设均为简单假设时,Template:Link-en在所有显著性水平相同的检验中统计功效最大。
假设检验是根据样本的观察结果,判断关于总体的命题真伪的方法。若要对某一命题的真伪做出判断,两种错误可能会发生:在命题为真时判断它为假,和在命题为假时判断它为真,两者分别称为第一类错误与第二类错误。发生第一类错误的概率即称作显著性水平,而不发生第二类错误的概率称作统计功效。尽管理想的判断方法应该同时最小化两种错误,但这一点很难实现。内曼-皮尔逊引理给出了,在发生第一类错误的概率上限固定时,能尽量减少第二类错误的检验方法。
背景
工厂验收、飞机试飞、新药研发等场合会从总体中抽样进行检查。总体的某一性质,比如合格品的占比、药品的效力,可被视作拥有未知概率分布的随机变量,比如期望值和方差不明确的正态分布。对样本中这一性质的观察结果可视为的取值,记为。通过这些观察结果,对有关的假设做出判断,例如分布的期望值是否大于某一特定值,便是假设检验的目标。这种判断称作接受或拒绝这一假设。Template:Sfn若有两种可能的分布和,记服从分布这一假设为,而不服从分布,亦即服从分布这一假设为。用表示对假设的检验,其中表示根据的值接受了假设,而则代表拒绝了假设。两种假设称作零假设和备择假设。Template:Sfn
内曼和皮尔逊认为,仅靠概率论无法证实或证伪单一的假设。然而,可以建立一套用于判断一系列假说的规则,使得长远来看依靠这一规则做出的判断大多数时候是正确的。Template:Sfn在判断观测到的数据来自于哪一种分布时,正如预算有限的消费者在购物时会分析商品的性价比,时间紧迫的旅客会思考不同交通方式的速度,一种可能的检验方法在于计算两种分布下出现这一观测结果的概率之比
比值中的两种概率称作似然,而该检验方法称作似然比检验。Template:Sfn
无论对假设作出怎样的判断,不可避免地会出现第一类错误与第二类错误:在假设为真时拒绝假设,和在假设为假时接受假设。取决于假设检验运用的场合,两种错误的结果会相当不同。若是用假设检验判断患者是否患有某一疾病,则第一类错误代表着患者没有患病时仍进行治疗,可能造成患者的不适和金钱损失;第二类错误则代表患者患病但没有诊出,若病情因而恶化可能导致患者死亡。在样本大小固定的情况下,无法同时控制这两种错误。发生第一类错误的概率称作显著性水平,统计功效则指不发生第二类错误的概率。Template:Sfn似然比检验即是显著性水平上限固定时,统计功效最大的检验方法。Template:Sfn
陈述
Template:Link-en使用拉东-尼科迪姆导数定义概率分布的概率密度函数,对引理的表述为:Template:Sfn
上述表述中的表示假设为真时的期望值。
另一种简化后的表述则只包含了充分条件部分:Template:Sfn
例子
若取自期望值为,方差为的正态分布,其中已知但为未知。如果假设为,假设为,则似然比为
显著性水平为的检验需要满足,因此,其中表示标准正态分布的第分位数。因此,对这一问题统计功效最大的检验方法为在时拒绝。Template:SfnTemplate:Sfn