查看“︁内曼-皮尔逊引理”︁的源代码
←
内曼-皮尔逊引理
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{noteTA |G1=Math |1=zh-cn:假设;zh-tw:假說; |2=zh-cn:最大功效检验;zh-tw:最強力檢定; }} 在[[统计学]]中,'''内曼-皮尔逊引理'''({{lang-en|Neyman–Pearson lemma}})是[[假设检验]]的基本[[引理]],由[[耶日·内曼]]和[[埃贡·皮尔逊]]于1933年提出。引理指出当[[零假设]]和[[备择假设]]均为简单假设时,{{link-en|似然比检验|Likelihood-ratio test}}在所有[[显著性水平]]相同的检验中[[统计功效]]最大。 假设检验是根据[[样本]]的观察结果,判断关于[[总体]]的命题真伪的方法。若要对某一命题的真伪做出判断,两种错误可能会发生:在命题为真时判断它为假,和在命题为假时判断它为真,两者分别称为[[第一类错误与第二类错误]]。发生第一类错误的[[概率]]即称作显著性水平,而不发生第二类错误的概率称作统计功效。尽管理想的判断方法应该同时最小化两种错误,但这一点很难实现。内曼-皮尔逊引理给出了,在发生第一类错误的概率上限固定时,能尽量减少第二类错误的检验方法。 == 背景 == 工厂验收、飞机试飞、新药研发等场合会从[[总体]]中[[抽样]]进行检查。总体的某一性质,比如合格品的占比、药品的效力,可被视作拥有未知[[概率分布]]的[[随机变量]]<math>\, X \,</math>,比如[[期望值]]和[[方差]]不明确的[[正态分布]]。对[[样本]]中这一性质的观察结果可视为<math>\, X \,</math>的取值,记为<math>\, x \,</math>。通过这些观察结果,对有关<math>\, X \,</math>的假设做出判断,例如分布的期望值是否大于某一特定值,便是[[假设检验]]的目标。这种判断称作接受或拒绝这一假设。{{sfn|Lehmann|Romano|2022|pp=3–7}}若<math>\, X \,</math>有两种可能的分布<math>\, P_0 \,</math>和<math>\, P_1 \,</math>,记<math>\, X \,</math>服从分布<math>\, P_0 \,</math>这一假设为<math>\, H_0 \,</math>,而<math>\, X \,</math>不服从分布<math>\, P_0 \,</math>,亦即服从分布<math>\, P_1 \,</math>这一假设为<math>\, H_1 \,</math>。用<math>\, \phi \,</math>表示对假设的检验,其中<math>\, \phi(x) = 0 \,</math>表示根据<math>\, x \,</math>的值接受了假设<math>\, H_0 \,</math>,而<math>\, \phi(x) = 1 \,</math>则代表拒绝了假设<math>\, H_0 \,</math>。两种假设称作[[零假设]]和[[备择假设]]。{{sfn|Rice|2007|pp=331–332}} 内曼和皮尔逊认为,仅靠[[概率论]]无法证实或证伪单一的假设。然而,可以建立一套用于判断一系列假说的规则,使得长远来看依靠这一规则做出的判断大多数时候是正确的。{{sfn|Neyman|Pearson|1933}}在判断观测到的数据<math>\, x \,</math>来自于哪一种分布时,正如预算有限的消费者在购物时会分析商品的性价比,时间紧迫的旅客会思考不同交通方式的速度,一种可能的检验方法在于计算两种分布下出现这一观测结果的概率之比 :<math>\frac {P_1(x)} {P_0(x)}.</math> 比值中的两种概率称作[[似然]],而该检验方法称作似然比检验。{{sfn|Lehmann|Romano|2022|pp=64–65}} 无论对假设作出怎样的判断,不可避免地会出现[[第一类错误与第二类错误]]:在假设为真时拒绝假设,和在假设为假时接受假设。取决于假设检验运用的场合,两种错误的结果会相当不同。若是用假设检验判断患者是否患有某一疾病,则第一类错误代表着患者没有患病时仍进行治疗,可能造成患者的不适和金钱损失;第二类错误则代表患者患病但没有诊出,若病情因而恶化可能导致患者死亡。在样本大小固定的情况下,无法同时控制这两种错误。发生第一类错误的[[概率]]称作[[显著性水平]],[[统计功效]]则指不发生第二类错误的概率。{{sfn|Lehmann|Romano|2022|pp=61–64}}似然比检验即是显著性水平上限固定时,统计功效最大的检验方法。{{sfn|Lehmann|Romano|2022|pp=64–65}} == 陈述 == {{link-en|埃里希·莱曼|Erich Leo Lehmann}}使用[[拉东-尼科迪姆定理|拉东-尼科迪姆导数]]定义概率分布的[[概率密度函数]],对引理的表述为:{{sfn|Lehmann|Romano|2022|p=66}} {{math theorem | name = 内曼-皮尔逊引理 | math_statement = 设<math>\, P_0, P_1 \,</math>为概率分布,其关于[[测度]]<math>\, \mu \,</math>的概率密度函数分别为<math>\, p_0, p_1 \,</math>。 * 存在性:存在有检验<math>\, \phi \,</math>和常数<math>\, k \,</math>使得 {{NumBlk|*:|<math>E_0 (\phi(X)) = \alpha,</math>|1}} {{NumBlk|*:|<math>\phi(x) = \begin {cases} 1, \quad p_1(x) > k p_0(x), \\ 0, \quad p_1(x) < k p_0(x). \end {cases}</math>|2}} * 最大功效检验的[[充分条件]]:满足上述条件1和2的检验在显著性水平为<math>\, \alpha \,</math>的所有检验中统计功效最大。 * 最大功效检验的[[必要条件]]:若检验<math>\, \phi \,</math>的显著性水平为<math>\, \alpha \,</math>,且在显著性水平相同的所有检验中统计功效最大,则存在常数<math>\, k \,</math>使得<math>\, \phi \,</math>在测度<math>\, \mu \,</math>上[[几乎处处]]满足条件2。除非存在显著性水平小于<math>\, \alpha \,</math>且统计功效为<math>\, 1 \,</math>的检验,检验<math>\, \phi \,</math>亦满足条件1。 }} 上述表述中的<math>\, E_0 (\phi(X)) \,</math>表示假设<math>\, H_0 \,</math>为真时<math>\, \phi(X) \,</math>的期望值。 另一种简化后的表述则只包含了充分条件部分:{{sfn|Rice|2007|pp=331–332}} {{math theorem | name = 内曼-皮尔逊引理 | math_statement = 若检验<math>\, \phi \,</math>的显著性水平为<math>\, \alpha \,</math>,其方法为在比值 :<math>\frac {P_1(x)} {P_0(x)}.</math> 大于某常数<math>\, k \,</math>时拒绝<math>\, H_0 \,</math>,即此时<math>\, \phi (x) = 1\,</math>。则任何其他显著性水平小于等于<math>\, \alpha \,</math>的检验方法的统计功效均小于等于<math>\, \phi \,</math>的统计功效。 }} {{math proof | proof = 记概率分布<math>\, P_0, P_1 \,</math>的概率密度函数或[[概率质量函数]]分别为<math>\, p_0, p_1 \,</math>。一种检验方法<math>\, \phi \,</math>只取<math>\, 0, 1\,</math>两个值,故<math>\, \phi(X) \,</math>是一个服从[[伯努利分布]]的随机变量。它的显著性水平 :<math>P_0 (\phi(X) = 1)</math> 即是假设<math>\, H_0 \,</math>为真时<math>\, \phi(X) \,</math>的期望值 :<math>E_0 (\phi(X)).</math> 它的统计功效 :<math>P_1 (\phi(X) = 0)</math> 即是假设<math>\, H_1 \,</math>为真时<math>\, \phi(X) \,</math>的期望值 :<math>E_1 (\phi(X)).</math> 若<math>\, \phi \,</math>是显著性水平为<math>\, \alpha \,</math>的似然比检验,即<math>\, \phi(x) \,</math>在<math>\, p_1(x) > k p_0(x) \,</math>时取值为<math>\, 1 \,</math>,且<math>\, E_0 (\phi(X)) = \alpha \,</math>。设有另一个显著性水平小于等于<math>\, \alpha \,</math>的检验<math>\, \phi^* \,</math>,即<math>\, E_0 (\phi^*(X)) \leq E_0 (\phi(X)) = \alpha \,</math>,则有不等式 :<math>\phi^*(x)[p_1(x) - k p_0(x)] \leq \phi(x)[p_1(x) - k p_0(x)].</math> 这是因为若<math>\, \phi(x) = 1 \,</math>,则依<math>\, \phi \,</math>的定义<math>\, p_1(x) > k p_0(x) \,</math>;若<math>\, \phi(x) = 0 \,</math>,则<math>\, p_1(x) < k p_0(x) \,</math>。 对不等式两侧关于<math>\, x \,</math>积分或求和,则 :<math>E_1 (\phi^*(X)) - k E_0 (\phi^*(X)) \leq E_1 (\phi(X)) - k E_0 (\phi(X)).</math> 因此 :<math>k [E_0 (\phi(X)) - E_0 (\phi^*(X))] \leq E_1 (\phi(X)) - E_1 (\phi^*(X)).</math> 由于<math>\, \phi^* \,</math>的显著性水平小于等于<math>\, \phi \,</math>,此时不等式左侧非负。因此不等式右侧同样非负,即<math>\, \phi^* \,</math>的统计功效亦小于等于<math>\, \phi \,</math>。 }} == 例子 == 若<math>\, x \,</math>取自期望值为<math>\, \mu \,</math>,方差为<math>\, \sigma^2 \,</math>的正态分布,其中<math>\, \sigma^2 \,</math>已知但<math>\, \mu \,</math>为未知。如果假设<math>\, H_0 \,</math>为<math>\, \mu = 0 \,</math>,假设<math>\, H_1 \,</math>为<math>\, \mu = \mu_1 > 0 \,</math>,则似然比为 :<math>\frac {p_1(x)} {p_0(x)} = \frac {\exp[-(x - \mu_1)^2 / (2 \sigma^2)]} {\exp[-x^2 / (2 \sigma^2)]} = \exp \left( \frac {\mu_1 x} {\sigma^2} - \frac {\mu_1^2} {2 \sigma^2} \right).</math> 由于[[指数函数]][[单调递增]],似然比<math>\, {p_1(x)} / {p_0(x)} > k \,</math>等价于<math>\, x \,</math>大于另一常数,即<math>\, x > k' \,</math>。 显著性水平为<math>\, \alpha \,</math>的检验需要满足<math>\, P_0 (X > k') = \alpha \,</math>,因此<math>\, k' = \sigma z_{1 - \alpha} \,</math>,其中<math>\, z_{1 - \alpha} \,</math>表示[[标准正态分布]]的第<math>\, (1 - \alpha) \,</math>[[分位数]]。因此,对这一问题统计功效最大的检验方法为在<math>\, X > \sigma z_{1 - \alpha} \,</math>时拒绝<math>\, H_0 \,</math>。{{sfn|Lehmann|Romano|2022|pp=68–69}}{{sfn|Rice|2007|p=333}} == 参见 == * [[假设检验]] * {{link-en|似然比检验|Likelihood-ratio test}} * [[学生t检验]] * [[F检验]] * [[卡方检验]] == 注释 == {{reflist|30em}} == 参考文献 == === 书籍 === * {{citation | last1 = Lehmann | first1 = E. L. | last2 = Romano | first2 = Joseph P. | title = Testing Statistical Hypotheses, Fourth Edition | publisher = Springer | year = 2022 | isbn = 978-3-030-70578-7 | language = en | ref = {{sfnref|Lehmann|Romano|2022}} }} * {{citation | last1 = Rice | first1 = John A. | title = Mathematical Statistics and Data Analysis, Third Edition | publisher = Duxbury | year = 2007 | isbn = 0-534-39942-8 | language = en | ref = {{sfnref|Rice|2007}} }} === 期刊论文 === * {{citation | last1 = Neyman | first1 = J. | last2 = Pearson | first2 = E. S. | title = On the Problem of the Most Efficient Tests of Statistical Hypotheses | journal = Philosophical Transactions of the Royal Society of London, Series A | year = 1933 | volume = 231 | pages = 289-337 | doi = 10.1098/rsta.1933.0009 | language = en | ref = {{sfnref|Neyman|Pearson|1933}} }} {{统计学}} [[Category:假設檢定]] [[Category:引理]]
该页面使用的模板:
Template:Citation
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:Link-en
(
查看源代码
)
Template:Math proof
(
查看源代码
)
Template:Math theorem
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Sfn
(
查看源代码
)
Template:统计学
(
查看源代码
)
返回
内曼-皮尔逊引理
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息