查看“︁卡方检验”︁的源代码
←
卡方检验
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{noteTa |G1=Math |1= zh-cn:零假设; zh-tw:虛無假說 |2= zh-cn:检验; zh-tw:檢定 |3=zh-cn:水平 ;zh-tw:水準 |4=zh-hant:葉氏;zh-tw:葉慈 }} {{About|廣義的卡方檢定|一般情況下常代指的卡方檢定|皮爾森卡方檢定}} [[File:Chi-square distributionCDF-English.png|thumb|right|300px|此图展示分别在1、2、3、4、5的自由度下,[[卡方分布|卡方]]统计量(X轴)与[[P值]](P-value,Y轴)之间的变化关系。]] '''卡方检验'''('''Chi-Squared Test'''或'''<math>\chi^2</math> Test''')是一种[[统计量]]的分布在[[零假设]]成立时近似服从[[卡方分布]](<math>\chi^2</math>分布)的[[假设检验]]。在没有其他的限定条件或说明时,卡方检验一般代指的是'''[[皮尔森卡方检定]]'''。在卡方检验的一般运用中,研究人员将观察量的值划分成若干[[互斥]]的分类,并且使用一套理论(或[[虛無假說]])尝试去说明观察量的值落入不同分类的[[概率分布]]的模型。而卡方检验的目的就在于去衡量这个假设对观察结果所反映的程度。 == 历史 == 在十九世纪,统计分析方法主要被用于生物数据分析。当时主流意见认为[[正态分布]]普遍适用于此类数据,例如[[乔治·比德尔·艾里|乔治·比德尔·艾里爵士]]以及{{link-en|梅里曼教授|Mansfield Merriman}},而[[卡尔·皮尔逊|卡尔·皮尔森]]在他1900年的论文中就针对了他们的研究数据作出了指正<ref name = Pearson1900>{{cite journal | last = Pearson | first = Karl | author-link = 卡尔·皮尔逊 | title = On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling | journal = Philosophical Magazine Series 5 | volume = 50 | year = 1900 | pages = 157-175 | url = http://www.economics.soton.ac.uk/staff/aldrich/1900.pdf | doi = 10.1080/14786440009463897 | access-date = 2017-07-27 | archive-date = 2018-11-23 | archive-url = https://web.archive.org/web/20181123102358/http://www.economics.soton.ac.uk/staff/aldrich/1900.pdf | dead-url = no }}</ref>。 直到十九世纪末期,皮尔森指出了部分数据具有明显的[[偏态]],正态分布并不是普遍适用。为了更好地对这些观察数据进行建模,皮尔森在1893年至1916年发表的系列文章<ref name = Pearson1893> {{cite journal | last = Pearson | first = Karl | author-link = 卡尔·皮尔逊 | title = Contributions to the mathematical theory of evolution [abstract] | journal = Proceedings of the Royal Society | volume = 54 | year = 1893 | pages = 329-333 | JSTOR = 115538 | doi = 10.1098/rspl.1893.0079 }} </ref><ref name = Pearson1895> {{cite journal | last = Pearson | first = Karl | author-link = 卡尔·皮尔逊 | title = Contributions to the mathematical theory of evolution, II: Skew variation in homogeneous material | journal = Philosophical Transactions of the Royal Society | volume = 186 | year = 1895 | pages = 343-414 | bibcode = 1895RSPTA.186..343P | JSTOR = 90649 | doi = 10.1098/rsta.1895.0010 }} </ref><ref name = Pearson1901> {{cite journal | last = Pearson | first = Karl | author-link = 卡尔·皮尔逊 | title = Mathematical contributions to the theory of evolution, X: Supplement to a memoir on skew variation | journal = Philosophical Transactions of the Royal Society A | volume = 197 | year = 1901 | pages = 443-459 | bibcode = 1901RSPTA.197..443P | JSTOR = 90841 | doi = 10.1098/rsta.1901.0023 }} </ref><ref name = Pearson1916> {{cite journal | last = Pearson | first = Karl | author-link = 卡尔·皮尔逊 | title = Mathematical contributions to the theory of evolution, XIX: Second supplement to a memoir on skew variation | journal = Philosophical Transactions of the Royal Society A | volume = 216 | year = 1916 | pages = 429-457 | bibcode = 1916RSPTA.216..429P | JSTOR = 91092 | doi = 10.1098/rsta.1916.0009 }} </ref>中提出了一个包含正态分布以及众多偏态分布的连续概率分布族——{{link-en|皮尔森分布族|Pearson Distribution}}。同时,他指出数据统计分析的步骤应该是在从皮尔森分布族中选取合适的分布来进行建模后,使用'''拟合优度检验'''技术来评价模型和实验数据间的拟合优度。 ==著名的卡方檢定== === 皮尔森卡方检验 === {{main|皮尔森卡方检定}} 在1900年,[[卡尔·皮尔逊|皮尔森]]发表了著名的关于<math>\chi^2</math>检验的文章<ref name = Pearson1900 />,该文章被认为是现代统计学的基石之一<ref name = Cochran1952> {{cite journal | last = Cochran | first = William G. | title = The Chi-square Test of Goodness of Fit | url = https://archive.org/details/sim_annals-of-mathematical-statistics_1952-09_23_3/page/315 | journal = The Annals of Mathematical Statistics | volume = 23 | year = 1952 | pages = 315-345 | JSTOR = 2236678 }}</ref>。在该文章中,皮尔森研究了拟合优度检验: 假设实验中从总体中随机取样得到的<math>n</math>个观察值被划分为<math>k</math>个互斥的分类,这样每个分类都有一个对应的'''实际观察次数'''<math>x_i</math>(<math>i=1,2,...,k</math>)。研究人员会对实验中各个观察值落入第<math>i</math>个分类的概率<math>p_i</math>的分布提出零假设,从而获得了对应所有第<math>i</math>分类的'''理论期望次数'''<math>m_i=np_i</math>以及限制条件 :<math>\sum^k_{i=1}{p_i}=1</math>以及<math>\sum^k_{i=1}{m_i}=\sum^k_{i=1}{x_i}=n</math>。 皮尔森提出,在上述零假设成立以及<math>n</math>趋向<math>\infty</math>的时候,以下统计量的极限分布趋向<math>\chi^2</math>分布。 :<math>X^2=\sum^k_{i=1}{\frac{(x_i-m_i)^2}{m_i}}=\sum^k_{i=1}{\frac{x_i^2}{m_i}}-n</math> 皮尔森首先讨论零假设中所有分类的理论期望次数<math>m_i</math>均为足够大且已知的情况,同时假设各分类的实际观测次数<math>x_i</math>均服从正态分布。皮尔森由此得到当样本容量<math>n</math>足够大时,<math>X^2</math>趋近服从'''自由度为<math>(k-1)</math>的<math>\chi^2</math>分布'''。 然而,皮尔森在讨论当零假设中的理论期望次数<math>m_i</math>未知并依赖于必须由样本去进行估计的若干参数的情况时,记<math>m_i</math>为实际的理论期望次数以及<math>m'_i</math>为估计的理论期望次数,认为 :<math>X^2-X'^2=\sum^k_{i=1}{\frac{x_i^2}{m_i}}-\sum^k_{i=1}{\frac{x_i^2}{m'_i}}</math> 的值通常为正且'''足够小'''以至于可以忽略。皮尔森总结为,如果我们认为<math>X'^2</math>也服从自由度为<math>(k-1)</math>的<math>\chi^2</math>分布,那么由此近似带来的误差通常足够小并不会对实际决策的结论带来实质性的影响。这个结论在应用层面造成了长达20年的争论,直到费歇尔在1922年及1924年的论文<ref name = Fisher1922> {{cite journal | last = Fisher | first = Ronald A. | author-link = 罗纳德·艾尔默·费希尔 | title = On the Interpretation of chi-squared from Contingency Tables, and the Calculation of P | journal = Journal of the Royal Statistical Society | volume = 85 | year = 1922 | pages = 87-94 | JSTOR = 2340521 }} </ref><ref name = Fisher1924> {{cite journal | last = Fisher | first = Ronald A. | author-link = 罗纳德·艾尔默·费希尔 | title = The Conditions Under Which chi-squared Measures the Discrepancey Between Observation and Hypothesis | journal = Journal of the Royal Statistical Society | volume = 87 | year = 1924 | pages = 442-450 | JSTOR = 2341149 }} </ref>发表后才暂告一段落。 === 其他卡方检验例子 === * [[皮爾森卡方檢定]],是最有名的卡方檢驗,有兩種用途,分別是「適配度檢定」(Goodness of Fit test)以及「獨立性檢定」。科學文章中,當提到卡方檢定而沒有特別註明是哪一種時,通常便是指皮爾森卡方檢定。 * {{link-en|葉氏連續性修正|Yates's correction for continuity}}:當用皮爾森卡方檢定做獨立性檢定時,若任何一個欄位的期望次數'''小於5''',會使「近似於卡方分配」的假設不可信,統計值會系統性地偏高,導致過度地拒絕虛無假設,此時可以做葉氏連續性修正。 * {{link-en|Cochran–Mantel–Haenszel chi-squared test|Cochran–Mantel–Haenszel statistics}}。 * {{link-en|McNemar's test|McNemar's test}},用於某些 2 × 2 表格的配對樣本。 * {{link-en|Tukey's test of additivity|Tukey's test of additivity}}。 * {{link-en|portmanteau test|portmanteau test}},用於[[時間序列 (經濟學)|時間數列分析]]裡檢定[[自相關函數|自我相關]]的存在。 * [[似然函數|似然比檢定]]({{lang-en|likelihood ratio test}}),在建立統計模型時,用於檢定證據是否支持某個複雜的模型(使用變數較多)優於簡單的模型(使用變數較少),其中簡單模型所使用的變數全部包含於複雜模型中。 == 运用 == *建立虛無假設({{lang|en|Null Hypothesis}}),即认为观测值与理论值的差异是由于随机误差所致; *确定数据间的实际差异,即求出卡方值; *如卡方值大于某特定概率标准(即[[显著性差异]])下的理论值,则拒绝虛無假说,即实测值与理论值的差异在该显著水準下是显著的。 == 相关条目 == *[[卡方分布]] *[[t檢定]] == 外部链接 == *[http://molecular-service-science.com/2012/08/10/chi-squared-test-pearson-yates-and-fisher/ 卡方檢定的歷史演進與精確檢定] {{Wayback|url=http://molecular-service-science.com/2012/08/10/chi-squared-test-pearson-yates-and-fisher/ |date=20190701204547 }} *[http://graphpad.com/quickcalcs/chisquared2.cfm Chi-Square Calculator from GraphPad] {{Wayback|url=http://graphpad.com/quickcalcs/chisquared2.cfm |date=20081203133836 }} *[https://web.archive.org/web/20091228192154/http://faculty.vassar.edu/lowry/odds2x2.html Vassar College's 2×2 Chi-Square with Expected Values] == 腳註 == {{reflist}} {{統計學}} [[Category:统计检验]]
该页面使用的模板:
Template:About
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Lang
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:Link-en
(
查看源代码
)
Template:Main
(
查看源代码
)
Template:NoteTa
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
Template:統計學
(
查看源代码
)
返回
卡方检验
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息