查看“︁司徒頓t分布”︁的源代码
←
司徒頓t分布
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{noteTA |T=zh-hans:学生t-分布; zh-tw:司徒頓t分布; |G1=Math |1=zh-cn:学生;zh-tw:司徒頓;zh:學生; |2=zh-hant:參數;zh-cn:参数;zh-tw:母數; |3= zh-hans:矩; zh-tw:動差;zh-hant:矩; |4= zh-hans:在线; zh-tw:線上; |5=zh-tw:高斯特;zh-cn:戈塞;zh-hk:戈塞; }} {{機率分佈 |name = 学生''t'' 分布 |type = 密度 |pdf_image = [[File:TStudent.png|325px|概率密度函数]] |cdf_image = [[File:T_distributionCDF.png|325px|累积分布函数]] |parameters =<math>\nu > 0\!</math>自由度 |support = <math>x \in (-\infty; +\infty)\!</math> |pdf = <math>\frac{\Gamma((\nu+1)/2)} {\sqrt{\nu\pi}\,\Gamma(\nu/2)\,(1+x^2/\nu)^{(\nu+1)/2}}\!</math> |cdf =<math>\frac{1}{2} + \frac{x \Gamma \left( (\nu+1)/2 \right) \,_2F_1 \left ( \frac{1}{2},(\nu+1)/2;\frac{3}{2};-\frac{x^2}{\nu} \right)} {\sqrt{\pi\nu}\,\Gamma (\nu/2)}</math>其中:<math>\,_2F_1 </math>是[[超几何函数]] |mean =<math>\nu>1</math>时为<math>0</math>,<math>\nu=1</math>时未定义 |median =<math>0</math> |mode =<math>0</math> |variance =<math>\nu>2</math>时为<math>\frac{\nu}{\nu-2}\!</math>,否则为无穷大 |skewness =<math>\nu>3</math>时为<math>0</math> |kurtosis =<math>\nu>4</math>时为<math>\frac{6}{\nu-4}\!</math> |entropy =<math>\begin{matrix} \frac{\nu+1}{2}\left[ \psi(\frac{1+\nu}{2}) - \psi(\frac{\nu}{2}) \right] \\[0.5em] + \log{\left[\sqrt{\nu}B(\frac{\nu}{2},\frac{1}{2})\right]} \end{matrix}</math> * <math>\psi</math>: [[双Γ函数]], * <math>B</math>: [[贝塔函数]] |mgf =未定义 |char =<math>\frac{K_{\nu/2}(\sqrt{\nu}|t|)(\sqrt{\nu}|t|)^{\nu/2}}{\Gamma(\nu/2)2^{\nu/2-1}},\;\nu>0</math> * <math>K_{\nu}(x)</math>: [[贝塞尔函数|第二类修正貝塞爾函數]] }} '''学生t分布'''(Student's ''t''-distribution),簡稱'''''t'' 分布''',在[[機率論]]及[[统计学]]中用于根据小样本來估計母體呈[[常態分布]]且[[標準差]]未知的[[期望值]]。若母體標準差已知,或是样本数足够大时(依據[[中央極限定理]]漸進[[常態分布]]),则应使用常態分布來進行估計。其為对两个样本期望值差异进行[[显著性差异|显著性]]测试的[[司徒頓t檢定]]之基础。 司徒頓''t'' 檢定改進了[[Z檢定]]({{lang|en|Z-test}}),因為在小樣本中,Z檢定以母體[[標準差]]已知為前提,Z檢定用在小樣本會產生很大的誤差,因此必須改用学生''t'' 檢定以求準確。但若在樣本數足夠大(普遍認為超過30個即足夠)時,可依據[[中央極限定理]]近似常態分布,以Z檢定來求得近似值, 在母體標準差數未知的情況下,不論樣本數量大或小皆可應用''t''檢定。在待比較的數據有三組以上時,因為誤差無法被壓低,此時可以用[[變異數分析]](ANOVA)代替''t''檢定。 ''t'' 分布的推导最早由德國大地测量学家{{tsl|en|Friedrich Robert Helmert|弗里德里希·羅伯特·赫爾默特}}于1876年提出,并由德國数学家{{tsl|en|Jacob Lüroth|雅各布·魯洛斯}}证明。<ref>{{Cite journal|first1=J.|last1=Pfanzagl| first2=O.|last2=Sheynin | title=A forerunner of the ''t''-distribution (Studies in the history of probability and statistics XLIV) |url=https://archive.org/details/sim_biometrika_1996-12_83_4/page/891| year=1996 | journal=Biometrika | volume=83 | issue=4 |pages=891–898 | doi=10.1093/biomet/83.4.891 <!-- abstract = “The t-distribution first occurred in a paper by Lüroth (1876) on the classical theory of errors in connection with a Bayesian result.” --> |mr=1766040}}</ref><ref>{{Cite journal| doi=10.1007/BF00374700 | last=Sheynin | first=O. | year=1995 | title=Helmert’s work in the theory of errors | journal=Arch. Hist. Exact Sci. | volume=49 | pages=73–104}}</ref> 英國人[[威廉·戈塞]]于1908年再次发现并发表了''t''分布,当时他还在愛爾蘭[[都柏林]]的[[吉尼斯]]啤酒酿酒厂工作。酒廠雖然禁止員工發表一切與釀酒研究有關的成果,但允許他在不提到釀酒的前提下,以筆名發表''t'' 分佈的發現,所以论文使用了「学生」(Student)这一笔名。之后''t''检定以及相关理论经由[[羅納德·費雪]]发扬光大,為了感謝戈塞的功勞,費雪将此分布命名为'''学生''t'' 分布'''(Student's ''t'')。<ref>{{cite book|title=Introduction to the Practice of SATISTICS|last=Moore|first=David S.|others=George P. McCabe, Bruce A. Craig|edition=7th International Edition|page=p. 401|publisher=W. H. Freeman and Company|location=New York|year=2012|language=en|ISBN=978-1-4292-8664-0}}</ref> == 描述 == 假设<math>X</math>是呈[[正态分布]]的独立的[[随机变量]](随机变量的[[期望值]]為<math>\mu</math>,母體[[變異數]]為<math>\sigma^{2}</math>但其值未知)。 令: :<math>\overline{X}_n=\frac{X_1+\cdots+X_n}{n}</math> 为'''样本期望值''', :<math>{S_n}^2=\frac{1}{n-1}\sum_{i=1}^n\left(X_i-\overline{X}_n\right)^2</math> 为'''樣本變異數''', :<math>Z=\frac{\overline{X}_n-\mu}{\frac{\sigma}{\sqrt{n}}}</math> 為呈期望值為0變異數為1的[[常態分布]]的[[随机变量]],但因母體變異數<math>\sigma^{2}</math>為未知,因此依[[史拉斯基定理]]以<math>{S_n}^2</math>替換之: :<math>T=\frac{\overline{X}_n-\mu}{\frac{S_n}{\sqrt{n}}}</math> ''T'' 的[[機率密度函數]]是: :<math>f(t) = \frac{\Gamma(\frac{\nu+1}{2})}{\sqrt{\nu\pi\,}\,\Gamma(\frac{\nu}{2})} (1+\frac{t^2}{\nu})^{\frac{-(\nu+1)}{2}}</math> '' <math> \nu </math> ''等于''n'' − 1。 ''T''的分布称为'''''t'' 分布'''。[[母數]]''<math>\nu</math> ''一般被称为[[自由度 (統計學)|自由度]]。 ''' <math> \Gamma </math> '''是[[Γ函数|伽玛函数]]。 如果<math>\nu</math>是偶数, : <math>\frac{\Gamma(\frac{\nu+1}{2})} {\sqrt{\nu\pi}\,\Gamma(\frac{\nu}{2})} = \frac{(\nu -1)(\nu -3)\cdots 5 \cdot 3} { 2 \sqrt{\nu}(\nu -2)(\nu -4)\cdots 4 \cdot 2\,}\cdot </math> 如果<math>\nu</math>是奇数, : <math>\frac{\Gamma(\frac{\nu+1}{2})} {\sqrt{\nu\pi}\,\Gamma(\frac{\nu}{2})} = \frac{(\nu -1)(\nu -3)\cdots 4 \cdot 2} {\pi \sqrt{\nu}(\nu -2)(\nu -4)\cdots 5 \cdot 3\,}\cdot\!</math> ''T'' 的[[機率密度函數]]的形状类似于期望值为0方差为1的正态分布,但更低更宽。随着自由度<math>\nu</math>的增加,则越来越接近期望值为0方差为1的正态分布。 {| align="center" |+ ''t'' 分布密度 (红色曲线) 在自由度为 1, 2, 3, 5, 10, 30比较于[[标准正态分布]](蓝色曲线).<br>前幅图用绿色曲线表示. |- | [[Image:T distribution 1df enhanced.svg|thumb|center|240x240px|alt=1df|1 degree of freedom]] | [[Image:T distribution 2df enhanced.svg|thumb|center|240x240px|alt=2df|2 degrees of freedom]] | [[Image:T distribution 3df enhanced.svg|thumb|center|240x240px|alt=3df|3 degrees of freedom]] |- | [[Image:T distribution 5df enhanced.svg|thumb|center|240x240px|alt=5df|5 degrees of freedom]] | [[Image:T distribution 10df enhanced.svg|thumb|center|240x240px|alt=10df|10 degrees of freedom]] | [[Image:T distribution 30df enhanced.svg|thumb|center|240x240px|alt=30df|30 degrees of freedom]] |} ''T''分布的概率累计函数,用[[Β函数#不完全贝塔函数|不完全贝塔函数]]''I''表示: :<math>F(t) = \int_{-\infty}^t f(u)\,du = 1- \tfrac{1}{2} I_{x(t)}\left(\tfrac{\nu}{2}, \tfrac{1}{2}\right), </math> 其中 :<math>x(t) = \frac{\nu}{{t^2+\nu}}.</math> ''T''分布的矩为: :<math>E(T^k)=\begin{cases} 0 & \mbox{k odd}, 0<k< \nu\\ \frac{\Gamma(\frac{k+1}{2})\Gamma(\frac{n-k}{2})^{k/2}}{\sqrt{\pi}\Gamma(\frac{n}{2})} & \mbox{k even}, 0<k< \nu\\ \mbox{NaN} & \mbox{k odd}, 0<\nu\leq k\\ \infty & \mbox{k even}, 0<\nu\leq k\\ \end{cases} </math> == 学生''t'' 分布置信区间的推导 == 假设数量''A''在当''T''呈''t''-分布(''T''的[[自由度 (统计学)|自由度]]为''n'' − 1)满足 :<math>\Pr(-A < T < A)=0.90\,</math> 这与 :<math>\Pr(T < A) = 0.95\,</math>是相同的 ''A''是这个[[概率分布]]的第95个百分点 那么 :<math>\Pr\left(-A < {\overline{X}_n - \mu \over S_n/\sqrt{n}} < A\right)=0.9,</math> 等价于 :<math>\Pr\left(\overline{X}_n - A{S_n \over \sqrt{n}} < \mu < \overline{X}_n + A{S_n \over \sqrt{n}}\right) = 0.9</math> 因此μ的90%[[置信区间]]为: :<math>\overline{X}_n\pm A\frac{S_n}{\sqrt{n}}</math> == 计算 == 现在最方便的计算T分布的办法是使用电子表格软件(如Excel)或查相关在线计算网站。例如,Excel的TDIST(x,v,sides)用来计算自由度为v的T分布,如果第三个参数为1,则给出Pr(T>x);如果第三个参数为2,则计算Pr(T>x Or T<-x). 下表列出了自由度為<math>\nu</math>的''t'' 分布的單側和雙側區間值。例如,當樣本數量n=5時,則自由度<math>\nu</math>=4,我們就可以查找表中以4開頭的行。該行第5列值為2.132,對應的''單側''值為95%(''雙側''值為90%)。這也就是說,T小於2.132的概率為95%(即單側),記為Pr(−∞ < ''T'' < 2.132) = 0.95;同時,T值介於-2.132和2.132之間的概率為90%(即雙側),記為Pr(−2.132 < ''T'' < 2.132) = 0.9。 這是根據分布的對稱性計算得到的, :Pr(''T'' < −2.132) = 1 − Pr(''T'' > −2.132) = 1 − 0.95 = 0.05, 因此, : Pr(−2.132 < ''T'' < 2.132) = 1 − 2(0.05) = 0.9. '''注意'''關於表格的最後一行的值:自由度為無限大的''t-''分布和常態分布等價。 {| class="wikitable" |- ! ''單側'' ! '''75%''' ! '''80%''' ! '''85%''' ! '''90%''' ! '''95%''' ! '''97.5%''' ! '''99%''' ! '''99.5%''' ! '''99.75%''' ! '''99.9%''' ! '''99.95%''' |- ! ''雙側'' ! '''50%''' ! '''60%''' ! '''70%''' ! '''80%''' ! '''90%''' ! '''95%''' ! '''98%''' ! '''99%''' ! '''99.5%''' ! '''99.8%''' ! '''99.9%''' |- !'''1''' |1.000 |1.376 |1.963 |3.078 |6.314 |12.71 |31.82 |63.66 |127.3 |318.3 |636.6 |- !'''2''' |0.816 |1.061 |1.386 |1.886 |2.920 |4.303 |6.965 |9.925 |14.09 |22.33 |31.60 |- !'''3''' |0.765 |0.978 |1.250 |1.638 |2.353 |3.182 |4.541 |5.841 |7.453 |10.21 |12.92 |- !'''4''' |0.741 |0.941 |1.190 |1.533 |2.132 |2.776 |3.747 |4.604 |5.598 |7.173 |8.610 |- !'''5''' |0.727 |0.920 |1.156 |1.476 |2.015 |2.571 |3.365 |4.032 |4.773 |5.893 |6.869 |- !'''6''' |0.718 |0.906 |1.134 |1.440 |1.943 |2.447 |3.143 |3.707 |4.317 |5.208 |5.959 |- !'''7''' |0.711 |0.896 |1.119 |1.415 |1.895 |2.365 |2.998 |3.499 |4.029 |4.785 |5.408 |- !'''8''' |0.706 |0.889 |1.108 |1.397 |1.860 |2.306 |2.896 |3.355 |3.833 |4.501 |5.041 |- !'''9''' |0.703 |0.883 |1.100 |1.383 |1.833 |2.262 |2.821 |3.250 |3.690 |4.297 |4.781 |- !'''10''' |0.700 |0.879 |1.093 |1.372 |1.812 |2.228 |2.764 |3.169 |3.581 |4.144 |4.587 |- !'''11''' |0.697 |0.876 |1.088 |1.363 |1.796 |2.201 |2.718 |3.106 |3.497 |4.025 |4.437 |- !'''12''' |0.695 |0.873 |1.083 |1.356 |1.782 |2.179 |2.681 |3.055 |3.428 |3.930 |4.318 |- !'''13''' |0.694 |0.870 |1.079 |1.350 |1.771 |2.160 |2.650 |3.012 |3.372 |3.852 |4.221 |- !'''14''' |0.692 |0.868 |1.076 |1.345 |1.761 |2.145 |2.624 |2.977 |3.326 |3.787 |4.140 |- !'''15''' |0.691 |0.866 |1.074 |1.341 |1.753 |2.131 |2.602 |2.947 |3.286 |3.733 |4.073 |- !'''16''' |0.690 |0.865 |1.071 |1.337 |1.746 |2.120 |2.583 |2.921 |3.252 |3.686 |4.015 |- !'''17''' |0.689 |0.863 |1.069 |1.333 |1.740 |2.110 |2.567 |2.898 |3.222 |3.646 |3.965 |- !'''18''' |0.688 |0.862 |1.067 |1.330 |1.734 |2.101 |2.552 |2.878 |3.197 |3.610 |3.922 |- !'''19''' |0.688 |0.861 |1.066 |1.328 |1.729 |2.093 |2.539 |2.861 |3.174 |3.579 |3.883 |- !'''20''' |0.687 |0.860 |1.064 |1.325 |1.725 |2.086 |2.528 |2.845 |3.153 |3.552 |3.850 |- !'''21''' |0.686 |0.859 |1.063 |1.323 |1.721 |2.080 |2.518 |2.831 |3.135 |3.527 |3.819 |- !'''22''' |0.686 |0.858 |1.061 |1.321 |1.717 |2.074 |2.508 |2.819 |3.119 |3.505 |3.792 |- !'''23''' |0.685 |0.858 |1.060 |1.319 |1.714 |2.069 |2.500 |2.807 |3.104 |3.485 |3.767 |- !'''24''' |0.685 |0.857 |1.059 |1.318 |1.711 |2.064 |2.492 |2.797 |3.091 |3.467 |3.745 |- !'''25''' |0.684 |0.856 |1.058 |1.316 |1.708 |2.060 |2.485 |2.787 |3.078 |3.450 |3.725 |- !'''26''' |0.684 |0.856 |1.058 |1.315 |1.706 |2.056 |2.479 |2.779 |3.067 |3.435 |3.707 |- !'''27''' |0.684 |0.855 |1.057 |1.314 |1.703 |2.052 |2.473 |2.771 |3.057 |3.421 |3.690 |- !'''28''' |0.683 |0.855 |1.056 |1.313 |1.701 |2.048 |2.467 |2.763 |3.047 |3.408 |3.674 |- !'''29''' |0.683 |0.854 |1.055 |1.311 |1.699 |2.045 |2.462 |2.756 |3.038 |3.396 |3.659 |- !'''30''' |0.683 |0.854 |1.055 |1.310 |1.697 |2.042 |2.457 |2.750 |3.030 |3.385 |3.646 |- !'''40''' |0.681 |0.851 |1.050 |1.303 |1.684 |2.021 |2.423 |2.704 |2.971 |3.307 |3.551 |- !'''50''' |0.679 |0.849 |1.047 |1.299 |1.676 |2.009 |2.403 |2.678 |2.937 |3.261 |3.496 |- !'''60''' |0.679 |0.848 |1.045 |1.296 |1.671 |2.000 |2.390 |2.660 |2.915 |3.232 |3.460 |- !'''80''' |0.678 |0.846 |1.043 |1.292 |1.664 |1.990 |2.374 |2.639 |2.887 |3.195 |3.416 |- !'''100''' |0.677 |0.845 |1.042 |1.290 |1.660 |1.984 |2.364 |2.626 |2.871 |3.174 |3.390 |- !'''120''' |0.677 |0.845 |1.041 |1.289 |1.658 |1.980 |2.358 |2.617 |2.860 |3.160 |3.373 |- !'''<math>\infty</math>''' |0.674 |0.842 |1.036 |1.282 |1.645 |1.960 |2.326 |2.576 |2.807 |3.090 |3.291 |} == 範例 == 给定一个样本:样本期望值和方差分别为10和2,样本大小为11([[自由度_(统计学)|自由度]]为10)。根據公式: :<math>\overline{X}_n\pm A\frac{S_n}{\sqrt{n}}</math> 可知,使用該方法統計出來的最大值,平均有90%的概率(即90%置信度/信心水準/confidence level)低於: :<math>10+1.37218 \frac{\sqrt{2}}{\sqrt{11}}=10.58510.</math> 同理,使用該方法統計出來的最小值,平均有90%的概率(即90%置信度/信心水準/confidence level)高於: :<math>10-1.37218 \frac{\sqrt{2}}{\sqrt{11}}=9.41490.</math> 因此,使用該方法統計出來的最大值和最小值,平均有80%的概率介於: :<math>10\pm1.37218 \frac{\sqrt{2}}{\sqrt{11}}=[9.41490,10.58510]</math> 兩值之間。(需注意此非代表數據的真正期望值介於這兩個值之間的機率為80%,詳情請參見[[置信区间]]。) ==參見== * [[假說檢定]] *[[司徒頓t檢定]] *[[概率分布]] * {{tsl|en|Levene's test|}} == 參考文獻 == <references /> == 外部連結 == * (en)[http://www.incertitudes.fr/book.pdf Probability, Statistics and Estimation]{{Wayback|url=http://www.incertitudes.fr/book.pdf |date=20170403013924 }} 首先第112页。 {{概率分布类型列表|学生t-分布}} [[Category:統計學]] [[Category:连续分布]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Lang
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Tsl
(
查看源代码
)
Template:Wayback
(
查看源代码
)
Template:概率分布类型列表
(
查看源代码
)
Template:機率分佈
(
查看源代码
)
返回
司徒頓t分布
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息