查看“︁T-标准化”︁的源代码
←
T-标准化
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1=Math}} 在[[统计学]]中,对一个样本统计量进行'''t-标准化'''(studentization,或直译为“学生化”)一般是指将其中心化之后,除以自身的[[标准差]]的变换方式。 广义的t-标准化,是指用其他[[矩_(數學)|样本矩]]来除该统计量。 t-标准化与[[标准化 (统计学)|标准化]]'''(standarization)'''最重要的区别是,标准化用真实的总体参数作除数,而t-标准化用可以观测到的样本统计量作除数。一般而言,标准化需要假设较多的已知信息。 ==例子== * 在对[[位置-尺度参数族]]的分布之总体均值进行估计的时候,经常用尺度参数的估计量来标准化位置参数的估计量。 例如,在估计正态分布 <math>N(\mu,\sigma^2)</math> 的位置参数 <math>\mu</math> 时,常用尺度参数 <math>\sigma</math> 的估计量来t-标准化位置参数的估计量,即: :<math>T = \frac{\bar X - \mu}{S/\sqrt{n}}</math> 其中 <math>S</math> 是样本方差,注意应该用 <math>S/\sqrt{n}</math> 整体(又称“[[标准误差]]”)而不是 <math>S</math> 来估计 <math>\bar{X}</math> 的标准差。在这个例子里,如果对 <math>\mathbb{E}[(\bar{X})^3]</math> 进行估计,并估计量的立方根代替 <math>T</math> 之表达式中的 <math>S/\sqrt{n}</math> ,那么就做成一个广义的t-标准化。如果用真实的 <math>\sigma</math> 代替 <math>S</math>,那么就做成一个[[标准化 (统计学)|标准化]]。 * 对一般的参数估计,也可以进行t-标准化,例如总体分布具有参数 <math>\theta</math> ,这里 <math>\theta</math> 既可以是一个参数模型的参数,例如 Exp<math>(\lambda)</math> 中的 <math>\lambda</math> ,也可以是一个非参数模型的泛函,例如一个所有矩存在的非参数模型的总体平均、总体方差等,可以考虑如下的t-标准化: :<math>T = \frac{\hat \theta - \theta}{\sqrt{\widehat{\mathrm Var}(\hat \theta)}}</math> 分母的平方是对 <math>{\mathrm Var}(\hat \theta) </math> 的良好估计,这个估计一般不容易得到,通行的做法是用一个经过仔细设计的重抽样方法做这个方差估计,例如Bootstrap、Jackknife等。 ==意义== t-标准化具有以下重要意义: * 标准化所得到的估计量,其分布不再、或更少地依赖于总体分布的尺度参数。这样可以方便地进行统计推断,例如设计置信区间和统计检验。<ref>{{cite journal |last1=Beran |first1=Rudolf |title=Prepivoting Test Statistics: A Bootstrap View of Asymptotic Refinements |url=https://archive.org/details/sim_journal-of-the-american-statistical-association_1988-09_83_403/page/687 |journal=Journal of the American Statistical Association |date=1988-09 |volume=83 |issue=403 |pages=687 |doi=10.2307/2289292}}</ref><ref>{{cite journal |last1=Beran |first1=Rudolf |title=Prepivoting to Reduce Level Error of Confidence Sets |url=https://archive.org/details/sim_biometrika_1987-09_74_3/page/457 |journal=Biometrika |date=1987-09 |volume=74 |issue=3 |pages=457 |doi=10.2307/2336685}}</ref> * 在[[自助法|Bootstrap方法]]中,t-标准化具有特殊的重要意义。对经过t-标准化的统计量进行bootstrap,以更高阶的精确度对被估计的参数进行统计推断(如更精确地控制[[置信区间]]的置信水平,及更好地控制统计检验中的[[第一型及第二型错误|第一类错误]]概率),而对未经标准化的统计量直接进行bootstrap则只能有低阶精确度的统计推断。<ref>{{cite book |author1=Larry Wasserman |title=All of nonparametric statistics |publisher=Springer |isbn=978-1-4419-2044-7}}</ref> ==不足== * 一般来说,t-标准化需要一个能够很好地估计待标准化统计量某个矩的估计量,设计这个估计量有时是很困难的,例如:观测到的是网络数据、或观测量间不是互相独立的(例如时间序列数据)。 * 除开简单的例子(例如正态分布),t-标准化后的统计量,其分布未必是容易计算或逼近的。 ==参考文献== [[Category:机器学习]] [[Category:统计学比率]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
返回
T-标准化
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息