查看“︁标准误差”︁的源代码
←
标准误差
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1=Math }} {{Not|标准差}} [[File:standard deviation diagram.svg|325px|thumb|图示为服从无偏性正态分布的标准误]] '''标准误差'''({{lang-en|standard error}}),也称'''标准误''',即[[样本]]平均數[[抽樣分佈]]的[[标准差]]({{lang|en|standard deviation}}),是描述对应的样本平均數抽样分布的[[离散程度]]及衡量对应样本平均數抽样[[误差]]大小的尺度<ref>Everitt, B.S. (2003) ''The Cambridge Dictionary of Statistics'', CUP. ISBN 0-521-81099-X</ref>。 == 概述 == 标准误差针对样本统计量而言,是某个样本统计量的标准差。当谈及标准误差时,一般须指明对应的样本统计量才有意义。以下以样本均值(样本均值是一种样本统计量)作为例子: 例如, [[样本]][[平均数|均值]]是[[总体均值]]的[[无偏估计]]。但是,来自同一总量的不同样本可能有不同的均值。 于是,假设可以从总体中随机选取无限的大小相同的样本,那每个样本都可以有一个样本均值。依此法可以得到一个由无限多样本均值组成的总体,该总体的标准差即为标准误差。 在很多实际应用中,标准差的真正值通常是未知的。因此,标准误这个术语通常运用于代表这一未知量的估计。在这些情况下,需要清楚业已完成的和尝试去解决的标准误差仅仅可能是一个估量。然而,这通行上不太可能:人们可能往往采取更好的估量方法,而避免使用标准误,例如采用[[最大似然]]或更形式化的方法去测定[[信賴區間]]。第一个众所周知的方法是在适当条件下可以采用[[学生t-分布]]为一个估量平均值提供[[置信区间]]。在其他情况下,标准差可以有效地利用于提供一个不确定性空间的示值,但其正式或半正式使用是提供置信区间或测试,并要求样本总量必须足够大。其总量大小取决于具体的数量分析<ref>{{cite journal | first = L. | last = Isserlis | year = 1918 | title = On the value of a mean as calculated from a sample | journal = Journal of the Royal Statistical Society | volume = 81 | issue = 1 | pages = 75–81 | url = http://www.jstor.org/stable/2340569 | access-date = 2010-03-28 | archive-date = 2021-03-08 | archive-url = https://web.archive.org/web/20210308122934/https://www.jstor.org/stable/2340569 | dead-url = no }}</ref>。 == 平均值标准误差 == 「样本均值的估計标准误差」,簡稱'''平均值标准误差'''({{lang|en|standard error of the mean, SEM}}),或'''平均数标准误差'''。必須記得在簡稱的背後總是意指「樣本的」。 如果已知[[总體]]的[[標準差]](σ),那麼抽取無限多份大小為 n 的樣本,每個樣本各有一個平均值,所有這個大小的樣本之平均值的標準差可證明為(注意!不是''一份樣本裡觀察值''的標準差(那是下面公式裡的<math>s</math>)): :<math>SD_\bar{x}\ = \frac{\sigma}{\sqrt{n}}</math> 但由於通常σ為未知,此時可以用研究中取得樣本的標準差 (s) 來估計<math>SD_\bar{x}</math>: :<math>SE_\bar{x}\ = \frac{s}{\sqrt{n}}</math> 其中,s为样本的[[标准差]],n为样本数量(大小)。 名詞比較: :<math>SD_\bar{x}</math>:樣本平均值的標準「差」 (standard ''deviation'' of sample mean) :<math>s</math> :「樣本的」標準差 (standard deviation of sample) :<math>SE_\bar{x}</math>:樣本平均值的標準「誤」 (standard ''error'' of sample mean)。 注意: # 标准误差也可定义为[[残差]]的[[标准差]]<ref>Kenney, J. and Keeping, E.S. (1963) ''Mathematics of Statistics'', van Nostrand, p. 187</ref><ref>Zwillinger D. (1995), ''Standard Mathematical Tables and Formulae'', Chapman&Hall/CRC. ISBN 0-8493-2479-3 p. 626</ref>。 # 无论是标准误差还是小型样本的标准差,都往往低估了母体的标准误差和标准差:平均数的标准误差是总量标准误差的一个有偏估计量。当样本总量 n = 2 时,低估率大概为25% ;但 n = 6 时,低估率只有5%。基于此,古尔兰({{lang|en|Gurland}})和特里帕蒂({{lang|en|Tripathi}})对此公式作了改进努力<ref>{{cite journal |last=Gurland |first=J |coauthors=Tripathi RC |year=1971 |title=A simple approximation for unbiased estimation of the standard deviation |url=https://archive.org/details/sim_american-statistician_1971-10_25_4/page/30 |journal=American Statistician |volume=25 |issue=4|pages=30–32 }}</ref>。 == 假设与运用 == 如果数据集服从[[正态分布]],其正态分布函数的[[分位数]]、[[样本]][[平均数]]和[[标准差]]都可以用来计算合适的平均数信賴區間。 以下公式表示在大于或小于95%的置信区间中,<math>\bar{x}</math> 等于样本平均数时,S 等于样本平均数的[[标准差]],1.96 则为服从正态分布的第 0.975[[百分位数]]值。 : 95% 置信区间的上限 = <math>\bar{x} </math>+ (S ×1.96) , : 95% 置信区间的下限 = <math>\bar{x} </math>- (S ×1.96) . 特殊情况下,样本统计(比如样本平均数)的标准误是一个有偏誤的估计标准。换句话说,标准误是一个样本统计的样本分布的标准差。这一标准误的符号可以是任何<math>SE</math>、<math>SEM</math>、<math>S_E</math>之一。 标准误提供一系列在证明数值不确定性的简单方法,并通常用于: * 如果一些个体数量的标准误是已知的,那么在一些情况下,一些方程的百分位数的标准误可以被容易运算出来; * 当概率分布的数值已知,标准误可以用来推算精确的置信区间,并且; * 当概率分布的数值未知,其他[[切比雪夫不等式]]等可以用来推算一个保守的置信区间。 * 只要样本总量倾向於无穷大,[[中心极限定理]]可以保证其样本分布渐进地倾向于[[正态分布]]。 == 有限总体校正 == 鉴于对上述标准误差的公式,假设样本量远小于总量规模,所以总量可以被视为足够大。当取样比例较大(大约为5%或以上)时,对标准误的估计必须用“有限总体校正”({{lang|en|finite population correction}})<ref>{{harvtxt|Isserlis|1981|loc=equation (1)}}</ref>: : {| class="wikitable" |- ! FPC(<math>C_n^N</math>) !! FPC(<math>H_n^N</math>) |- | 樣本元素為不可重復組合 || 樣本元素為可重復組合 |- | 所有可能樣本的數目 = <math>C_n^N</math> || 所有可能樣本的數目 = [[組合#重複組合理論與公式|<math>H_n^N</math>]] |- | <math>FPC(C_n^N)=\sqrt{\frac{N-n}{N-1}}</math> ||<math>FPC(H_n^N)=\sqrt{\frac{N+n}{N+1}}</math> |} 该公式以考虑到增加所获得的采样精度,以接近的人口较大比例。有限总体校正的意义在于:如果样本大小 n 等于总量大小 N 时,有限总体校正数值为零。 == 样本相关性校正 == [[File:SampleBiasCoefficient.png|thumb|300px|right|一个样本中的预期误差与样本误差系数关系,其无误差的标准误,即 ρ=0,函数为图中红色直线,系数为-½]] 如果实测量 A 的数值不具有统计意义上的独立性,但是其仍然可以从已知的参数空间 x 中获取。那么一个误差的无偏估计可以通过以下方程获得: : <math> \text{f}= \sqrt{\frac{1+(n-1) \rho}{1-\rho}}</math> 其中,样本偏差系数 ρ 为自相关系数 ρ<sub>ij</sub> (-1到1之间的数量)的平均值。 == 相对标准误差 == [[相对标准误差]]({{lang|en|Relative Standard Error}})仅仅是标准误除以平均值的一种百分比表述。例如,制作两份家庭收入调查,其平均值为50000美元。如果一个调查的标准误有10000美元,而另一个则为5000美元,其相对标准误差分别为20%和10%。直观地说,拥有较低标准误差的调查看起来更为可靠。事实上,由于制作数据机构通常预设可信度标准,以使得其统计数据必须满足此前公布的内容。譬如,美国国家卫生统计中心通常不会报告其数据相对标准误差超过30%的估计。 == 相关条目 == * [[方差]]和[[标准差]] * [[样本均值]]和[[样本方差]] == 参考文献 == {{Reflist}} {{Statistics}} [[Category:统计偏差和离散度]]
该页面使用的模板:
Template:Cite journal
(
查看源代码
)
Template:Harvtxt
(
查看源代码
)
Template:Lang
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:Not
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Statistics
(
查看源代码
)
返回
标准误差
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息