查看“︁样本均值”︁的源代码
←
样本均值
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1=Math}} '''样本均值'''是由一個或多個[[隨機變數]]中得到的[[统计量]],样本均值是一個[[向量空间|向量]],其中的每個元素都是針對隨機變數取样後得到的[[算术平均数]]。若只考慮一個随机变量,則样本均值為一個[[标量 (数学)|純量]],是隨機變數觀測值的算术平均。 ==定義== 令<math>x_{ij}</math>為第''j''個隨機變數(j=1,...,K)在第''i''次觀測(i=1,...,N)到的值,所有觀測值可以重組為N個''K'' ×1的向量,其中第''i''次觀測的所有數據用<math>\mathbf{x}_i</math>表示(i=1,...,N)。 算术平均向量<math>\mathbf{\bar{x}}</math>的第j個元素<math>\bar{x}_{j}</math>是第j個隨機變數在N次觀測值的平均值: :<math> \bar{x}_{j}=\frac{1}{N}\sum_{i=1}^{N}x_{ij},\quad j=1,\ldots,K. </math> 因此算术平均向量包括所有隨機變數的平均值,可以用以下方式表示: :<math> \mathbf{\bar{x}}=\frac{1}{N}\sum_{i=1}^{N}\mathbf{x}_i. </math> 样本均值是{{link-en|多元隨機變數|Multivariate random variable|隨機向量}}<math>\textstyle \mathbf{X}</math>[[期望值|期望]](若存在)的{{link-en|估計的偏差|Bias of an estimator|無偏估計}},隨機向量是一個列向量,其中第''j''個元素(''j = 1, ..., K'')為第''j''個隨機變數<ref name="JohnsonWichern2007">{{cite book|author1=Richard Arnold Johnson|author2=Dean W. Wichern|title=Applied Multivariate Statistical Analysis|url=http://books.google.com/books?id=gFWcQgAACAAJ|accessdate=10 August 2012|year=2007|publisher=Pearson Prentice Hall|isbn=978-0-13-187715-3|archive-date=2020-10-30|archive-url=https://web.archive.org/web/20201030203450/https://books.google.com/books?id=gFWcQgAACAAJ|dead-url=no}}</ref>。 样本均值因為是用所有的觀測值計算而得,稍微和每次的觀測值有關。若母体平均<math>\operatorname{E}(\mathbf{X})</math>已知,其無偏估計值 :<math> q_{jk}=\frac{1}{N}\sum_{i=1}^N \left( x_{ij}-\operatorname{E}(X_j)\right) \left( x_{ik}-\operatorname{E}(X_k)\right), </math> 用到母体平均,其分母為<math>\textstyle N</math>。 ==样本均值的方差== <!--{{main|方差}}--> 本节中总假定出现的均值和方差都是存在的。對於每個隨機變數,样本均值是母体平均的良好[[估计函数]],其中的良好是指有效及無偏差。當然样本均值不會是[[統計母體]]真實均值的正確值,因為從同一個分佈中不同的取様會產生不同的样本均值,也就對真實均值有不同的估计。因此样本均值也是[[隨機變數]],不是常數,因此也會有其分佈隨機變數。針對第''j''個隨機變數''N''次觀測的隨機取様,其样本均值分佈的均值會等於母體均值<math>E(X_j)</math>,而其[[變異數]]會等於<math> \frac{\sigma^2_j}{N}</math>,其中<math>\sigma^2_j</math>是隨機變數''X''<sub>j</sub>的變異數。 ==評論== 样本均值廣為使用在統計學及相關應用中,不過也有其缺點。样本均值不是[[稳健统计]],容易受{{link-en|異常點|outliers}}影響。在真實世界的應用中,一般會期望數據有稳健的性質,有其他方式可以計算類似样本均值的統計量,但又比样本均值要稳健,可以得到一些常見的量化統計量,例如[[樣本眾數]]和{{link-en|位置參數|Location parameter}}有關<ref>[http://www.edge.org/q2008/q08_16.html#kosko The World Question Center 2006: The Sample Mean] {{Wayback|url=http://www.edge.org/q2008/q08_16.html#kosko |date=20190712130156 }}, Bart Kosko</ref>。其他的替代品包括{{link-en|Winsorising|Winsorising}}及{{link-en |修整估计量|Trimmed estimator}},例如{{link-en|Winsorized平均|Winsorized mean}}及{{link-en|修整平均|trimmed mean}}。 ==參考資料== {{reflist}} [[Category:统计学]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Link-en
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
样本均值
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息