离散程度

来自testwiki
imported>林欣輝2023年4月9日 (日) 10:10的版本 (使用HotCat已移除Category:统计偏差和离散度
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

Template:NoteTA Template:多个问题

在统计学里,离散程度Template:Lang-en,scatter,spread)或离散度,又稱统计变异性(statistical variability)[1],简称 變異變差(variation)、变率,是指一个分布随机变量的拉伸或压缩程度[2]Template:Clarify用以描述离散程度或變異的量主要有方差標準差變異系数四分位距等。

离散程度与集中趋势相对,因此,离散度就是指各个变量值与集中趋势的偏离程度。

衡量

衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。

部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是-{zh-hans:米; zh-tw:公尺 ;zh-hk:公尺}-或秒,则这些量的单位也是-{zh-hans:米; zh-tw:公尺; zh-hk:公尺}-或秒。这些量举例如下:

此外,也有一些无量纲量

另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:

可解释性

变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。

假设有随机变量𝐗及其服从的真实分布𝐗D。则对于该随机变量的观测值,可计算其变差(以方差表示)SStotal:=Var(𝐗);对于分布,亦可计算其变差SSdistribution:=Var(D)。则SSdistribution是相对该随机变量的可解释變異(英语:explainable variation),其余的部分则是不可解释變異(英语:unexplainable variation)。为了衡量不可解释變異,可引入不可解释變異分数(英语:fraction of unexplainable variation)FUV:=1SSdistributionSStotal。不可解释變異亦称为Template:Le

假设D是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器變異(以方差表示)SSmodel:=Var(D)。则SSmodel是该模型相对该随机变量的已解释變異(英语:explained variation),其余部分则是未解释變異(英语:unexplained variation)。同样,为了衡量未解释變異,可引入未解释變異分数(英语:fraction of unexplained variation)FUV:=1SSmodelSStotal

参考资料

Template:Reflist

Template:統計學

  1. 贺睿杰. 统计活动视角下的高中生统计学习研究[D]. 华东师范大学, 2020.
  2. Template:Cite web