查看“︁离散程度”︁的源代码
←
离散程度
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1 = Math |1 = zh-cn:量纲; zh-tw:因次; }} {{多个问题| {{expert}} {{refimprove|time=2019-12-10T13:08:20+00:00}} }} 在统计学里,'''离散程度'''({{lang-en|statistical dispersion}},scatter,spread)或'''离散度''',又稱'''统计变异性'''(statistical variability)<ref>贺睿杰. 统计活动视角下的高中生统计学习研究[D]. 华东师范大学, 2020.</ref>,简称 '''變異'''、'''變差'''(variation)、'''变率''',是指一个[[概率分布|分布]]或[[随机变量]]的拉伸或压缩程度<ref>{{cite web|last1=NIST/SEMATECH e-Handbook of Statistical Methods|title=1.3.6.4. Location and Scale Parameters|url=http://www.itl.nist.gov/div898/handbook/eda/section3/eda364.htm|website=www.itl.nist.gov|publisher=U.S. Department of Commerce|access-date=2022-11-14|archive-date=2022-11-14|archive-url=https://web.archive.org/web/20221114024305/https://www.itl.nist.gov/div898/handbook/eda/section3/eda364.htm|dead-url=no}}</ref>。{{clarify|习惯上,“离散”常用来描述数据分布<ref>{{Cite book | author = 米小琴 | title = 统计计算与分析 | publisher = 清华大学出版社有限公司 | date = 2004 | pages = 68-75 | ISBN = 9787302064343}}</ref>,而“變異”(指:變異-{}-數、方-{}-差)更常用来描述[[随机变量]]的变异程度<ref>{{Cite book | author = 安德森 | editor = 王峰 | title = 商务与经济统计 | publisher = 中信出版社 | date = 2003 | pages = 202 | ISBN = 9787800738753}}</ref>。}}用以描述离散程度或變異的量主要有[[方差]]、[[標準差]]、[[變異系数]]和[[四分位距]]等。 离散程度与[[集中趋势]]相对,因此,离散度就是指各个变量值与集中趋势的偏离程度。 == 衡量 == 衡量离散程度的值,通常是非负[[实数]]:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。 部分描述离散程度的量是带单位的,并且,这些量的[[计量单位|单位]]与随机变量本身的单位相同。也就是说,如果随机变量的单位是-{zh-hans:米; zh-tw:公尺 ;zh-hk:公尺}-或秒,则这些量的单位也是-{zh-hans:米; zh-tw:公尺; zh-hk:公尺}-或秒。这些量举例如下: * [[标准差]] * [[四分位距]] * [[全距]] * {{le|平均绝对偏差|Mean_absolute_difference}} * {{le|绝对差中位数|Median_absolute_deviation}} * [[平均差]] * {{le|间隔关系|Distance_correlation}} 此外,也有一些[[无量纲量]]: * [[變異係數]] * {{le|四分位離散係數|Quartile_coefficient_of_dispersion}} * [[基尼系数]] * [[熵]] 另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同: * [[方差]] * {{le|离散指数|Index_of_dispersion}} == 可解释性 == 变差的可解释性,通常是对于一个随机变量而言的。当[[观测]]到随机变量的一些取值(例如[[训练集]]中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立[[数学模型|模型]]的过程。 假设有随机变量<math>\mathbf X</math>及其服从的真实分布<math>\mathbf X\sim D</math>。则对于该随机变量的观测值,可计算其变差(以方差表示)<math>\text{SS}_{\text{total}} := \text{Var}(\mathbf X)</math>;对于分布,亦可计算其变差<math>\text{SS}_{\text{distribution}} := \text{Var}(D)</math>。则<math>\text{SS}_{\text{distribution}}</math>是相对该随机变量的'''可解释變異'''(英语:explainable variation),其余的部分则是'''不可解释變異'''(英语:unexplainable variation)。为了衡量不可解释變異,可引入'''不可解释變異分数'''(英语:fraction of unexplainable variation)<math>\text{FUV} := 1 - \tfrac{\text{SS}_{\text{distribution}}}{\text{SS}_{\text{total}}}</math>。不可解释變異亦称为'''{{le|统计噪声|statistical_noise}}'''。 假设<math>D'</math>是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器變異(以方差表示)<math>\text{SS}_{\text{model}} := \text{Var}(D')</math>。则<math>\text{SS}_{\text{model}}</math>是该模型相对该随机变量的'''已解释變異'''(英语:explained variation),其余部分则是'''未解释變異'''(英语:unexplained variation)。同样,为了衡量未解释變異,可引入'''未解释變異分数'''(英语:fraction of unexplained variation)<math>\text{FUV} := 1 - \tfrac{\text{SS}_{\text{model}}}{\text{SS}_{\text{total}}}</math>。 == 参考资料 == {{Reflist}} {{統計學}} [[Category:统计学]]
该页面使用的模板:
Template:Cite web
(
查看源代码
)
Template:Clarify
(
查看源代码
)
Template:Lang-en
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:多个问题
(
查看源代码
)
Template:統計學
(
查看源代码
)
返回
离散程度
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息