查看“︁安斯库姆四重奏”︁的源代码
←
安斯库姆四重奏
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
[[Image:Anscombe's quartet 3.svg|right|425px|thumb|安斯库姆四重奏的四组数据图表]] '''安斯库姆四重奏'''({{lang|en|Anscombe's quartet}})是四组基本的统计特性一致的数据,但由它们绘制出的图表则截然不同。每一组数据都包括了11个(''x'',''y'')点。这四组数据由统计学家[[弗朗西斯·安斯库姆]](Francis Anscombe)于1973年构造,他的目的是用来说明在分析数据前先绘制图表的重要性,以及[[离群值]]对统计的影响之大。 这四组数据的共同统计特性如下: {| class="wikitable" ! 性质 ! 数值 |- | ''x''的[[平均数]] | 9 |- | ''x''的[[方差]] | 11 |- | ''y''的平均数 | 7.50(精确到小数点后两位) |- | ''y''的方差 | 4.122或4.127(精确到小数点后三位) |- | ''x''与''y''之间的[[相关系数]] | 0.816(精确到小数点后三位) |- | [[线性回归]]线 | <math>y=3.00 + 0.500x</math>(分别精确到小数点后两位和三位) |} 在四幅图中,由第一组数据绘制的图表(左上图)是看起来最“正常”的,可以看出两个随机变量之间的相关性。从第二组数据的图表(右上图)则可以明显地看出两个随机变量间的关系是非线性的。第三组中(左下图),虽然存在着线性关系,但由于一个离群值的存在,改变了线性回归线,也使得相关系数从1降至0.81。最后,在第四个例子中(右下图),尽管两个随机变量间没有线性关系,但仅仅由于一个离群值的存在就使得相关系数变得很高。 [[爱德华·塔夫特]](Edward Tufte)在他所著的《图表设计的现代主义革命》(''The Visual Display of Quantitative Information'')一书的第一页中,就使用安斯库姆四重奏来说明绘制数据图表的重要性。 四组数据的具体取值如下所示。其中前三组数据的''x''值都相同。 {| class="wikitable" style="text-align: center; margin-left:auto; margin-right:auto;" border="1" |+ 安斯库姆四重奏 |- ! colspan="2"| 一 ! colspan="2"| 二 ! colspan="2"| 三 ! colspan="2"| 四 |- | x | y | x | y | x | y | x | y |- | 10.0 || 8.04 || 10.0 || 9.14 || 10.0 || 7.46 || 8.0 || 6.58 |- | 8.0 || 6.95 || 8.0 || 8.14 || 8.0 || 6.77 || 8.0 || 5.76 |- | 13.0 || 7.58 || 13.0 || 8.74 || 13.0 || 12.74 || 8.0 || 7.71 |- | 9.0 || 8.81 || 9.0 || 8.77 || 9.0 || 7.11 || 8.0 || 8.84 |- | 11.0 || 8.33 || 11.0 || 9.26 || 11.0 || 7.81 || 8.0 || 8.47 |- | 14.0 || 9.96 || 14.0 || 8.10 || 14.0 || 8.84 || 8.0 || 7.04 |- | 6.0 || 7.24 || 6.0 || 6.13 || 6.0 || 6.08 || 8.0 || 5.25 |- | 4.0 || 4.26 || 4.0 || 3.10 || 4.0 || 5.39 || 19.0 || 12.50 |- | 12.0 || 10.84 || 12.0 || 9.13 || 12.0 || 8.15 || 8.0 || 5.56 |- | 7.0 || 4.82 || 7.0 || 7.26 || 7.0 || 6.42 || 8.0 || 7.91 |- | 5.0 || 5.68 || 5.0 || 4.74 || 5.0 || 5.73 || 8.0 || 6.89 |} == 参见 == {{div col|2}} * [[方差分析]] * [[横截面回归]] * [[曲线拟合]] * [[经验贝叶斯方法]] * [[逻辑斯蒂回归]] * [[M估计]] * [[非线性回归]] * [[非参数回归]] * [[多元自适应回归样条]] * [[Lack-of-fit sum of squares]]<!--没有什么好的译名--> * [[截断回归模型]] * [[删失回归模型]] * [[简单线性回归]] * [[分段回归|分段线性回归]] {{div col end}} == 参考文献 == * F.J. Anscombe, [http://links.jstor.org/sici?sici=0003-1305%28197302%2927%3A1%3C17%3AGISA%3E2.0.CO%3B2-J "Graphs in Statistical Analysis,"] American Statistician, 27 (February 1973), 17-21. * Tufte, Edward R. (2001). ''The Visual Display of Quantitative Information,'' 2nd Edition, Cheshire, CT: Graphics Press. ISBN 0961392142 * Sangit Chatterjee and Aykut Firat (2007). "Generating Data with Identical Statistics but Dissimilar Graphics: A Follow up to the Anscombe Dataset", American Statistician, 61(3), 248-254. [[doi:10.1198/000313007X220057]] == 外部链接 == * [http://www.upscale.utoronto.ca/GeneralInterest/Harrison/Visualisation/Visualisation.html Department of Physics, University of Toronto] {{Wayback|url=http://www.upscale.utoronto.ca/GeneralInterest/Harrison/Visualisation/Visualisation.html |date=20170107000224 }} * [https://web.archive.org/web/20090707031600/http://exploringdata.cqu.edu.au/curv_fit.htm Curve fitting, Central Queensland University, Australia] * [http://physics.info/linear-regression/practice.shtml Practice Problems, Linear Regression, The Physics Hypertextbook] {{Wayback|url=http://physics.info/linear-regression/practice.shtml |date=20201001193224 }} (See practice problem 4.) [[Category:统计图表]] [[Category:1973年科学]] [[Category:統計資料集]]
该页面使用的模板:
Template:Div col
(
查看源代码
)
Template:Div col end
(
查看源代码
)
Template:Lang
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
安斯库姆四重奏
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息