查看“︁单峰”︁的源代码
←
单峰
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1 = Math |1=zh-cn:數學對象;zh-tw:數學物件; }} [[数学]]中,'''单峰'''意味着拥有唯一的[[众数 (数学)|众数]]。更一般地说,单峰意味着[[数学对象]]只有唯一的最大值。<ref>{{MathWorld|urlname=Unimodal|title=Unimodal}}</ref> == 单峰概率分布 == [[File:Normal distribution pdf.svg|thumb|'''图 1.''' 正态分布的[[概率密度函数]],单峰分布的例子。]] [[File:Bimodal.png|thumb|'''图 2.''' 简单双峰分布。]] [[File:Bimodal geological.PNG|thumb|'''图 3.''' 双峰分布。注意只有最大的峰才对应严格的峰定义。]] [[统计学]]中,'''单峰概率分布'''或'''单峰分布'''是具有单一峰值的[[概率分布]]。“峰”指分布的任何峰值,不仅仅是统计学中通常的[[众数 (数学)|众数]]。 若只有一个峰,则分布函数就是“单峰”的。除此之外都叫做“多峰”(multimodal)。<ref>{{MathWorld|urlname=Mode|title=Mode}}</ref>图 1展示的[[正态分布]]、[[柯西分布]]、[[T分布]]、[[卡方分布]]、[[指数分布]]等都是单峰分布。离散型分布中,[[二项分布]]和[[泊松分布]]可视作单峰分布,但对于某些参数可以在两个相邻值上产生相同的概率。 图 2、图 3展示了双峰分布。 ===其他定义=== 分布函数的单峰性还有其他定义。 对于连续型分布,单峰性可通过[[累积分布函数]](CDF)的行为定义。<ref name=Khinchin>{{cite journal|author=A.Ya. Khinchin|title=On unimodal distributions|journal=Trams. Res. Inst. Math. Mech.|publisher=University of Tomsk|volume=2|issue=2|year=1938|pages=1–7|language=ru}}</ref>若CDF在<math>x<m</math>时是[[凸函数|凸]]的、在<math>x<m</math>时是[[凹函数|凹]]的,则分布就是单峰分布,<math>m</math>为众数。需要注意的是,根据这一定义,[[均匀分布]]也是单峰分布<ref>{{Springer|title=Unimodal distribution|id=U/u095330|first=N.G.|last=Ushakov}}</ref>,任何在一定区间内可取到最大分布的也是单峰分布,如[[梯形分布]]。这一定义通常允许峰处不连续;在连续分布中,任意单一值的概率通常都是0,而这一定义则允许在峰中存在非零概率点。 单峰的标准也可用分布的[[特征函数 (概率论)|特征函数]]<ref name=Khinchin/>或[[拉普拉斯-斯蒂尔切斯变换]]来定义。<ref>{{cite book|title=Random summation: limit theorems and applications|url=https://archive.org/details/randomsummationl0000gned|author=Vladimirovich Gnedenko and Victor Yu Korolev|isbn=0-8493-2875-6|publisher=CRC-Press|year=1996}} p. 31</ref> 定义单峰离散分布的另一种方法是通过概率差序列的变号。<ref>{{cite journal|title=On the unimodality of discrete distributions |journal=Periodica Mathematica Hungarica|first=P. |last=Medgyessy|volume= 2| issue = 1–4 |pages=245–257|date=1972-03|url=http://www.akademiai.com/content/j5012306777g764n/ |doi=10.1007/bf02018665|s2cid=119817256 }}</ref>离散分布的[[概率质量函数]]为<math>\{p_n : n = \dots, -1, 0, 1, \dots\}</math>,若序列<math>\dots, p_{-2} - p_{-1}, p_{-1} - p_0, p_0 - p_1, p_1 - p_2, \dots</math>只有一次变号(不计入零),则称为单峰分布。 ===使用与结果=== 分布的单峰性之所以重要,是因为它可以得到几个重要的结果。下面给出的几个[[不等式]]仅适用于单峰分布,因此评估给定数据集是否来自单峰分布非常重要。[[双峰分布]]条目中给出了几种单峰测试法。 ===不等式=== {{See also|切比雪夫不等式}} ====高斯不等式==== [[高斯不等式]]是第一个重要结果,<ref>{{cite journal|last=Gauss|first=C. F.|author-link=Carl Friedrich Gauss|year=1823|title=Theoria Combinationis Observationum Erroribus Minimis Obnoxiae, Pars Prior|journal=Commentationes Societatis Regiae Scientiarum Gottingensis Recentiores|volume=5}}</ref>给出了值与峰的距离超过给定数的概率的上限,其只能用于单峰分布。 ====维索尚斯基–佩图宁不等式==== 第二个是[[维索尚斯基–佩图宁不等式]],<ref>{{cite journal |author=D. F. Vysochanskij, Y. I. Petunin |year=1980 |title=Justification of the 3σ rule for unimodal distributions |journal=Theory of Probability and Mathematical Statistics |volume=21 |pages=25–36}}</ref>其是[[切比雪夫不等式]]的细化。切比雪夫不等式保证在任何分布中,“几乎所有”值都“接近”均值。而维索尚斯基–佩图宁不等式则将其细化到更接近的值,前提是分布函数为连续单峰的。Sellke与Sellke得出了进一步的结果。<ref>{{Cite journal | last1 = Sellke | first1 = T.M. | last2 = Sellke | first2 = S.H. | title = Chebyshev inequalities for unimodal distributions | url = https://archive.org/details/sim_american-statistician_1997-02_51_1/page/34 | jstor = 2684690 | year = 1997 | journal = [[American Statistician]] | volume = 51 | issue = 1 | pages = 34–40 | publisher = American Statistical Association | doi=10.2307/2684690 }}</ref> ====众数、中位数与平均数==== 高斯在1823年也证明了单峰分布的情形<ref name=Gauss1823>Gauss C.F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae. Pars Prior. Pars Posterior. Supplementum. Theory of the Combination of Observations Least Subject to Errors. Part One. Part Two. Supplement. 1995. Translated by G.W. Stewart. Classics in Applied Mathematics Series, Society for Industrial and Applied Mathematics, Philadelphia</ref> : <math>\sigma \le \omega \le 2 \sigma</math> 及 : <math>|\nu - \mu| \le \sqrt{\frac{3}{4}} \omega ,</math> 其中[[中位数]]是''ν'',平均数是''μ'', ''ω''是与众数的[[均方根误差]]。 对于单峰分布,可以证明中位数''ν''与平均值''μ''在(3/5)<sup>1/2</sup> ≈ 0.7746个[[标准差]]的范围内。<ref name="unimodal">{{cite journal | url=http://epubs.siam.org/doi/pdf/10.1137/S0040585X97975447 | doi=10.1137/S0040585X97975447 | title=The Mean, Median, and Mode of Unimodal Distributions: A Characterization | year=1997 | last1=Basu | first1=S. | last2=Dasgupta | first2=A. | journal=Theory of Probability & Its Applications | volume=41 | issue=2 | pages=210–223 | access-date=2023-09-24 | archive-date=2019-04-29 | archive-url=https://web.archive.org/web/20190429175422/https://epubs.siam.org/doi/pdf/10.1137/S0040585X97975447 | dead-url=no }}</ref>用符号表示, : <math>\frac{|\nu - \mu|}{\sigma} \le \sqrt{\frac{3}{5}}</math> 其中| . |是[[绝对值]]。 2020年,Bernard、Kazzi与Vanduffel通过推导对称分位数均值<math>\frac{ q_\alpha + q_{(1-\alpha)} }{ 2 } </math>与均值<ref name="unimodalbounds">{{cite journal | doi=10.1016/j.insmatheco.2020.05.013 | title=Range Value-at-Risk bounds for unimodal distributions under partial information | year=2020 | last1=Bernard | first1=Carole | last2=Kazzi | first2=Rodrigue | last3=Vanduffel | first3=Steven | journal=Insurance: Mathematics and Economics | volume=94 | pages=9–24 | doi-access=free }}</ref> : <math>\frac{ \left| \frac{ q_\alpha + q_{(1-\alpha)} }{2} - \mu \right| }{ \sigma } \le \left\{ \begin{array}{cl} \frac{\sqrt[]{\frac{4}{9(1-\alpha)}-1} \text{ } + \text{ } \sqrt[]{\frac{1-\alpha}{1/3+\alpha}}}{2} & \text{for }\alpha \in \left[\frac{5}{6},1\right)\!, \\ \frac{\sqrt[]{\frac{3 \alpha}{4-3\alpha}} \text{ } + \text{ } \sqrt[]{\frac{1-\alpha}{1/3+\alpha}}}{2} & \text{for }\alpha \in \left(\frac{1}{6},\frac{5}{6}\right)\!,\\ \frac{\sqrt[]{\frac{3 \alpha}{4-3\alpha}} \text{ } + \text{ } \sqrt[]{\frac{4}{9 \alpha} -1}}{2} & \text{for }\alpha \in \left(0,\frac{1}{6}\right]\!. \end{array} \right.</math> 之间的最大距离,推广了前面的不等式。值得注意的是,<math>\alpha=0.5</math>时最大距离取得最小(即当对称分位均值<math>= q_{0.5} = \nu</math>),这也是选择中位数为均值的稳健估计值的原因之一。此外,当<math>\alpha = 0.5</math>,边界等于<math>\sqrt{3/5}</math>,这时单峰分布中位数和均值距离的最大值。 中位数和众数''θ''也有类似关系:它们位于3<sup>1/2</sup> ≈ 1.732个标准差之内: : <math>\frac{|\nu - \theta|}{\sigma} \le \sqrt{3}.</math> 也可以证明均值和众数相差在3<sup>1/2</sup>之内: : <math>\frac{|\mu - \theta|}{\sigma} \le \sqrt{3}.</math> ====偏度与峰度==== Rohatgi与Szekely声称,单峰分布的[[偏度]]与[[峰度]]可通过不等式相联系:<ref name=Rohatgi1989>{{cite journal | doi=10.1016/0167-7152(89)90035-7 | title=Sharp inequalities between skewness and kurtosis | year=1989 | last1=Rohatgi | first1=Vijay K. | last2=Székely | first2=Gábor J. | journal=Statistics & Probability Letters | volume=8 | issue=4 | pages=297–299 }}</ref> : <math> \gamma^2 - \kappa \le \frac{ 6 }{ 5 } = 1.2 </math> ''κ''为峰度,''γ''为偏度。Klaassen、Mokveld与van Es发现,这只适于部分情形,如众数与均值重合的单峰分布集合。<ref name=Klaassen2000>{{cite journal | doi=10.1016/S0167-7152(00)00090-0 | title=Squared skewness minus kurtosis bounded by 186/125 for unimodal distributions | year=2000 | last1=Klaassen | first1=Chris A.J. | last2=Mokveld | first2=Philip J. | last3=Van Es | first3=Bert | journal=Statistics & Probability Letters | volume=50 | issue=2 | pages=131–135 }}</ref> 他们推导出了一个适用于所有单峰分布的较弱不等式:<ref name=Klaassen2000 /> : <math> \gamma^2 - \kappa \le \frac{ 186 }{ 125 } = 1.488 </math> 这个界限很锐,因为它是[0, 1]上的均匀分布和{0}处的离散分布的等权混合。 ==单峰函数== “峰”适用于数据集合概率分布,而非一般[[函数]],所以上述定义并不适用。“单峰”的定义可扩展到[[实数]]函数。 通常定义如下:若对某值''m'',函数''f''(''x'')在<math>x\le m</math>时[[单调函数|单调]]递增、在<math>x\ge m</math>时单调递减,则为'''单峰函数'''。也就是说,''f''(''x'')的[[最值|最大值]]为''f''(''m''),且没有其他极大值。 证明单峰性通常很难。一种方法是利用定义,但这只适用于简单函数。还有基于[[导数]]的通用方法<ref>{{cite web|url=http://homepage.univie.ac.at/thibaut.barthelemy/METRIC.pdf|title=On the unimodality of METRIC Approximation subject to normally distributed demands.|work=Method in appendix D, Example in theorem 2 page 5|access-date=2013-08-28|archive-date=2017-08-09|archive-url=https://web.archive.org/web/20170809060455/http://homepage.univie.ac.at/thibaut.barthelemy/METRIC.pdf|dead-url=no}}</ref>,但并不适用于每个函数。 单峰函数有二次项系数为负的[[二次函数]]、[[帐篷映射]]等等。 上述情形有时被称为'''{{visible anchor|强单调性}}'''。如有值''m''使<math>x\le m</math>时,函数''f''(''x'')弱单调递增;<math>x\ge m</math>时,函数''f''(''x'')弱单调递减,则称函数为'''弱单峰函数'''。这时,''x''存在可取到最大值''f''(''m'')的区间。[[杨辉三角]]的每一行都是弱单峰函数。 单峰函数也可以指只有一个极小值的函数。<ref>{{cite web|url=https://glossary.informs.org/indexVer1.php?page=U.html|title=Mathematical Programming Glossary.|access-date=2020-03-29|archive-date=2022-03-28|archive-url=https://web.archive.org/web/20220328222757/https://glossary.informs.org/indexVer1.php?page=U.html|dead-url=no}}</ref>例如,数值优化中的[[局部单峰抽样]]经常用这样的函数演示。可以说,这种推广下的单峰函数具有单一局部极值。 单峰函数的重要特性之一是,可以使用[[黄金分割搜索]]、[[三份查找]]或[[逐次抛物线插值]]等[[搜索算法]]找到最值。<ref>{{Cite book |last1=Demaine |first1=Erik D. |last2=Langerman |first2=Stefan |title=Algorithms – ESA 2005 |chapter=Optimizing a 2D Function Satisfying Unimodality Properties |series=Lecture Notes in Computer Science |date=2005 |volume=3669 |editor-last=Brodal |editor-first=Gerth Stølting |editor2-last=Leonardi |editor2-first=Stefano |chapter-url=https://link.springer.com/chapter/10.1007/11561071_78 |language=en |location=Berlin, Heidelberg |publisher=Springer |pages=887–898 |doi=10.1007/11561071_78 |isbn=978-3-540-31951-1 |access-date=2023-09-24 |archive-date=2023-07-09 |archive-url=https://web.archive.org/web/20230709012435/https://link.springer.com/chapter/10.1007/11561071_78 |dead-url=no }}</ref> ==其他推广== 若<math>\forall x \ne c</math>[[施瓦兹导数]]均为负,则函数''f''(''x'')是“S-单峰”(常称为“S-单峰映射”)函数,其中<math>c</math>是临界点。<ref>See e.g. {{cite journal|title=Distortion of S-Unimodal Maps|url=https://archive.org/details/sim_annals-of-mathematics_1990-07_132_1/page/71|author1=John Guckenheimer |author2=Stewart Johnson |journal=Annals of Mathematics |series=Second Series|volume=132|number=1|date=July 1990|pages=71–130|doi=10.2307/1971501|jstor=1971501 }}</ref> [[计算几何]]中,单峰函数可以设计出高效的找到极值的算法。<ref>{{cite journal|author=Godfried T. Toussaint|title=Complexity, convexity, and unimodality|journal=International Journal of Computer and Information Sciences|volume=13|number=3|date=June 1984|pages=197–217|doi=10.1007/bf00979872|s2cid=11577312 }}</ref> 适用于向量自变量''X''的函数''f''(''X'')的更一般定义是,若存在[[可微函数|可微]][[单射]]''X'' = ''G''(''Z'')使''f''(''G''(''Z''))为凸函数,则''f''是单峰函数。通常,我们希望''G''(''Z'')连续可微,且有可逆雅各布矩阵。 [[拟凸函数]]和拟凹函数将单峰性推广到参数属于高维[[欧几里得空间]]的函数。 ==另见== *[[双峰分布]] ==参考文献== {{Reflist|2}} [[Category:函数]] [[Category:数学关系]] [[Category:概率分布理论]]
该页面使用的模板:
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:Cite web
(
查看源代码
)
Template:MathWorld
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:See also
(
查看源代码
)
Template:Springer
(
查看源代码
)
Template:Visible anchor
(
查看源代码
)
返回
单峰
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息