单峰

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA 数学中,单峰意味着拥有唯一的众数。更一般地说,单峰意味着数学对象只有唯一的最大值。[1]

单峰概率分布

图 1. 正态分布的概率密度函数,单峰分布的例子。
图 2. 简单双峰分布。
图 3. 双峰分布。注意只有最大的峰才对应严格的峰定义。

统计学中,单峰概率分布单峰分布是具有单一峰值的概率分布。“峰”指分布的任何峰值,不仅仅是统计学中通常的众数

若只有一个峰,则分布函数就是“单峰”的。除此之外都叫做“多峰”(multimodal)。[2]图 1展示的正态分布柯西分布T分布卡方分布指数分布等都是单峰分布。离散型分布中,二项分布泊松分布可视作单峰分布,但对于某些参数可以在两个相邻值上产生相同的概率。

图 2、图 3展示了双峰分布。

其他定义

分布函数的单峰性还有其他定义。

对于连续型分布,单峰性可通过累积分布函数(CDF)的行为定义。[3]若CDF在x<m时是的、在x<m时是的,则分布就是单峰分布,m为众数。需要注意的是,根据这一定义,均匀分布也是单峰分布[4],任何在一定区间内可取到最大分布的也是单峰分布,如梯形分布。这一定义通常允许峰处不连续;在连续分布中,任意单一值的概率通常都是0,而这一定义则允许在峰中存在非零概率点。

单峰的标准也可用分布的特征函数[3]拉普拉斯-斯蒂尔切斯变换来定义。[5]

定义单峰离散分布的另一种方法是通过概率差序列的变号。[6]离散分布的概率质量函数{pn:n=,1,0,1,},若序列,p2p1,p1p0,p0p1,p1p2,只有一次变号(不计入零),则称为单峰分布。

使用与结果

分布的单峰性之所以重要,是因为它可以得到几个重要的结果。下面给出的几个不等式仅适用于单峰分布,因此评估给定数据集是否来自单峰分布非常重要。双峰分布条目中给出了几种单峰测试法。

不等式

Template:See also

高斯不等式

高斯不等式是第一个重要结果,[7]给出了值与峰的距离超过给定数的概率的上限,其只能用于单峰分布。

维索尚斯基–佩图宁不等式

第二个是维索尚斯基–佩图宁不等式[8]其是切比雪夫不等式的细化。切比雪夫不等式保证在任何分布中,“几乎所有”值都“接近”均值。而维索尚斯基–佩图宁不等式则将其细化到更接近的值,前提是分布函数为连续单峰的。Sellke与Sellke得出了进一步的结果。[9]

众数、中位数与平均数

高斯在1823年也证明了单峰分布的情形[10]

σω2σ

|νμ|34ω,

其中中位数ν,平均数是μω是与众数的均方根误差

对于单峰分布,可以证明中位数ν与平均值μ在(3/5)1/2 ≈ 0.7746个标准差的范围内。[11]用符号表示,

|νμ|σ35

其中| . |是绝对值

2020年,Bernard、Kazzi与Vanduffel通过推导对称分位数均值qα+q(1α)2与均值[12]

|qα+q(1α)2μ|σ{49(1α)1 + 1α1/3+α2for α[56,1),3α43α + 1α1/3+α2for α(16,56),3α43α + 49α12for α(0,16].

之间的最大距离,推广了前面的不等式。值得注意的是,α=0.5时最大距离取得最小(即当对称分位均值=q0.5=ν),这也是选择中位数为均值的稳健估计值的原因之一。此外,当α=0.5,边界等于3/5,这时单峰分布中位数和均值距离的最大值。

中位数和众数θ也有类似关系:它们位于31/2 ≈ 1.732个标准差之内:

|νθ|σ3.

也可以证明均值和众数相差在31/2之内:

|μθ|σ3.

偏度与峰度

Rohatgi与Szekely声称,单峰分布的偏度峰度可通过不等式相联系:[13]

γ2κ65=1.2

κ为峰度,γ为偏度。Klaassen、Mokveld与van Es发现,这只适于部分情形,如众数与均值重合的单峰分布集合。[14]

他们推导出了一个适用于所有单峰分布的较弱不等式:[14]

γ2κ186125=1.488

这个界限很锐,因为它是[0, 1]上的均匀分布和{0}处的离散分布的等权混合。

单峰函数

“峰”适用于数据集合概率分布,而非一般函数,所以上述定义并不适用。“单峰”的定义可扩展到实数函数。

通常定义如下:若对某值m,函数f(x)在xm单调递增、在xm时单调递减,则为单峰函数。也就是说,f(x)的最大值f(m),且没有其他极大值。

证明单峰性通常很难。一种方法是利用定义,但这只适用于简单函数。还有基于导数的通用方法[15],但并不适用于每个函数。

单峰函数有二次项系数为负的二次函数帐篷映射等等。

上述情形有时被称为Template:Visible anchor。如有值m使xm时,函数f(x)弱单调递增;xm时,函数f(x)弱单调递减,则称函数为弱单峰函数。这时,x存在可取到最大值f(m)的区间。杨辉三角的每一行都是弱单峰函数。

单峰函数也可以指只有一个极小值的函数。[16]例如,数值优化中的局部单峰抽样经常用这样的函数演示。可以说,这种推广下的单峰函数具有单一局部极值。

单峰函数的重要特性之一是,可以使用黄金分割搜索三份查找逐次抛物线插值搜索算法找到最值。[17]

其他推广

xc施瓦兹导数均为负,则函数f(x)是“S-单峰”(常称为“S-单峰映射”)函数,其中c是临界点。[18] 计算几何中,单峰函数可以设计出高效的找到极值的算法。[19]

适用于向量自变量X的函数f(X)的更一般定义是,若存在可微单射X = G(Z)使f(G(Z))为凸函数,则f是单峰函数。通常,我们希望G(Z)连续可微,且有可逆雅各布矩阵。

拟凸函数和拟凹函数将单峰性推广到参数属于高维欧几里得空间的函数。

另见

参考文献

Template:Reflist

  1. Template:MathWorld
  2. Template:MathWorld
  3. 3.0 3.1 Template:Cite journal
  4. Template:Springer
  5. Template:Cite book p. 31
  6. Template:Cite journal
  7. Template:Cite journal
  8. Template:Cite journal
  9. Template:Cite journal
  10. Gauss C.F. Theoria Combinationis Observationum Erroribus Minimis Obnoxiae. Pars Prior. Pars Posterior. Supplementum. Theory of the Combination of Observations Least Subject to Errors. Part One. Part Two. Supplement. 1995. Translated by G.W. Stewart. Classics in Applied Mathematics Series, Society for Industrial and Applied Mathematics, Philadelphia
  11. Template:Cite journal
  12. Template:Cite journal
  13. Template:Cite journal
  14. 14.0 14.1 Template:Cite journal
  15. Template:Cite web
  16. Template:Cite web
  17. Template:Cite book
  18. See e.g. Template:Cite journal
  19. Template:Cite journal