卜瓦松二項分布

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA

Template:Infobox 機率分佈

機率论统计学中,卜瓦松二项分布是一個基於独立伯努利试验之和的离散機率分布。这一概念以西梅翁·德尼·泊松的名字命名。

换句话说,它是成功概率分別為p1,p2,,pnn独立伯努利试验中,成功次数的機率分布。普通二项分布是卜瓦松二项分布在所有成功機率相同(即p1=p2==pn)时的特例。

定義

機率质量函数

n次试验中有k次成功的機率可以写为以下总和[1]

Pr(K=k)=AFkiApijAc(1pj)

其中Fk是 {1,2,3,..., n } 的全體k元子集的集合。例如,如果n = 3,那么F2={{1,2},{1,3},{2,3}}AcA补集,也就是Ac={1,2,3,,n}A

Fk将包含n!/((nk)!k!)個元素,因此上述总和在實務中是很難計算的,除非试验次数n很小(例如,如果n = 30,F15包含超过1020个元素)。然而,还有其他更有效的方法可以计算Pr(K=k)

只要成功機率都不等于 1,就可以使用递归公式计算出k次成功的機率:[2][3]

Pr(K=k)={i=1n(1pi)k=01ki=1k(1)i1Pr(K=ki)T(i)k>0

其中

T(i)=j=1n(pj1pj)i.

递归公式在数值上不稳定,在n约大于20時应避免使用。另一种方法是使用分治算法:假设n=2b是2的幂,並以f(pi:j)表示成功概率為pi,,pj的卜瓦松二项分布,*表示卷积,則f(p1:2b)=f(p1:2b1)*f(p2b1+1:2b)

另一种可能性是使用离散傅立叶变换[4]

Pr(K=k)=1n+1l=0nClkm=1n(1+(Cl1)pm)

其中C=exp(2iπn+1)i=1

Chen和Liu在“卜瓦松二项式和条件伯努利分布的统计应用”中描述了其他方法。 [5]

特性

均值和方差

由于卜瓦松二项式分布變數是n个独立伯努利分布變數的总和,因此其均值和方差将是n个伯努利分布的均值和方差之和:

μ=i=1npi
σ2=i=1n(1pi)pi

當平均值(μ)和次數(n)為定值,且所有成功機率相等時,我们會得到二项式分布,變異數此時最大。当平均值固定时,變異數的上界為具有相同均值的卜瓦松分布的變異數,該上界在n趋于无穷大時可以渐近取得。Template:Citation needed

卜瓦松二項式分佈的沒有簡單的公式,但熵的上限是具有相同數字參數和相同均值的二項式分佈的熵。因此,熵也不大於相同均值的卜瓦松分佈的熵。

謝普-奧爾金凹性猜想由Template:LeTemplate:Le於1981年提出,指出卜瓦松二項式分佈的熵是成功機率p1,p2,,pn的凹函數。這個猜想由 Erwan Hillion 和 Oliver Johnson 於2015年證明。1981年同一篇論文亦提出謝普-奧爾金單調性猜想:若pi1/2,則熵對pi為單調遞增。這個猜想也被 Hillion 和 Johnson 於 2019 年證明。

參考資料