卜瓦松二項分布
在機率论和统计学中,卜瓦松二项分布是一個基於独立伯努利试验之和的离散機率分布。这一概念以西梅翁·德尼·泊松的名字命名。
换句话说,它是成功概率分別為的n次独立伯努利试验中,成功次数的機率分布。普通二项分布是卜瓦松二项分布在所有成功機率相同(即)时的特例。
定義
機率质量函数
n次试验中有k次成功的機率可以写为以下总和[1]
其中是 {1,2,3,..., n } 的全體k元子集的集合。例如,如果n = 3,那么。是的补集,也就是。
将包含個元素,因此上述总和在實務中是很難計算的,除非试验次数n很小(例如,如果n = 30,包含超过1020个元素)。然而,还有其他更有效的方法可以计算。
只要成功機率都不等于 1,就可以使用递归公式计算出k次成功的機率:[2][3]
其中
递归公式在数值上不稳定,在约大于20時应避免使用。另一种方法是使用分治算法:假设是2的幂,並以表示成功概率為的卜瓦松二项分布,表示卷积,則。
其中,。
Chen和Liu在“卜瓦松二项式和条件伯努利分布的统计应用”中描述了其他方法。 [5]
特性
均值和方差
由于卜瓦松二项式分布變數是n个独立伯努利分布變數的总和,因此其均值和方差将是n个伯努利分布的均值和方差之和:
當平均值()和次數(n)為定值,且所有成功機率相等時,我们會得到二项式分布,變異數此時最大。当平均值固定时,變異數的上界為具有相同均值的卜瓦松分布的變異數,該上界在n趋于无穷大時可以渐近取得。Template:Citation needed
熵
卜瓦松二項式分佈的熵沒有簡單的公式,但熵的上限是具有相同數字參數和相同均值的二項式分佈的熵。因此,熵也不大於相同均值的卜瓦松分佈的熵。
謝普-奧爾金凹性猜想由Template:Le和Template:Le於1981年提出,指出卜瓦松二項式分佈的熵是成功機率的凹函數。這個猜想由 Erwan Hillion 和 Oliver Johnson 於2015年證明。1981年同一篇論文亦提出謝普-奧爾金單調性猜想:若,則熵對為單調遞增。這個猜想也被 Hillion 和 Johnson 於 2019 年證明。