卜瓦松分布

来自testwiki
imported>Hohomi2025年2月11日 (二) 10:19的版本 (添加前提假设)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

Template:NoteTA

Template:機率分佈

泊松分布Template:Lang-frTemplate:Lang-en)又稱Poisson分布-{zh-cn:帕松; zh-tw:泊松; zh-hk:帕松;}-分布布瓦松分布布阿松分布普阿松分布波以松分布卜氏分布帕松小數法則(Poisson law of small numbers),是一種統計概率學裡常見到的離散機率分布,由法國數學家西莫恩·德尼·泊松在1838年時發表。

泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、雷射的光子數分布等等。(單位時間內發生的次數,可以看作事件發生的頻率,類似物理的頻率f)。

泊松分布的機率質量函数为:

P(X=k)=eλλkk!

泊松分布的参数λ是随机事件发生次数的数学期望值。

记号

X服从参数为λ的泊松分布,记为Xπ(λ),或记为XPoisson(λ).

假设

如果以下假设成立,则适用泊松分布:

1、k 是一个非负整数,是某个事件在某个时间间隔内发生的次数。

2、一个事件的发生不会影响第二个事件的概率。

3、事件发生的平均速率与任何事件的发生无关。

4、两个事件不可能在同一时刻发生。

如果这些条件成立,则 k 是泊松随机变量;k 的分布是泊松分布。

性质

1、服从泊松分布的随机变量,其数学期望方差相等,同为参数λ : E(X)=V(X)=λ

2、兩個獨立且服从泊松分布的随机变量,其和仍然服从泊松分布。更精確地說,若 XPoisson(λ1)YPoisson(λ2),則X+YPoisson(λ1+λ2)。反過來若兩個獨立隨機變量的和服從卜瓦松分布,則這兩個隨機變量經平移後皆服從卜瓦松分布(Template:Le)。

3、其動差母函數为:

MX(t)=E[etX]=x=0etxeλλxx!=eλx=0(etλ)xx!=eλ(et1)

推導

期望值:(倒數第三至第二是使用泰勒展開式)

E(X)=i=0iP(X=i)=i=1ieλλii!=λeλi=1λi1(i1)!=λeλi=0λii!=λeλeλ=λ

E(X2)=i=0i2P(X=i)=i=1i2eλλii!=λeλi=1iλi1(i1)!=λeλi=11(i1)!ddλ(λi)=λeλddλ[i=1λi(i1)!]=λeλddλ[λi=1λi1(i1)!]=λeλddλ(λeλ)=λeλ(eλ+λeλ)=λ+λ2

我們可以得到:Var(X)=(λ+λ2)λ2=λ

如同性質:E(X)=Var(X)=λσX=λTemplate:-

相互獨立的卜瓦松分佈隨機變數之和仍服從卜瓦松分佈:

XPoisson(λ1),YPoisson(λ2).

P(X=k1)=λ1k1eλ1k1!,P(Y=k2)=λ2k2eλ2k2!.

P(X+Y=k)=i=0kP(X=i)P(Y=ki)=i=0kλ1iλ2kie(λ1+λ2)i!(ki)!=e(λ1+λ2)k!i=0kCkiλ1iλ2ki=e(λ1+λ2)(λ1+λ2)kk!

X+YPoisson(λ1+λ2)


泊松分布的来源(泊松小数定律)

二项分布伯努利试验中,如果试验次数n很大,二项分布的概率p很小,且乘积λ=np比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散時間上的对应物。

证明如下。首先,回顾自然對數e的定义:

limn(1λn)n=eλ,

二项分布的定义:

P(X=k)=(nk)pk(1p)nk

如果令p=λnn趋于无穷时P的极限:

limnP(X=k)=limn(nk)pk(1p)nk=limnn!(nk)!k!(λn)k(1λn)nk=limn[n!nk(nk)!]F(λkk!)(1λn)nexp(λ)(1λn)k1=limn[(11n)(12n)(1k1n)]1(λkk!)(1λn)nexp(λ)(1λn)k1=(λkk!)exp(λ)

最大似然估計(MLE)

给定n个样本值ki,希望得到从中推测出总体的泊松分布参数λ的估计。为计算最大似然估计值,列出对数似然函数:

L(λ)=lni=1nf(kiλ)=i=1nln(eλλkiki!)=nλ+(i=1nki)ln(λ)i=1nln(ki!).
ddλL(λ)=0n+(i=1nki)1λ=0.

解得λ从而得到一个驻点(stationary point):

λ^MLE=1ni=1nki.

检查函数L的二阶导数,发现对所有的λki大于零的情况二阶导数都为负。因此求得的驻点是对数似然函数L的极大值点:

2Lλ2=i=1nλ2ki

例子

对某公共汽车站的客流做调查,统计了某天上午10:30到11:47来到候车的乘客情况。假定来到候车的乘客各批(每批可以是1人也可以是多人)是互相独立发生的。观察每20秒区间来到候车的乘客批次,共观察77分钟*3=231次,共得到230个观察记录。其中来到0批、1批、2批、3批、4批及4批以上的观察记录分别是100次、81次、34次、9次、6次。使用极大似真估计(MLE),得到λ的估计为81×1+34×2+9×3+6×42300.87

生成泊松分布的随机变量

一个用来生成随机泊松分布的数字(伪随机数抽样)的简单算法,已经由高德纳给出(见下文参考):

algorithm poisson random number (Knuth):
    init:
         Let L ← e−λ, k ← 0 and p ← 1.
    do:
         k ← k + 1.
         Generate uniform random number u in [0,1] and let p ← p×u.
    while p > L.
    return k − 1.

尽管简单,但复杂度是线性的,在返回的值k,平均是λ。还有许多其他算法来克服这一点。有些人由Ahrens和Dieter给出,请参阅下面的参考资料。同样,对于较大的λ值,eλ可能导致数值稳定性问题。对于较大λ值的一种解决方案是拒绝采样,另一种是采用泊松分布的高斯近似。

对于很小的λ值,逆变换取样简单而且高效,每个样本只需要一个均匀随机数u。直到有超过u的样本,才需要检查累积概率。

algorithm Poisson generator based upon the inversion by sequential search:[1]
    init:
         Let x ← 0, p ← e−λ, s ← p.
         Generate uniform random number u in [0,1].
    do:
         x ← x + 1.
         p ← p * λ / x.
         s ← s + p.
    while u > s.
    return x.

参见

参考文献

引用

Template:Reflist

来源

Template:ReflistH

Template:ReflistF

Template:- Template:常见一元概率分布 Template:概率分布类型列表

  1. Luc Devroye, Non-Uniform Random Variate Generation(Springer-Verlag, New York, 1986), chapter 10, page 505 -{R|http://luc.devroye.org/rnbookindex.html}- Template:Wayback