指数分布

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA Template:機率分佈

機率論統計學中,指數分布Template:Lang-en)是一種連續機率分佈。指數分布可以用来建模平均发生率恒定、连续、独立的事件發生的間隔,比如旅客進入機場的時間間隔、電話打進客服中心的時間間隔、中文維基百科新條目出現的時間間隔、機器的壽命等。

記號

指數分布即形狀母數α為1的伽瑪分布

若隨機變數X服从母數為λβ的指数分布,則記作

XExp(λ)XExp(β)

兩者意義相同,只是λβ互為倒數關係。只要將以下式子做λ=1β的替換即可,即,指數分布之機率密度函數為:

f(x;λ)={λeλxx0,0,x<0.

f(x;β)={1βe1βxx0,0,x<0.


累积分布函数為:

F(x;λ)={1eλx,x0,0,x<0.

F(x;β)={1e1βx,x0,0,x<0.


其中λ>0是分布的母數,即每单位时间发生该事件的次数;β為比例母數,即該事件在每單位時間內的發生率。兩者常被称为率参数(rate parameter)。指数分布的区间是[0,∞)。

特性

期望值与變異數

随机变量X (X母數為λ或β) 的期望值是:

𝐄(X)=1λ=β

例如:如果你平均每个小时接到2次电话,那么你预期等待每一次电话的时间是半个小时。

X方差是:

𝐕𝐚𝐫(X)=1λ2=β2

X偏態系数是: V[X] = 1

无记忆性

指数函数的一个重要特征是无记忆性(Memoryless Property,又稱遺失記憶性)。这表示如果一个随机变量呈指数分布,它的条件概率遵循:

P(T>s+t|T>t)=P(T>s)for all s,t0.

与泊松过程的关系

泊松過程是一种重要的随机过程。泊松過程中,第k次随机事件与第k+1次随机事件出现的时间间隔服从指数分布。而根据泊松過程的定义,长度为t的时间段内没有随机事件出现的概率等于

eλt(λt)00!=eλt,

长度为t的时间段内随机事件发生一次的概率等于 eλt(λt)11!=eλtλt, 所以第k次随机事件之后长度为t的时间段内,第k+n次 (n=1, 2, 3,...)随机事件出现的概率等于1eλt。这是指数分布。这还表明了泊松过程的无记忆性。

四分位数

率参数λ的四分位数函数(Quartile function)是:

F1(p;λ)=ln(1p)λ,0p<1
  • 第一四分位数:ln(4/3)/λ
  • 中位数ln(2)/λ
  • 第三四分位数:ln(4)/λ

因此,四分位距為ln(3)/λ

参数估计

最大概似法

给定独立同分布样本x = (x1, ..., xn),λ的似然函数(Likelihood function)是:

L(λ)=i=1nλexp(λxi)=λnexp(λi=1nxi)=λnexp(λnx)

其中:

x=1ni=1nxi是样本期望値。

似然函数对数导数是:

ddλlnL(λ)=ddλ(nln(λ)λnx)=nλnx {>0if 0<λ<1/x,=0if λ=1/x,<0if λ>1/x.

参数λ的最大概似估計(Maximum likelihood)值是:

λ^=1x

參見

参考文獻

  1. Donald E. Knuth (1998). The Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn. Boston: Addison-Wesley. ISBN 0-201-89684-2. pp. 133
  2. Luc Devroye (1986). Non-Uniform Random Variate Generation. New York: Springer-Verlag. ISBN 0-387-96305-7. pp. 392–401

外部連結

Template:- Template:概率分布类型列表