对数正态分布

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA Template:Infobox 機率分佈概率论统计学中,任意随机变量对数服从正态分布,则这个随机变量服从的分布称为对数正态分布。如果 Y 是正态分布的随机变量,则 exp(Y)指数函数)为对数正态分布;同样,如果 X 是对数正态分布,则 lnX为正态分布。 如果一个变量可以看作是许多很小独立因子的乘积,则这个变量可以看作是对数正态分布。一个典型的例子是股票投资的长期收益率,它可以看作是每天收益率的乘积。 对于 x>0,对数正态分布的概率密度函数

f(x;μ,σ)=1xσ2πe(lnxμ)2/2σ2

其中 μσ 分别是变量对数平均值標準差。它的期望值

E(X)=eμ+σ2/2

方差

var(X)=(eσ21)e2μ+σ2.

给定期望值与方差,也可以用这个关系求 μσ

μ=ln(E(X))12ln(1+var(X)E(X)2),
σ2=ln(1+var(X)E(X)2).

与几何平均值和几何标准差的关系

对数正态分布、几何平均数几何標準差是相互关联的。在这种情况下,几何平均值等于 exp(μ),几何標準差等于 exp(σ)

如果采样数据来自于对数正态分布,则几何平均值与几何标准差可以用于估计置信区间,就像用算术平均数与标准差估计正态分布的置信区间一样。

置信区间界 对数空间 几何
3σ 下界 μ3σ μgeo/σgeo3
2σ 下界 μ2σ μgeo/σgeo2
1σ 下界 μσ μgeo/σgeo
1σ 上界 μ+σ μgeoσgeo
2σ 上界 μ+2σ μgeoσgeo2
3σ 上界 μ+3σ μgeoσgeo3

其中几何平均数 μgeo=exp(μ),几何標準差 σgeo=exp(σ)

原始为:

μ1=eμ+σ2/2
μ2=e2μ+4σ2/2
μ3=e3μ+9σ2/2
μ4=e4μ+16σ2/2

或者更为一般的矩

μk=ekμ+k2σ2/2.

局部期望

随机变量 X 在阈值 k 上的局部期望定义为

g(k)=k(xk)f(x)dx

其中 f(x) 是概率密度。对于对数正态概率密度,这个定义可以表示为

g(k)=exp(μ+σ2/2)Φ(ln(k)+μ+σ2σ)kΦ(ln(k)+μσ)

其中 Φ 是标准正态部分的累积分布函数。对数正态分布的局部期望在保险业及经济领域都有应用,著名的Black-Scholes期权定价公式便可由此推导出。

参数的最大似然估计

为了确定对数正态分布参数 μσ最大似然估计,我们可以采用与正态分布参数最大似然估计同样的方法。我们来看

fL(x;μ,σ)=1xfN(lnx;μ,σ)

其中用 fL() 表示对数正态分布的概率密度函数,用 fN()— 表示正态分布。因此,用与正态分布同样的指数,我们可以得到对数最大似然函数:

L(μ,σ|x1,x2,...,xn)=klnxk+N(μ,σ|lnx1,lnx2,,lnxn)= =constant+N(μ,σ|lnx1,lnx2,,lnxn).

由于第一项相对于 μσ 来说是常数,两个对数最大似然函数 LN 在同样的 μσ 处有最大值。因此,根据正态分布最大似然参数估计器的公式以及上面的方程,我们可以推导出对数正态分布参数的最大似然估计

μ^=klnxkn, σ^2=k(lnxkμ^)2n.

相关分布

  • 如果 Y=ln(X)XLog-N(μ,σ2),则 YN(μ,σ2)正态分布
  • 如果 XmLog-N(μ,σm2), m=1...n 是有同样 μ 参数、而 σ 可能不同的统计独立对数正态分布变量 ,并且 Y=m=1nXm,则 Y 也是对数正态分布变量:YLog-N(nμ,m=1nσm2)

进一步的阅读资料

参考文献

参见

Template:概率分布类型列表