后验概率

来自testwiki
imported>InternetArchiveBot2021年10月8日 (五) 15:13的版本 (Add 1 book for verifiability (20211007)) #IABot (v2.0.8.1) (GreenC bot
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

Template:Expand Template:NoteTA贝叶斯统计中,一个随机事件或者一个不确定事件的后验概率(Posterior probability)是在考虑和给出相关证据或数据后所得到的条件概率。同样,后验概率分布是一个未知量(视为随机变量)基于试验和调查后得到的概率分布。“后验”在本文中代表考虑了被测试事件的相关证据。 Template:各地中文名

定义

后验概率是在给定证据X后,参数θ的概率:p(θ|X)

似然函数相对,其为在给定了参数θ后,证据X的概率:p(X|θ)

两者有以下联系:

首先定义先验概率服从以下概率分布函数p(θ),则样本x的似然性为p(x|θ),那么后验概率可以定义为

p(θ|x)=p(x|θ)p(θ)p(x)[1]

此处p(x)为标准化常量,对于连续的θ,按如下方法计算

p(x)=p(x|θ)p(θ)dθ

对于离散的θ,应对所有可能的θ取值求和p(x|θ)p(θ)

因此,后验概率与似然性先验概率的乘积是成比例的

实例

假设一个学校裡有60%男生和40%女生。女生穿裤子的人数和穿裙子的人数相等,所有男生穿裤子。一个人在远处随机看到了一个穿裤子的学生。那么这个学生是女生的概率是多少?

使用贝叶斯定理,事件A是看到女生,事件B是看到一个穿裤子的学生。我们所要计算的是P(A|B)。

P(A)是忽略其它因素,看到女生的概率,在这里是40%

P(A')是忽略其它因素,看到不是女生(即看到男生)的概率,在这里是60%

P(B|A)是女生穿裤子的概率,在这里是50%

P(B|A')是男生穿裤子的概率,在这里是100%

P(B)是忽略其它因素,学生穿裤子的概率,P(B) = P(B|A)P(A) + P(B|A')P(A'),在这里是Template:Nowrap.

根据贝叶斯定理,我们计算出后验概率P(A|B)

P(A|B)=P(B|A)P(A)P(B)=0.5×0.40.8=0.25

可见,后验概率实际上就是条件概率。

计算

根据贝叶斯定理,一个随机变量在给定另一随机变量值之后的后验概率分布可以通过先验概率分布似然函数相乘并除以归一化常数求得

fXY=y(x)=fX(x)LXY=y(x)fX(u)LXY=y(u)du

上式为给出了随机变量X在给定数据Y=y后的后验概率分布函数,式中

  • fX(x)X的先验密度函数,
  • LXY=y(x)=fYX=x(y)x的似然函数,
  • fX(u)LXY=y(u)du为归一化常数,
  • fXY=y(x)为考虑了数据Y=yX的后验密度函数。

置信区间

后验概率是考虑了一系列随机观测数据的条件概率。对于一个随机变量来说,量化其不确定性非常重要。其中一个实现方法便是提供其后验概率的置信区间

参见

引用

Template:Reflist

Template:Statistics