吉布斯采样

吉布斯采样（Template:Lang-en）是统计学中用于马尔科夫蒙特卡洛（MCMC）的一种算法，用于在难以直接采样时从某一多变量概率分布中近似抽取样本序列。该序列可用于近似联合分布、部分变量的边缘分布或计算积分（如某一变量的期望值）。某些变量可能为已知变量，故对这些变量并不需要采样。

吉布斯采样常用于统计推断（尤其是贝叶斯推断）之中。这是一种随机化算法，与最大期望算法等统计推断中的确定性算法相区别。与其他MCMC算法一样，吉布斯采样从马尔科夫链中抽取样本，可以看作是Metropolis–Hastings算法的特例。

该算法的名称源于约西亚·威拉德·吉布斯，由Template:Le与Template:Le兄弟于1984年提出。^[1]

演算法

吉布斯采样适用于条件分布比边缘分布更容易采样的多变量分布。假设我们需要从联合分布 $p (x_{1}, \dots, x_{n})$ 中抽取 $𝐗 = (x_{1}, \dots, x_{n})$ 的 $k$ 个样本。记第 $i$ 个样本为 $𝐗^{(i)} = (x_{1}^{(i)}, \dots, x_{n}^{(i)})$ 。吉布斯采样的过程则为：

确定初始值 $𝐗^{(1)}$ 。
假设已得到样本 $𝐗^{(i)}$ ，记下一个样本为 $𝐗^{(i + 1)} = (x_{1}^{(i + 1)}, x_{2}^{(i + 1)}, \dots, x_{n}^{(i + 1)})$ 。于是可将其看作一个向量，对其中某一分量 $x_{j}^{(i + 1)}$ ，可通过在其他分量已知的条件下该分量的概率分布来抽取该分量。对于此条件概率，我们使用样本 $𝐗^{(i + 1)}$ 中已得到的分量 $x_{1}^{(i + 1)}$ 到 $x_{j - 1}^{(i + 1)}$ 以及上一样本 $𝐗^{(i)}$ 中的分量 $x_{j + 1}^{(i)}$ 到 $x_{n}^{(i)}$ ，即 $p (x_{j}^{(i + 1)} | x_{1}^{(i + 1)}, \dots, x_{j - 1}^{(i + 1)}, x_{j + 1}^{(i)}, \dots, x_{n}^{(i)})$ 。
重复上述过程 $k$ 次。

在采样完成后，我们可以用这些样本来近似所有变量的联合分布。如果仅考虑其中部分变量，则可以得到这些变量的边缘分布。此外，我们还可以对所有样本求某一变量的平均值来估计该变量的期望。

参见

参考文献

Template:Reflist

Template:Citation
Bolstad, William M. (2010), Understanding Computational Bayesian Statistics, John Wiley Template:ISBN
Template:Cite journal
Template:Citation
Gelman, A., Carlin J. B., Stern H. S., Dunson D., Vehtari A., Rubin D. B. (2013), Bayesian Data Analysis, third edition. London: Chapman & Hall.
Levin, David A.; Peres, Yuval; Wilmer, Elizabeth L. (2008), "Markov Chains and Mixing Times", American Mathematical Society.
Robert, C. P.; Casella, G. (2004), Monte Carlo Statistical Methods (second edition), Springer-Verlag.

↑ Template:Cite journal

[1] Template:Cite journal

[1]

吉布斯采样

演算法

参见

参考文献

导航菜单

搜索