贝叶斯多元线性回归

来自testwiki
跳转到导航 跳转到搜索

Template:回归侧栏 统计学中,贝叶斯多元线性回归是一种多元线性回归(预测结果为相关随机变量向量,而非标量随机变量的线性回归)的贝叶斯推断方法。这种方法的更一般论述见最小均方误差

细节

考虑一回归问题,其中需要预测的自变量不是实标量而是相关实数组成的m维向量。与标准回归设置一样,有n个观测值,其中每个观测i包含k−1个解释变量,归为k维向量𝐱i(添加值为1的虚拟变量,以允许截距系数)。对每个观测i,可以视作m个相关回归问题: yi,1=𝐱i𝖳𝜷1+ϵi,1yi,m=𝐱i𝖳𝜷m+ϵi,m 其中误差集{ϵi,1,,ϵi,m}都是相关的。等价地,也可以视作单一回归问题,其中结果是行向量𝐲i𝖳,回归系数向量排在一起: 𝐲i𝖳=𝐱i𝖳𝐁+𝝐i𝖳.

系数矩阵Bk×m矩阵,其中每个回归问题的系数向量𝜷1,,𝜷m垂直排列在一起: 𝐁=[(𝜷1)(𝜷m)]=[(β1,1βk,1)(β1,mβk,m)].

每个观测i的噪声向量𝝐i服从联合正态分布,因此给定观测的结果是相关的: 𝝐iN(0,𝜮ϵ).

可以将整个回归问题写成矩阵形式: 𝐘=𝐗𝐁+𝐄, 其中YEn×m矩阵。设计矩阵Xn×k矩阵,观测如标准线性回归垂直排列: 𝐗=[𝐱1𝖳𝐱2𝖳𝐱n𝖳]=[x1,1x1,kx2,1x2,kxn,1xn,k].

经典频率学派Template:Link-en解利用摩尔-彭若斯广义逆,简单地估计回归系数矩阵𝐁^𝐁^=(𝐗𝖳𝐗)1𝐗𝖳𝐘.

求贝叶斯解,要先指定条件似然,再找到适当的共轭先验。与线性贝叶斯回归不同,可以指定一个自然的条件共轭先验(与规模相关)。

把条件似然写成[1] ρ(𝐄|𝜮ϵ)|𝜮ϵ|n/2exp(12tr(𝐄𝖳𝐄𝜮ϵ1)), 误差𝐄表为𝐘,𝐗,𝐁,则有 ρ(𝐘|𝐗,𝐁,𝜮ϵ)|𝜮ϵ|n/2exp(12tr((𝐘𝐗𝐁)𝖳(𝐘𝐗𝐁)𝜮ϵ1)),

寻找一个自然共轭先验——联合密度ρ(𝐁,Σϵ),其泛函形式与似然相同。由于似然在𝐁中是二次的,因此我们重写似然使其在(𝐁𝐁^)(与经典样本估计的差)是正态的。 用与Template:Link-en相同的技术,可用矩阵形式的平方和分解指数项。不过此处还要用到矩阵微分(克罗内克积向量化变换)。

首先,应用平方和得到新的似然表达式: ρ(𝐘|𝐗,𝐁,𝜮ϵ)|𝜮ϵ|(nk)/2exp(tr(12𝐒𝖳𝐒𝜮ϵ1))|𝜮ϵ|k/2exp(12tr((𝐁𝐁^)𝖳𝐗𝖳𝐗(𝐁𝐁^)𝜮ϵ1)), 𝐒=𝐘𝐗𝐁^

我们想开发一种先验的条件形式: ρ(𝐁,𝜮ϵ)=ρ(𝜮ϵ)ρ(𝐁|𝜮ϵ), 其中ρ(𝜮ϵ)服从逆威沙特分布ρ(𝐁|𝜮ϵ)是矩阵𝐁中某种形式的正态分布。这是通过向量化变换实现的,它将似然从矩阵𝐁,𝐁^的函数变换为向量𝜷=vec(𝐁),𝜷^=vec(𝐁^)的函数。

tr((𝐁𝐁^)𝖳𝐗𝖳𝐗(𝐁𝐁^)𝜮ϵ1)=vec(𝐁𝐁^)𝖳vec(𝐗𝖳𝐗(𝐁𝐁^)𝜮ϵ1)

vec(𝐗𝖳𝐗(𝐁𝐁^)𝜮ϵ1)=(𝜮ϵ1𝐗𝖳𝐗)vec(𝐁𝐁^), 其中𝐀𝐁表示矩阵AB克罗内克积,其是外积的推广。

vec(𝐁𝐁^)𝖳(𝜮ϵ1𝐗𝖳𝐗)vec(𝐁𝐁^)=(𝜷𝜷^)𝖳(𝜮ϵ1𝐗𝖳𝐗)(𝜷𝜷^) 产生的似然在(𝜷𝜷^)中正态。

有了更易理解的似然,就可以找到自然的(条件)共轭先验了。

共轭先验分布

由向量化的𝜷得到的自然共轭先验形式为[1] ρ(𝜷,𝜮ϵ)=ρ(𝜮ϵ)ρ(𝜷|𝜮ϵ), 其中 ρ(𝜮ϵ)𝒲1(𝐕0,𝝂0)

ρ(𝜷|𝜮ϵ)N(𝜷0,𝜮ϵ𝜦01).

后验分布

利用上述先验与似然,可得到后验[1] ρ(𝜷,𝜮ϵ|𝐘,𝐗)|𝜮ϵ|(𝝂0+m+1)/2exp(12tr(𝐕0𝜮ϵ1))×|𝜮ϵ|k/2exp(12tr((𝐁𝐁0)𝖳𝜦0(𝐁𝐁0)𝜮ϵ1))×|𝜮ϵ|n/2exp(12tr((𝐘𝐗𝐁)𝖳(𝐘𝐗𝐁)𝜮ϵ1)), 其中vec(𝐁0)=𝜷0。 记𝜦0=𝐔𝖳𝐔,涉及𝐁的项可以分类为 (𝐁𝐁0)𝖳𝜦0(𝐁𝐁0)+(𝐘𝐗𝐁)𝖳(𝐘𝐗𝐁)=([𝐘𝐔𝐁0][𝐗𝐔]𝐁)𝖳([𝐘𝐔𝐁0][𝐗𝐔]𝐁)=([𝐘𝐔𝐁0][𝐗𝐔]𝐁n)𝖳([𝐘𝐔𝐁0][𝐗𝐔]𝐁n)+(𝐁𝐁n)𝖳(𝐗𝖳𝐗+𝜦0)(𝐁𝐁n)=(𝐘𝐗𝐁n)𝖳(𝐘𝐗𝐁n)+(𝐁0𝐁n)𝖳𝜦0(𝐁0𝐁n)+(𝐁𝐁n)𝖳(𝐗𝖳𝐗+𝜦0)(𝐁𝐁n), 其中 𝐁n=(𝐗𝖳𝐗+𝜦0)1(𝐗𝖳𝐗𝐁^+𝜦0𝐁0)=(𝐗𝖳𝐗+𝜦0)1(𝐗𝖳𝐘+𝜦0𝐁0).

现在可以用更有用的形式来写后验: ρ(𝜷,𝜮ϵ|𝐘,𝐗)|𝜮ϵ|(𝝂0+m+n+1)/2exp(12tr((𝐕0+(𝐘𝐗𝐁𝐧)𝖳(𝐘𝐗𝐁𝐧)+(𝐁n𝐁0)𝖳𝜦0(𝐁n𝐁0))𝜮ϵ1))×|𝜮ϵ|k/2exp(12tr((𝐁𝐁n)𝖳(𝐗T𝐗+𝜦0)(𝐁𝐁n)𝜮ϵ1)).

其形式为逆威沙特分布乘以矩阵正态分布ρ(𝜮ϵ|𝐘,𝐗)𝒲1(𝐕n,𝝂n) ρ(𝐁|𝐘,𝐗,𝜮ϵ)𝒩k,m(𝐁n,𝜦n1,𝜮ϵ).

此后验的参数由下式给出 𝐕n=𝐕0+(𝐘𝐗𝐁𝐧)𝖳(𝐘𝐗𝐁𝐧)+(𝐁n𝐁0)𝖳𝜦0(𝐁n𝐁0) 𝝂n=𝝂0+n 𝐁n=(𝐗𝖳𝐗+𝜦0)1(𝐗𝖳𝐘+𝜦0𝐁0) 𝜦n=𝐗𝖳𝐗+𝜦0

另见

参考文献

Template:Reflist

  1. 1.0 1.1 1.2 Peter E. Rossi, Greg M. Allenby, Rob McCulloch. Bayesian Statistics and Marketing. John Wiley & Sons, 2012, p. 32.