贝叶斯多元线性回归

来自testwiki
跳转到导航 跳转到搜索

Template:回归侧栏 统计学中,贝叶斯多元线性回归是一种多元线性回归(预测结果为相关随机变量向量,而非标量随机变量的线性回归)的贝叶斯推断方法。这种方法的更一般论述见最小均方误差

细节

考虑一回归问题,其中需要预测的自变量不是实标量而是相关实数组成的m维向量。与标准回归设置一样,有n个观测值,其中每个观测i包含k−1个解释变量,归为k维向量𝐱i(添加值为1的虚拟变量,以允许截距系数)。对每个观测i,可以视作m个相关回归问题: yi,1=𝐱i𝖳β1+ϵi,1yi,m=𝐱i𝖳βm+ϵi,m 其中误差集{ϵi,1,,ϵi,m}都是相关的。等价地,也可以视作单一回归问题,其中结果是行向量𝐲i𝖳,回归系数向量排在一起: 𝐲i𝖳=𝐱i𝖳𝐁+ϵi𝖳.

系数矩阵Bk×m矩阵,其中每个回归问题的系数向量β1,,βm垂直排列在一起: 𝐁=[(β1)(βm)]=[(β1,1βk,1)(β1,mβk,m)].

每个观测i的噪声向量ϵi服从联合正态分布,因此给定观测的结果是相关的: ϵiN(0,Σϵ).

可以将整个回归问题写成矩阵形式: 𝐘=𝐗𝐁+𝐄, 其中YEn×m矩阵。设计矩阵Xn×k矩阵,观测如标准线性回归垂直排列: 𝐗=[𝐱1𝖳𝐱2𝖳𝐱n𝖳]=[x1,1x1,kx2,1x2,kxn,1xn,k].

经典频率学派Template:Link-en解利用摩尔-彭若斯广义逆,简单地估计回归系数矩阵𝐁^𝐁^=(𝐗𝖳𝐗)1𝐗𝖳𝐘.

求贝叶斯解,要先指定条件似然,再找到适当的共轭先验。与线性贝叶斯回归不同,可以指定一个自然的条件共轭先验(与规模相关)。

把条件似然写成[1] ρ(𝐄|Σϵ)|Σϵ|n/2exp(12tr(𝐄𝖳𝐄Σϵ1)), 误差𝐄表为𝐘,𝐗,𝐁,则有 ρ(𝐘|𝐗,𝐁,Σϵ)|Σϵ|n/2exp(12tr((𝐘𝐗𝐁)𝖳(𝐘𝐗𝐁)Σϵ1)),

寻找一个自然共轭先验——联合密度ρ(𝐁,Σϵ),其泛函形式与似然相同。由于似然在𝐁中是二次的,因此我们重写似然使其在(𝐁𝐁^)(与经典样本估计的差)是正态的。 用与Template:Link-en相同的技术,可用矩阵形式的平方和分解指数项。不过此处还要用到矩阵微分(克罗内克积向量化变换)。

首先,应用平方和得到新的似然表达式: ρ(𝐘|𝐗,𝐁,Σϵ)|Σϵ|(nk)/2exp(tr(12𝐒𝖳𝐒Σϵ1))|Σϵ|k/2exp(12tr((𝐁𝐁^)𝖳𝐗𝖳𝐗(𝐁𝐁^)Σϵ1)), 𝐒=𝐘𝐗𝐁^

我们想开发一种先验的条件形式: ρ(𝐁,Σϵ)=ρ(Σϵ)ρ(𝐁|Σϵ), 其中ρ(Σϵ)服从逆威沙特分布ρ(𝐁|Σϵ)是矩阵𝐁中某种形式的正态分布。这是通过向量化变换实现的,它将似然从矩阵𝐁,𝐁^的函数变换为向量β=vec(𝐁),β^=vec(𝐁^)的函数。

tr((𝐁𝐁^)𝖳𝐗𝖳𝐗(𝐁𝐁^)Σϵ1)=vec(𝐁𝐁^)𝖳vec(𝐗𝖳𝐗(𝐁𝐁^)Σϵ1)

vec(𝐗𝖳𝐗(𝐁𝐁^)Σϵ1)=(Σϵ1𝐗𝖳𝐗)vec(𝐁𝐁^), 其中𝐀𝐁表示矩阵AB克罗内克积,其是外积的推广。

vec(𝐁𝐁^)𝖳(Σϵ1𝐗𝖳𝐗)vec(𝐁𝐁^)=(ββ^)𝖳(Σϵ1𝐗𝖳𝐗)(ββ^) 产生的似然在(ββ^)中正态。

有了更易理解的似然,就可以找到自然的(条件)共轭先验了。

共轭先验分布

由向量化的β得到的自然共轭先验形式为[1] ρ(β,Σϵ)=ρ(Σϵ)ρ(β|Σϵ), 其中 ρ(Σϵ)𝒲1(𝐕0,ν0)

ρ(β|Σϵ)N(β0,ΣϵΛ01).

后验分布

利用上述先验与似然,可得到后验[1] ρ(β,Σϵ|𝐘,𝐗)|Σϵ|(ν0+m+1)/2exp(12tr(𝐕0Σϵ1))×|Σϵ|k/2exp(12tr((𝐁𝐁0)𝖳Λ0(𝐁𝐁0)Σϵ1))×|Σϵ|n/2exp(12tr((𝐘𝐗𝐁)𝖳(𝐘𝐗𝐁)Σϵ1)), 其中vec(𝐁0)=β0。 记Λ0=𝐔𝖳𝐔,涉及𝐁的项可以分类为 (𝐁𝐁0)𝖳Λ0(𝐁𝐁0)+(𝐘𝐗𝐁)𝖳(𝐘𝐗𝐁)=([𝐘𝐔𝐁0][𝐗𝐔]𝐁)𝖳([𝐘𝐔𝐁0][𝐗𝐔]𝐁)=([𝐘𝐔𝐁0][𝐗𝐔]𝐁n)𝖳([𝐘𝐔𝐁0][𝐗𝐔]𝐁n)+(𝐁𝐁n)𝖳(𝐗𝖳𝐗+Λ0)(𝐁𝐁n)=(𝐘𝐗𝐁n)𝖳(𝐘𝐗𝐁n)+(𝐁0𝐁n)𝖳Λ0(𝐁0𝐁n)+(𝐁𝐁n)𝖳(𝐗𝖳𝐗+Λ0)(𝐁𝐁n), 其中 𝐁n=(𝐗𝖳𝐗+Λ0)1(𝐗𝖳𝐗𝐁^+Λ0𝐁0)=(𝐗𝖳𝐗+Λ0)1(𝐗𝖳𝐘+Λ0𝐁0).

现在可以用更有用的形式来写后验: ρ(β,Σϵ|𝐘,𝐗)|Σϵ|(ν0+m+n+1)/2exp(12tr((𝐕0+(𝐘𝐗𝐁𝐧)𝖳(𝐘𝐗𝐁𝐧)+(𝐁n𝐁0)𝖳Λ0(𝐁n𝐁0))Σϵ1))×|Σϵ|k/2exp(12tr((𝐁𝐁n)𝖳(𝐗T𝐗+Λ0)(𝐁𝐁n)Σϵ1)).

其形式为逆威沙特分布乘以矩阵正态分布ρ(Σϵ|𝐘,𝐗)𝒲1(𝐕n,νn) ρ(𝐁|𝐘,𝐗,Σϵ)𝒩k,m(𝐁n,Λn1,Σϵ).

此后验的参数由下式给出 𝐕n=𝐕0+(𝐘𝐗𝐁𝐧)𝖳(𝐘𝐗𝐁𝐧)+(𝐁n𝐁0)𝖳Λ0(𝐁n𝐁0) νn=ν0+n 𝐁n=(𝐗𝖳𝐗+Λ0)1(𝐗𝖳𝐘+Λ0𝐁0) Λn=𝐗𝖳𝐗+Λ0

另见

参考文献

Template:Reflist

  1. 1.0 1.1 1.2 Peter E. Rossi, Greg M. Allenby, Rob McCulloch. Bayesian Statistics and Marketing. John Wiley & Sons, 2012, p. 32.