广义奇异值分解

来自testwiki
跳转到导航 跳转到搜索

线性代数中,广义奇异值分解(GSVD)是基于奇异值(SVD)的两种不同算法的统称。其区别在于,一个是分解两个矩阵(类似于高阶或张量SVD),另一种使用施加于单矩阵SVD奇异向量上的约束。

版本1:双矩阵分解

广义奇异值分解(GSVD)是对矩阵对的矩阵分解,将奇异值分解推广到两个矩阵的情形。它由Van Loan [1]于1976年提出,后来由Paige与Saunders完善,[2]也就是本节描述的版本。与SVD相对,GSVD可以同时分解具有相同列数的矩阵对。SVD、GSVD及SVD的其他一些推广[3][4][5]被广泛用于研究线性系统在二次半范数方面的条件调节正则化。下面设𝔽=,或𝔽=

定义

A1𝔽m1×nA2𝔽m2×n广义奇异值分解A1=U1Σ1[W*D,0D]Q*,A2=U2Σ2[W*D,0D]Q*,,其中

  • U1𝔽m1×m1酉矩阵
  • U2𝔽m2×m2为酉矩阵;
  • Q𝔽n×n为酉矩阵;
  • W𝔽k×k为酉矩阵;
  • Dk×k对角线元素为正实数,包含C=[A1A2]的非零奇异值的降序排列,
  • 0D=0k×(nk),
  • Σ1=IA,S1,0Am1×k是非负实数分块对角阵,其中S1=αr+1,,αr+s,其中1>αr+1αr+s>0, IA=Ir,且0A=0(m1rs)×(krs)
  • Σ2=0B,S2,IBm2×k是非负实数分块对角阵,其中S2=βr+1,,βr+s,其中0<βr+1βr+s<1, IB=Ikrs,且0B=0(m2k+r)×r
  • Σ1*Σ1=α12,,αk2,
  • Σ2*Σ2=β12,,βk2,
  • Σ1*Σ1+Σ2*Σ2=Ik,
  • k=rank(C).

α1==αr=1, αr+s+1==αk=0, β1==βr=0, βr+s+1==βk=1。而Σ1是对角阵,Σ2不总是对角阵,因为前导矩形零矩阵;相反,Σ2是“副对角阵”。

变体

GSVD有许多变体,与这样一个事实有关:Q*总可以左乘EE*=I<(E𝔽n×n)是任意酉矩阵。记

  • X=([W*D,0D]Q*)*
  • X*=[0,R]Q^*,其中R𝔽k×k是上三角可逆阵;Q^𝔽n×n是酉矩阵。QR分解总可以得到这样的矩阵。
  • Y=W*D,那么Y可逆。

下面是GSVD的一些变体:

  • MATLAB(gsvd):A1=U1Σ1X*,A2=U2Σ2X*.
  • LAPACK(LA_GGSVD):A1=U1Σ1[0,R]Q^*,A2=U2Σ2[0,R]Q^*.
  • 简化:A1=U1Σ1[Y,0D]Q*,A2=U2Σ2[Y,0D]Q*.

广义奇异值

A1A2广义奇异值 是一对(a,b)2使得

limδ0det(b2A1*A1a2A2*A2+δIn)/det(δInk)=0,a2+b2=1,a,b0.我们有

  • AiAj*=UiΣiYY*Σj*Uj*
  • Ai*Aj=Q[Y*Σi*ΣjY000]Q*=Q1Y*Σi*ΣjYQ1*


根据这些性质,可以证明广义奇异值正是成对的(αi,βi)。有det(b2A1*A1a2A2*A2+δIn)=det(b2A1*A1a2A2*A2+δQQ*)=det(Q[Y*(b2Σ1*Σ1a2Σ2*Σ2)Y+δIk00δInk]Q*)=det(δInk)det(Y*(b2Σ1*Σ1a2Σ2*Σ2)Y+δIk).因此

limδ0det(b2A1*A1a2A2*A2+δIn)/det(δInk)=limδ0det(Y*(b2Σ1*Σ1a2Σ2*Σ2)Y+δIk)=det(Y*(b2Σ1*Σ1a2Σ2*Σ2)Y)=|det(Y)|2i=1k(b2αi2a2βi2).

对某个i,当a=αi, b=βi时,表达式恰为零。

[2]中,广义奇异值被认为是求解det(b2A1*A1a2A2*A2)=0的奇异值。然而,这只有当k=n时才成立,否则行列式对每对(a,b)2都将是0;这可通过替换上面的δ=0得到。

广义逆

对任意可逆阵E𝔽n×n,令E+=E1,对任意零矩阵0𝔽m×n,令0+=0*,对任意分块对角阵令E1,E2+=E1+,E2+。定义Ai+=Q[Y10]Σi+Ui*可以证明这里定义的Ai+Ai广义逆阵;特别是Ai{1,2,3}逆。由于它一般不满足(Ai+Ai)*=Ai+Ai,所以不是摩尔-彭若斯广义逆;否则可以得出,对任意所选矩阵都有(AB)+=B+A+,这只对特定类型的矩阵成立。

Q=[Q1Q2],其中Q1𝔽n×k, Q2𝔽n×(nk)。这个广义逆具有如下性质:

  • Σ1+=IA,S11,0AT
  • Σ2+=0BT,S21,IB
  • Σ1Σ1+=I,I,0
  • Σ2Σ2+=0,I,I
  • Σ1Σ2+=0,S1S21,0
  • Σ1+Σ2=0,S11S2,0
  • AiAj+=UiΣiΣj+Uj*
  • Ai+Aj=Q[Y1Σi+ΣjY000]Q*=Q1Y1Σi+ΣjYQ1*

商SVD

'A1A2的'广义奇异比σi=αiβi+。由以上性质,A1A2+=U1Σ1Σ2+U2*。注意Σ1Σ2+=0,S1S21,0是对角阵,忽略前导零矩阵,按降序包含着奇异比。若A2可逆,则Σ1Σ2+没有前导零,广义奇异比就是奇异值,U1U2则是A1A2+=A1A21的奇异向量矩阵。事实上计算A1A21的SVD是GSVD的动机之一,因为“形成AB1并求SVD,当B的方程解条件不佳时,可能产生不必要、较大的数值误差”。[2]因此有时也被称为“商GSVD”,虽然这并不是使用GSVD的唯一原因。若A2不可逆,并放宽奇异值降序排列的要求,则U1Σ1Σ2+U2*仍是A1A2+的SVD。或者,把前导零移到后面,也可以找到降序SVD:U1Σ1Σ2+U2*=(U1P1)P1*Σ1Σ2+P2(P2*U2*),其中P1P2是适当的置换矩阵。由于秩等于非零奇异值的个数,所以rank(A1A2+)=s

构造

  • C=PD,0Q*C=[A1A2]的SVD,其中P𝔽(m1+m2)×(m1×m2)是酉矩阵,QD如上所述;
  • P=[P1,P2],其中P1𝔽(m1+m2)×kP2𝔽(m1+m2)×(nk)
  • P1=[P11P21],其中P11𝔽m1×kP21𝔽m2×k
  • P11=U1Σ1W*通过P11的SVD得到,其中U1Σ1W如上所述,
  • P21W=U2Σ2经过类似于QR分解的分解,其中U2Σ2如上所述。

那么,C=PD,0Q*=[P1D,0]Q*=[U1Σ1W*D0U2Σ2W*D0]Q*=[U1Σ1[W*D,0]Q*U2Σ2[W*D,0]Q*].还有[U1*00U2*]P1W=[Σ1Σ2].因此Σ1*Σ1+Σ2*Σ2=[Σ1Σ2]*[Σ1Σ2]=W*P1*[U100U2][U1*00U2*]P1W=I.由于P1的列归一正交,||P1||21,因此||Σ1||2=||U1*P1W||2=||P1||21.对每个xk,有||x||2=1,使得||P21x||22||P11x||22+||P21x||22=||P1x||221.因此||P21||21||Σ2||2=||U2*P21W||2=||P21||21.

应用

张量GSVD是比较谱分解的一种,是SVD在多张量上的推广,提出动机是同时识别其中的相似与不相似数据,并从任何数量和维度的任意数据类型中得到单一相干模型。

GSVD是一种比较谱分解,[6]已成功应用于信号处理和数据科学,如基因组信号处理。[7][8][9]

这些应用启发了其他几种比较谱分解,即高阶GSVD(HO GSVD)[10]与张量GSVD。[11] [12]

当特征函数以线性模型(即再生核希尔伯特空间)为参数时,它同样适于估计线性运算的谱分解。[13]

版本2:加权单矩阵分解

广义奇异值分解(GSVD)的加权情形是一种有约束矩阵分解,约束施加在奇异向量上。[14][15][16]这种GSVDSVD的推广。给定m×n实或复数矩阵MSVD分解

M=UΣV*

,其中

U*WuU=V*WvV=I.

其中I单位矩阵UV在约束条件下(WuWv)是标准正交矩阵。另外,WuWv是正定矩阵(通常是权的对角矩阵)。这种形式的GSVD是某些算法的核心,如广义主成分分析和对应分析

加权形式的GSVD之所以被称为加权形式,是因为在正确取权时,可以推出许多算法(如多维标度线性判别分析)。[17]

参考文献

Template:Reflist

阅读更多

Template:Refbegin

Template:Refend

  1. 引用错误:<ref>标签无效;未给name(名称)为VanLoan的ref(参考)提供文本
  2. 2.0 2.1 2.2 引用错误:<ref>标签无效;未给name(名称)为Paige的ref(参考)提供文本
  3. Template:Cite book
  4. Template:Cite web
  5. Template:Cite journal
  6. Template:Cite journal
  7. Template:Cite journal
  8. Template:Cite journal
  9. Template:Cite journal
  10. 引用错误:<ref>标签无效;未给name(名称)为Ponnapalli2011的ref(参考)提供文本
  11. 引用错误:<ref>标签无效;未给name(名称)为Sankaranarayanan2015的ref(参考)提供文本
  12. 引用错误:<ref>标签无效;未给name(名称)为Bradley2019的ref(参考)提供文本
  13. Template:Cite arXiv
  14. Template:Cite book
  15. Template:Cite book
  16. Template:Cite journal
  17. Template:Cite book