LU分解

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA Template:ScienceNavigation线性代数数值分析中,LU分解矩阵分解的一种,将一个矩阵分解为一个下三角矩阵和一个上三角矩阵的乘积,有时需要再乘上一个置换矩阵。LU分解可以被視為高斯消去法的矩陣形式。在数值计算上,LU分解經常被用来解线性方程组、且在求逆矩阵和计算行列式中都是一個關鍵的步驟。

定义

對於方阵 AALU 分解是将它分解成一個下三角矩阵 L 與上三角矩阵 U 的乘積,也就是

A=LU

如果適當的改變 A的行的順序或列的順序,就可以將 A做 LU 分解。

舉例來說一个 3×3 的矩阵 A ,其 LU 分解會寫成下面的形式:

A=[a11a12a13a21a22a23a31a32a33]=[l1100l21l220l31l32l33][u11u12u130u22u2300u33]

事實上,並不是每個矩陣都有 LU 分解。例如,從上式可知 a11=l11u11,若 a11=0,則 l11u11等於 0,故 L 或 U 是非可逆矩阵,A 必須也是非可逆矩阵。然而,存在著可逆矩阵 A 滿足 a11=0,這些 A 就是沒有 LU 分解的例子。該問題可藉由置換 A 的各-{zh-hans:行; zh-hant:列;}-順序來解決,最終會得到一個 A 的 PLU 分解。

PLU 分解

方陣 A 的 PLU 分解是是将它分解成一个置换矩阵 P、一個下三角矩阵 L 與上三角矩阵 U 的乘積,即

A=PLU

事實上,所有的方陣都可以寫成 PLU 分解的形式,由於左乘置換矩陣 P1是在交換行的順序,所以由 P1A=LU推得適當的交換 A 的行的順序,即可將 A 做 LU 分解。事實上,PLU 分解有很高的數值穩定性,因此實用上是很好用的工具。

有時為了計算上的方便,會同時間換行與列的順序,此時會將 A 分解成

A=PLUQ

其中 P、L、U 同上,Q 是一個置換矩陣

LDU 分解

方陣 A 的 LDU 分解是是将它分解成一個單位下三角矩阵 L、對角矩陣 D 與單位上三角矩阵 U 的乘積,即

A=LDU

其中單位上、下三角矩陣是指对角线上全是 1 的上、下三角矩阵。

事實上,LDU 分解可以推廣到 A 是一般的矩陣,而非方陣。此時,L 和 D 是方陣,並且與 A 有相同的-{zh-hans:行; zh-hant:列;}-,U 則有和 A 相同的長寬。注意到現在 U 是上三角的定義改為主對角線的下方都是 0,而主對角線是收集所有 Uij 滿足 i=j。

存在性和唯一性

一个可逆矩阵可以进行LU分解当且仅当它的所有子式都非零。如果要求其中的L矩阵(或U矩阵)为单位三角矩阵,那么分解是唯一的。同理可知,矩阵的LDU可分解条件也相同,并且总是唯一的。

即使矩阵不可逆,LU仍然可能存在。实际上,如果一个k的矩阵的前k个顺序主子式不为零,那么它就可以进行LU分解,但反之则不然。

目前,在任意上一个方块矩阵可进行LU分解的充要条件已经被发现,这些充要条件可以用某些特定子矩阵的秩表示。用高斯消元法来得到LU分解的算法也可以扩张到任意域上。

任意矩阵A(不仅仅是方块矩阵)都可以进行LUP分解。其中的LU矩阵是方阵,P矩阵则与A形状一样。

正定矩阵

如果矩阵A埃尔米特矩阵,并且是正定矩阵,那么可以使,UL共轭转置。也就是说,A可以写成

A=LL* 

这个分解被称作Cholesky分解。对每一个正定矩阵,Cholesky分解都唯一存在。此外,比起一般的LU分解,计算Cholesky分解更为快捷,并具有更高的数值稳定性

具体的表达式

由于LDU分解唯一存在,对给定的矩阵,可以给出相应三个矩阵LDU的具体的表达式。表达式由A主子式之比构成(因此要求它们不为零)。设d1,d2,dn为矩阵D的对角线系数,则有d1=𝐀1,1。对i=2,,ndi的值等于A的第i个顺序主子式与第i1个顺序主子式之比,其中约定d0=1。

算法

LU分解在本质上是高斯消元法的一种表达形式。实质上是将A通过初等行变换变成一个上三角矩阵,其变换矩阵就是一个单位下三角矩阵。这正是所谓的杜尔里特算法(Doolittle algorithm):从下至上地对矩阵A做初等行变换,将对角线左下方的元素变成零,然后再证明这些行变换的效果等同于左乘一系列单位下三角矩阵,这一系列单位下三角矩阵的乘积的逆就是L矩阵,它也是一个单位下三角矩阵。

这类算法的复杂度一般在2n33左右,对充分消元的分解则不然。

杜尔里特算法

对给定的N × N矩阵

A=(an,n)

A(0):=A

然后定义对于n = 1,...,N-1的情况如下:

在第n步,消去矩阵A(n-1)的第n列主对角线下的元素:将A(n-1)的第n行乘以li,n:=ai,n(n1)an,n(n1)之后加到第i行上去。其中i=n+1,,N

这相当于在A(n-1)的左边乘上一个单位下三角矩阵:

Ln=[101ln+1,n0lN,n1]

于是,定义为:设

A(n):=LnA(n1)

经过N-1轮操作后,所有在主对角线下的系数都为0了,于是我们得到了一个上三角矩阵:A(N-1),这时就有:

A=L11L1A(0)=L11A(1)=L11L21L2A(1)=L11L21A(2)==L11LN11A(N1)

这时,矩阵A(N-1) 就是UL=L11LN11。 下三角矩阵Lk的逆依然是下三角矩阵,而且下三角矩阵的乘积仍是下三角矩阵,所以L是下三角矩阵。 于是我们得到分解:A=LU

显然,要是算法成立,在每步操作时必须有an,n(n1)0。如果这一条件不成立,就要将第n行和另一行交换,由此就会出现一个置换矩阵P。这就是为什么一般来说LU分解里会带有一个置换矩阵的原因。

例子

将一个简单的3×3矩阵A进行LU分解:

A=[123257353]

先将矩阵第一列元素中a11以下的所有元素变为0,即

L1A=[100210301]×[123257353]=[123011016]

再将矩阵第二列元素中a22以下的所有元素变为0,即

L2(L1A)=[100010011]×[123011016]=[123011005]=U
L=L11L21=[100210301]×[100010011]=[100210311]

还有一种方法是通过方程求解,如下所示,将以下矩阵进行LU分解:

[4363]=[l110l21l22][u11u120u22]

由于矩阵阶数只是2,可以直接列方程解:

l11*u11+0*0=4
l11*u12+0*u22=3
l21*u11+l22*0=6
l21*u12+l22*u22=3

这个线性方程组有无数多组解。因此,可以假设其中一个是单位三角矩阵,比如说L,也就是说其对角线上的两个系数都是1。这时可以解出:

l21=1.5
u11=4
u12=3
u22=1.5

也就是说

[4363]=[101.51][4301.5]

稀疏矩阵分解

对于阶数很大的稀疏矩阵,有特别的简便算法来获得其LU分解:这时的LU也是稀疏矩阵。理论上来说,算法的复杂度约等于非零系数的个数,而不是矩阵的大小阶数。这些算法通过运用行和列的交换,使得过程中零系数因为操作而变成非零系数的次数减到最少。

一般的将零系数因为操作而变成非零系数的次数减到最少的方法是运用图论

应用

求解线性方程

对于给定的线性方程组

Ax=LUx=b

要解出x,可以进行以下步骤:

  1. 首先,解方程Ly=b得到y
  2. 然后解方程Ux=y 得到x

在两次的求解中,我们遇到的都是三角矩阵,因此运用向前(向后)替代法就可以简洁地求解(参见三角矩阵),而不需要用到高斯消元法。然而,在将A进行LU分解时,仍然要用到高斯消元法。因此,这个方法适合在要对许多个不同的b求解时用。

求逆矩阵

求矩阵A的逆时,可以直接求LU的逆矩阵,然后代入:A1=U1L1 。也可以将单位矩阵分解成n个列向量,然后用上面求解线性方程的方法解出逆矩阵的列向量,然后拼起来。后者的复杂度在n2级别Template:Fact,较高斯法为优。

计算行列式

矩阵LU可以用来快速地计算矩阵A行列式,因为det(A) = det(L) det(U),而三角矩阵的行列式就是对角线元素的乘积。如果要求L 是单位三角矩阵,那么det(A)=det(L)det(U)=i=1nuii

同样的方法也可以应用于LUP分解,只需乘上P的行列式,即相应置换的符号差

参见

参考来源

外部链接

de:Gaußsches Eliminationsverfahren#LR-Zerlegung