若尔当标准型

来自testwiki
imported>Hrs814582023年11月19日 (日) 08:18的版本 top
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

线性代数中,若尔当标准型(英語:Jordan normal form)或称若尔当标准式喬登正則式(英語:Jordan canonical form)是某個線性映射在有限維向量空間上的特別的矩陣表達形式,稱作若尔当矩陣(Jordan matrix),這矩陣接近对角矩阵:除了主对角线和主对角线上方元素之外,其餘都是零,且主對角線上方的對角線的係數若不為零-{只}-能為1,且這1左方和下方的係數(都在主對角線上)有相同的值。谱定理正规矩阵都是若尔当标准型的特殊情况,因為可以被對角化(diagonalizable)。若尔当矩阵理论说明了任何一个系数𝕂方块矩阵M如果特征值都在𝕂中,那么必然和某个若尔当标准型相似。或者说,如果一个有限維向量空間上的自同态線性映射的特征值都在系数域𝕂中,那么它可以在某个基底下表示成若尔当标准型。

若尔当标准型得名于十九世纪后期的法国数学家卡米尔·若尔当

简介

一个n × n的矩阵M可对角化的,当且仅当M满足下列条件之一:

矩阵的对角化使得研究其性质变为研究相应的对角矩阵的性质,而后者显然简单得多。由于不是所有矩阵都满足上述三个条件之一,有的矩阵是不可对角化的,例如以下的:

M=[5421011111301112]

计入重数的话,M的特征值为1, 2, 4, 4。M4I维数是1,因此M不可对角化。但经过基底变换,M相似于下面的矩阵:

J=[1000020000410004]

矩阵J近乎对角矩阵,除了第三列第四行系数是1。如果将后两行和后两列的部分作为一块的话,矩阵J就是一个分块对角矩阵。若尔当标准型的目标就是将更多的矩阵化简到一类只比对角矩阵稍微复杂的矩阵:若尔当标准型。实际上这是一种简单的分块对角矩阵。

J=[J1Jp]

这里的“简单”是指每小块矩阵都具备一种很简单的形状:

Ji=[λi1λi1λi]

其中主对角线上都是同一个系数,而对角线上方一排全是1。形同以上Ji的矩阵称为若尔当矩阵。而矩阵J中每一个这样的小块被称为若尔当块

线性代数中有如下的结果:

对任意系数域为𝕂的矩阵M,只要其特征值都在𝕂中,就存在一个与之相似的若尔当标准型JM=PJP1,其中P是一个可逆矩阵。并且满足:

  • 矩阵J的特征值(计入重数)就是主对角线上的系数。
  • 对于J的一个特征值λi,它的几何重数就是属于特征值λi的若尔当块的个数。
  • 所有属于特征值λi的若尔当块的维数之和是特征值λi代数重数

证明

广义特征向量

考虑前面例子中的矩阵MM的若尔当标准型可以写成P−1MP = J,即

MP=PJ

其中变换矩阵P的四个列向量为:pi , i = 1, ..., 4,于是

M[p1p2p3p4]=[p1p2p3p4][1000020000410004]=[p12p24p3p3+4p4]

也就是:

(M1I)p1=0,(M2I)p2=0
(M4I)p3=0,(M4I)p4=p3

对于i = 1、2、3,pi都是某个特征值所对应的特征向量:piKer(MλI)。然而,当i=4时,p4并不是特征值4所对应的特征向量。尽管如此:

(M4I)2p4=(M4I)p3=0

于是p4Ker(MλI)2。像p4这样的向量被称为M广义特征向量

给定一个特征值λ,它对应的若尔当块Jλ,m

[λ1000λ10000λ10000λ]

对应着一个由广义特征向量所张成的子空间,因为对应的基底eλ,1,eλ,2,,eλ,m满足:

(MλI)eλ,1=0,(MλI)eλ,2=eλ,1,,(MλI)eλ,m=eλ,m1
也就是说(MλI)eλ,1=0,(MλI)2eλ,2=0,,(MλI)meλ,m=0

因此,“所有特征值在𝕂中的矩阵都相似于某个若尔当标准型”这个命题等价于存在一个由这个矩阵的特征向量和广义特征向量构成的全空间的基底。

幂零矩阵的情况

当矩阵A幂零矩阵(即存在m使得Am=0)时,可以证明整个空间总是可以分解为若干个A-循环子空间的直和[1]。所谓的A-循环子空间就是由某个向量v以及基底:𝐵v={v,Av,A2v,}线性张成的子空间。显然,这样的子空间是A-不变子空间。同时,注意到𝐵v是由A的特征向量和广义特征向量构成的(j0,AjvKerAm)。因此在这个循环子空间里,A在基底𝐵v下表示为若尔当块:

Jv=[010000100000100000]

因此A在所有这样的基底下可以表示为由若尔当块组成的分块对角矩阵,即若尔当标准型:

J=[Jv10000Jv200000Jvs100000Jvs]

一般情况

下面用数学归纳法证明:所有特征值在𝕂中的n × n的矩阵都相似于某个若尔当标准型。

n= 1的情况显然。对于n>1考虑n × n矩阵A。对于A的一个特征值λ,设s为λ的几何重数。设线性变换(AλI)s 的像空间为Im(AλI)s,这是关于A的一个不变子空间。因为λ是特征值,Im(AλI)s的空间维数r严格小于n。记AA在子空间限制Im(AλI)s上的部分。根据归纳假设存在一个基底:{p1, ..., pr}使得A在这个基底上为若尔当标准型。

接下来考虑子空间Ker(AλI)s,只要能够证明整个空间可以分为:

Cn=Im(AλI)sKer(AλI)s

由于Ker(AλI)s是一个A-不变子空间,在上面AλI是幂零矩阵,因此可以写成若尔当标准型:

J=[Jv10000Jv2000000Jvs]

而加上λI后还是若尔当标准型。因此,AKer(AλI)sIm(AλI)s上都能写成若尔当标准型,从而A相似于某个若尔当标准型。

利用归纳法可知所有的n × n的矩阵都相似于某个若尔当标准型。

下面证明:

Cn=Im(AλI)sKer(AλI)s

A的最小多项式为πA,并将其写成πA=(XλI)sQ。于是Q(XλI)s互素。于是根据裴蜀定理,存在多项式:ab使得a(XλI)s+bQ=1。每个向量u都可以写成:

u=a(AλI)s(u)+bQ(A)(u)

并且Q(A)(a(AλI)s(u))=(Q(AλI)s)(a(u))=πA(u)=0,同样地(AλI)s(bQ(A)(u))=((AλI)sQ)(b(u))=πA(u)=0,因此a(AλI)s(u)Ker(Q(A)),bQ(A)(u)Ker(AλI)s,也就是说:

Cn=Ker(Q(A))+Ker(AλI)s

另一方面,任意vKer(AλI)sKer(Q(A))v=a(AλI)s(v)+bQ(A)(v)=0+0=0。也就是说:Ker(AλI)sKer(Q(A))=0。综上所述,

Cn=Ker(Q(A))Ker(AλI)s

然而uIm(AλI)sQ(A)(u)=0,从而Im(AλI)sKer(Q(A))。而根据秩-零化度定理Ker(Q(A))Im(AλI)s维数相等,所以两者完全相等。于是

Cn=Im(AλI)sKer(AλI)s

从而命题得证。

推论

  • 如果矩阵的系数域是一个代数闭域,那么由于其特征值是特征多项式的根,所以也在系数域中。于是只要系数域是一个代数闭域,所有的矩阵都相似于若尔当标准型。特别的,所有复系数矩阵都可以简化为若尔当标准型,因为复数域是代数封闭的。
  • 所有的若尔当标准型都可以分解成一个对角矩阵D和一个只有对角线上一排为1的矩阵N的和。注意,这两个矩阵是不可交换的,因为对角矩阵D不一定是数量矩阵。矩阵N是一个幂零矩阵。因此,每个相似于若尔当标准型的矩阵都可以写成可交换的一个对角矩阵和一个幂零矩阵的和。因为与对角矩阵和幂零矩阵相似的矩阵仍然是对角矩阵和幂零矩阵。换句话说,只要一个矩阵的特征值都在它的系数域里(或者说它的最小多项式或特征多项式可以分解成一次项的乘积),就可以将这个矩阵分解成一个对角矩阵和一个幂零矩阵的和,但要注意这两个矩阵可以交换。当对角矩阵为数量矩阵时,在计算矩阵的指数时是很方便的(可以用二项式展开)。

谱映射定理

用若尔当标准型以及直接的计算可以得出:如果n × n矩阵A的特征值为:λ1, ..., λn,那么对于多项式:p,矩阵p(A)的特征值是:p1), ..., pn)。

凯莱-哈密尔顿定理

凯莱-哈密尔顿定理断言任意矩阵A都是特征方程的根:如果pA特征多项式,那么p(A) = 0。这个定理一样可以用若尔当标准型直接计算得出。

最小多项式

方块矩阵A最小多项式是使得m(A) = 0的非常数首一多项式中次数最小者。另一种定义是:所有使得m(A) = 0的多项式构成主理想环C[x]的一个理想I,而m则是这个理想的产生子。

对于有若尔当标准型的矩阵A,其最小多项式以其特征值为根,并且由若尔当标准型的形状可以看出,每个特征值的重数是若尔当标准型中属于这个特征值的最大的若尔当块的维数。

反之已知矩阵A的最小多项式并不能知道其若尔当标准型。要确定矩阵A的标准型需要用到所谓的初等因子。矩阵A的一个初等因子是它的某一个若尔当块的特征多项式(或最小多项式,对于若尔当块两者一样)。如果所有的初等因子都是一次多项式,那么A可对角化。

不变子空间分解

一个n × n的矩阵A的若尔当标准型是分块对角矩阵,因此给出了一个将n欧几里得空间分解为矩阵A的不变子空间的具体方法。每个若尔当块Ji都对应着一个不变子空间:Xi。可以简记为:

n=i=1kXi

其中的每个Xi都是由若尔当块Ji对应的广义特征向量张成的子空间。

注意到这里的k并不是不同的特征值的个数,因为属于同一个特征值的若尔当块可以不止一个。如果要将n分解为l个不变子空间,其中l是不同特征值的个数的话,可以将属于同一个特征值,比如说λi的若尔当块合并:只需使用A的最小多项式πA中关于λi的重根数(代数重数)ν(λi),考虑空间:

Yi=Ker(λiA)ν(λi).

这就是所有的属于同一个特征值λi的若尔当块所对应的Xi,p所合并后的空间,因为它包含了所有使得经过ν(λi)λiA操作后会清零的向量集合。如果某个Xi中向量没有被清零,那么由于这个向量也不会被其他的特征值λjA清零,它将不会被πA清零,这与πA(A)=0矛盾。

于是n欧几里得空间也可以被分解为

n=i=1lYi

其中l是矩阵A的不同的特征值的个数。

值得注意的是,这里的指标ν(λ)是使得特征零空间Ker(λA)m“稳定”下来的最小次数:

Ker(λA)ν(λ)=Ker(λA)m,mν(λ)

这也可以作为代数重数的另一个定义。

参见

注释

Template:Reflist

参考来源

  • N.丹佛,J.T.施瓦茨,《线性算子》第一章:一般理论(Linear Operators, Part I: General Theory), Interscience, 1958.
  • Daniel.T. Finkbeiner II,《矩阵与线性变换导论》第三版(Introduction to Matrices and Linear Transformations, Third Edition), Freeman, 1978.
  • Gene H. Golub,Charles F. van Loan,《矩阵计算》第三版(Matrix Computations), Johns Hopkins University Press, Baltimore, 1996.
  • Gene H. Golub,J. H. Wilkinson,《病态特征系统以及若尔当标准型计算》(Ill-conditiones Eigensystems and the computation of the Jordan normal form), SIAM Review, vol. 18, nr. 4, pp. 578–619, 1976.
  • Template:Citation.
  • Glenn James,Robert C. James,《数学辞典》第四版(Mathematics Dictionary, Fourth Edition), Van Nostrand Reinhold, 1976.
  • Saunders MacLane,Garrett Birkhoff,《代数学》(Algebra), MacMillan, 1967.
  • Anthony N. Michel,Charles J. Herget,《应用代数和泛函分析》(Applied Algebra and Functional Analysis), Dover, 1993.
  • Georgi E. Shilov,《线性代数》(Linear Algebra), Dover, 1977.
  • 若尔当正规型 Template:Wayback

外部链接