查看“︁若尔当标准型”︁的源代码
←
若尔当标准型
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
在[[线性代数]]中,'''若尔当标准型'''(英語:Jordan normal form)或称'''若尔当标准式'''、'''喬登正則式'''(英語:Jordan canonical form)是某個線性映射在有限維向量空間上的特別的矩陣表達形式,稱作若尔当矩陣(Jordan matrix),這矩陣接近[[对角矩阵]]:除了主[[对角线]]和主对角线上方元素之外,其餘都是零,且主對角線上方的對角線的係數若不為零-{只}-能為<math>1</math>,且這<math>1</math>左方和下方的係數(都在主對角線上)有相同的值。[[谱定理]]和[[正规矩阵]]都是若尔当标准型的特殊情况,因為可以被對角化(diagonalizable)。若尔当矩阵理论说明了任何一个[[系数]][[体 (数学)|域]]为<math>\mathbb{K}</math>的[[方块矩阵]]<math>M</math>如果[[特征值]]都在<math>\mathbb{K}</math>中,那么必然和某个若尔当标准型[[相似矩阵|相似]]。或者说,如果一个有限維[[向量空間]]上的[[自同态]]線性映射的[[特征值]]都在系数域<math>\mathbb{K}</math>中,那么它可以在某个[[基底]]下表示成若尔当标准型。 若尔当标准型得名于十九世纪后期的[[法国]]数学家[[卡米尔·若尔当]]。 ==简介== 一个''n'' × ''n''的矩阵<math>M</math>是[[可对角化矩阵|可对角化]]的,当且仅当<math>M</math>满足下列条件之一: * <math>M</math>有''n''个[[线性无关]]的[[特征向量]]。或者说,<math>M</math>有一个由特征向量组成的基。(称作极大无关条件) * <math>M</math>的所有[[特征值]]的[[几何重数]](即相应特征子空间的维数)等于相应的[[代数重数]](即[[特征多项式]]中<math>(x-\lambda) </math>项的次数)。或者说,<math>M</math>的所有几何重数之和等于''n''。(称作重数相等条件) * <math>M</math>的[[极小多项式]]经[[标准分解]]后,每一项都是一次项,且重数都是1。(称作互异单根条件) 矩阵的对角化使得研究其性质变为研究相应的对角矩阵的性质,而后者显然简单得多。由于不是所有矩阵都满足上述三个条件之一,有的矩阵是不可对角化的,例如以下的: :<math>M = \begin{bmatrix} 5 & 4 & 2 & 1 \\ 0 & 1 & -1 & -1 \\ -1 & -1 & 3 & 0 \\ 1 & 1 & -1 & 2 \end{bmatrix} </math> 计入重数的话,<math>M</math>的特征值为1, 2, 4, 4。<math>M-4I</math>的[[核 (线性算子)|核]]的[[维度|维数]]是1,因此<math>M</math>不可对角化。但经过基底变换,<math>M</math>相似于下面的矩阵: :<math>J = \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 4 & 1 \\ 0 & 0 & 0 & 4 \end{bmatrix} </math> 矩阵<math> J</math>近乎对角矩阵,除了第三列第四行系数是1。如果将后两行和后两列的部分作为一块的话,矩阵<math> J</math>就是一个分块对角矩阵。若尔当标准型的目标就是将更多的矩阵化简到一类只比对角矩阵稍微复杂的矩阵:若尔当标准型。实际上这是一种简单的分块对角矩阵。 :<math>J = \begin{bmatrix} J_1 & \; & \; \\ \; & \ddots & \; \\ \; & \; & J_p\end{bmatrix}</math> 这里的“简单”是指每小块矩阵都具备一种很简单的形状: :<math>J_i = \begin{bmatrix} \lambda_i & 1 & \; & \; \\ \; & \lambda_i & \ddots & \; \\ \; & \; & \ddots & 1 \\ \; & \; & \; & \lambda_i \end{bmatrix} </math> 其中主对角线上都是同一个系数,而对角线上方一排全是1。形同以上<math>J_i</math>的矩阵称为[[若尔当矩阵]]。而矩阵<math> J</math>中每一个这样的小块被称为'''若尔当块'''。 线性代数中有如下的结果: 对任意系数域为<math>\mathbb{K}</math>的矩阵<math>M</math>,只要其特征值都在<math>\mathbb{K}</math>中,就存在一个与之相似的若尔当标准型<math> J</math>:<math>M = PJP^{-1}</math>,其中<math> P</math>是一个[[可逆矩阵]]。并且满足: *矩阵<math> J</math>的特征值(计入重数)就是主对角线上的系数。 *对于<math> J</math>的一个特征值<math>\lambda_i</math>,它的'''[[特征值|几何重数]]'''就是属于特征值<math>\lambda_i</math>的若尔当块的个数。 *所有属于特征值<math>\lambda_i</math>的若尔当块的维数之和是特征值<math>\lambda_i</math>的'''[[特征值|代数重数]]'''。 ==证明== === 广义特征向量 === 考虑前面例子中的矩阵''M''。''M''的若尔当标准型可以写成''P''<sup>−1</sup>''MP'' = ''J'',即 :<math>\; MP = PJ </math> 其中[[变换矩阵]]''P''的四个列向量为:''p''<sub>''i''</sub> , ''i'' = 1, ..., 4,于是 : <math>M \begin{bmatrix} p_1 & p_2 & p_3 & p_4 \end{bmatrix} = \begin{bmatrix} p_1 & p_2 & p_3 & p_4 \end{bmatrix} \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 4 & 1 \\ 0 & 0 & 0 & 4 \end{bmatrix} = \begin{bmatrix} p_1 & 2p_2 & 4p_3 & p_3+4p_4 \end{bmatrix}</math> 也就是: :<math>\; (M - 1 I) p_1 = 0, \; \, (M - 2 I) p_2 = 0</math> :<math>\; (M - 4 I) p_3 = 0, \; \, (M - 4 I) p_4 = p_3 </math> 对于''i'' = 1、2、3,<math>p_i</math>都是某个特征值所对应的特征向量:<math>p_i \in \operatorname{Ker}(M-\lambda I)</math>。然而,当''i''=4时,<math> p_4</math>并不是特征值4所对应的特征向量。尽管如此: :<math>\; (M-4I)^2 p_4 = (M-4I) p_3 = 0 </math> 于是<math>p_4 \in \operatorname{Ker}(M-\lambda I)^2</math>。像<math>p_4</math>这样的向量被称为''M''的'''广义特征向量'''。 给定一个[[特征值]]<math>\scriptstyle \lambda </math>,它对应的[[若尔当块]]<math>\displaystyle J_{\lambda, m} </math>: :<math>\begin{bmatrix} \lambda & 1 & 0 & \cdots & 0 \\ 0 & \lambda & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots& \vdots & \vdots \\ 0 & 0 & 0 & \lambda & 1 \\ 0 & 0 & 0 & 0 & \lambda \\\end{bmatrix}</math> 对应着一个由广义特征向量所张成的子空间,因为对应的基底<math>\displaystyle e_{\lambda, 1}, e_{\lambda, 2}, \cdots , e_{\lambda, m} </math>满足: :<math>\; (M - \lambda I) e_{\lambda, 1} = 0, \; (M - \lambda I) e_{\lambda, 2} = e_{\lambda, 1} , \cdots , (M - \lambda I) e_{\lambda, m} =e_{\lambda, m-1} </math> :也就是说<math>\; (M - \lambda I) e_{\lambda, 1} = 0 , \; (M - \lambda I)^2 e_{\lambda, 2} = 0 , \cdots , (M - \lambda I)^m e_{\lambda, m} =0 </math> 因此,“所有特征值在<math>\mathbb{K}</math>中的矩阵都相似于某个若尔当标准型”这个命题等价于存在一个由这个矩阵的特征向量和广义特征向量构成的全空间的基底。 === 幂零矩阵的情况 === 当矩阵''A''为[[幂零矩阵]](即存在''m''使得<math>A^m = 0</math>)时,可以证明整个空间总是可以分解为若干个''A''-循环子空间的直和<ref>{{en}}[http://www.mth.msu.edu/~shapiro/Pubvit/Downloads/CycNilp/CycNilp.pdf J.H. Shapiro的一个证明] {{Wayback|url=http://www.mth.msu.edu/~shapiro/Pubvit/Downloads/CycNilp/CycNilp.pdf |date=20140309024546 }}</ref>。所谓的''A''-循环子空间就是由某个向量''v''以及基底:<math>\mathit{B}_v = \left\{ v, Av, A^2v, \cdots \right\}</math>线性张成的子空间。显然,这样的子空间是''A''-[[不变子空间]]。同时,注意到<math>\mathit{B}_v</math>是由''A''的特征向量和广义特征向量构成的(<math>\forall j \ge 0, A^j v \in \operatorname{Ker} A^m</math>)。因此在这个循环子空间里,''A''在基底<math>\displaystyle\mathit{B}_v</math>下表示为若尔当块: :<math>J_v = \begin{bmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots& \vdots & \vdots \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 0 \\\end{bmatrix}</math> 因此''A''在所有这样的基底下可以表示为由若尔当块组成的分块对角矩阵,即若尔当标准型: :<math>J = \begin{bmatrix} J_{v_1} & 0 & 0 & \cdots & 0 \\ 0 & J_{v_2} & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots& \vdots & \vdots \\ 0 & 0 & 0 & J_{v_{s-1}} & 0 \\ 0 & 0 & 0 & 0 & J_{v_s} \\\end{bmatrix}</math> ===一般情况=== 下面用[[数学归纳法]]证明:所有特征值在<math>\mathbb{K}</math>中的''n'' × ''n''的矩阵都相似于某个若尔当标准型。 ''n''= 1的情况显然。对于<math>n > 1</math>考虑''n'' × ''n''矩阵''A''。对于''A''的一个特征值λ,设''s''为λ的几何重数。设线性变换<math>(A - \lambda I)^s</math> 的像空间为<math>\mathrm{Im}(A - \lambda I)^s</math>,这是关于''A''的一个[[不变子空间]]。因为λ是特征值,<math>\mathrm{Im}(A - \lambda I)^s</math>的空间维数''r''严格小于''n''。记<math>\scriptstyle A^{\prime}</math>为''A''在子空间限制<math>\mathrm{Im}(A - \lambda I)^s</math>上的部分。根据归纳假设存在一个基底:{''p''<sub>1</sub>, ..., ''p''<sub>''r''</sub>}使得<math>\scriptstyle A^{\prime}</math>在这个基底上为若尔当标准型。 接下来考虑子空间<math>\operatorname{Ker}(A-\lambda I)^s</math>,只要能够证明整个空间可以分为: :<math>C^n = \mathrm{Im}(A - \lambda I)^s \oplus \mathrm{Ker}(A - \lambda I)^s </math> 由于<math>\mathrm{Ker}(A - \lambda I)^s</math>是一个''A''-不变子空间,在上面<math>A - \lambda I</math>是幂零矩阵,因此可以写成若尔当标准型: :<math>J = \begin{bmatrix} J_{v_1} & 0 & 0 & \cdots & 0 \\ 0 & J_{v_2} & 0 & \cdots & 0 \\ \vdots & \vdots & \ddots& \vdots & \vdots \\ 0 & 0 & 0 & 0 & J_{v_s} \\\end{bmatrix}</math> 而加上<math>\displaystyle \lambda I</math>后还是若尔当标准型。因此,''A''在<math>\mathrm{Ker}(A - \lambda I)^s</math>和<math>\mathrm{Im}(A - \lambda I)^s</math>上都能写成若尔当标准型,从而''A''相似于某个若尔当标准型。 利用归纳法可知所有的''n'' × ''n''的矩阵都相似于某个若尔当标准型。 下面证明: :<math>C^n = \mathrm{Im}(A - \lambda I)^s \oplus \mathrm{Ker}(A - \lambda I)^s </math> 设''A''的最小多项式为<math>\pi_A</math>,并将其写成<math>\pi_A = (X - \lambda I)^s \cdot Q</math>。于是<math>Q</math>和<math>(X - \lambda I)^s</math>互素。于是根据[[裴蜀定理]],存在多项式:''a''和''b''使得<math>a(X - \lambda I)^s + bQ=1</math>。每个向量''u''都可以写成: : <math>\displaystyle u =a(A - \lambda I)^s(u) + bQ(A)(u)</math> 并且<math>\displaystyle Q(A)(a(A - \lambda I)^s(u)) = (Q(A - \lambda I)^s)(a(u)) = \pi_A(u) = 0 </math>,同样地<math>\displaystyle (A - \lambda I)^s(bQ(A)(u))= ((A - \lambda I)^sQ)(b(u)) = \pi_A(u) =0</math>,因此<math>a(A - \lambda I)^s(u) \in \mathrm{Ker}(Q(A)), \; bQ(A)(u) \in \mathrm{Ker}(A - \lambda I)^s</math>,也就是说: :<math>\displaystyle C^n = \mathrm{Ker}(Q(A)) + \mathrm{Ker}(A - \lambda I)^s </math> 另一方面,任意<math>v \in \mathrm{Ker}(A - \lambda I)^s \cap \mathrm{Ker}(Q(A))</math>,<math>\displaystyle v =a(A - \lambda I)^s(v) + bQ(A)(v) = 0 + 0 = 0</math>。也就是说:<math>\mathrm{Ker}(A - \lambda I)^s \cap \mathrm{Ker}(Q(A)) = {0}</math>。综上所述, :<math>C^n = \mathrm{Ker}(Q(A)) \oplus \mathrm{Ker}(A - \lambda I)^s </math> 然而<math>\forall u \in \mathrm{Im}(A - \lambda I)^s</math>,<math>\displaystyle Q(A)(u) = 0</math>,从而<math>\mathrm{Im}(A - \lambda I)^s \subset \mathrm{Ker}(Q(A))</math>。而根据[[秩-零化度定理]],<math>\mathrm{Ker}(Q(A))</math>和<math>\mathrm{Im}(A - \lambda I)^s</math>维数相等,所以两者完全相等。于是 :<math>C^n = \mathrm{Im}(A - \lambda I)^s \oplus \mathrm{Ker}(A - \lambda I)^s </math> 从而命题得证。 == 推论 == *如果矩阵的系数域是一个[[代数闭域]],那么由于其特征值是[[特征多项式]]的根,所以也在系数域中。于是只要系数域是一个代数闭域,所有的矩阵都相似于若尔当标准型。特别的,所有复系数矩阵都可以简化为若尔当标准型,因为复数域是代数封闭的。 *所有的若尔当标准型都可以分解成一个对角矩阵''D''和一个只有对角线上一排为1的矩阵''N''的和。注意,这两个矩阵是不可交换的,因为对角矩阵''D''不一定是数量矩阵。矩阵''N''是一个幂零矩阵。因此,每个相似于若尔当标准型的矩阵都可以写成可交换的一个对角矩阵和一个幂零矩阵的和。因为与对角矩阵和幂零矩阵相似的矩阵仍然是对角矩阵和幂零矩阵。换句话说,只要一个矩阵的特征值都在它的系数域里(或者说它的最小多项式或特征多项式可以分解成一次项的乘积),就可以将这个矩阵分解成一个对角矩阵和一个幂零矩阵的和,但要注意这两个矩阵可以交换。当对角矩阵为数量矩阵时,在计算矩阵的[[指數函數|指数]]时是很方便的(可以用二项式展开)。 === 谱映射定理 === 用若尔当标准型以及直接的计算可以得出:如果''n'' × ''n''矩阵''A''的特征值为:λ<sub>1</sub>, ..., λ<sub>''n''</sub>,那么对于多项式:''p'',矩阵''p''(''A'')的特征值是:''p''(λ<sub>1</sub>), ..., ''p''(λ<sub>''n''</sub>)。 === 凯莱-哈密尔顿定理 === [[凯莱-哈密顿定理|凯莱-哈密尔顿定理]]断言任意矩阵''A''都是特征方程的根:如果''p''是''A''的[[特征多项式]],那么''p''(''A'') = 0。这个定理一样可以用若尔当标准型直接计算得出。 === 最小多项式 === 方块矩阵''A''的[[最小多项式]]是使得''m''(''A'') = 0的非常数[[首一多项式]]中次数最小者。另一种定义是:所有使得''m''(''A'') = 0的多项式构成[[主理想环]]''C''[''x'']的一个[[理想 (环论)|理想]]''I'',而''m''则是这个理想的产生子。 对于有若尔当标准型的矩阵''A'',其最小多项式以其特征值为根,并且由若尔当标准型的形状可以看出,每个特征值的重数是若尔当标准型中属于这个特征值的最大的若尔当块的维数。 反之已知矩阵''A''的最小多项式并不能知道其若尔当标准型。要确定矩阵''A''的标准型需要用到所谓的'''初等因子'''。矩阵''A''的一个初等因子是它的某一个若尔当块的特征多项式(或最小多项式,对于若尔当块两者一样)。如果所有的初等因子都是一次多项式,那么''A''可对角化。 === 不变子空间分解 === 一个''n'' × ''n''的矩阵''A''的若尔当标准型是分块对角矩阵,因此给出了一个将''n''维[[欧几里得空间]]分解为矩阵''A''的不变子空间的具体方法。每个若尔当块''J''<sub>''i''</sub>都对应着一个不变子空间:''X''<sub>''i''</sub>。可以简记为: :<math>\mathbb{C}^n = \bigoplus_{i = 1}^k X_i</math> 其中的每个''X''<sub>''i''</sub>都是由若尔当块''J''<sub>''i''</sub>对应的广义特征向量张成的子空间。 注意到这里的''k''并不是不同的特征值的个数,因为属于同一个特征值的若尔当块可以不止一个。如果要将<math>\mathbb{C}^n</math>分解为''l''个不变子空间,其中''l''是不同特征值的个数的话,可以将属于同一个特征值,比如说<math>\scriptstyle \lambda_i</math>的若尔当块合并:只需使用''A''的最小多项式<math>\pi_A</math>中关于<math>\scriptstyle \lambda_i</math>的重根数(代数重数)<math>\scriptstyle \nu(\lambda_i)</math>,考虑空间: :<math>\; Y_i = \operatorname{Ker} (\lambda_i - A)^{\nu(\lambda_i)}.</math> 这就是所有的属于同一个特征值<math>\scriptstyle \lambda_i</math>的若尔当块所对应的''X''<sub>''i'',''p''</sub>所合并后的空间,因为它包含了所有使得经过<math>\scriptstyle \nu(\lambda_i)</math>次<math>\scriptstyle \lambda_i - A</math>操作后会清零的向量集合。如果某个''X''<sub>''i''</sub>中向量没有被清零,那么由于这个向量也不会被其他的特征值<math>\scriptstyle \lambda_j - A</math>清零,它将不会被<math>\scriptstyle \pi_A</math>清零,这与<math>\pi_A(A)=0</math>矛盾。 于是''n''维[[欧几里得空间]]也可以被分解为 :<math>\mathbb{C}^n = \bigoplus_{i = 1}^l Y_i</math> 其中''l''是矩阵''A''的不同的特征值的个数。 值得注意的是,这里的指标ν(''λ'')是使得特征零空间<math>\operatorname{Ker} (\lambda - A)^m </math>“稳定”下来的最小次数: :<math>\mathrm{Ker}(\lambda - A)^{\nu(\lambda)} = \operatorname{Ker} (\lambda - A)^m, \; \forall m \geq \nu(\lambda) </math> 这也可以作为代数重数的另一个定义。 == 参见 == * [[矩阵分解]] * [[若尔当矩阵]] ==注释== {{reflist}} ==参考来源== <div class="references-small"> * N.丹佛,J.T.施瓦茨,《线性算子》第一章:一般理论(''Linear Operators, Part I: General Theory''), Interscience, 1958. * Daniel.T. Finkbeiner II,《矩阵与线性变换导论》第三版(''Introduction to Matrices and Linear Transformations, Third Edition''), Freeman, 1978. * Gene H. Golub,Charles F. van Loan,《矩阵计算》第三版(''Matrix Computations''), Johns Hopkins University Press, Baltimore, 1996. * Gene H. Golub,J. H. Wilkinson,《病态特征系统以及若尔当标准型计算》(Ill-conditiones Eigensystems and the computation of the Jordan normal form), ''SIAM Review'', vol. 18, nr. 4, pp. 578–619, 1976. * {{Citation | last1=Horn | first1=Roger A. | last2=Johnson | first2=Charles R. | title=矩阵分析(Matrix Analysis) | publisher=[[Cambridge University Press]] | isbn=978-0-521-38632-6 | year=1985}}. * Glenn James,Robert C. James,《数学辞典》第四版(''Mathematics Dictionary, Fourth Edition''), Van Nostrand Reinhold, 1976. * Saunders MacLane,Garrett Birkhoff,《代数学》(''Algebra''), MacMillan, 1967. * Anthony N. Michel,Charles J. Herget,《应用代数和泛函分析》(''Applied Algebra and Functional Analysis''), Dover, 1993. * Georgi E. Shilov,《线性代数》(''Linear Algebra''), Dover, 1977. * [http://mathworld.wolfram.com/JordanCanonicalForm.html 若尔当正规型] {{Wayback|url=http://mathworld.wolfram.com/JordanCanonicalForm.html |date=20210422093929 }} </div> ==外部链接== [[Category:线性代数]] [[Category:矩阵论]] [[Category:矩阵分解]]
该页面使用的模板:
Template:Citation
(
查看源代码
)
Template:En
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Wayback
(
查看源代码
)
返回
若尔当标准型
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息