秩 (线性代数)

来自testwiki
跳转到导航 跳转到搜索

Template:ScienceNavigation Template:NoteTA

线性代数中,一个矩阵 A 的列秩是列向量生成的最大线性无关组的向量个数。类似地,行秩是矩阵A线性无关的横行的个数。矩阵的列秩和行秩总是相等的,因此它们可以简单地称作矩阵 ATemplate:Lang)。通常表示为 r(A)rank(A)rk(A)

可替代定义

用-{行列式}-定义

Am×n 矩阵。若 A 至少有一个 r 阶非零子式,而其所有 r+1 阶子式全为零,即矩阵的最高阶非零子式的阶数为r。则称 rA 的秩。

用向量组的秩定义

对于 m线性空间 V 中的一个向量组 F={α1,α2,...,αs},若 FS={α1,α2,...,αr} 中的 r 个向量线性无关,且若 r<sαr+1FSS{αr+1}r+1 个向量都线性相关,则称 {α1,α2,...,αr}{α1,α2,...,αs}极大线性无关组r{α1,α2,...,αs}。可以证明 F 的秩等于向量组 F 生成的子空间的维数。 矩阵 A列秩定义为 A 的列向量组的秩,也即矩阵的列空间的维数。类似地,矩阵的行秩定义为 A 的行向量组的秩,即矩阵的行空间的维数。

用线性映射定义

考虑线性映射

fA:FnFm
xAx

对于每个矩阵 AfA 都是一个线性映射,同时,对每个 FnFm 的 线性映射 f,都存在矩阵 A使得 f=fA。也就是说,映射

Φ:n(𝕂)(Fn,Fm)
AfA

是一个同构映射。所以一个矩阵 A 的秩还可定义为 fA 的像的维度(像与核的讨论参见线性映射)。矩阵 A 称为 fA变换矩阵。这个定义的好处是适用于任何线性映射而不需要指定矩阵,因为每个线性映射有且仅有一个矩阵与其对应。秩还可以定义为 nf的维度;秩-零化度定理證明它等于 f 的像的维度。

行秩列秩相等性

矩阵的行秩与列秩相等,是线性代数基本定理的重要组成部分。其基本证明思路是,矩阵可以看作线性映射的变换矩阵,列秩为像空间的维度,行秩为非零原像空间的维度,因此列秩与行秩相等,即像空间的维度与非零原像空间的维度相等(这里的非零原像空间是指约去了零空间后的商空间:原像空间)。这从矩阵的奇异值分解就可以看出来。

给出这一结果的两种证明. 第一个证明是简短的,仅用到向量的线性组合的基本性质. 第二个证明利用了正交性[1]. 第一个证明利用了列空间的基, 第二个证明利用了行向量空间的基. 第一个证明适用于定义在标量域上的矩阵,第二个证明适用于内积空间。二者都适用于实或复的欧氏空间,也都易于修改去证明当A是线性变换的情形.

证明一

A 是一个 m×n 的矩阵,其列秩为 r . 因此矩阵 A 的列空间的维度是 r . 令 c1,c2,,crA 的列空间的一组基,构成 m×r 矩阵 C的列向量 C=[c1,c2,,cr],并使得 A 的每个列向量是 Cr 个列向量的线性组合. 由矩阵乘法的定义,存在一个 r×n 矩阵 R, 使得 A=CR. (A(i,j) 元素是 ciR 的第 j 个行向量的点积.)

现在,由于 A=CR, A 的每个行向量是 R 的行向量的线性组合,这意味着 A 的行向量空间被包含于 R 的行向量空间之中. 因此 A 的行秩 ≤ R的行秩. 但R仅有r行, 所以R的行秩 ≤ r = A的列秩. 这就证明了A的行秩 ≤ A的列秩.

把上述证明过程中的“行”与“列”交换,利用对偶性质同样可证A的列秩 ≤ A的行秩。更简单的方法是考虑A的转置矩阵AT,则A的列秩 = AT的行秩 ≤ AT的列秩 = A的行秩. 这证明了A的列秩等于A的行秩. 证毕.

证明二

Am×n矩阵,其行秩是r. 因此A的行向量空间的维度是r,设x1,x2,,xrA的行向量空间的一组基. 如果把这组基当作原像列向量看待,则向量集Ax1,Ax2,,Axr是线性独立的。 这是因为对一组标量系数c1,c2,,cr,如果:

c1Ax1+c2Ax2+crAxr=A(c1x1+c2x2++crxr)=Av=0,

其中v=c1x1+c2x2+,crxr. 则可以推出有两个事实: (a) vA行向量空间的线性组合, 即v属于A的行向量空间;(b) 由于Av = 0, v正交于A的所有行向量,从而正交于A的行向量空间的所有向量. 事实(a)与(b)结合起来,则v正交于自身,这意味着v = 0. 由v的定义:

c1x1+c2x2+,crxr=0.

再由xiA的行向量空间的一组线性独立的基,可知c1=c2==cr=0. Ax1,Ax2,,Axr因而是线性独立的.

AxiA的列空间中的向量. 因此Ax1,Ax2,,AxrA的列空间中r个线性独立的向量. 所以A的列向量空间的维数(A的列秩)必然不小于r. 这证明了A的行秩r ≤ A的列秩. 把这一结果应用于A的转置矩阵可以得到: A的列秩 = AT的行秩 ≤ AT列秩 = A的行秩. 这证明了A的列秩等于A的行秩,证毕.

最后, 还可以证明rk(A) = rk(A*), 其中A*A的共轭转置或称施密特转置. 当A的元素都是实数, 这一结果变为rk(A) = rk(AT). 然而对于复系数矩阵,rk(A) = rk(A*)并不等价于行秩等于列秩, 需要用到上述两个证明.

证明三

A是一个m×n矩阵. 定义rk(A)为A的列秩,A*A的共轭转置或称施密特转置. 首先可知A*Ax = 0当且仅当Ax = 0.

A*Ax = 0 ⇒ x*A*Ax = 0 ⇒ (Ax)*(Ax) = 0 ⇒ ‖Ax‖2 = 0 ⇒ Ax = 0,

其中‖·‖是欧氏范数. 这说明A的零空间与A*A的零空间相同. 由秩-零化度定理, 可得rk(A) = rk(A*A). A*A的每一个列向量是A*的列向量的线性组合. 所以A*A的列空间是A*的列空间的子空间. 从而rk(A*A) ≤ rk(A*). 即: rk(A) = rk(A*A) ≤ rk(A*). 应用这一结果于A*可获得不等式: 由于(A*)* = A, 可写作rk(A*) ≤ rk((A*)*) = rk(A). 这证明了rk(A) = rk(A*). 证毕.

性质

我们假定A是在域F上的m × n矩阵并描述了上述线性映射。

  • m × n矩阵的秩不大于m且不大于n的一个非负整数,表示為 rk(A) ≤ min(m, n)。有尽可能大的秩的矩阵被称为有满秩;类似的,否则矩阵是秩不足(或称为“欠秩”)的。
  • 只有零矩阵有秩0
  • A的秩最大为min(m,n)
  • f单射,当且仅当A有秩n(在这种情况下,我们称A有“列满秩”)。
  • f满射,当且仅当A有秩m(在这种情况下,我们称A有“行满秩”)。
  • 在方块矩阵A (就是m = n)的情况下,则A可逆的,当且仅当A有秩n(也就是A有满秩)。
  • 如果B是任何n × k矩阵,则AB的秩最大为A的秩和B的秩的小者。即:
    rank(AB)min(rank A,rank B).
    推广到若干个矩阵的情况,就是:
    rank(A1A2An)min(rank A1,rank A2,,rank An).
    证明:
    考虑矩阵的秩的线性映射的定义,令A、B对应的线性映射分别为fg,则AB表示复合映射f·g,它的象Im f·gg的像Im g在映射f作用下的象。然而Im g是整个空间的一部分,因此它在映射f作用下的象也是整个空间在映射f作用下的象的一部分。也就是说映射Im f·gIm f的一部分。对矩阵就是:秩(AB)≤秩(A)。
    对于另一个不等式:秩(AB)≤秩(B),考虑Im g的一组:(e1,e2,...,en),容易证明(f(e1),f(e2),...,f(en))生成了空间Im f·g,于是Im f·g维度小于等于Im g的维度。对矩阵就是:秩(AB)≤秩(B)。
    因此有:秩(AB)≤min(秩(A),秩(B))。若干个矩阵的情况证明类似。
    作为"<"情况的一个例子,考虑积
    [0010][0001]
    两个因子都有秩1,而这个积有秩0。
    可以看出,等号成立当且仅当其中一个矩阵(比如说A)对应的线性映射不减少空间的维度,即是单射,这时A是满秩的。于是有以下性质:
    • 如果B是秩nn × k矩阵,则
      rank(AB)=rank(A).
    • 如果C是秩ml × m矩阵,则
      rank(CA)=rank(A).
  • A的秩等于r,当且仅当存在一个可逆m × m矩阵X和一个可逆的n × n矩阵Y使得
    XAY=[Ir000]
    这裡的Ir指示r × r 单位矩阵
    证明可以通过高斯消去法构造性地给出。
  • 西尔维斯特不等式: 如果 A 是一个 m × n 的矩阵且 Bn × k 的, 则
    rank(A)+rank(B)nrank(AB).Template:Efn-lr
    这是下一个不等式的特例.
  • 这个不等式是由Frobenius提出的: 如果 AB, ABCBC 有定义, 则
    rank(AB)+rank(BC)rank(B)+rank(ABC).Template:Efn-lr
  • 子加性:当矩阵AB的形状相同时,有rank(A+B)rank(A)+rank(B) . 因此,一个秩为k的矩阵能够表示成k个秩为1的矩阵的加和,但不能是k-1个或更少。
  • 矩阵的秩加上矩阵的零化度等于矩阵的纵列数(这就是秩-零化度定理)。
  • 如果 A实数上的矩阵,那么 A 的秩和它对应格拉姆矩阵的秩相等。于是,对于实矩阵
    rank(ATA)=rank(AAT)=rank(A)=rank(AT).
    该性质可以通过它们的零空间证明. 格拉姆矩阵的零空间由所有满足 ATAx=0的向量x组成。如果上式成立, 那么下式也成立: 0=xTATAx=|Ax|2,于是,Ax=0,即ATAA的零空间相同.[2]
  • 如果 A复数上的矩阵且 A* 表示 A 的共轭转置(i.e., A 伴随), 则
    rank(A)=rank(A)=rank(AT)=rank(A*)=rank(A*A).

向量组的线性相关性

mn维列向量排列成n×m的矩阵A,这个对应矩阵的秩即为原向量组的秩。

原向量组线性相关的充分必要条件为:

r(A)<m

如果

r(A)=m

则向量组线性无关。另外,不存在

r(A)>m

特殊的,若向量的个数m大于向量的维数n,则根据:

r(A)n<m

这个向量组必然线性相关。

计算

计算矩阵A的秩的最容易的方式是高斯消去法,即利用矩阵的初等变换生成一个行阶梯形矩阵,由于矩阵的初等变换不改变矩阵的秩,因此A的行阶梯形矩阵有同A一样的秩。经过初等变换的矩阵的非零行的数目就是原矩阵的秩。

例如考虑4 × 4矩阵

A=[2413121000223625]

我们看到第2纵列是第1纵列的两倍,而第4纵列等于第1和第3纵列的总和。第1和第3纵列是线性无关的,所以A的秩是2。这可以用高斯算法验证。它生成下列A的行阶梯形矩阵:

A=[1201001100000000]

它有两个非零的横行。

在应用在计算机上的浮点数的时候,基本高斯消去(LU分解)可能是不稳定的,应当使用秩启示(revealing)分解。一个有效的替代者是奇异值分解(SVD),但还有更少代价的选择,比如有支点(pivoting)的QR分解,它也比高斯消去在数值上更强壮。秩的数值判定要求对一个值比如来自SVD的一个奇异值是否为零的依据,实际选择依赖于矩阵和应用二者。

应用

计算矩阵的秩的一个有用应用是计算线性方程组解的数目。如果系数矩阵的秩等于增广矩阵的秩,则该方程组有解。在这种情况下,如果它的秩等于方程的数目那么该方程组有唯一的一个精确解。如果增广矩阵的秩大于系数矩阵的秩,则方程组是不一致(Inconsistent)的。

控制论中,矩阵的秩可以用来确定线性系统是否为可控制的,或可观察的。

註解

Template:Notelist-lr

参考文献

  1. Mackiw, G. (1995). A Note on the Equality of the Column and Row Rank of a Matrix. Mathematics Magazine, Vol. 68, No. 4
  2. Template:Cite book
  • Horn, Roger A. and Johnson, Charles R. Matrix Analysis. Cambridge University Press, 1985. ISBN 978-0-521-38632-6.
  • Kaw, Autar K. Two Chapters from the book Introduction to Matrix Algebra: 1. Vectors [1] and System of Equations [2]

参见

Template:线性代数的相关概念