查看“︁投影 (线性代数)”︁的源代码
←
投影 (线性代数)
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑该页面:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{线性代数}} [[File:Orthogonal projection.svg|frame|right|变换 ''P'' 是在线 ''m'' 上的正交投影。]] 在[[线性代数]]和[[泛函分析]]中,'''投影'''是从[[向量空间]]映射到自身的一种[[线性变换]]<math>P</math>,满足<math>P^2=P</math>,也就是说,当<math>P</math>两次作用于某个值,与作用一次得到的结果相同([[幂等]])。是日常生活中“平行投影”概念的形式化和一般化。同现实中阳光将事物投影到地面上一样,投影变换将整个向量空间映射到它的其中一个子空间,并且在这个子空间中是恒等变换<ref>Meyer, pp 386+387</ref>。 ==定义== 投影的严格定义是:一个从向量空间'''V'''射到它自身的线性变换 ''P'' 是投影,[[当且仅当]]<math>P^2 = P</math>。另外一个定义则较为直观:''P'' 是投影,当且仅当存在'''V'''的一个子空间'''W''',使得 ''P'' 将所有'''V'''中的元素都映射到'''W'''中,而且 ''P'' 在'''W'''上是恒等变换。用数学的语言描述,就是: :<math>\exists W</math>,使得<math>\forall u \in V, P(u) \in W</math>,并且<math>\forall u \in W, P(u)= u</math> == 简单例子 == 在现实生活中,阳光在地面上留下各种影子。这就是投影变换最直白的例子。可以理想化地假设阳光都是沿着同一个方向(比如说垂直于地面的角度)照射而来,大地是严格的平面,那么,对于任意一个物体(比如说一只正在飞行的鸟),它的位置可以用向量 (''x'', ''y'', ''z'') 来表示,而这只鸟在阳光下对应着一个影子,也就是 (''x'', ''y'', 0)。这样的一个变换就是一个投影变换。它将三维空间中的向量 (''x'', ''y'', ''z'') 到映射到向量 (''x'', ''y'', 0) 。这是在 ''x''-''y'' 平面上的投影。这个变换可以用[[矩阵]]表示为 :<math> P = \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix} </math> 因为对任意一个向量 (''x'', ''y'', ''z'') ,这个矩阵的作用是: :<math> P \begin{bmatrix} x \\ y \\ z \end{bmatrix} = \begin{bmatrix} x \\ y \\ 0 \end{bmatrix}</math> 注意到如果一个向量原来就是表示地面上的一点的话(也就是说它的''z''分量等于0),那么经过变换 ''P'' 后不会有改变。也就是说这个变换在子空间 ''x''-''y'' 平面上是恒等变换,这证明了 ''P'' 的确是一个投影。 另外, :<math> P^2 \begin{bmatrix} x \\ y \\ z \end{bmatrix} = P \begin{bmatrix} x \\ y \\ 0 \end{bmatrix} = \begin{bmatrix} x \\ y \\ 0 \end{bmatrix}; </math> 所以 ''P'' = ''P''<sup>2</sup>,这也证明 ''P'' 的确是投影。 == 基本性质 == [[File:Oblique projection.svg|frame|right|变换 ''T'' 是沿着 ''k'' 方向到直线 ''m'' 上的投影。''T'' 的像空间是 ''m'' 而零空间是 ''k''。]] 这里假定投影所在的向量空间'''W'''是有限维的(因此不需要考虑如投影的连续性之类的问题)。假设子空间'''U'''与'''V'''分别为 ''P'' 的像空间与[[零空间]](也叫做[[核 (線性算子)|核]])。那么按照定义,有如下的基本性质: # 按照定义,P是等幂的(即<math>P^2=P</math>) # ''P'' 在像空间'''U'''上是恒等变换:<math> \forall x \in U, \quad P(x) = x</math> # 整个向量空间可以分解成子空间'''U'''与'''V'''的[[直和]]:<math> W = U \oplus V</math>。也就是说,空间里的每一个向量<math>x \in W</math>,都可以以唯一的方式写成两个向量<math>u</math>与<math>v</math>的和:<math> x = u + v</math>,并且满足<math>u=Px</math>, <math>v=x-Px=(I-P)x</math>, 其中<math> u \in U </math>、<math> v \in V </math>。 用[[抽象代数]]的术语来说,投影 ''P'' 是[[幂等]]的[[线性映射]](''P''<sup>2</sup> = ''P'')。因此它的[[极小多项式]]是<math>X^2-X=X(X-1)</math>。因式分解后可以看到,这个多项式只有相异的单根(没有多重根),因此 ''P'' 是[[可对角化矩阵]]。极小多项式也显示出了投影的特性: 像空间与零空间分别是是对应于特征值1和0的[[特征空间]],并给出了整个空间的一个直和分解。 正如日常生活中阳光沿着一定的方向将影子投射到地面上,一般的投影变换也可以称为是沿着'''W'''到'''U'''上的投影。由于向量空间分解成直和的方式一般不是唯一的(阳光可以顺着不同的方向照射),给定一个子空间 ''V''(地面),一般的说有很多到''V'' 的投影(沿不同的'''W''')。 == 正交投影 == 如果向量空间<math>V</math>被赋予了[[内积]]且是[[完備空間|完備]]的,那么就可以定义[[正交]]和其它相关的概念(比如线性算子的自伴随性)了。正交投影是指[[值域]]<math>U</math>和[[零空间]]<math>W</math>相互[[正交]]的投影,也就是说,對於任意<math>u \in U</math>,<math>w \in W</math>,它们的内积<math>(u|w)</math>都等于0。一个投影是正交投影,当且仅当它是[[自伴算子]],以下為證明:如果投影 <math> P</math> 是自伴算子,那么 :<math>\forall u = P(v) \in U,</math> <math>w \in W:</math> :<math>(u|w) = \left( P(v) | w \right) = \left( v | P^*(w) \right) = \left( v | P(w) \right) = \left( v | 0 \right) = 0,</math> 其中<math> P^* </math> 表示 <math> P</math> 的伴随算子。 所以 <math> P</math> 是正交投影。相反的,如果 <math> P</math> 是正交投影,由於 :<math>\forall v \in V: \, v - P(v) \in W,</math> 因此我們有 :<math>\forall v_1, \, v_2 \in V:0 = \left( P(v_1) |(v_2 - P(v_2))\right) = \left( v_1 | (P^* - P^* P)(v_2) \right) .</math> 鉴于 <math> v_1, \, v_2 </math> 是任意選取的,必然有 <math> P^* - P^* P = 0</math> 或 <math> P^* = P^* P,</math> 由於<math>P^*P</math>一定是自伴算子,因此可知 <math> P^*</math>與<math> P</math> 也是自伴算子。 这意味着正交投影的矩阵有特殊的性质。如果投影是在实向量空间中,那么它对应的矩阵是[[对称矩阵|对称]]矩阵: <math> P = P^T</math>。如果投影是在虚向量空间中,那么它的矩阵则是[[埃尔米特矩阵]]:<math> P = P^*</math> ===例子=== 正交投影的最简单的情况是到(过原点)直线上的正交投影。如果 ''u'' 是这条直线的单位方向向量,则投影给出为 :<math> P_u = u u^* \ </math> 这个[[算子]]保留 ''u'' 不变(<math> P_u (u)= u u^* u = u \| u \|^2 = u</math>),并且它作用在所有正交于 ''u'' 的向量上都是0(如果<math>(u|v) = 0 </math>,那么 <math>P_u (v)= u u^* v = u (u|v) = 0 </math>),证明它的确是到包含 ''u'' 的直线上的正交投影<ref>Meyer, p. 431</ref>。 这个公式可以推广至到在任意维的子空间上的正交投影。设 ''u''<sub>1</sub>, …, ''u''<sub>''k''</sub> 是子空间 ''U'' 的一组[[正交基]],并设 ''A'' 为一个''n''×''k'' 的矩阵,它的列向量是 ''u''<sub>1</sub>, …, ''u''<sub>''k''</sub>。那么投影: :<math> P_A = A A^T \ </math><ref>Meyer, equation (5.13.4)</ref> 也是正交的。矩阵 ''A''<sup>T</sup> 是在 ''U'' 的正交补变为零的[[偏等距同构]],而 ''A'' 是把 ''U'' 嵌入底层向量空间的等距同构。''P<sub>A</sub>'' 的值域因此是 ''A'' 的“终空间”(final space)。''A''<sup>T</sup>''A'' 是在 ''U'' 上的恒等算子也是明显的。 正交条件也可以去除。如果 ''u''<sub>1</sub>, …, ''u''<sub>''k''</sub> 是(不必须正交)基,而 ''A'' 是有这些向量作为列的矩阵,则投影是 :<math>P_A = A (A^T A)^{-1} A^T \, </math>。<ref>Meyer, equation (5.13.3)</ref> 矩阵 ''A''<sup>T</sup> 仍把 ''U'' 嵌入到低层向量空间中但一般不再是等距的。矩阵 (''A''<sup>T</sup>''A'')<sup>−1</sup> 是恢复规范的“规范化因子”。例如,秩-1 算子 ''uu''<sup>T</sup> 不是投影,如果 ||''u''|| ≠ 1。在除以 ''u''<sup>T</sup>''u'' = \|''u''\|<sup>2</sup> 之后,我们得获得了到 ''u'' 所生成的子空间的投影 ''u''(''u''<sup>T</sup>''u'')<sup>−1</sup>''u''<sup>T</sup>。 所有这些公式对于复数内积空间也成立,假如用[[共轭转置]]替代转置。 === 斜投影 === 术语'''斜投影'''有时用来提及非正交投影。这些投影也用来在二维绘图中表示空间图形(参见[[斜投影]]),尽管不如正交投影常用。 斜投影用它们的值域和零空间来定义。有给定值域和零空间的投影的矩阵表示的公式可如下这样找到。设向量 ''u''<sub>1</sub>, …, ''u''<sub>''k''</sub> 形成了投影的值域的基,并把这些向量组合到 ''n''×''k'' 矩阵 ''A'' 中。值域和零空间是互补空间,所以零空间有维度 ''n'' − ''k''。它推出零空间的[[正交补]]有维度 ''k''。设 ''v''<sub>1</sub>, …, ''v''<sub>''k''</sub> 形成这个投影的零空间的正交补的基,并把这些向量组合到矩阵 ''B'' 中。则投影定义为 :<math> P = A (B^T A)^{-1} B^T \, </math>。 这个表达式一般化上面给出的正交投影公式。<ref>Meyer, equation (7.10.39)</ref> == 在赋范向量空间上的投影 == 当底层向量空间 ''X'' 是(不必需有限维)[[赋范向量空间]],需要考虑无关于有限维情况的分析问题,假定现在 ''X'' 是[[巴拿赫空间]]。 上面讨论的多数代数概念转移到这个上下文后幸存下来了。给定的 ''X'' 的直和分解成补子空间仍指定一个投影,反之亦然。如果 ''X'' 是直和 ''X'' = ''U'' ⊕ ''V'',则定义自 ''P''(''u'' + ''v'') = ''u'' 的算子仍是有值域 ''U'' 和核 ''V'' 的投影。明显的也 ''P''<sup>2</sup> = ''P''。反过来说,如果 ''P'' 是在 ''X'' 上的投影,就是说 ''P''<sup>2</sup> = ''P'',则很容易验证 (''I'' − ''P'')<sup>2</sup> = (''I'' − ''P'')。换句话说,(''I'' − ''P'') 也是投影。关系 ''I'' = ''P'' + (''I'' − ''P'') 蕴涵了 ''X'' 是直和 Ran(''P'') ⊕ Ran(''I'' − ''P'')。 但是相对于有限维情况,投影一般不必须是[[有界线性算子|连续]]的。如果 ''X'' 的子空间 ''U'' 在规范拓扑下不闭合,则到 ''U'' 上的投影是不连续的。换句话说,连续投影 ''P'' 的值域一定是闭合子空间。进一步的,连续投影(事实上,一般的连续线性算子)的核是闭合的。所以连续投影 ''P'' 把 ''X'' 分解成两个互补的闭合子空间: ''X'' = Ran(''P'') ⊕ Ker(''P'') = Ran(''P'') ⊕ Ran(''I'' − ''P'')。 反命题在有额外假定条件下也成立。假设 ''U'' 是 ''X'' 的闭合子空间。如果存在一个闭合子空间 ''V'' 使得 ''X'' = ''U'' ⊕ ''V'',则有值域 ''U'' 和核 ''V'' 的投影 ''P'' 是连续的。这是从[[闭合图定理]]推出的。假定 ''x<sub>n</sub>'' → ''x'' 而 ''Px<sub>n</sub>'' → ''y''。需要证明 ''Px'' = ''y''。因为 ''U'' 是闭合的且 {''Px<sub>n</sub>''} ⊂ ''U'', ''y'' 位于 ''U'' 中,就是说 ''Py'' = ''y''。还有 ''x<sub>n</sub>'' − ''Px<sub>n</sub>'' = (''I'' − ''P'')''x<sub>n</sub>'' → ''x'' − ''y''。因为 ''V'' 是闭合的且 {(''I'' − ''P'')''x<sub>n</sub>''} ⊂ ''V'',我们有了 ''x'' − ''y'' ∈ ''V'',就是说 ''P''(''x'' − ''y'') = ''Px'' − ''Py'' = ''Px'' − ''y'' = 0,这证明了这个断言。 上述论证利用 ''U'' 和 ''V'' 都是闭合的假定。一般的说,给定一个闭合子空间 ''U'', 不需要存在一个互补的闭合子空间 ''V'',尽管对于[[希尔伯特空间]]总是可以采取[[正交补]]得到。对于巴拿赫空间,一维子空间总是有闭合的补子空间。这是 [[哈恩-巴拿赫定理]]的直接推论。设 ''U'' 是 ''u'' 的线性扩张。通过哈恩-巴拿赫定理,存在一个有界线性泛函 ''φ'',使得 ''φ''(''u'') = 1。算子 ''P''(''x'') = ''φ''(''x'')''u'' 满足 ''P''<sup>2</sup> = ''P'',就是说它是个投影。''φ'' 的有界性蕴涵了 ''P'' 的连续性,因此 Ker(''P'') = Ran(''I'' − ''P'') 是 ''U'' 的闭合补子空间。 == 应用 == 投影(正交与非正交投影)在算法领域和特定线性代数问题中有重要应用。 * [[QR分解]](参见[[豪斯霍尔德变换]]和[[格拉姆-施密特正交化]]) * [[奇异值分解]] * 化为[[海森伯格矩阵]]形式(许多特征值算法的第一步) * [[线性回归]] == 参见 == * {{le|中心矩阵|Centering matrix}},它是投影矩阵的例子。 * [[正交化]] * [[不变子空间]] * [[透视投影]] == 注解 == <references/> == 引用 == * N. Dunford and J.T. Schwartz, ''Linear Operators, Part I: General Theory'', Interscience, 1958. * Carl D. Meyer, ''[http://www.matrixanalysis.com/ Matrix Analysis and Applied Linear Algebra] {{Wayback|url=http://www.matrixanalysis.com/ |date=20200719110850 }}'', Society for Industrial and Applied Mathematics, 2000. ISBN 978-0-89871-454-8. {{线性代数的相关概念}} [[Category:泛函分析|T]] [[Category:线性代数|T]] [[Category:线性算子]] [[sv:Projektion (matematik)]]
该页面使用的模板:
Template:Le
(
查看源代码
)
Template:Wayback
(
查看源代码
)
Template:线性代数
(
查看源代码
)
Template:线性代数的相关概念
(
查看源代码
)
返回
投影 (线性代数)
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
特殊页面
工具
链入页面
相关更改
页面信息