中心化矩阵

来自testwiki
imported>書畫晝盡2023年10月1日 (日) 12:26的版本 建立内容为“数学多元变量统计中,'''中心化矩阵'''<ref>John I. Marden, ''Analyzing and Modeling Rank Data'', Chapman & Hall, 1995, {{ISBN|0-412-99521-2}}, page 59.</ref>指对称幂等矩阵,且当其与向量相乘时,效果等用于从向量的每个分量中减去分量的平均值。 == 定义 == 大小为n的'''中心化矩阵'''是n×n的 :<math>C_n = I_n - \tfrac{1}{n}J_n </math> 其中<math>I_n…”的新页面)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

数学多元变量统计中,中心化矩阵[1]对称幂等矩阵,且当其与向量相乘时,效果等用于从向量的每个分量中减去分量的平均值

定义

大小为n的中心化矩阵是n×n的

Cn=In1nJn

其中In单位矩阵Jn是n×n一矩阵。例如

C1=[0],
C2=[1001]12[1111]=[12121212] ,
C3=[100010001]13[111111111]=[231313132313131323]

性质

给定长为n的列向量𝐯Cn中心性可表为

Cn𝐯=𝐯(1nJn,1T𝐯)Jn,1

其中Jn,1值全为1的列向量1nJn,1T𝐯𝐯的分量的平均值。

  • Cn是正半定对称阵。
  • Cn幂等矩阵,所以Cnk=Cn (k=1,2,)。均值被移除的话它就是零,再次移除也没有任何影响。
  • Cn奇异矩阵/不可逆矩阵。应用Cn𝐯变换的效果无法逆转。
  • Cn具有重数为n-1的特征值1与重数为1的特征值0
  • Cn正交投影矩阵。也就是说Cn𝐯𝐯在n-1维线性子空间上的投影,其与零空间Jn,1正交(这是所有分量和为0的n向量构成的子空间)。
  • Cn的迹是n(n1)/n=n1

应用

虽然与中心化矩阵相乘并不是去除向量均值的有效计算方法,但却是一种方便的分析工具。它不仅可用来去除单个向量的均值,还可去除存储在m×n矩阵X的行或列中多个向量的均值。

左乘Cm将从n列的每一列减去相应的均值,这样积CmX的每列的均值都是0。相似地,右乘Cn会从每行减去相应的均值,这样积XCn的每行均值都为0。两侧均乘:CmXCn将产生行列均值均为0的矩阵。

中心化矩阵提供了一种表示散布矩阵的方法:对数据样本X,有S=(XμJn,1T)(XμJn,1T)T,其中μ=1nXJn,1样本均值。有了中心化矩阵,可以将散布矩阵更简洁地表示为

S=XCn(XCn)T=XCnCnXT=XCnXT.

Cn多项分布协方差矩阵,在特殊情况下分布参数为k=np1=p2==pn=1n

参考文献

Template:Reflist

  1. John I. Marden, Analyzing and Modeling Rank Data, Chapman & Hall, 1995, Template:ISBN, page 59.