协方差矩阵

来自testwiki
跳转到导航 跳转到搜索

Template:NoteTA

中心为 (0, 0) 的一个二元高斯概率密度函数,协方差矩阵为 [ 1.00, 0.50 ; 0.50, 1.00 ]。
一个左下右上方向标准差为 3,正交方向标准差为 1 的多元高斯分布的样本点。由于 xy 分量共变(即相关),xy 的方差不能完全描述该分布;箭头的方向对应的协方差矩阵的特征向量,其长度为特征值的平方根。

统计学概率论中,协方差矩阵(covariance matrix)是一个方阵,代表著任兩列Template:Le间的协方差,是协方差的直接推广。

定义

Template:Math theorem

將之以矩形表示的話就是:

𝐜𝐨𝐯(X,Y)=[cov(x1,y1)cov(x1,y2)cov(x1,yn)cov(x2,y1)cov(x2,y2)cov(x2,yn)cov(xm,y1)cov(xm,y2)cov(xm,yn)]
=[E[(x1μ1)(y1ν1)]E[(x1μ1)(y2ν2)]E[(x1μ1)(ynνn)]E[(x2μ2)(y1ν1)]E[(x2μ2)(y2ν2)]E[(x2μ2)(ynνn)]E[(xmμm)(y1ν1)]E[(xmμm)(y2ν2)]E[(xmμm)(ynνn)]]

根據測度積分的線性性質,协方差矩阵還可以進一步化簡為:

𝐜𝐨𝐯(X,Y)=[E(xiyj)μiνj]n×n

矩陣表示法

以上定義所述的隨機變數序列 XY ,也可分別以用行向量 𝐗:=[xi]m𝐘:=[yj]n 表示,換句話說:

𝐗:=[x1x2xm] 𝐘:=[y1y2yn]

這樣的話,對於 m×n 個定義在 Ω 上的隨機變數 aij 所組成的矩陣 𝐀=[aij]m×n , 定義:

E[𝐀]:=[E(aij)]m×n

也就是說

E[𝐀]:=[E(a11)E(a12)E(a1n)E(a21)E(a22)E(a2n)E(am1)E(am2)E(amn)]

那上小節定義的协方差矩阵就可以記为:

𝐜𝐨𝐯(X,Y)=E[(𝐗E[𝐗])(𝐘E[𝐘])T]

所以协方差矩阵也可對 𝐗𝐘 來定義:

𝐜𝐨𝐯(𝐗,𝐘):=E[(𝐗E[𝐗])(𝐘E[𝐘])T]

术语与符号分歧

也有人把以下的 ΣX 稱為协方差矩阵:

ΣX:=[cov(xi,xj)]m×m=𝐜𝐨𝐯(X,X)

但本頁面沿用威廉·费勒的说法,把 ΣX 稱為 X 的方差(variance of random vector),來跟 𝐜𝐨𝐯(X,Y) 作區別。這是因為:

cov(xi,xi)=E[(xiμi)2]=var(xi)

換句話說, ΣX 的對角線由隨機變數 xi方差所組成。據此,也有人也把 𝐜𝐨𝐯(X,Y) 稱為方差-协方差矩阵(variance–covariance matrix)。

更有人因為方差离差的相關性,含混的將 𝐜𝐨𝐯(X,Y) 稱為离差矩阵

性质

Σ=𝐜𝐨𝐯(X,X) 有以下的基本性质:

  1. Σ=E(𝐗𝐗T)E(𝐗)[E(𝐗)]T
  2. Σ半正定的和对称的矩阵。
  3. var(𝐚𝐓𝐗)=𝐚𝐓var(𝐗)𝐚
  4. Σ0
  5. var(𝐀𝐗+𝐚)=𝐀var(𝐗)𝐀𝐓
  6. cov(𝐗,𝐘)=cov(𝐘,𝐗)T
  7. cov(𝐗𝟏+𝐗𝟐,𝐘)=cov(𝐗𝟏,𝐘)+cov(𝐗𝟐,𝐘)
  8. p=q,則有var(𝐗+𝐘)=var(𝐗)+cov(𝐗,𝐘)+cov(𝐘,𝐗)+var(𝐘)
  9. cov(𝐀𝐗,𝐁𝐗)=𝐀cov(𝐗,𝐗)𝐁T
  10. 𝐗𝐘 是独立的,則有cov(𝐗,𝐘)=0
  11. Σ=ΣT

尽管共變異數矩阵很简单,可它却是很多领域里的非常有力的工具。它能导出一个变换矩阵,这个矩阵能使数据完全去相关(decorrelation)。从不同的角度看,也就是说能够找出一组最佳的基以紧凑的方式来表达数据。(完整的证明请参考瑞利商)。 这个方法在统计学中被称为主成分分析(principal components analysis),在图像处理中称为Karhunen-Loève 变换(KL-变换)。

複随机向量

均值为μ的複随机标量变量的方差定义如下(使用共轭複数):

var(z)=E[(zμ)(zμ)*]

其中复数z的共轭记为z*

如果Z 是一个复列向量,则取其共轭转置,得到一个方阵:

E[(Zμ)(Zμ)*]

其中Z*为共轭转置, 它对于标量也成立,因为标量的转置还是标量。

估计

多元正态分布的共變異數矩阵的估计的推导非常精致. 它需要用到谱定义以及为什么把标量看做1×1矩阵的迹更好的原因。参见共變異數矩阵的估计

外部链接