散布矩阵

来自testwiki
跳转到导航 跳转到搜索

[多元变量统计]]和概率论中,散布矩阵是一种统计量,用于估计协方差矩阵,例如多元正态分布的协方差矩阵。

定义

给定m维数据的n个样本,写作m×n矩阵X=[𝐱1,𝐱2,,𝐱n],则样本均值

𝐱=1nj=1n𝐱j

其中𝐱jX的第j列。[1]

散布矩阵是m×m正半定矩阵

S=j=1n(𝐱j𝐱)(𝐱j𝐱)T=j=1n(𝐱j𝐱)(𝐱j𝐱)=(j=1n𝐱j𝐱jT)n𝐱𝐱T

其中()T表示矩阵转置[2]乘法为外积。散布矩阵可更简洁地表为

S=XCnXT

其中Cn是n×n中心化矩阵

应用

给定n个样本的多元正态分布协方差矩阵的最大似然估计值可表为归一化散布矩阵

CML=1nS.[3]

X的列从多元正态分布中独立采样时,S遵循威沙特分布

另见

参考文献

Template:Reflist


Template:Statistics-stub Template:Math-stub