简单匹配系数

来自testwiki
跳转到导航 跳转到搜索

简单匹配系数Template:Lang-en,缩写Template:Lang),又称为兰德相似系数Template:Lang),是用于比较样本信合之间相似性与多样性统计量[1]

A
0 1
B 0 M00 M10
1 M01 M11

假设两个对象A与B分别有n个二值属性,则SMC的定义为:

SMC=匹 配 属 性 数 量属 性 总 数=M00+M11M00+M01+M10+M11

其中

M11表示AB的数值都为1的属性数量;
M01表示A的数值为0、而B的数值为1的属性数量;
M10表示A的数值为1、而B的数值为0的属性数量;
M00表示AB的数值都为0的属性数量。

类似地,可以定义简单匹配距离Template:Lang,缩写Template:Lang)为1SMC,用于量度样本集合间的不相似度。[2]

SMC与汉明相似度间呈线性关系:SMC=(Hamann+1)/2。而其与欧基里得距离间的关系为SMC=1D2/n,其中n为属性总数。SMC与雅卡尔指数也很相似,区别在于在雅卡尔指数的定义中分子与分母都没有M00项。

参考文献

Template:Reflist