简单匹配系数

来自testwiki
imported>InternetArchiveBot2022年12月4日 (日) 05:26的版本 (补救2个来源,并将0个来源标记为失效。) #IABot (v2.0.9.2)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转到导航 跳转到搜索

简单匹配系数Template:Lang-en,缩写Template:Lang),又称为兰德相似系数Template:Lang),是用于比较样本信合之间相似性与多样性统计量[1]

A
0 1
B 0 M00 M10
1 M01 M11

假设两个对象A与B分别有n个二值属性,则SMC的定义为:

SMC=匹 配 属 性 数 量属 性 总 数=M00+M11M00+M01+M10+M11

其中

M11表示AB的数值都为1的属性数量;
M01表示A的数值为0、而B的数值为1的属性数量;
M10表示A的数值为1、而B的数值为0的属性数量;
M00表示AB的数值都为0的属性数量。

类似地,可以定义简单匹配距离Template:Lang,缩写Template:Lang)为1SMC,用于量度样本集合间的不相似度。[2]

SMC与汉明相似度间呈线性关系:SMC=(Hamann+1)/2。而其与欧基里得距离间的关系为SMC=1D2/n,其中n为属性总数。SMC与雅卡尔指数也很相似,区别在于在雅卡尔指数的定义中分子与分母都没有M00项。

参考文献

Template:Reflist