雅卡尔指数

来自testwiki
跳转到导航 跳转到搜索

Template:Multiple image 雅卡尔指数Template:Lang-en),又称为交并比Template:Lang)、雅卡尔相似系数Template:Lang),是用于比较样本集的相似性与多样性的统计量。雅卡尔系数能够量度有限样本集合的相似度,其定义为两个集合交集大小与并集大小之间的比例:

J(A,B)=|AB||AB|=|AB||A|+|B||AB|.

如果AB完全重合,则定义J(A,B) = 1。于是有

0J(A,B)1.

雅卡尔距离Template:Lang)则用于量度样本集之间的不相似度,其定义为1减去雅卡尔系数,即

dJ(A,B)=1J(A,B)=|AB||AB||AB|.

此外,亦有人将雅卡尔距离定义两集合对称差AB=(AB)(AB)的大小与并集大小之间的比例。

雅卡尔距离是所有有限样本集合间的度量[1][2][3]

Template:Stub

参见

参考文献

Template:Reflist

  1. Sven Kosub, "A note on the triangle inequality for the Jaccard distance" arXiv:1612.02696 Template:Wayback
  2. Template:Citation
  3. Template:Citation