【2.7.3】集合相似性--Overlap coefficient

overlap coefficient 或Szymkiewicz–Simpson coefficient(SCC)是两个数据集相似度的度量,是两个数据集的交集和最小的那个数据集的比值,是Jaccard index 的一种延伸。

$$ overlap(X,Y) = \frac{X ∩ Y}{ min (|A| ,|B| )}$$

这里是一个广告位,,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn