【2.7.3】集合相似性--Overlap coefficient
overlap coefficient 或Szymkiewicz–Simpson coefficient(SCC)是两个数据集相似度的度量,是两个数据集的交集和最小的那个数据集的比值,是Jaccard index 的一种延伸。
$$ overlap(X,Y) = \frac{X ∩ Y}{ min (|A| ,|B| )}$$

overlap coefficient 或Szymkiewicz–Simpson coefficient(SCC)是两个数据集相似度的度量,是两个数据集的交集和最小的那个数据集的比值,是Jaccard index 的一种延伸。
$$ overlap(X,Y) = \frac{X ∩ Y}{ min (|A| ,|B| )}$$