close

Jaccard相似度主要的概念為 = (交集) / (聯集) ; 而這裡的聯集是指只要有任何一個項目成立即可,而交集則是兩者都必需同時成立。

舉例來說,若要求得Lee與Ken的相似度,以及Meg與Nan的相似,其計算如下:

1.png

 Jaccard Similarity (Lee, Ken) = 3/6 =0.5

Jaccard Similarity (Meg, Nan) = 1/6 =0.167 


當然,你也可透過 另外一種方式來解讀Jaccard相似度,下表為Contingency table,主要在探討item i與item j之間的相似度 

 1.png  

 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 MR. MINING 的頭像
    MR. MINING

    蛋塔賣你 (Data Mining)

    MR. MINING 發表在 痞客邦 留言(0) 人氣()