我有两个用户名列表,我想计算Jaccard的相似性.可能吗?
This thread演示了如何计算两个字符串之间的Jaccard相似性,但是我想将其应用于两个列表,其中每个元素都是一个单词(例如用户名).
我有两个用户名列表,我想计算Jaccard的相似性.可能吗?
This thread演示了如何计算两个字符串之间的Jaccard相似性,但是我想将其应用于两个列表,其中每个元素都是一个单词(例如用户名).
我最终写下了自己的解决方案:
def jaccard_similarity(list1, list2):
intersection = len(list(set(list1).intersection(list2)))
union = (len(set(list1)) + len(set(list2))) - intersection
return float(intersection) / union