我有两个用户名列表,我想计算Jaccard的相似性.可能吗?

This thread演示了如何计算两个字符串之间的Jaccard相似性,但是我想将其应用于两个列表,其中每个元素都是一个单词(例如用户名).

推荐答案

我最终写下了自己的解决方案:

def jaccard_similarity(list1, list2):
    intersection = len(list(set(list1).intersection(list2)))
    union = (len(set(list1)) + len(set(list2))) - intersection
    return float(intersection) / union

Python-3.x相关问答推荐

如何从Django连接到Neo4J s AuraDB(免费层)?'

小部件padx和包方法ipadx有什么不同?

文件名中的文件打开和撇号

visual studio代码窗口中未激活虚拟环境11

以某种方式分割字符串

生成具有偶数个 0 和 1 的给定长度的所有二进制数

根据另一个数据帧中的位置从主数据帧中提取子序列

有没有办法使用 python opencv 计算与图像的白色距离

通过附加/包含多个列表来创建 nDimensional 列表

如何在 django 中没有循环的情况下获得前键的前键?

在气流中运行 DAG 时出现处理信号:ttou消息

你如何表达一个没有参数的 Python Callable?

内部如何使用 Python 语法?

如何从字典中打印特定键值?

在python中基于列表理解的条件下跳过元素

AttributeError:系列对象没有属性iterrows

如何遍历某些扩展名的文件?

plt.cm.get_cmap 中可以使用哪些名称?

警告:请使用 tensorflow/models 中的官方/mnist/dataset.py 等替代方案

如何将发音相似的词放在一起