我需要有人的帮助,我有一个单词专栏,我想删除每个单元格中重复的单词

我想要的是这样的东西

words expected
car apple car good car apple good
good bad well good good bad well
car apple bus food car apple bus food

我试过了,但不管用

from collections import OrderedDict


df['expected'] = (df['words'].str.split().apply(lambda x: OrderedDict.fromkeys(x).keys()).str.join(' '))

如果有人能帮助我,我将不胜感激

推荐答案

如果您不需要保留单词的原始顺序,您可以创建一个中间集来删除重复项.

df["expected"] = df["words"].str.split().apply(set).str.join(" ")

Python相关问答推荐

在Google Colab中设置Llama-2出现问题-加载判断点碎片时Cell-run失败

Pandas 都是(),但有一个门槛

Vectorize多个头寸的止盈/止盈回溯测试pythonpandas

如何使用根据其他值相似的列从列表中获取的中间值填充空NaN数据

将pandas Dataframe转换为3D numpy矩阵

Python,Fitting into a System of Equations

如何在Python数据框架中加速序列的符号化

当独立的网络调用不应该互相阻塞时,'

如何使Matplotlib标题以图形为中心,而图例框则以图形为中心

如何在表中添加重复的列?

在两极中过滤

如何杀死一个进程,我的Python可执行文件以sudo启动?

如何删除重复的文字翻拍?

递归函数修饰器

504未连接IB API TWS错误—即使API连接显示已接受''

ModuleNotFoundError:Python中没有名为google的模块''

如何写一个polars birame到DuckDB

Pandas 删除只有一种类型的值的行,重复或不重复

条件Python Polars cum_sum over a group,有更好的方法吗?

通过外键Django创建从一个字段到其他字段的 Select 列表