我想逐行查看字符列值是否存在于字符串列中.

例如在

df = pd.DataFrame({
    'char': ['A', 'B', 'A', 'C', 'D'], 
    'str': ['WCCC', 'BFC', 'GFA', 'E', <NA>]
})

我想看看'char'列是否在'str'列中.

预期yields 为 [False, True, True, False, False].

我正在处理一个大型数据集.

推荐答案

您可以使用zip和list理解,并使用一些dtype判断NaN值,如下所示:

[c in s if isinstance(c, str) & isinstance(s, str) else False for c, s in zip(df['char'], df['str'])]

输出:

[False, True, True, False, False]

Python相关问答推荐

大Pandas 胚胎中产生组合

Pandas 在最近的日期合并,考虑到破产

对某些列的总数进行民意调查,但不单独列出每列

删除任何仅包含字符(或不包含其他数字值的邮政编码)的观察

Pandas 有条件轮班操作

如何在Raspberry Pi上检测USB并使用Python访问它?

Odoo 16使用NTFS使字段只读

形状弃用警告与组合多边形和多边形如何解决

如何在表中添加重复的列?

Plotly Dash Creating Interactive Graph下拉列表

Polars Group by描述扩展

从一个df列提取单词,分配给另一个列

使用tqdm的进度条

Js的查询结果可以在PC Chrome上显示,但不能在Android Chrome、OPERA和EDGE上显示,而两者都可以在Firefox上运行

浏览超过10k页获取数据,解析:欧洲搜索服务:从欧盟站点收集机会的微小刮刀&

修改.pdb文件中的值并另存为新的

随机森林n_估计器的计算

对于标准的原始类型注释,从键入`和`从www.example.com `?

为什么在不先将包作为模块导入的情况下相对导入不起作用

极地数据帧:ROLING_SUM向前看