我想逐行查看字符列值是否存在于字符串列中.
例如在
df = pd.DataFrame({
'char': ['A', 'B', 'A', 'C', 'D'],
'str': ['WCCC', 'BFC', 'GFA', 'E', <NA>]
})
我想看看'char'列是否在'str'列中.
预期yields 为
[False, True, True, False, False]
.
我正在处理一个大型数据集.
我想逐行查看字符列值是否存在于字符串列中.
例如在
df = pd.DataFrame({
'char': ['A', 'B', 'A', 'C', 'D'],
'str': ['WCCC', 'BFC', 'GFA', 'E', <NA>]
})
我想看看'char'列是否在'str'列中.
预期yields 为
[False, True, True, False, False]
.
我正在处理一个大型数据集.
您可以使用zip和list理解,并使用一些dtype判断NaN值,如下所示:
[c in s if isinstance(c, str) & isinstance(s, str) else False for c, s in zip(df['char'], df['str'])]
输出:
[False, True, True, False, False]