在我的数据帧(DF)中,我需要:
- 对于"列A"中的值==是的所有行
- ‘Column B’中的值应为:
- 行的数据帧‘df2’中‘列E’的值,其中‘df2’‘列D’==‘df’‘列C’
目前我有这个:
df.loc[df['Column A'] == 'Yes', 'Column B'] = df2.loc[(df2['Column D'] == df['Column C']), 'Column E']
但是,这会导致:
ValueError: Can only compare identically-labeled Series objects
我的数据帧示例:
df:
Column A Column B Column C
Yes 2554072
No 2557766
No 261191
Yes 2600355
Yes 2601388
... ...
df2:
Column D Column E
2554072 8
2601388 4
2604142 6
...
Required results:
df:
Column A Column B Column C
Yes 8 2554072
No 2557766
No 261191
Yes NoMatch 2600355
Yes 4 2601388
... ...
我try 将所有这些列中的值更改为字符串,并在列C中填充NaN值,但是ValueError是持久的.有什么建议吗?