我有一个如下所示的数据集:
hiring_mgr_id candidate_id candidate_name emp_id emp_name
1000 1234 Joe 4321 Mike
1000 1234 Joe 9876 Sam
1000 1234 Joe 5674 Rob
我想要的是创建一个按hiring_mgr_id
分组的新行,如果candidate_id
不在emp_id
列中,则创建一个填充emp_id
和emp_name
的新行.
我想要的:
hiring_mgr_id candidatae_id candidate_name emp_id emp_name
1000 1234 Joe 4321 Mike
1000 1234 Joe 9876 Sam
1000 1234 Joe 5674 Rob
1000 1234 Joe 1234 Joe
到目前为止,我所拥有的是:
new_row = []
for index, row in df.iterrows():
candidate_id= row['candidate_id']
emp_id = row['emp_id']
if candidate_id not in df['emp_id'].values:
new_row.append({'hiring_mgr_id:row['hiring_mg'r_id],
'candidate_name':row['candidate_name'],
'emp_id':row['emp_id'],
'emp_name': row['emp_name']
df = df.append(new_row,ignore_index = True)
当我这样做时,我得到一个错误‘DataFrame’对象没有属性‘append’
我认为你可以使用附加与数据帧任何建议如何修复?先谢谢你了.