我有两个数据帧:
帧A:
OB_ID CA_ID col1 col2 col3
4 4 a b c
4 4 a d b
3 5 c c e
这个数据帧非常大,我不确定其中的所有ID.
帧B:
OB_ID CA_ID colZ
1 1 sky
4 4 fire
4 3 data
我想仅当OB_ID和CA_ID匹配时才将COLZ添加到帧A,否则在该 colored颜色 中添加NAN/NULL,结果数据帧如下所示:
OB_ID CA_ID col1 col2 col3 colz
4 4 a b c fire
4 4 a d b fire
3 5 c c e NA/unknown
框架A的形状是8666515行×3列,B的形状是367469行×342列,但当我这样做时
df3 = pd.merge(frameA, frameB, on=['OB_ID','CA_ID'], how='left')
df3.shape
它给出了形状:1490420 rows × 343 columns
,但我不明白为什么行数从367469行增加到1490420行.