我有两个数据帧,如下所示:
df1 =
A B C D E F
timestamp
2022-04-08 10:07:00 40 50 NaN 50 NaN NaN
2022-04-08 10:07:01 70 80 80 10 NaN NaN
2022-04-08 10:07:02 200 220 NaN 10 10 NaN
df2 =
A_1 B_1
C 10 10
D 20 10
E 30 20
F 5 15
如你所见,df1
的columns
C,D,E和F是df2
的index
.我想进行如下操作:
df1 =
A B C D E F Sum_C Sum_D Sum_E Sum_F
timestamp
2022-04-08 10:07:00 40 50 NaN 50 NaN NaN NaN 120 NaN NaN
2022-04-08 10:07:01 70 80 80 10 NaN NaN 170 180 NaN NaN
2022-04-08 10:07:02 200 220 NaN 10 10 NaN NaN 450 470 NaN
在这里
在df1
的第一行中,有一个column D
的值.column A and B
的值分别为40和50.现在,由于在df1
的column D
中存在一个值,因此 Select df2
的索引D,注意对应的a_1和B_1,在本例中为20和10.
如果有更简单的方法,我将不胜感激.
提前谢谢!
EDIT:我不想添加从A、B、A_1、B_1列中获得的值,而是想执行以下操作:
import geopy.distance as distance
P1 = (A,B)
P2 = (A_1,B_1)
使用distance.great_circle(P1,P2)
计算距离,并将结果存储在df1
中.