我有一个pandas数组,它的值是"along path",有距离,但是有些值丢失了. Dataframe看起来像这样:
Idx AccumDist ValT
0 1 3059 112
1 2 4281 194
2 3 4947 NaN
3 4 5460 NaN
4 5 5811 543
5 6 6021 591
6 7 6289 NaN
7 8 7487 909
8 9 8031 954
9 10 8242 1069
AccumDist
和ValT
是累积的数据,ValT
中的一些是"缺失"的.
我想做的是将第ValT
列中的NaN替换为该列中最接近的"已知"数据的平均值,并以AccumDist
的差异加权.
因为可能一个接一个地缺少ValT
个值(可能大于1),所以我不能使用滚动加权平均值(或者我不知道如何使用它),而我仍然希望只对"最接近的已知"值进行平均.
我在考虑使用df.shift()
,也许在一些嵌套框架子集上,但我真的不知道如何做到这一点.感谢任何帮助或建议.