我有两个数据帧,看起来像这样:
df1 = pl.DataFrame(
{
"Name": ["A", "B", "C", "D"],
"Year": [2001, 2003, 2003, 2004]
}
)
df2 = pl.DataFrame(
{
"Name": ["A", "B", "C", "D"],
"2001": [111, 112, 113, 114],
"2002": [221, 222, 223, 224],
"2003": [331, 332, 333, 334],
"2004": [441, 442, 443, 444]
}
)
我想对第二个df(Df2)的每一年列求和,只考虑df1中相应年份为同年或更晚的名字.所需输出:
┌──────┬──────┐
│ Year ┆ Sum │
╞══════╪══════╡
│ 2001 ┆ 111 │
│ 2002 ┆ 221 │
│ 2003 ┆ 996 │ (= 331 + 332 + 333)
│ 2004 ┆ 1770 │ (= 441 + 442 + 443 + 444)
└──────┴──────┘
我刚接触北极星(来自Pandas ),我不确定该怎么做.任何帮助都将不胜感激.