我有两个数据帧,df1包含一个groupID和连续变量,如下所示:
GroupID Var1 Var2 Var3 Var4
1 20.33115 19.59319 0.6384765 0.6772862
1 31.05899 23.14446 0.5796645 0.7273182
2 24.28984 20.99047 0.6425050 0.6865804
2 22.47856 21.36709 0.6690020 0.6368560
3 21.65817 20.99444 0.6829786 0.6461840
3 23.45899 21.57718 0.6655482 0.6473043
df2包含每个变量的截止值(ct):
Var1ct Var2ct Var3ct Var4ct
22.7811 20.3349 0.7793 0.4294
我想做的是,对于df1中的每个变量,在df2中的相关列n中找到值大于截止值的行数,并 for each groupID返回该数字,因此输出如下所示:
GroupID N-Var1 N-Var2 N-Var3 N-Var4
1 62 78 33 99
2 69 25 77 12
3 55 45 27 62
df1由GroupID和30个变量列不均匀地分布了约200万行,我需要计算它们的数量,我只是在寻找一种比为所有30个变量键入相同函数更有效的方法.