因此,我有一个数据框架,如下所示:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.array([[1, 2, 3, 3, 2, 1], [4, 3, 6, 6 ,3 ,4], [7, 2, 9, 9, 2, 7]]),
columns=['a', 'b', 'c', 'a_select','b_select','c_select'])
df
现在,我可能需要重新组织数据帧(或使用两个)来实现这一点,但是...
我想从每行的每个"\u select"列中 Select 2个最大值,然后用它来表示相应的列.
例如,第1行表示a&;中的值;b、 第2行a和;c(不是我们正在查看的\u select列中的值).
目前,我只是迭代每一行,因为这看起来很简单,但对于大型数据集来说速度很慢,但是我不知道如何使用apply或lambda函数来进行等价(或者如果可能的话).