我在一个代码库中工作,我看到很多像这样的groupby使用,它们对df
列的子集进行操作
df[cols].groupby(some_column).nunique()[column2extract]
其中cols
包括some_column
和column2extract
,在大多数情况下是cols = [some_column, column2extract]
从功能上来说,我认为这相当于
df.groupby(some_column).nunique()[column2extract]
前者是否有一些我应该意识到的优势?我在这个代码库中经常看到这种情况,我觉得我可能错过了一些东西.
事实上,我认为2只有在cols = [some_column, column2extract]
时才等效,而在cols
包含额外列时不一定等效