我从事的是数据挖掘的分析工作.在中,GROUPBY函数的用法如下:
df.groupby('tshirts')['id'].count()
['id']
到底是做什么的?我知道函数是按tshirts
分组的,但括号不知道..
你能给我解释一下吗?如果你能给我举个例子,我很感激.
致以最诚挚的敬意.
PD:df
是一个数据帧.
我从事的是数据挖掘的分析工作.在中,GROUPBY函数的用法如下:
df.groupby('tshirts')['id'].count()
['id']
到底是做什么的?我知道函数是按tshirts
分组的,但括号不知道..
你能给我解释一下吗?如果你能给我举个例子,我很感激.
致以最诚挚的敬意.
PD:df
是一个数据帧.
因此,在GROUPBY()后面的方括号中,通常放置要应用后面的函数的列名(在本例中为count()).例如,在您的例子中,它按T恤分组,然后计算每个唯一的id值在‘id’列中出现的次数.
如果您的代码类似于df.groupby([‘t恤’])[‘id’,‘size’].count(),那么它将按t恤分组,然后将count()函数应用于id和size列.
通常,基本模板如下所示:df.groupby([List of COLS to Groupby])[LIST COLS to Apply Function to].Function()
如果您希望为COLS列表中每一列应用不同的函数,可以try df.groupby([...]).agg(‘col1’:‘count’,‘col2’:‘sum’)