我从事的是数据挖掘的分析工作.在中,GROUPBY函数的用法如下:

df.groupby('tshirts')['id'].count()

['id']到底是做什么的?我知道函数是按tshirts分组的,但括号不知道..

你能给我解释一下吗?如果你能给我举个例子,我很感激.

致以最诚挚的敬意.

PD:df是一个数据帧.

推荐答案

因此,在GROUPBY()后面的方括号中,通常放置要应用后面的函数的列名(在本例中为count()).例如,在您的例子中,它按T恤分组,然后计算每个唯一的id值在‘id’列中出现的次数.

如果您的代码类似于df.groupby([‘t恤’])[‘id’,‘size’].count(),那么它将按t恤分组,然后将count()函数应用于id和size列.

通常,基本模板如下所示:df.groupby([List of COLS to Groupby])[LIST COLS to Apply Function to].Function()

如果您希望为COLS列表中每一列应用不同的函数,可以try df.groupby([...]).agg(‘col1’:‘count’,‘col2’:‘sum’)

Python相关问答推荐

Plotly Dash函数来切换图形参数-pPython

零填充2D数组上的Numpy切片

如何修复fpdf中的线路出血

Odoo onchange for invoice_Status of sale事件.订单未触发

如何在不使用字符串的情况下将namedtuple属性传递给方法?

Python Hashicorp Vault库hvac创建新的秘密版本,但从先前版本中删除了密钥

根据在同一数据框中的查找向数据框添加值

PywinAuto在Windows 11上引发了Memory错误,但在Windows 10上未引发

删除任何仅包含字符(或不包含其他数字值的邮政编码)的观察

OR—Tools CP SAT条件约束

如何在WSL2中更新Python到最新版本(3.12.2)?

把一个pandas文件夹从juyter笔记本放到堆栈溢出问题中的最快方法?

如何根据一列的值有条件地 Select 前N个组,然后按两列分组?

Django RawSQL注释字段

使用Python从URL下载Excel文件

用渐近模计算含符号的矩阵乘法

基于形状而非距离的两个numpy数组相似性

处理具有多个独立头的CSV文件

关于两个表达式的区别

Cython无法识别Numpy类型