无涯教程网

python解释groupby

发布于04月27日

我从事的是数据挖掘的分析工作.在中，GROUPBY函数的用法如下:

df.groupby('tshirts')['id'].count()

['id']到底是做什么的？我知道函数是按tshirts分组的，但括号不知道..

你能给我解释一下吗？如果你能给我举个例子，我很感激.

致以最诚挚的敬意.

PD:df是一个数据帧.

推荐答案

因此，在GROUPBY()后面的方括号中，通常放置要应用后面的函数的列名(在本例中为count()).例如，在您的例子中，它按T恤分组，然后计算每个唯一的id值在‘id’列中出现的次数.

如果您的代码类似于df.groupby([‘t恤’])[‘id’，‘size’].count()，那么它将按t恤分组，然后将count()函数应用于id和size列.

通常，基本模板如下所示:df.groupby([List of COLS to Groupby])[LIST COLS to Apply Function to].Function()

如果您希望为COLS列表中每一列应用不同的函数，可以try df.groupby([...]).agg(‘col1’:‘count’，‘col2’:‘sum’)

Python相关问答推荐

Plotly Dash函数来切换图形参数-pPython

零填充2D数组上的Numpy切片

如何修复fpdf中的线路出血

Odoo onchange for invoice_Status of sale事件.订单未触发

如何在不使用字符串的情况下将namedtuple属性传递给方法？

Python Hashicorp Vault库hvac创建新的秘密版本，但从先前版本中删除了密钥

根据在同一数据框中的查找向数据框添加值

PywinAuto在Windows 11上引发了Memory错误，但在Windows 10上未引发

删除任何仅包含字符(或不包含其他数字值的邮政编码)的观察

OR—Tools CP SAT条件约束

如何在WSL2中更新Python到最新版本(3.12.2)？

把一个pandas文件夹从juyter笔记本放到堆栈溢出问题中的最快方法？

如何根据一列的值有条件地 Select 前N个组，然后按两列分组？

Django RawSQL注释字段

使用Python从URL下载Excel文件

用渐近模计算含符号的矩阵乘法

基于形状而非距离的两个numpy数组相似性

处理具有多个独立头的CSV文件

关于两个表达式的区别

Cython无法识别Numpy类型

实用课程推荐

相关教程推荐