大家好,我正在处理大Pandas 的数据集. 让我们假设数据集具有 身份证, 测试类型, 测试状态, 测试日期, 等

我需要对一类专栏进行分组,所以我首先try

data_useless[['TEST_TYPE', 'TEST_STATUS']].groupby('TEST_STATUS').count_values()

它起作用了:按TEST_STATUS(未通过测试和通过测试)和数据集上该数据的计数值显示分组数据的结果

现在我想更多地了解和查看通过测试的数据

所以我试着

data_useless.groupby(['TEST_STATUS'] == 'PASS TEST')

但它不起作用..显示错误,显示为KEY ERROR : FALSE

我需要做一些事情,比如 在SQL中:

SELECT *
FROM data_useless
WHERE TEST_STATUS = "PASS TEST"
group by TEST_STATUS;

请帮帮忙,,,

推荐答案

您可以使用以下方式进行筛选:

data_useless.loc[data_useless['TEST_STATUS'] == 'PASS TEST']

或者:

data_useless.query('TEST_STATUS == "PASS TEST"')

然后,如果需要,计算Groupby+Aggregation:

(data_useless.loc[data_useless['TEST_STATUS'] == 'PASS TEST']
             .groupby(...).agg(...) # or any other groupby function
)

Python相关问答推荐

按列分区,按另一列排序

Pandas 都是(),但有一个门槛

如何使用LangChain和AzureOpenAI在Python中解决AttribeHelp和BadPressMessage错误?

' osmnx.shortest_track '返回有效源 node 和目标 node 的'无'

Julia CSV for Python中的等效性Pandas index_col参数

基于字符串匹配条件合并两个帧

删除字符串中第一次出现单词后的所有内容

如何在python polars中停止otherate(),当使用when()表达式时?

判断solve_ivp中的事件

Pandas—堆栈多索引头,但不包括第一列

解决Geopandas和Altair中的正图和投影问题

如何在信号的FFT中获得正确的频率幅值

用来自另一个数据框的列特定标量划分Polars数据框中的每一列,

使用xlsxWriter在EXCEL中为数据帧的各行上色

如果列包含空值,则PANAS查询不起作用

Pandas 删除只有一种类型的值的行,重复或不重复

在不中断格式的情况下在文件的特定部分插入XML标签

对当前的鼹鼠进行编码,并且我的按键获得了注册

是否将列表分割为2?

如何省略所有Pandas 数据帧