我有一个数据框,其中包含美国各地玉米生产值(maiz_a)的值.数据按纬度和经度(yx)组织,也按州和县组织.许多特定纬度和经度属于同一个县,这会为同一个州和县提供许多重复条目,但值不同.以下是一个例子:

         x          y           maiz_a  maiz_pct    name_adm1   name_adm2
62748   -89.875000  41.625000   49642.6 0.000155    Illinois    Whiteside
29499   -98.041667  40.791667   49621.1 0.000309    Nebraska    Hamilton
28101   -98.208333  40.791667   48866.9 0.000462    Nebraska    Hamilton
24910   -98.041667  40.958333   48741.3 0.000614    Nebraska    Hamilton
28615   -97.958333  40.958333   48538.8 0.000765    Nebraska    Hamilton
24697   -97.875000  40.791667   48536.3 0.000916    Nebraska    Hamilton
64127   -89.791667  41.625000   48448.2 0.001067    Illinois    Whiteside

注意"内布拉斯加州"和"汉密尔顿"的组合中有多少个是name_adm1name_adm2.我想删除重复项,但根据maiz_amaiz_pct将所有重复项汇总为一行.此外,新格式化的数据帧应该只包含xy的第一个实例,显然应该保留name_adm1name_adm2.

推荐答案

use groupby and agg
This allows you to specify how you want to aggregate each specific column.

df.groupby(['name_adm1', 'name_adm2'], as_index=False).agg(
    {'x': 'first', 'y': 'first', 'maiz_a': 'sum', 'maiz_pct': 'sum'}
)

  name_adm1  name_adm2          x          y    maiz_a  maiz_pct
0  Illinois  Whiteside -89.875000  41.625000   98090.8  0.001222
1  Nebraska   Hamilton -98.041667  40.791667  244304.4  0.003066

Python-3.x相关问答推荐

是否有必要使用Threads()中的args显式地将共享变量传递给Python中的线程函数或直接访问它?

具有多个值的极轴旋转和熔化/取消旋转(反转旋转)操作(Pandas 堆叠/取消堆叠交替/UDF覆盖)

我用Kivy创建的应用程序在安卓系统上运行时出错.(attributeerror:';class';对象没有属性';_javaclass__cls_storage';)

无法导入名称';核心';来自部分初始化的模块';tensorflow_datasets';(很可能是由于循环导入)

Python webdrivermanager 和 Chrome 115.0 的 URL https://chromedriver.storage.googleapis.com/LATEST_RELEASE_115.0.5790 错误没有此类驱动程序

SQL Server 2022和Python3.10脚本错误

合并所有文件并获取特定列数据

我正在使用 python 线程,当查询 mysql 时,代码似乎在运行并保持在无限循环中,没有返回任何错误

如何在pyspark的列中按连续1分组并保持具有特定大小的组

Python.在循环中填充字典的问题

Python 解包运算符 (*)

Python过滤器函数 - 单个结果

判断 dict.items() 中的成员资格的时间复杂度是多少?

为什么 TensorFlow 的 `tf.data` 包会减慢我的代码速度?

使用 python 3.0 的 Numpy

同步调用协程

有效地判断一个元素是否在列表中至少出现 n 次

如何使用异步 for 循环遍历列表?

Python 无法处理以 0 开头的数字字符串.为什么?

Python asyncio:处理gather()中的异常-文档不清楚?