前几天我问了一个问题,我得到了公认的回答.问题是,

Group the dataframe based on ids and stick the values of ids to each other with mean of the last days

但是,问题是,当我想将这段代码应用于一个 Big Data 帧时,它会给我一个错误,即ValueError: cannot handle a non-unique multi-index!.我试着用df.columns.value_counts()判断我的数据帧的索引,如下所示,我的数据帧的所有计数都是1.我的数据框有30列3000行.point_id, date, and Temperatures是列.

enter image description here

有人知道如何解决这个问题吗?非常感谢.

推荐答案

有254行,其中至少有两个数据点(点id、日期).您想对同一个(点id、日期)的记录做什么?例如,您可以将这些数据分组并保留平均值.

以下是 list :

df = pd.read_csv('dft.csv', index_col=0)
counts = df.value_counts(['point_id', 'date'], sort=False).loc[lambda x: x > 1]

Python相关问答推荐

双情节在单个图上切换-pPython

为什么我的主页不会重定向到详细视图(Django)

Pandas 按照特殊规则保留每n行

Snap 7- read_Area用于类似地址的变量

Flask主机持续 bootstrap 本地IP| Python

删除pandas rame时间序列列中未更改的值

如何将Matplotlib的fig.add_axes本地坐标与我的坐标关联起来?

在Pandas框架中截短至固定数量的列

使用Keras的线性回归参数估计

更改matplotlib彩色条的字体并勾选标签?

将DF中的名称与另一DF拆分并匹配并返回匹配的公司

根据在同一数据框中的查找向数据框添加值

非常奇怪:tzLocal.get_Localzone()基于python3别名的不同输出?

追溯(最近最后一次调用):文件C:\Users\Diplom/PycharmProject\Yolo01\Roboflow-4.py,第4行,在模块导入roboflow中

处理带有间隙(空)的duckDB上的重复副本并有效填充它们

如何调整QscrollArea以正确显示内部正在变化的Qgridlayout?

组/群集按字符串中的子字符串或子字符串中的字符串轮询数据框

无法连接到Keycloat服务器

如何合并两个列表,并获得每个索引值最高的列表名称?

Pandas:填充行并删除重复项,但保留不同的值