Context:我从考勤系统中提取原始数据,它向我显示人们进出办公室的时间.我需要转换数据,以便计算一些统计数据和图表.

Input:我的Power查询的最后一步看起来是这样的:

Name DateIn AM_PM TimeMin TimeMax AM_In_raw AM_Out_raw PM_In_raw PM_Out_raw
Pablo 29/4/2024 AM 08:27:21 12:22:01 08:27:21 12:22:01 00:00:00 00:00:00
Pablo 29/4/2024 PM 14:13:02 19:16:00 00:00:00 00:00:00 14:13:02 19:16:00
Pablo 30/4/2024 AM 08:09:15 12:17:24 08:09:15 12:17:24 00:00:00 00:00:00
Pablo 30/4/2024 PM 14:17:28 18:06:04 00:00:00 00:00:00 14:17:28 18:06:04

Desired Output:我想按名称和日期对行进行分组,并对时间列进行总和,因此每个名称和日期的进出时间都在一行中.它应该看起来像这样:

Name DateIn AM_In AM_Out PM_In PM_Out
Pablo 29/4/2024 08:27:21 12:22:01 14:13:02 19:16:00
Pablo 30/4/2024 08:09:15 12:17:24 14:17:28 18:06:04

Problem:当我try 对日期进行总和(聚合)时,大多数单元格都会出现"错误".

= Table.Group(#"Filtered Pablo", {"Name", "Date"}, 
{{"AM_In", each List.Sum([AM_In_raw]), type any}, 
{"AM_Out", each List.Sum([AM_Out_raw]), type any}, 
{"PM_In", each List.Sum([PM_In_raw]), type any}, 
{"PM_Out", each List.Sum([PM_Out_raw]), type any}})

Question:使用Excel中的Power Query将多行合并为仅包含所有有效值的行的好方法是什么?

提前感谢您提供的任何线索,以找到有效的解决方案.如果有最佳实践或技术来解决不同场景下的此类问题,我们将不胜感激.

SQL或Python解决方案也受到欢迎.

推荐答案

无论您是在Excel中的Power Query中聚合(总和)时间值还是其他类型的值,确保值采用它可以处理的格式非常重要.Clock次进出时间通常表示为时间,即小时、分钟和秒,但Excel可能会将它们解释为文本或其他类型.

就您的情况而言,由于您正在try 计算时间,因此您不想计算原始时钟邮票的总和.您希望用每人每个特定日子的第一个(最早)和最后一个(最新)值替换时间列.

我们不对时间条目进行总和,因此List.Sum不适用.

= Table.Group(#"Filtered Pablo", {"Name", "Date"}, 
{{"AM_In", each List.Min([AM_In_raw]), type time}, 
{"AM_Out", each List.Max([AM_Out_raw]), type time}, 
{"PM_In", each List.Min([PM_In_raw]), type time}, 
{"PM_Out", each List.Max([PM_Out_raw]), type time}})

我将List.Sum替换为List.MinList.Max,它们分别返回列表中最小(第一个)和最大(最后一个)值.

看看上面是否有效.

Python相关问答推荐

用ctype构建指针链

Flask:如何在完整路由代码执行之前返回验证

在两极中实施频率编码

如何知道标志是否由用户传递或具有默认值?

使用Beautiful Soup获取第二个srcset属性

在for循环中仅执行一次此操作

有什么方法可以避免使用许多if陈述

从DataFrame.apply创建DataFrame

Pandas 除以一列中出现的每个值

如何让 turtle 通过点击和拖动来绘制?

Pandas 第二小值有条件

从webhook中的短代码(而不是电话号码)接收Twilio消息

将整组数组拆分为最小值与最大值之和的子数组

如何标记Spacy中不包含特定符号的单词?

OR—Tools中CP—SAT求解器的IntVar设置值

对象的`__call__`方法的setattr在Python中不起作用'

计算每个IP的平均值

在含噪声的3D点网格中识别4连通点模式

启动带有参数的Python NTFS会导致文件路径混乱

Python—转换日期:价目表到新行