我很难理解dspirr的summarise
功能中.group = "drop"
的用途.我试图执行以下代码来显示前20个站点及其各自的纬度和经度:
summary <- trips_2023 %>%
filter(member_casual == "member") %>%
group_by(start_station_name, start_lat, start_lng) %>%
summarise(count = n()) %>%
arrange(desc(count)) %>%
mutate(type = "start",
member = "member") %>%
slice(1:20)
然而,该代码返回的表的行比请求的20行多得多.
如果我在summarise
函数中添加.groups = "drop"
,那么代码就可以工作,但老实说,我不明白为什么.
summary <- trips_2023 %>%
filter(member_casual == "member") %>%
group_by(start_station_name, start_lat, start_lng) %>%
summarise(count = n(), .groups = "drop") %>%
arrange(desc(count)) %>%
mutate(type = "start",
member = "member") %>%
slice(1:20)
据称,.groups = "drop"
指示dSEARCH在执行分组和汇总操作后删除组信息.
然而,我并不清楚这个定义.
我也看过官方文件,但不是很容易理解.
有人能用一个实际的例子帮助我更好地理解吗?
我还对这样一个事实感到困惑,即如果我执行该函数
groups(summary)
在第一个代码块(没有.groups ="drop")中,我得到的输出如下:
[[1]]
start_station_name
[[2]]
start_lat
start_lng
人不也应该是一个群体吗?
谢谢