我试图做的事情大致有以下几点:

library(tidyverse)

starwars %>% 
  filter(!is.na(gender)) %>% 
  group_by(gender) %>% 
  summarise(total_count = n(), max_species_count_per_gender = max(count(species)))

基本上,除了试图获得每组的总计数,并在一个group_by之后以gender分隔,并在摘要列中报告,我还试图提取给定性状的较高级别组的最高子组人口计数(在本例中为species).显然,上面的方法不起作用,返回错误消息,

Caused by error in `UseMethod()`:
! no applicable method for 'count' applied to an object of class "character"

因此,如果我试图以以下方式结束一些事情

# A tibble: 2 × 3
  gender    total_count     max_species_count_per_gender
  <chr>           <int>                            <int>
1 feminine           17                   some_smaller_x
2 masculine          66                   some_smaller_y

这是我可以作为summarise行动的一部分来处理的事情,还是我需要做一些其他的事情?谢谢你的帮助.

推荐答案

你可以两次打summarize分.使用.by...group_byungroup的替代方案,两者都行得通.

library(tidyverse)

starwars %>%
  filter(!is.na(gender)) %>%
  summarize(
    sub_count = n(),
    .by = c(species, gender)
  ) %>%
  summarize(
    total_count = sum(sub_count),
    max_species_count = max(sub_count),
    .by = gender
  )
#> # A tibble: 2 × 3
#>   gender    total_count max_species_count
#>   <chr>           <int>             <int>
#> 1 masculine          66                26
#> 2 feminine           17                 9

创建于2024-02-29,共reprex v2.0.2

R相关问答推荐

具有多个依赖变量/LHS的逻辑模型

根据收件箱中的特定值提取列名

在R底座中更改白天和夜晚的背景 colored颜色

terra nearest()仅为所有`to_id`列返回NA

在发布到PowerBI Service时,是否可以使用R脚本作为PowerBI的数据源?

根据模式将一列拆分为多列,并在R中进行拆分

derrr mutate case_when grepl不能在R中正确返回值

如何根据嵌套元素的名称高效而优雅地确定它属于哪个列表?

为什么我的基准测试会随着样本量的增加而出现一些波动?

如何通过ggplot2添加短轴和删除长轴?

迭代到DataFrame列并获得成对的值列表(col1->;col2、col2->;col3、col3->;col4等)的正确方法.

在使用tidyModels和XGBoost的二进制分类机器学习任务中,所有模型都失败

如何通过匹配R中所有可能的组合来从宽到长旋转多个列?

有没有办法使用ggText,<;Sub>;&;<;sup>;将上标和下标添加到同一元素?

Geom_arcbar()中出错:找不到函数";geom_arcbar";

判断函数未加载R中的库

如何在使用Alpha时让geom_curve在箭头中显示恒定透明度

以任意顺序提取具有多个可能匹配项的组匹配项

如何调整一个facet_work()面板内的框图和移动标签之间的水平宽度?

按组使用dummy r获取高于标准的行的平均值