假设学校注册数据以这种格式存储,带有开始日期和结束日期字段:
unique_name | enrollment_start | enrollment_end |
---|---|---|
Amy | 1, Jan, 2017 | 30, Sep 2018 |
Franklin | 1, Jan, 2017 | 19, Feb, 2017 |
Franklin | 5, Jun, 2017 | 4, Feb, 2018 |
Franklin | 21, Oct, 2018 | 9, Mar, 2019 |
Samir | 1, Jun, 2017 | 4, Feb, 2017 |
Samir | 5, Apr, 2017 | 12, Sep, 2018 |
... | ... | ... |
我想按月份生成注册总数,如下所示:
month | enrollment_count |
---|---|
Jan, 2017 | 25 |
Feb, 2017 | 31 |
Mar, 2017 | 19 |
Apr, 2017 | 34 |
May, 2017 | 29 |
Jun, 2017 | 32 |
... | ... |
有没有一种简单的方法可以通过dplyr实现这一点?
我能想到的唯一方法是循环一个从month_min到month_max的所有月份列表,计算每个月内开始或停止日期的行数.希望代码更简单.