我有列出一个县疾病的数据,以及2011-2022年的年发病率.我已经创建了以下模拟数据的子集:
df <- data.frame(Year = as.integer(c(2020, 2021, 2022, 2020, 2021, 2022)),
Disease = c("Chlamydia", "Chlamydia", "Chlamydia", "Gonorrhea", "Gonorrhea", "Gonorrhea"),
Rate = as.numeric(c(30.75, 46.97, 98.75, 46.97, 29.34, 22.97)))
我想做的是按疾病分组,取最大年率值(本例中最大年率为2022年),然后从最小年率中减go 它(这里的最小年率为2020年).理想的输出将如下所示:
> df_dif
Disease_dif Rate_Dif
1 Chlamydia 68
2 Gonorrhea -24
这些变量名称和df名称是完全可扩展的,我所需要的是按疾病分组并减go 最小和最大年值之间的差异的方法.我对编码有点陌生,如果你能解释一下你的代码,我将不胜感激.非常感谢.