假设我们有来自不同学校、不同班级的数据,如下所示:
df <- data.frame(school= rep(c("Oldenburg", "Berlin", "Homburg"), each= 4), class= rep(LETTERS[1:4], 3))
现在我需要将数据子集,例如,我们可能需要来自学校Berlin
班B
和学校Oldenburg
班A
的数据.我们能做的是
subset(df, school == "Berlin" & class == "B" | school== "Oldenburg" & class == "A")
但在其他情况下,我们需要其他学校的其他班级,数据中可能也有一些新学校或新班级.因此,我不能总是手写学校和班级的名称,而是需要根据两个条件自动设置数据子集.
我的try 是提供两个相同长度的向量,一个表示学校名称,另一个表示班级名称.对于上面的示例,它将是schools <- c("Berlin", "Oldenburg")
和classes <- c("B", "A")
.我找不到任何解决这个问题的办法.有什么主意吗?