我有一个类似以下简化数据集的数据集:
x_1 <- c(1, NA, 2, 3, NA, 4, 5)
x_2 <- c(2, 1, NA, NA, NA, 4, 6)
y_1 <- c(2, 4, 6, 8, NA, 10, NA)
y_2 <- c(NA, 4, NA, 8, 10, 11, 13)
df <- data.frame(x_1, x_2, y_1, y_2)
x_1 x_2 y_1 y_2
1 1 2 2 NA
2 NA 1 4 4
3 2 NA 6 NA
4 3 NA 8 8
5 NA NA NA 10
6 4 4 10 11
7 5 6 NA 13
目标是合并两个相应变量(x和y)中的每一个,并用NA替换不相同的值(例如,x_1和x_2的第一行).我是通过以下方式做到这一点的:
df <- df %>%
mutate(x = coalesce(x_1, x_2)) %>%
mutate(x = ifelse(!is.na(x) &
!is.na(x_2) &
x != x_2,
NA,
x)) %>%
select(!c(x_1, x_2))
现在,我必须对21个变量执行此操作,所以我认为我将变量放在一个列表中,并使用如下所示的for循环将它们提供给管道:
cols <- c("x", "y")
for(i in cols){
var_1 <- paste(i, "1", sep = "_")
var_2 <- paste(i, "2", sep = "_")
df <- df %>%
mutate(i = coalesce(var_1, var_2)) %>%
mutate(i = ifelse(!is.na(i) &
!is.na(var_2) &
i != var_2,
NA,
i)) %>%
select(!c(var_1, var_2))
}
结果是代码被执行了,但是没有新的变量,只有值为空值的变量"i".似乎R没有将流水线中的"i"识别为迭代器,但它确实识别了"var_1"和"var_2"(因为它们正从数据集中删除).
有没有人知道这是为什么,我怎么才能修复它?
提前谢谢你了.