我有同一数据集的5个版本,即,所有版本都有相同的列和行,名称相同.然而,它们包含不同单元格的值,所以只有当我可以组合所有单元格时,我才能得到所有数据.
下面是一个例子:
dataset1 <- as.data.frame(matrix(c("1", "1", "NA", "NA", "NA", "NA", "A", "NA", "B", "B", "A", "B"), ncol = 2))
colnames(dataset1) = c("Patient", "Treatment")
dataset2 <- as.data.frame(matrix(c("1", "1", "2", "4", "3", "NA", "A", "NA", "B", "B", "A", "B"), ncol = 2))
colnames(dataset2) = c("Patient", "Treatment")
dataset3 <- as.data.frame(matrix(c("1", "1", "NA", "NA", "NA", "NA", "A", "NA", "B", "B", "A", "B"), ncol = 2))
colnames(dataset3) = c("Patient", "Treatment")
dataset4 <- as.data.frame(matrix(c("1", "1", "NA", "2", "NA", "NA", "A", "NA", "B", "B", "A", "B"), ncol = 2))
colnames(dataset4) = c("Patient", "Treatment")
dataset5 <- as.data.frame(matrix(c("1", "1", "NA", "2", "NA", "2", "A", "C", "B", "B", "A", "B"), ncol = 2))
colnames(dataset5) = c("Patient", "Treatment")
我想以某种方式组合这5个数据集,以便数据集1中的任何单元格都被替换为数据集2中的值,如果这些单元格有效,或者如果数据集3中的单元格无效,依此类推,这样示例数据的结果将如下所示:
dataset_complete <- as.data.frame(matrix(c("1", "1", "2", "4", "3", "2", "A", "C", "B", "B", "A", "B"), ncol = 2))
colnames(dataset_complete) = c("Patient", "Treatment")
有没有一种自动的方法来做到这一点?我试着阅读关于连接转换(https://r4ds.hadley.nz/joins.html),但没有找到解决方案.
亲切问候