我有一个跨组重复的数据集. 例如:
dat <- data.frame(
group = c("A", "A", "A", "B", "B", "C","C","C"),
values = c("duplicate1","duplicate2",3,"duplicate1",
5,"duplicate1","duplicate2",6)
)
我的预期输出是由N个数据集组成的列表,这些数据集包含每个组如何保存重复项的独特组合:
dfs <- list(df1, df2, df3, df4, df5, df6)
dfs[[1]] ## Combination 1
group values
1 A duplicate1
2 A duplicate2
3 A 3
4 B 5
5 C 6
dfs[[2]] ## Combination 2
group values
1 A duplicate2
2 A 3
3 B 5
4 B duplicate1
5 C 6
dfs[[3]] ## Combination 3
group values
1 A duplicate2
2 A 3
3 B 5
4 C 6
5 C duplicate1
dfs[[4]] ## Combination 4
group values
1 A duplicate1
2 A 3
3 B 5
4 C 6
5 C duplicate2
dfs[[5]] ## Combination 5
group values
1 A 3
2 B 5
3 B duplicate1
4 C 6
5 C duplicate2
dfs[[6]] ## Combination 6
group values
1 A 3
2 B 5
3 C 6
4 C duplicate1
5 C duplicate2
我以为我有一个解决方案: Find all unique combinations of removing a duplicate in groups from a data set
然而,如果副本跨2个组(如上面的示例中所示),则此解决方案不起作用.它只会从打印机中删除其中一个重复内容,然后组合例如也会在B组或C组中保留重复内容1.