我有一个数据框,看起来像这样
df <- data.frame(col1 = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B",
"C", "C", "C", "C", "C"),
col2 = c("A", "B", "C", "D", "E", "A", "B", "C", "D", "E",
"A", "B", "C", "D", "E"))
我想要的是像这样
df <- data.frame(col1 = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B",
"C", "C", "C", "C", "C"),
col2 = c("A", "B", "C", "D", "E", "A", "B", "C", "D", "E",
"A", "B", "C", "D", "E"),
col3 = c("1","0","0","0","0","1","1","0","0","0","1","1","1","0","0"))
在col3中,它将重复字符计为1,将唯一字符计为0.第6行被认为是重复的,因为交换字符("B","A")在第2行中已经被算作唯一的("A","B").我可以在EXCEL中使用if和Countif函数轻松完成此操作.提前谢谢!