我有一个数据框,看起来像这样

df <- data.frame(col1 = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B", 
                      "C", "C", "C", "C", "C"), 
             col2 = c("A", "B", "C", "D", "E", "A", "B", "C", "D", "E", 
                      "A", "B", "C", "D", "E"))

我想要的是像这样

df <- data.frame(col1 = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B", 
                      "C", "C", "C", "C", "C"), 
             col2 = c("A", "B", "C", "D", "E", "A", "B", "C", "D", "E", 
                      "A", "B", "C", "D", "E"),
             col3 = c("1","0","0","0","0","1","1","0","0","0","1","1","1","0","0"))

            

在col3中,它将重复字符计为1,将唯一字符计为0.第6行被认为是重复的,因为交换字符("B","A")在第2行中已经被算作唯一的("A","B").我可以在EXCEL中使用if和Countif函数轻松完成此操作.提前谢谢!

推荐答案

我们可以使用pminpmax按行从左到右排序值,并使用duplicated判断重复项

transform(
  df,
  col3 = +(duplicated(paste(pmin(col1, col2), pmax(col1, col2))) | col1 == col2)
)

这给了我们

   col1 col2 col3
1     A    A    1
2     A    B    0
3     A    C    0
4     A    D    0
5     A    E    0
6     B    A    1
7     B    B    1
8     B    C    0
9     B    D    0
10    B    E    0
11    C    A    1
12    C    B    1
13    C    C    1
14    C    D    0
15    C    E    0

R相关问答推荐

为什么stat_bin在R中的ggplot中显示错误的数字?

更改绘图上的x轴断点,而不影响风险?

为什么st_join(ob1,ob2,left = True)返回具有比ob1更多功能的sf对象?

随机森林回归:下拉列重要性

如何写一个R函数来旋转最后n分钟?

二维样条,严格以一个参数递增

如何在Chart_Series()中更改轴值的 colored颜色 ?

Ggplot2中的重复注记

`夹心::vcovCL`不等于`AER::tobit`标准错误

是否有新方法来更改Facet_WRAP(Ggplot2)中条文本的文本 colored颜色 ?

如何根据R中其他变量的类别汇总值?

使用不同的定性属性定制主成分分析中点的 colored颜色 和形状

'使用`purrr::pwalk`从嵌套的嵌套框架中的列表列保存ggplots时出现未使用的参数错误

有没有办法一次粘贴所有列

如何计算每12行的平均数?

根据r中另一个文本列中给定的范围对各列求和

在ggploy中创建GeV分布时出错

GOGPLATE geom_boxploy色彩疯狂

图中显示错误 colored颜色 的图例geom_sf

在子图内和子图之间对齐行数不均匀的表格罗布对