无涯教程网

如何计算R中两列之间的交换字符

发布于09月06日

我有一个数据框，看起来像这样

df <- data.frame(col1 = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B", 
                      "C", "C", "C", "C", "C"), 
             col2 = c("A", "B", "C", "D", "E", "A", "B", "C", "D", "E", 
                      "A", "B", "C", "D", "E"))

我想要的是像这样

df <- data.frame(col1 = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B", 
                      "C", "C", "C", "C", "C"), 
             col2 = c("A", "B", "C", "D", "E", "A", "B", "C", "D", "E", 
                      "A", "B", "C", "D", "E"),
             col3 = c("1","0","0","0","0","1","1","0","0","0","1","1","1","0","0"))

在col3中，它将重复字符计为1，将唯一字符计为0.第6行被认为是重复的，因为交换字符("B"，"A")在第2行中已经被算作唯一的("A"，"B").我可以在EXCEL中使用if和Countif函数轻松完成此操作.提前谢谢！

推荐答案

我们可以使用pmin和pmax按行从左到右排序值，并使用duplicated判断重复项

transform(
  df,
  col3 = +(duplicated(paste(pmin(col1, col2), pmax(col1, col2))) | col1 == col2)
)

这给了我们

   col1 col2 col3
1     A    A    1
2     A    B    0
3     A    C    0
4     A    D    0
5     A    E    0
6     B    A    1
7     B    B    1
8     B    C    0
9     B    D    0
10    B    E    0
11    C    A    1
12    C    B    1
13    C    C    1
14    C    D    0
15    C    E    0

R相关问答推荐

为什么stat_bin在R中的ggplot中显示错误的数字？

更改绘图上的x轴断点，而不影响风险？

为什么st_join(ob1，ob2，left = True)返回具有比ob1更多功能的sf对象？

随机森林回归：下拉列重要性

如何写一个R函数来旋转最后n分钟？

二维样条，严格以一个参数递增

如何在Chart_Series()中更改轴值的 colored颜色？

Ggplot2中的重复注记

`夹心：：vcovCL`不等于`AER：：tobit`标准错误

是否有新方法来更改Facet_WRAP(Ggplot2)中条文本的文本 colored颜色？

如何根据R中其他变量的类别汇总值？

使用不同的定性属性定制主成分分析中点的 colored颜色和形状

'使用`purrr：：pwalk`从嵌套的嵌套框架中的列表列保存ggplots时出现未使用的参数错误

有没有办法一次粘贴所有列

如何计算每12行的平均数？

根据r中另一个文本列中给定的范围对各列求和

在ggploy中创建GeV分布时出错

GOGPLATE geom_boxploy色彩疯狂

图中显示错误 colored颜色的图例geom_sf

在子图内和子图之间对齐行数不均匀的表格罗布对

实用课程推荐

相关教程推荐