所有人. 我有一个包含1000行( node 和链接)的数据集,在txt中有两列V1和V2,这是我用Read.table导入的. 数据集中有颠倒的行,例如:

net <- read.table("DD242.txt", quote="\"", comment.char="")

    V1 V2
    4  5
    5  4
    6  7
    7  8
    and so on...

但我不知道哪些价值观会重复.如何找到这些重复行并删除其中一行?在本例中,我想删除反转=5 4的第二行.因此,我只有:

V1 V2
4  5
6  7
7  8

非常感谢!

推荐答案

您可以使用filter x lag:

library(dplyr)
df %>% 
  filter(!(V1 == lag(V2, default = 0) & V2 == lag(V1, default = 0)))

#  V1 V2
#1  4  5
#2  6  7
#3  7  8

或在底座R中:

as.data.frame((df <- t(apply(df, 1, sort)))[!duplicated(df), ])

  V1 V2
1  4  5
2  6  7
3  7  8

R相关问答推荐

找出疾病消失的受试者

判断字符串中数字的连续性

在数学中正确显示摄氏度、开氏度或华氏度

如果第一个列表中的元素等于第二个列表的元素,则替换为第三个列表的元素

在R中为马赛克图中的每个字段着色

使用R闪光显示所有数据点作为默认设置

在嵌套列表中查找元素路径的最佳方法

根据类别合并(汇总)某些行

将一个字符串向量调整为与其他字符串向量完全相同的大小

如何在ggplot2中绘制具有特定 colored颜色 的连续色轮

有没有可能用shiny 的书签恢复手风琴面板?

自动STAT_SUMMARY统计与手动标准误差之间的差异

如何在R中改变fviz_pca_biplot中圆的边界线的 colored颜色 ?

如何为混合模型输出绘制不同的线型?

将CSV转换为R中的自定义JSON格式

打印的.txt文件,将值显示为&Quot;Num&Quot;而不是值

如何根据每个子框架中分类因子的唯一计数来过滤子框架列表?

以列名的字符向量作为参数按行应用自定义函数

根据R中的值将多列折叠为一列

Visreg和ggmap,如何通过渐变中的连续变量为点着色