示例数据集如下所示:
var1 | var2 | var3 |
---|---|---|
a | 1 | 2 |
b | 2 | 3 |
如果var1=a的var2=a=var1=b的var3,我想将具有var1=a的记录链接到var1=b.
因此,样例数据集将如下所示:
var1 | var2 | var3 |
---|---|---|
a | 1 | 3 |
此外,如果var1=b
之后的下一行也是b
,则该记录也将被链接,
例如:
var1 | var2 | var3 |
---|---|---|
a | 1 | 2 |
b | 2 | 3 |
b | 3 | 5 |
b | 7 | 9 |
c | 5 | 9 |
我想要的结果是:
var1 | var2 | var3 |
---|---|---|
a | 1 | 5 |
b | 7 | 9 |
c | 5 | 9 |
有什么办法可以做到这一点吗?谢谢!
根据zx8754的S comments ,对于这个问题,可以使用igraph
进行数据清理.然而,当我试图使用
library(igraph)
df = structure(list(var1 = c("a", "b", "b", "b", "c"), var2 = c(1L,
2L, 3L, 7L, 5L), var3 = c(2L, 3L, 5L, 9L, 9L)), class = "data.frame", row.names = c(NA,
-5L))
g <- graph_from_data_frame(df)
The graph only showed var2
and ignored var3
:
问题
- 如果
a
和b
的名称不相同,如何连接它们? - 如何在图中再增加一个变量(Var3)?