我想对一个数据帧进行子集设置,使其只包含具有三列的唯一组合的行.我的情况与this个问题中的情况类似,但我想保留数据中的其他列.以下是我的例子:
> df
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C NA 80
4 8 1 C 78 75
5 8 1 C 50 62
6 9 3 C 75 75
请求的输出是这样的,在这里我只寻找基于v1、v2和v3的独特 case :
> df.new
v1 v2 v3 v4 v5
1 7 1 A 100 98
2 7 2 A 98 97
3 8 1 C NA 80
6 9 3 C 75 75
如果我能恢复非唯一行,那也太好了:
> df.dupes
v1 v2 v3 v4 v5
3 8 1 C NA 80
4 8 1 C 78 75
5 8 1 C 50 62
我在sql(here)中看到了一个关于如何实现这一点的相关问题,但在R中我无法得到这个问题.我相信这很简单,但混用unique()和subset()并没有什么成效.提前谢谢.