我有两个数据集,它们应该是相同大小的,但不是.我需要修剪A中不在B中的值,反之亦然,以消除进入报表的图形中的噪声.(别担心,这些数据不会被永久删除!)

我读了以下内容:

但我还是没能让它正常工作.这是我的代码:

bg2011missingFromBeg <- setdiff(x=eg2011$ID, y=bg2011$ID)
#attempt 1
eg2011cleaned <- subset(eg2011, ID != bg2011missingFromBeg)
#attempt 2
eg2011cleaned <- eg2011[!eg2011$ID %in% bg2011missingFromBeg]

第一次try 只是消除结果setdiff向量中的第一个值.第二次try 会产生巨大的错误:

Error in `[.data.frame`(eg2012, !eg2012$ID %in% bg2012missingFromBeg) 
:  undefined columns selected

推荐答案

这会给你想要的:

eg2011cleaned <- eg2011[!eg2011$ID %in% bg2011missingFromBeg, ]

第二次try 的错误是因为你忘记了,

一般来说,为了方便起见,本规范对2d objectobject[index]个列进行了子集设置.如果要将行子集化并保留所有列,则必须使用规范

但是,您仍然需要包含,,以表明您希望获得行的子集,而不是列的子集.

R相关问答推荐

当y大于阈值和值范围时,在时间序列中突出显示区域

基于2行删除重复项指定每列要执行的操作

创建重复删除的唯一数据集组合列表

从R中的另一个包扩展S3类的正确方法是什么

以R为基数排列奇数个图

无法在我的情节中表现出显着的差异

保存包含循环和ifelse的函数的输出

根据R中两个变量的两个条件删除带有dspirr的行

编辑文件后编辑RhandsonTable

terra nearest()仅为所有`to_id`列返回NA

多重RHS固定估计

用黄土法确定区间

移除仪表板Quarto中顶盖和车身之间的白色区域

在嵌套列表中查找元素路径的最佳方法

DEN扩展包中的RECT树形图出现异常行为

使用范围和单个数字将数字与字符串进行比较

使用Scale_*_MANUAL时在图例中保留未使用的系数级别

如何使用For-R循环在向量中找到一系列数字

随机 Select 的非NA列的行均数

有没有办法将勾选/审查标记添加到R中的累积关联图中?