我有两个数据集,它们应该是相同大小的,但不是.我需要修剪A中不在B中的值,反之亦然,以消除进入报表的图形中的噪声.(别担心,这些数据不会被永久删除!)
我读了以下内容:
- Selecting columns in R data frame based on those *not* in a vector
- http://www.ats.ucla.edu/stat/r/faq/subset_R.htm
- How to combine multiple conditions to subset a data-frame using "OR"?
但我还是没能让它正常工作.这是我的代码:
bg2011missingFromBeg <- setdiff(x=eg2011$ID, y=bg2011$ID)
#attempt 1
eg2011cleaned <- subset(eg2011, ID != bg2011missingFromBeg)
#attempt 2
eg2011cleaned <- eg2011[!eg2011$ID %in% bg2011missingFromBeg]
第一次try 只是消除结果setdiff向量中的第一个值.第二次try 会产生巨大的错误:
Error in `[.data.frame`(eg2012, !eg2012$ID %in% bg2012missingFromBeg)
: undefined columns selected