我试图在正常情况下做一个简单的任务,然而,在这种情况下,我处理的是不同格式的 Big Data (snp.data,GENABEL包).因此,这里的挑战不是任务本身,而是如何在单行代码中完成任务,而无需进一步的数据操作.
因此,我try 在不同的数据帧中使用不同的变量更改列(在操作过程中充当向量).同一个数据框也有一个参考列,用于匹配将要更改的变量.
让我用一个可重复使用的例子来解释:
vec = c("424","425","426","429", "430", "455","467","468")
df = data.frame(ID = c("426","429", "430","424","425","455","467","468", "508","601"),
ID_rep = c("D1","D2", "D3","D4","D5","D6","D7","D8","D9","D10"))
因此,应该再次基于df
中的ID
列(引用)的匹配信息,将df
中的ID_rep
列改为df
中的ID_rep
列.
换句话说,vec
应该是从这个开始的:
> vec
[1] "424" "425" "426" "429" "430" "455" "467" "468"
对此:
> desired.result
[1] "D4" "D5" "D1" "D2" "D3" "D6" "D7" "D8"
同样,这将改变像元数据中的列这样的向量,所以我不认为多步数据操作方法是不可行的,因为该部分数据具有如此多不同的 struct 和不均匀的大小.
先谢谢你了!