我试图在正常情况下做一个简单的任务,然而,在这种情况下,我处理的是不同格式的 Big Data (snp.data,GENABEL包).因此,这里的挑战不是任务本身,而是如何在单行代码中完成任务,而无需进一步的数据操作.

因此,我try 在不同的数据帧中使用不同的变量更改列(在操作过程中充当向量).同一个数据框也有一个参考列,用于匹配将要更改的变量.

让我用一个可重复使用的例子来解释:

vec = c("424","425","426","429", "430", "455","467","468")

df = data.frame(ID = c("426","429", "430","424","425","455","467","468", "508","601"),
               ID_rep = c("D1","D2", "D3","D4","D5","D6","D7","D8","D9","D10"))

因此,应该再次基于df中的ID列(引用)的匹配信息,将df中的ID_rep列改为df中的ID_rep列.

换句话说,vec应该是从这个开始的:

> vec
[1] "424" "425" "426" "429" "430" "455" "467" "468"

对此:

> desired.result
[1] "D4" "D5" "D1" "D2" "D3" "D6" "D7" "D8"

同样,这将改变像元数据中的列这样的向量,所以我不认为多步数据操作方法是不可行的,因为该部分数据具有如此多不同的 struct 和不均匀的大小.

先谢谢你了!

推荐答案

像这样的吗?

desired.result <- df$ID_rep[match(vec, df$ID)]

输出

[1] "D4" "D5" "D1" "D2" "D3" "D6" "D7" "D8"

R相关问答推荐

geom_raster不适用于x比例中超过2,15的值

用单个表达匹配多个替代模式

将Multilinetring合并到一个线串中,使用sf生成规则间隔的点

使用预定值列表将模拟数量(n)替换为rnorm()

selectInput不返回ALL,并将因子转换为shiny 的数字

筛选出以特定顺序患病的个体

我想在R中总结一个巨大的数据框架,使我只需要唯一的lat、lon、Date(Year)和Maxium Value""""""""

使用ggsankey调整Sankey图中单个 node 上的标签

在for循环中转换rabrame

如何改变时间图R中的悬停信息?

如何在PackageStatus()中列出&q;不可用的包&q;?

将多个变量组合成宽格式

警告消息";没有非缺失的参数到min;,正在返回数据中的inf";.表分组集

将统计检验添加到GGPUBR中的盒图,在R

将列的值乘以在不同数据集中找到的值

按两个因素将观测值分组后计算单独的百分比

使用ggplot2绘制具有边缘分布的坡度图

R:如何在数据集中使用Apply

将美学添加到ggploy中的文本标签

通过不完全重叠的多个柱连接