我有一个包含数千行和以下列的数据集:ID、ParentID、RANK和Science Name.
我希望创建一个新的专栏,它将通知给定物种所属的family(rank中的一个级别).如果有人能帮上忙,我将不胜感激.
示例数据:
ID = c('f1','f2','g1','g2','g3','g4','s1','s2','s3','s4','s5','s6') # all unique
parentID = c(NA,NA,'f1','f1','f2','f2','g1','g1','g2','g3','g3','g4')
rank = c('family','family','genus','genus','genus','genus','species','species','species','species','species','species')
scientificName = c('FamA','FamB','GenA','GenB','GenC','GenD','SpA','SpB','SpC','SpD','SpE','SpF')
dat = data.frame( ID, parentID, rank, scientificName)
我想要的输出(在本例中)是一个额外的列,告知这些族为: Family=c(‘FAMA’,‘FAMB’,‘FAMA’,‘FAMA’,‘FAMB’,‘FAMA’,‘FAMA’,‘FAMB’,‘FAMB’)
我曾想过创建家族及其ID的矢量,然后在ParentID栏中用姓氏更改代码,然后try 类似的方法,让该属最终将家族信息与每个物种联系起来,但最终变得有点混乱(也就是说,它不起作用).我想我需要的东西可以通过‘dplyr’套餐来完成,但我被卡住了…再说一次,如果能帮上忙我会很感激.