我有两个数据框,它们的样本几乎相同.df1
有很多样本,除了2或3个样本外,它几乎包含了df2
中发现的所有样本.
在df1
人中有一个栏目,假设是性别,它有NA
个价值观.这些性别价值观在df2
中得到了体现.
我想根据df2
填写df1
个样本中每个样本的NA值,用于它们之间共享的样本.
我怎么能做到这一点?尤其是df1
比df2
大得多,而且样品的顺序也不一样.
例如,假设这是df1
:
samples gender
1 Pt8 NA
2 Pt102 NA
3 Pt87 NA
4 Pt1 NA
这是df2
:
subject_id gender
1 Pt1 male
2 Pt102 male
3 Pt6 female
4 Pt8 male
因此,我只需根据样本名称填写以df1
为单位的NA值.