我正在使用试验参与者血液测试结果的数据框架,其中有一些零星的缺失值(分析物失败).幸运的是,我们有两个非常接近的时间点,所以对于时间点1的缺失值,我希望从时间点2估算相应的值.
以下是一些示例数据:
timepoint = c(1,1,1,1,1,2,2,2,2,2),
fst_test = c(NA,sample(1:40,9, replace =F)),
scd_test = c(sample(1:20,8, replace = F),NA,NA))
到目前为止,我一直在更广泛地旋转,然后手动合并相应的测试结果,如下所示:
test %>%
pivot_wider(names_from = timepoint,
values_from = fst_test:scd_test) %>%
mutate(fst_test_imputed = coalesce(fst_test_1, fst_test_2),
scd_test_imputed = coalesce(scd_test_1, scd_test_2)) %>%
select(ID, fst_test_imputed, scd_test_imputed)
然而,对于15个测试来说,这是很麻烦的...
非常感谢您的帮助!!