因此,我有一个包含重复条目的数据集,这些条目具有相同的ID1但不同的ID2,并且某些数据丢失.我想要通过将缺失的观测移动到单个实体上,然后删除其他实体来生成完整的数据集.
一些示例测试数据来说明该问题:
library(data.table)
tab = data.table(ID1 = rep("A", 9),
ID2 = c(rep("AA", 3), rep("AB", 3), rep("AC", 3)),
year = c(2010, 2011, 2012, 2010, 2011, 2012, 2010, 2011, 2012),
var1 = c(100, NA, 150, 100, 120, NA, NA, NA, NA),
var2 = c(NA, NA, NA, 4, 5, NA, NA, 5, 2),
var3 = c(4.1, 3.1, 2.7, NA, 3.1, NA, 4.1, NA, NA))
我已经根据丢失的数据量对实体进行了排序,但我需要一种方法来移动丢失的数据以填补空白.例如:将缺失的var1
和var2
数据从AB
移至AA
.
我有多达5个副本,我的数据是面板(时间x实体).
非常感谢