我有一个数据框,由分布在15个不同ID中的近50000行组成(每个ID有数千个观察值).数据框看起来像:
ID Year Temp ph
1 P1 1996 11.3 6.80
2 P1 1996 9.7 6.90
3 P1 1997 9.8 7.10
...
2000 P2 1997 10.5 6.90
2001 P2 1997 9.9 7.00
2002 P2 1997 10.0 6.93
我想 for each ID取500个随机行(所以P1取500,P2取500,…)并创建一个新的df.我试着:
new_df<-df[df$ID %in% sample(unique(dfID),500),]
但它随机抽取一个ID,而我需要 for each ID随机抽取500行.