我有一个超过3000行和超过100个字节的数据帧(Tibble).我想每隔5列(例如,StoZ.x、StoZ.y、StoZ.x.x、StoZ.y.y)计算一下是否存在任何数据.如果数据出现在第5列,则将通过创建新列来添加总计数.
A tibble: 1,500 × 23
chr start end.x end.y StoZ.x Tier.x Gene.x cohort.x end.x.x StoZ.y Tier.y Gene.y cohort.y
> > <chr> <dbl> <dbl> <dbl> <dbl> <chr> <chr> <chr> <dbl> <dbl> <chr> <chr> <chr>
1 chr1 2220001 2230000 2230000 -2.68 T2 SKI cr19naBile… NA NA NA NA NA
2 chr1 2230001 2240000 NA NA NA NA NA NA NA NA NA NA
3 chr1 2240001 2250000 NA NA NA NA NA NA NA NA NA NA
4 chr1 2250001 2260000 2260000 -2.24 T2 SKI cr19naBile… 2260000 -2.90 T2 SKI ji15pnH…
5 chr1 2270001 2280000 NA NA NA NA NA NA NA NA NA NA
6 chr1 2280001 2290000 NA NA NA NA NA NA NA NA NA NA
7 chr1 2290001 2300000 NA NA NA NA NA NA NA NA NA NA
8 chr1 2550001 2560000 NA NA NA NA NA 2560000 -2.13 T1 TNFRS… ji15pnH…
预期的表格应该是这样的,添加的列计数将引用特定窗口中基因的存在.
A tibble: 1,500 × 23
chr start end.x end.y StoZ.x Tier.x Gene.x cohort.x end.x.x StoZ.y Tier.y Gene.y cohort.y Count
> > > <chr> <dbl> <dbl> <dbl> <dbl> <chr> <chr> <chr> <dbl> <dbl> <chr> <chr> <chr> <num>
1 chr1 2220001 2230000 2230000 -2.68 T2 SKI cr19naBile… NA NA NA NA NA 1
2 chr1 2230001 2240000 NA NA NA NA NA NA NA NA NA NA 0
3 chr1 2240001 2250000 NA NA NA NA NA NA NA NA NA NA 0
4 chr1 2250001 2260000 2260000 -2.24 T2 SKI cr19naBile… 2260000 -2.90 T2 SKI ji15pnH…. 2
5 chr1 2270001 2280000 NA NA NA NA NA NA NA NA NA NA 0
6 chr1 2280001 2290000 NA NA NA NA NA NA NA NA NA NA 0
7 chr1 2290001 2300000 NA NA NA NA NA NA NA NA NA NA 0
8 chr1 2550001 2560000 NA NA NA NA NA 2560000 -2.13 T1 TNFRS… ji15pnH… 1