我有一个包含100个氨基酸(AA)的蛋白质序列,可以作为data.framework处理.每个AA都有一个职位,目前最重要的是职位:
Protein <- data.frame(AA = 1:100)
然后我有一个数据.框架,其中包含来自蛋白质(消化/序列分解后)的肽,以及与蛋白质相关的AA的初始和最终位置:
df <- data.frame(
Peptides = c("Peptide_A", "Peptide_B", "Peptide_C", "Peptide_D"),
Initial.AA = c(1, 23, 59, 77),
Final.AA = c(18, 58, 70, 100)
)
Output:
Peptides Initial.AA Final.AA
1 Peptide_A 1 18
2 Peptide_B 23 58
3 Peptide_C 59 70
4 Peptide_D 77 100
判断DF时,很明显一些AA未映射(19:22和71:76,共有10个未映射AA).
我希望输出total percentual of mapped AA,在本例中是90% (90 mapped AA from all the peptides / 100 protein AA).
一如既往地欢迎所有答案,但最好是整洁的答案.