给定三个字符串:
seq <- c("abcd", "bcde", "cdef", "af", "cdghi")
我想进行多重序列比对,以便得到以下结果:
abcd
bcde
cdef
a f
cd ghi
使用msa包中的msa()函数,我try 了:
msa(seq, type = "protein", order = "input", method = "Muscle")
并得到以下结果:
aln names
[1] ABCD--- Seq1
[2] -BCDE-- Seq2
[3] --CD-EF Seq3
[4] -----AF Seq4
[5] --CDGHI Seq5
Con --CD-?? Consensus
我想将此函数用于可以包含任何unicode字符的序列,但在本示例中,该函数已经给出了一个警告:找到了无效的字母.有什么 idea 吗?