我想把肽序列和给定的蛋白质序列相匹配。我每种蛋白质都有很多肽,其中一些也是重叠的。对于输出,我想要一个新的文件,它也告诉我序列在蛋白质中的位置。蛋白质例子:
AH受体相互作用蛋白: AHAAVWNAQEAQADFAK :AHAAVWNAQEAQADFAK
AVPLIHQEGNR
EHSSLGHADLDALQQNPQPLIFHMEMLK
GELPDFQDGTK
NIAVGKDPLEGQR
RVIQEGRGELPDFQDGTK
TLHSDDEGTVLDDSR
VESPGTYQQDPWAMTDEEK
VLELDPALAPVVSR
我想对很多蛋白质都这样做,有一个简单的解决办法吗?
非常感谢!
发布于 2015-03-18 11:53:21
不确定您使用的是哪种语言,但是循环中简单的字符串搜索有什么问题呢?
这是一个显而易见的解决方案,除非你必须在短时间内计算出一个淫秽的数字。(我猜想,如果你需要每秒超过200次,那么你可能需要考虑一种更优化的算法。)
https://stackoverflow.com/questions/29120941
复制相似问题