文章/答案/技术大牛

发布

社区首页 >问答首页 >读取蛋白质fasta文件并在Arginine(R)上拆分读取的字符串，然后炸掉这些肽以获得匹配项？

问读取蛋白质fasta文件并在Arginine(R)上拆分读取的字符串，然后炸掉这些肽以获得匹配项？
EN

Stack Overflow用户

提问于 2013-06-08 07:42:25

回答 1查看 401关注 0票数 1

我有以下fasta文件：

'>gi|277456704|dbj|ID_P|Gene name LLL
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKV
YRRKHQELQAMQMELQSPEYKLSKLRTSTIMTDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFG
EVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQDELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLEL
MAGGDLKSFLRETRPRPSQPSSLAMLDLLHVARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKI
GDFGMARDIYRASYYRKGGCAMLPVKWMPPEAFMEGIFTSKTDTWSFGVLLWEIFSLGYMPYPSKSNQEV
LEFVTSGGRMDPPKNCPGPVYRIMTQCWQHQPEDRPNFAIILERIEYCTQDPDVINTALPIEYGPLVEEE

'>gi|27704|dbj|ID_Y|Gene name JJJ
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG
SELRGGYGDPGRLPVGSGLCSASRARLPGHVAADHPPAVYRRKHQELQAMQMELQSPEYKLSKLRTSTIM
TDYNPNYCFAGKTSSISDLKEVPRKNITLIRGLGHGAFGEVYEGQVSGMPNDPSPLQVAVKTLPEVCSEQ
DELDFLMEALIISKFNHQNIVRCIGVSLQSLPRFILLELMAGGDLKSFLRETRPRPSQPSSLAMLDLLHV
ARDIACGCQYLEENHFIHRDIAARNCLLTCPGPGRVAKIGDFGMARDIYRASYYRKGGCAMLPVKWMPPE

'>gi|2097704|dbj|ID_X|Gene name X
MDGFAGSLDDSISAASTSDVQDRLSALESRVQQQEDEITVLKAALADVLRRLAISEDHVASVKKSVSSKG
QPSPRAVIPMSCITNGSGANRKPSHTSAVSIAGKETLSSAAKSGTEKKKEKPQGQREKKEESHSNDQSPQ
IRASPSPQPSSQPLQIHRQTPESKNATPTKSIKRPSPAEKSHNSWENSDDSRNKLSKIPSTPKLIPKVTK
TADKHKDVIINQEGEYIKMFMRGRPITMFIPSDVDNYDDIRTELPPEKLKLEWAYGYRGKDCRANVYLLP
TGEIVYFIASVVVLFNYEERTQRHYLGHTDCVKCLAIHPDKIRIATGQIAGVDKDGRPLQPHVRVWDSVT
LSTLQIIGLGTFERGVGCLDFSKADSGVHLCVIDDSNEHMLTVWDWQRKAKGAEIKTTNEVVLAVEFHPT

我想循环通过FASTA，在它遇到的所有'R‘处分割蛋白质序列，这将产生多肽，然后爆发多肽。从blastp获取结果，并将blastp结果存储在fasta文件中每个蛋白质ID的单独文件中。我对使用什么语言并不挑剔。我想学习如何做到这一点，这样我就可以在它上面构建更多的功能。谢谢!

split

bioinformatics

biopython

fasta

bioperl

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-06-08 08:12:27

使用Biopython，您可以parse the FASTA file到Sequence对象，在"R“处使用split，然后使用BLAST over the internet或run BLAST locally。您可以获取结果(表示为SeqRecords，使用iterating over each record表示为output them to a FASTA file。

文档中有大量的代码示例，您可以使用它们来拼凑您正在寻找的内容。

票数 6

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/16994465

复制

相似问题

问读取蛋白质fasta文件并在Arginine(R)上拆分读取的字符串，然后炸掉这些肽以获得匹配项？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问读取蛋白质fasta文件并在Arginine(R)上拆分读取的字符串，然后炸掉这些肽以获得匹配项？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问读取蛋白质fasta文件并在Arginine(R)上拆分读取的字符串，然后炸掉这些肽以获得匹配项？
EN