首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从fasta序列制作表格,python

从fasta序列制作表格,python
EN

Stack Overflow用户
提问于 2013-02-13 19:24:49
回答 1查看 534关注 0票数 1

我有大约500个fasta格式的蛋白质序列,这是我从blastp搜索得到的。从这些序列中,我需要有蛋白质名称、有机体、Uniprot ID,如果可能的话,还要有蛋白质家族,这样我就可以用这些信息构建一个表。

有没有什么办法可以用python做到这一点?一些与Uniprot通信功能?如何解析fasta报头中的信息?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-02-13 19:29:18

您应该看看具有FASTA解析器的Biopython。解析之后,您可以使用pandas DataFrame来构建一个表。如果没有一个示例数据片段,很难提供一个更深思熟虑的答案,但它应该是可行的,大约5行代码:)

代码语言:javascript
复制
from Bio import SeqIO
with open("example.fasta", "rU") as handle:
    print list(SeqIO.parse(handle, "fasta"))
票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14852437

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档