首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >下载RCSB蛋白质数据库中的所有heteroComplex蛋白质PDB ID

下载RCSB蛋白质数据库中的所有heteroComplex蛋白质PDB ID
EN

Stack Overflow用户
提问于 2019-10-22 12:31:49
回答 1查看 144关注 0票数 1

我想下载所有的HeteroComplex蛋白质PDB I,它们都在蛋白质数据库中(由两种或更多种不同类型的链组成的所有PDB I)。例如,PDB ID XXXX,它将由链A和链B组成,而不是两个链A)。有人知道用python程序来完成这个任务吗?

提前谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-10-30 09:38:24

我认为您可能需要一个具有不同实体(https://www.rcsb.org/pages/help/advancedsearch/numberOfEntities)的PDB结构:

与链不同,实体不包括重复副本。

您可以搜索包含两个或更多不同蛋白质实体的PDB结构,并使用package黑云母(https://www.biotite-python.org)下载它们:

代码语言:javascript
复制
import biotite.database.rcsb as rcsb
pdb_ids = rcsb.search(rcsb.EntityCountQuery(min=2, entity_type="protein"))
rcsb.fetch(pdb_ids, format="pdb", target_path="some/directory", verbose=True)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58504375

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档