我想下载所有的HeteroComplex蛋白质PDB I,它们都在蛋白质数据库中(由两种或更多种不同类型的链组成的所有PDB I)。例如,PDB ID XXXX,它将由链A和链B组成,而不是两个链A)。有人知道用python程序来完成这个任务吗?
提前谢谢。
发布于 2019-10-30 09:38:24
我认为您可能需要一个具有不同实体(https://www.rcsb.org/pages/help/advancedsearch/numberOfEntities)的PDB结构:
与链不同,实体不包括重复副本。
您可以搜索包含两个或更多不同蛋白质实体的PDB结构,并使用package黑云母(https://www.biotite-python.org)下载它们:
import biotite.database.rcsb as rcsb
pdb_ids = rcsb.search(rcsb.EntityCountQuery(min=2, entity_type="protein"))
rcsb.fetch(pdb_ids, format="pdb", target_path="some/directory", verbose=True)https://stackoverflow.com/questions/58504375
复制相似问题