是否有PDB文件(蛋白质数据库)的解析器,可以从标题/备注部分提取(大多数)信息,如细化统计数据等?
可能值得注意的是,我主要感兴趣的是在文件生成后立即访问数据,而不是从已经存放在蛋白质数据库中的结构中访问数据。这意味着有相当多的不同的“适当”格式需要处理,这取决于所使用的改进软件。
我看过Biopython,但他们在FAQ中明确表示:“如果您对PDB头文件的数据挖掘感兴趣,那么您可能想看看其他地方,因为对此的支持有限。”
我很清楚,从mmCIF文件中提取这些信息要容易得多,但不幸的是,这些信息仍然不是许多大分子结晶学程序的常规输出。
发布于 2017-04-20 05:21:42
到目前为止,我找到的最好的方法是使用pdb_extract (http://pdb-extract.wwpdb.org/,在线或独立)将PDB文件转换为mmcif格式。
可以使用Biopythons Bio.PDB模块解析mmcif文件。向mmcif-file写入数据有点麻烦,Python PDBx似乎工作得相当好。
这个工具和其他有用的PDB-/mmcif-工具可以在http://mmcif.wwpdb.org/docs/software-resources.html上找到
发布于 2016-08-17 19:37:39
也许你应该试试那个库?https://pypi.python.org/pypi/bioservices
https://stackoverflow.com/questions/38994845
复制相似问题