文章/答案/技术大牛

发布

社区首页 >问答首页 >将大型.cif文件的片段转换为较小的.pdb文件

问将大型.cif文件的片段转换为较小的.pdb文件
EN

Stack Overflow用户

提问于 2020-02-11 20:33:02

回答 1查看 125关注 0票数 2

我试图从核糖体晶体结构的cif文件中划出一些与配体的结合位点，但遇到了一个涉及类型错误的恼人问题。

TypeError: %c requires int or char

使用下面的代码，

from Bio.PDB import *
from Bio import PDB

class save_res(Select):
    def accept_residue(self, residue):
        if residue in keep_res_list:
            print(residue)
            return 1
        else:
            return 0

keep_res_list = []

parser = MMCIFParser()
structure = parser.get_structure("1vvj.cif", "./1vvj.cif")
structure = structure[0]
atom_list = Selection.unfold_entities(structure, "A") # A for atoms
ns = NeighborSearch(atom_list)      

for residue in structure.get_residues():
    if residue.get_resname() == "PAR":
        for atom in residue:
            center = atom.get_coord()
            neighbors = ns.search(center, 5.0)
            neighbor_residue_list = Selection.unfold_entities(neighbors, "R")
            for res in neighbor_residue_list:
                if res not in keep_res_list:
                    keep_res_list.append(res)

io  = PDBIO()
io.set_structure(structure)
io.save("1vvj_bs.pdb", save_res())

给了我一个错误：

  File "/scratch/software/anaconda3/envs/my-devel-3.6/lib/python3.6/site-packages/Bio/PDB/PDBIO.py", line 112, in _get_atom_line
    return _ATOM_FORMAT_STRING % args
TypeError: %c requires int or char

此代码在将pdb-id更改为1fyb时运行良好，该1fyb也具有相同的配体id。我认为问题源于原始文件中大量的链和它们的in。我的假设是完全错误的吗?或者有人知道如何解决这个问题？我一直在尝试找到一种重命名链ID的方法，但还没有找到可行的方法。

非常感谢您的帮助。

casting

bioinformatics

biopython

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-05-18 23:16:31

_ATOM_FORMAT_STRING中的链名格式为%c，而在本例中，您的链名称为QA。

PDB文件中的链名称通常是单个字符。但是只有这么多的字母和数字。对于核糖体，有必要使用更长的名称。pdb格式具有第二个字母的空间--从1个字符的链名开始左侧的空列。许多程序都支持它，但并不是所有程序都支持它，而且这不是官方规范的一部分。

因此，您可以使用具有2字符链的PDB文件(如果您的工作流的其余部分支持它)，或者在输出中重命名链(您的输出只是原始结构的一小部分)。

下面是如何在gemmi中执行此操作

import gemmi

structure = gemmi.read_structure('1vvj.cif')
model = structure[0]

ns = gemmi.NeighborSearch(model, structure.cell, 5.0).populate()

for chain in model:
    for residue in chain:
        if residue.name == 'PAR':
            for atom in residue:
                for nb in ns.find_neighbors(atom):
                    nb.to_cra(model).residue.flag = 'y'

sel = gemmi.Selection().set_residue_flags('y')
new_structure = sel.copy_structure_selection(structure)
#new_structure.remove_empty_chains()
#new_structure.shorten_chain_names()
new_structure.write_minimal_pdb('1vvj-par.pdb')

这两个注释掉的行正在重命名这些链。

与您的代码相比，一个不同之处在于gemmi中的NeighborSearch是对称感知的。它也能从对称配对中找到附近的原子。在BioPython中，您只能在非对称单元(asu)中搜索。两者都不同于生物组装-- PDB-101 covers it nicely。如果你只想在亚利桑那州立大学进行搜索--用上面的gemmi.UnitCell()替换structure.cell，也就是说，不要传递单元格信息。

(你可以在bioinformatics.SE上提出这样的问题--应该很快就会有答案)。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60168883

复制

相似问题

问将大型.cif文件的片段转换为较小的.pdb文件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将大型.cif文件的片段转换为较小的.pdb文件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将大型.cif文件的片段转换为较小的.pdb文件
EN