首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信小驿站

    查询蛋白结构

    结构域是蛋白质三级结构的基本结构单位和功能单位 蛋白质三级结构的基本结构单位是结构域。 一个蛋白质可以只包含一个结构域也可以由 几个结构域组成,故结构域是能够独立折叠为稳定的三级结构的多肽链的一部分或全部。结构域也是功能单位,通常多结构蛋白质中不同的结构域是与不同的功能相关联的。 生物体的基因组决定了所有构成该生物体的蛋白质,基因规定了蛋白质的氨基酸序列。蛋白结构域是蛋白中具有特异空间结构和独立功能的区域,是蛋白质发挥生物学效用的关键功能单位。 了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物学研究是非常重要的。 Pfam 与其他蛋白相关的数据库的不同之处在于,它以蛋白质的功能域 或者是蛋白家族作为分类检索的标准。 Pfam中的条目可以称为4个种类,除了蛋白 家族和功能域外,还有本定重复序列,以及Motif。

    2.3K11发布于 2020-06-05
  • 来自专栏Dechin的专栏

    蛋白质基础组成结构

    技术背景 了解蛋白质的基本组成单元和结构,有助于了解蛋白质的特性。对于蛋白结构的研究,在医药领域是非常核心的重要工作。 这里我们仅仅介绍一些蛋白质的基本组成单元——20种氨基酸的种类,以及可以用于蛋白质建模的一些工具。 HO-p-Ph-CH2-CH(NH2)-COOH 5.66 Valine 缬氨酸 Val V (CH3)2CH-CH(NH2)-COOH 5.96 PDB文件基本格式 pdb是最常用的一种存储蛋白结构的文本文件格式 ,但是pdb本身又是一个严格的结构化的文本文件,其对应位置的内容为: 列 数据 格式, 对齐 说明 1-4 ATOM 字符, 左 Record Type 记录类型 7-11 serial 同时本文还介绍了常用的存储蛋白结构的文件格式pdb的具体格式化定义,总体来说是一个总结性的文章。

    94531编辑于 2022-05-09
  • 来自专栏量子位

    清华AI蛋白结构预测,连续4周夺得CAMEO第一

    衡宇 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI蛋白结构预测赛道,国产模型又有吸睛表现: 在蛋白结构预测竞赛CAMEO上,有支队伍连续四周夺得全球第一。 AIRFold在近4周的比赛中,不仅预测结果IDDT分数领先,系统响应时间上也远远领先后几名的团队。 亮眼成绩如何取得?后续又有哪些研究和应用方向? 目前主流的结构预测方法,比如AlphaFold2和ESMFold都主要使用单结构蛋白进行训练,这是因为PDB数据库中单结构蛋白远多于多结构蛋白。 AIRFold团队在这样一个时间点开始研究蛋白结构,我们更多的是想关注蛋白结构如何决定功能,如何助力药物与疗法的研发,并不是只关注结构预测这一个孤立的问题。 多构象预测其实是蛋白结构和功能以及药物研发之间的另一道鸿沟。我们知道无论是AlphaFold2预测的还是实验解析的蛋白结构其实都是静态的。

    32920编辑于 2022-09-22
  • 来自专栏DrugOne

    InstructPLM: 对齐蛋白质语言模型以遵循蛋白结构指令

    鉴于结构决定功能,结构相似的突变蛋白更有可能在生物进化中保存下来。 为了解决数据有限的问题,在大型视觉-语言模型领域出现了一种新的策略,即跨模态对齐,据说已被整合到GPT-4中(尽管GPT-4的技术细节尚未公开披露)。 此外,作者仿照着Qwen-VL的方法,在交叉注意力中添加一维绝对位置编码,以在压缩过程中保留蛋白质一级结构信息。压缩后的蛋白质主链结构特征序列随后被送入蛋白质语言模型,作为一个软提示。 Adapter中可学习的查询向量数据的消融实验 表 4 为了探究蛋白结构-序列adapter在序列设计中的表达能力,作者对adapter中交叉注意力的可学习查询向量数量进行了消融研究。 InstructPLM在不同查询数量下的详细性能显示在表4中。

    45010编辑于 2024-06-04
  • 来自专栏DrugScience

    寻找蛋白结构中的紊乱残基

    紊乱残基,分析蛋白结构的时候,经常遇见的一个点,以前的,我觉得蛋白结构就是结构,唯一的稳定的,直到我亲眼遇到了几个坑。 好吧开始 用的biopython,编程语言还是python 直接代码: 我懒得排版,你们就简单看 拿个蛋白:1h10 ? 假如出现什么值得注意的地方,那事情就有点难办了 #建造一个mmcif解析器 from Bio.PDB.MMCIFParser import MMCIFParser parser = MMCIFParser() #结构输入 structure = parser.get_structure('1h10', '1h10.cif') #简单看下 structure #看下这个实例能做什么 dir(structure) #这个结构只有一个 model,不是nmr结构,只有A链一条链,残基总共357个 #(水,ligand也算残基(biopython说法应该是异质残基)) len(structure[0]['A']) #判断一个残基是否位为紊乱残基

    68120发布于 2021-02-04
  • 来自专栏DrugOne

    BIB | 动态结构信息提升蛋白-蛋白相互作用预测能力

    蛋白质的空间结构与其功能特性密切相关,在预测蛋白质-蛋白质相互作用中增加蛋白质空间结构相关信息能潜在提高模型预测能力。 本文提出TAGPPI模型,融合蛋白质序列特征与AlphaFold2预测的结构信息提高蛋白-蛋白相互作用预测精度。德睿智药团队负责了研究部分AI模型的开发与验证。 由于蛋白质的空间结构与其功能密切相关,研究团队认为针对PPI预测问题,结合蛋白结构信息,可潜在提高模型的预测性能。 然而,已知结构蛋白质数量有限,限制了基于结构的预测方法的应用,利用Alphafold2预测的蛋白结构是一种新的尝试。 随着蛋白结构预测方法的改进,三维结构在数量和质量上都会有实质性的发展,这一趋势或许将促使更多围绕结构特征的研究的开展。团队计划尝试将该策略应用于其他预测任务,如药物-靶点相互作用预测和蛋白质设计。

    1.1K20编辑于 2022-03-25
  • 来自专栏生信小驿站

    蛋白结构学习记录1

    β-Strands (β-Sheets)  一般不单独出现,成对或多个出现  β链通过氢键相互作用,稳定结构  通过β转角,短或长的loop、coil或α螺旋连 接序列相邻的两个β片。  平行或反平行的β−sheet Loop 连接α-helix或β-sheet 长度和三级结构不确定 在蛋白结构的表面 受点突变的影响小 柔性好,构象变化余地大 带电荷、极性的氨基酸比例高 维系蛋白结构的作用力 氢键: 与电负性大的原子X(氧、氮等)共价结合 的氢,如与负电性大的原子Y接近,在X与Y之间以 氢为媒介,生成X-H…Y形的键。有饱和性和方向 性。 盐键(离子键): 是蛋白质分子中带正、负电荷 的侧链基团互相接近,通过静电吸引而形成,作 用力强,无饱和性,无方向性。 一般认为折 叠过程中不介导蛋白形成正确构象,但加固已形 成的折叠结构。 金属配位键: 金属离子与蛋白特定残基形成。 1,蛋白质的正确折叠所必须; 2,正确折叠过程非必须,但有利于结构稳定。

    85820发布于 2020-10-28
  • AlphaFold破解心脏病关键蛋白结构

    揭示心脏病关键蛋白结构,长期以来既是重要的公共卫生目标,也是一个棘手的科学难题。 揭示其关键蛋白结构,有望阐明坏胆固醇如何在体内产生危害,为科学家预防和治疗ASCVD提供更优策略。AlphaFold在此项工作中发挥了核心作用。 他利用AlphaFold生成了该蛋白结构的原子级精度预测,然后通过与冷冻电镜图像数据进行比对,对这些预测结构进行了优化。 最终生成的模型以前所未有的细节揭示了坏胆固醇关键蛋白结构:一个环绕每个LDL颗粒的笼状外壳,其中包含一条带状结构,确保颗粒在血液中的完整性。 他说:“AlphaFold上线那周,这是我第一个用它来运算的结构,也是我第一个想用我们那台两层楼高的冷冻电镜去观察的蛋白质。解析apoB100的结构,梦想成真了。”FINISHED

    11610编辑于 2026-02-13
  • 来自专栏生信小驿站

    蛋白质二级结构预测

    蛋白质二级结构 ? α-螺旋(α-Helix) 蛋白质中最丰富的的二级结构 β-折叠片(β-Sheets) 具有平行(parallel)与反平行(antiparallel)两种形式 环区(Loops) 连接螺旋和折叠结构 常位于蛋白结构表面,多为带点和极性氨基酸 常为活性位点组成部分 无规则卷曲(Disordered regions) Jpred Jpred 是一种蛋白质二级结构预测网络服务器,由Barton Group 通过提交单一蛋白质序列或多重蛋白质序列并运行,Jpred就可以预测出蛋白质序列的二级结构:α-螺旋、β-折叠或无规则卷曲。Jpred应用了Jnet神经网络算法,准确率达到了76.4%。 (windows)输入神经网络进行二级结构预测。

    1.6K01发布于 2020-07-14
  • 来自专栏DrugOne

    结构感知的蛋白质预训练

    这篇文章设计了针对蛋白结构的预训练任务,并运用双层优化和互信息捕捉序列信息和结构信息的一致性,在下游任务上取得了当前最好的结果。 现有蛋白质表征学习的主要阻碍是有监督数据太少,而最近的一些研究已经证明了自监督学习有希望解决标签不足这个问题。然而,现有蛋白质自监督学习方法只作用在蛋白质序列层面,没有显式考虑蛋白结构的信息。 为此,作者提出了一种新的蛋白质自监督学习方法来有效地捕捉蛋白质的结构信息。具体来讲,基于残基间距离和二面角设计了两个自监督学习任务并使用图神经网络来捕捉这些信息。 更进一步,作者利用预训练好的蛋白质语言模型增强蛋白结构的自监督学习,并且提出一种伪双层优化方案去保证蛋白质序列信息和结构信息的一致性。下游任务的实验验证了作者提出的方法的有效性。 基于图神经网络的两个自监督任务很好地捕捉蛋白质的结构信息,同时,伪双层优化保证了蛋白质序列信息和结构信息的一致性。下游任务C2, C10和C384的结果验证了方法的有效性。

    28330编辑于 2022-11-28
  • 来自专栏机器之心

    4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源

    编辑 | ScienceAI 蛋白结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。 如何利用这些蛋白结构来训练强大且通用的表征模型是一个值得研究的方向。 论文链接:https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4 github链接:https://github.com/westlake-repl 这样对于蛋白质的每个位点,其氨基酸类型和对应的局部结构都能组合成新词表中的某个元素,从而让模型同时考虑到蛋白质的序列与结构信息。 蛋白质区分开来,而ESM-2的可视化结果却将两种蛋白质混杂在一起,这说明了SaProt对结构的变化有很强的感知能力。

    33910编辑于 2024-04-26
  • Science|蛋白质-蛋白质相互作用的结构发生机制

    -结构映射,以晶体结构为输入,将序列簇与其结构构型关联;源于这些计算模型并经界面结构验证的上位性分析,揭示关键残基-残基相互作用,为塑造蛋白质-蛋白质相互作用的进化机制提供见解。 簇间特异性与交叉反应的结构洞察 图4 簇间特异性与正交性的结构洞察 (A)图3C中代表性配对所有可能Z-A和Z-B组合的特异性矩阵:通过酵母切割-捕获实验测量的结合亲和力相对于最高亲和力(A4B4复合物 )和非相互作用对照(11丙氨酸突变体)进行归一化;该矩阵显示高簇内特异性,同源配对位于对角位置;观察到部分交叉反应,包括非同源配对形成的A4B1和A7B3混合复合物;数据为n=3个独立重复的平均值。 合成与天然蛋白质-蛋白质界面的结构和上位性特征 图5 界面组成的结构解析与上位性分析 (A)Z结构域链间接触:对于每个结构,链A以表面模型显示,链B以卡通模型显示,接触残基的侧链以棍状模型显示;非接触库残基为蓝色或蓝灰色 (D)A1B1结构模型上可视化的顶级链间上位性保守性:V14ᴬ-V47ᴮ是种子、所有中间节点和A1B1的最高或第2高排名链间上位性效应大小;A1B1的结构模型通过对A4B1晶体结构进行F14V点突变构建

    12720编辑于 2026-03-03
  • 来自专栏智药邦

    Nature|仅根据靶点结构设计蛋白质的结合蛋白

    我们成功地解析出了五个结合蛋白-靶点复合物的晶体结构,所有这五个结构都非常接近于相应的计算设计模型。 (protein backbones);3)在这些结构中找出重复出现的骨架基序(backbone motifs);4)生成并针对靶点投放第二轮包含这些相互作用基序的骨架(图1a)。 步骤1和2对空间进行了非常广泛的搜索,而步骤3和4则在最有希望的区域加强了搜索。我们在下文中对每个步骤进行描述和说明。 图1 | 从头蛋白质结合物设计管道的概述。 很少有交叉反应(图4a),可能是由于它们的表面形状和静电特性相当不同(图4b)。与以前对亲和力的观察一致,这表明各种各样的结合特异性可以在简单的螺旋束中进行编码。 图4|设计的结合物具有高靶点特异性 高分辨率的结构验证 高分辨率的结构对于评估计算蛋白设计的准确性至关重要。

    2.8K20编辑于 2022-04-13
  • 来自专栏科研猫

    IBS—绘制核酸、蛋白结构图的神器

    IBS简介 IBS是一款专业的核酸和蛋白质生物序列图绘制软件,为华中科技大学薛宇教授的团队CUCKOO制作,内置蛋白质序列和核酸序列的多种模板和推荐配色,也可以自己进行创作。 两者的区别是:下载版有35个蛋白样品图和27个核酸样品图,在线版只有20个蛋白样品图和20个核酸样品图。 01 查找序列结构 首先查找相关基因或者蛋白质的序列结构,查询网站一般用以下三个: Ensembl: http://grch37.ensembl.org/Homo_sapiens/Info/Index //www.uniprot.org/ 02 绘制图形 首先登录IBS网站: http://ibs.biocuckoo.org/ 在线绘制图形,有三种绘制方法:1、自定义画图;2、模板上修改;3、输入蛋白质 3、输入蛋白质ID。在网站首页点击FOR DATABASE,可以直接搜索蛋白质的ID进行绘图。 ? 03 观看视频学习 如果想了解更加详细的图画绘制步骤可以观看网站发布的教学视频学习。

    4.8K20发布于 2020-07-16
  • 来自专栏DrugOne

    Science | 蛋白结构预测: now easier, faster

    根特大学的结构生物学家 Savvas Savvides 曾六次尝试模拟一种有问题的蛋白质。 2020 年秋季,谷歌旗下的英国人工智能公司 DeepMind 在两年一度的竞赛中以其结构预测赢得了该领域的盛赞(Science,2020 年 12 月 4 日,第1144页),该竞赛称为蛋白结构预测的关键评估 但是 AlphaFold2 只解决了单个蛋白质的结构,而 RoseTTAFold 也预测了复合物,例如锁定在其受体上的免疫分子白细胞介素 12 的结构。 巴塞尔大学的计算结构生物学家 Torsten Schwede 说,许多生物功能取决于蛋白质-蛋白质的相互作用。 但 Savvides 表示,Baker实验室的方法更好地捕捉了“蛋白结构的本质和特殊性”,例如识别从蛋白质侧面伸出的原子串——这是蛋白质之间相互作用的关键特征。

    56970发布于 2021-07-28
  • 来自专栏智药邦

    Nature|确定蛋白结构的短暂状态

    因此,结构生物学的一个挑战是扩大确定这些高能状态的方法。目前确定蛋白结构的技术,包括X射线晶体学和低温电子显微镜,都具有局限性。 解决方案 在核磁共振中,蛋白质中的每个原子都可以通过其原子核在磁场中的共振频率来检测,这称为化学位移。但仅仅测量化学位移并不足以准确计算蛋白结构。 这种方法以前被用来确定蛋白质的主要结构,但我们将其与 CPMG 弛豫色散(PCS-CPMG)结合起来,以确定蛋白质在其高能状态下的 PCS。 这项工作概述了一种确定蛋白质中这种瞬时结构的新策略。 --Hashim Al-Hashimi 美国北卡罗来纳州达勒姆的杜克大学医学院生物化学系 这篇论文的背后 大约20年前,我意识到最具生物活性的蛋白质构象是高能状态,而不是充满蛋白结构数据库的低能结构

    52110编辑于 2022-04-13
  • 来自专栏R语言数据分析指南

    ggplot2优雅绘制蛋白结构域与基因结构

    0.1,1.2), legend.justification = c(0,1.2), legend.text=element_text(color="black",size=8)) 绘制蛋白保守结构域 pfam <- read_tsv("pfam.xls",col_names = F) %>% select(1,4,5,6,12) %>% filter(X12 < 0.001) %>% fill = guide_legend(direction = "horizontal"))+ guides(fill=guide_legend(nrow=1, byrow=TRUE)) 绘制基因结构

    2.7K20编辑于 2022-09-21
  • 来自专栏新智元

    地球超2亿蛋白结构全预测,AlphaFold引爆「蛋白质全宇宙」!

    AlphaFold能够预测2亿多个蛋白结构,实现数量级的重大飞跃。 最重要的是,全部免费开放! 在未来,预测蛋白结构就如同使用「谷歌搜索引擎」一样简单。 当时,98.5%的人类蛋白结构全被AlphaFold2预测出来了。 而现在,DeepMind正式宣布该数据库已经从近100万扩大到2.14亿个结构,预测蛋白结构数量也提升了200多倍! AlphaFold在国际蛋白结构预测竞赛(CASP)上首次亮相,力压其他97个参赛者。 当时,AlphaFold预测出了43种蛋白质中25种蛋白质的最精确结构。 其预测了98.5%的人类蛋白结构,以及20个其他被大量研究的生物体的完整蛋白质组,其中包括小鼠、酵母菌和大肠杆菌,累计共有36.5万个结构。 他说:「从近100万个蛋白结构扩展到超过2亿个蛋白结构,几乎涵盖了所有基因组测序的生物体,这是一个巨大的里程碑!」

    68020编辑于 2022-08-26
  • 来自专栏机器学习初学者精选文章

    【数据竞赛】天池蛋白结构预测大赛总结

    :Top5分享 比赛背景 蛋白质是生命活动中重要的组成,蛋白质的结构决定了蛋白质在生命活动中的功能,因此对蛋白结构进行分析具有重要的实际意义。 蛋白结构又可分为一级结构,二级结构,三级结构和四级结构。 ,每条蛋白质序列与二级结构序列长度相同,蛋白质序列中字母表示氨基酸类型,二级结构字母对应当前氨基酸构成的二级结构,二级结构中的空白也是一种松散结构的表示。 蛋白质可以看成是一条氨基酸序列,在空间中是一种相互交错螺旋的结构,像一条互相缠绕的绳子: 这种三维结构叫做蛋白质的三级结构,而如果不考虑结构的三维性,或者说把这整条序列拉直,用一个一维的序列表示,这便是得到了蛋白质的一级结构 用这样的序列表示蛋白质比起原始的三维结构确实方便不少,但却丢失了三维的结构信息,蛋白质的结构决定其功能,这里的结构不止是序列本身,更多的还依赖其三维结构

    92520发布于 2021-04-16
  • 来自专栏生信修炼手册

    SMART:蛋白结构域数据库

    SMART是蛋白结构域的数据库,该数据库最新版本为v8,收录了1300多个蛋白结构域信息,覆盖了来自uniprot, ensembl等多个数据库的蛋白。 ,这些蛋白序列是存在冗余的,genomic模式下只包含了拥有完整蛋白质组的物种的信息。 domian 结构图 ? 从图中,可以看出,该蛋白质包括以下5种domain CUB EGF_CA CCP Tryp_SPc 还提供了每个结构域的位置信息 ? 2. 蛋白质相互作用 提供了来自STRING数据库的蛋白相互作用信息,示意如下 ? 3. 4. orthology group 注释 提供了来自eggNOG数据库的注释信息,示意如下 ? 5. 转录后修饰 提供了来自PTM数据库的转录后修饰信息,示意如下 ?

    4.8K20发布于 2020-05-08
领券