首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Y大宽

    6️⃣蛋白质序列的功能信息分析1:基于蛋白质基序motif

    序列比对和序列特征分析总目录 蛋白质具有多种生物学功能,具体可参照《生物化学》。蛋白质若发挥生物学功能,须以空间结构形式。 而蛋白质多肽链一旦合成,即可在其他物质协助下,自然折叠,形成一定的空间构象。 1 如果两种蛋白质一级结构相似,那么其空间结构和功能也相似,也有例外。 因为蛋白质的空间结构是发挥功能的基础,凡是能影响蛋白质构象的物化和生物因素等,均可影响其功能。 依照蛋白质序列特征进行功能预测,主要有以下几种方法: 1 基于蛋白质基序 2 基于结构域 3 基于同源性搜索 ---- 基于蛋白质motif motif是指与蛋白质特定功能相关,具有特定的氨基酸排列顺序的片段 PROSITE PROSITE可以做什么 可以通过蛋白的UniProtKB中的ID,PDB ID或FASTA格式的蛋白质序列在PROSITE中搜索,判断该序列包含的功能位点,从而推测其可能属于哪个蛋白质家族

    6.3K42发布于 2019-03-05
  • 来自专栏生命科学

    MCE | 表观遗传:YTHDF蛋白调节 m6A-RNA

    mRNA” 的研究,揭示了 YTHDF 蛋白调节 m6A 修饰的 mRNA 的功能统一模型。 与“不同的 m6A 位点结合不同的 DF 蛋白”的主流观点不同,该研究人员发现,所有 m6A 位点与三个 DF 蛋白都以基本相似的方式结合,它们以冗余的作用方式诱导同一子集的 mRNA 降解,没有证据表明它们能直接促进翻译 首先,研究人员观察DF1 和 DF2 YTH 结构域与含有 m6A 的 RNA 的结合,发现在整个转录组中,DF 蛋白结合 m6A 的氨基酸以及结合近端的氨基酸都是保守的,因此三个 DF 蛋白与 m6A 但是,不同的 DF 如何对 m6A-mRNAs 发挥不同的分子效应这个问题仍未解决,研究人员又分析了 DF 旁系同源物之间的效应区域差异,以及它们的相互作用蛋白 (不同的 DF 蛋白可能通过与不同的蛋白相互作用介导其不同的功能 根据已有报道,研究人员考虑到每种 DF 蛋白都有介导 m6A-mRNA 降解的可能性。

    49020编辑于 2023-03-15
  • 来自专栏Y大宽

    6️⃣蛋白质序列的功能信息分析2:基于蛋白质结构域domain和功能位点分析

    [序列比对和序列特征分析总目录](https://www.jianshu.com/p/878f2b2495ae 结构域domain比较抽象,属于蛋白质构象中二级结构和三级结构之间的一个层次,一般每个结构域有 InterProScan数据库:online和linux(无mac和window) nterPro将来自许多其他资源的蛋白质功能的预测信息统一在一起,概述了蛋白质所属的家族及其所包含的域和位点。 非常全面,,将UniProtDB,PROTSITE,PRINTS,PFAM,ProDom等数据库中含有的蛋白质序列的结构域,motif等合并统一,包含了蛋白质所属的家族,及其所包含的结构域和功能位点。

    3.1K00发布于 2019-03-04
  • 【辰辉创聚生物】重组蛋白表达纯化|蛋白表达定制|蛋白修饰|原核表达蛋白

    原核蛋白表达宿主菌株与表达载体的选择1. C41、C43 等突变株:对有毒或难表达蛋白更为耐受,常用于膜蛋白或代谢负担较大的蛋白。2. 例如,使用硫氧还蛋白(Thioredoxin, Trx)作为融合伴体,可大幅提高表达溶解性,并通过加Tag(如6×His)简化纯化步骤,之后切除伴体以获得目标蛋白。 例如使用携带冷激蛋白promoter的表达载体,在较低温度(如11℃)下诱导,可显著提高可溶表达几率。蛋白表达定制服务1. 大规模表达与裂解;6. 蛋白纯化:亲和层析 → 可选凝胶过滤或离子交换等进一步纯化;7. 酶切去伴体:如需去除融合标签,采用特异性酶处理;8.

    64210编辑于 2025-08-25
  • 来自专栏新智元

    Meta打造首个「蛋白质宇宙」全景图!用150亿参数语言模型,预测了6亿+蛋白质结构

    利用大型语言模型 ,打造了一个超过6亿个宏基因组结构的数据库,让蛋白质结构预测提速60倍。 Meta在蛋白质结构的探索上又前进了一步! 这次他们瞄准的是更大的目标领域:宏基因组学。 由于宏基因组学的研究对象无所不包,远远超过了构成动植物生命的蛋白质,可以说是地球上最不为人知的蛋白质。 为此,Meta AI用上了最新的大型语言模型、打造了一个超过6亿个宏基因组结构的数据库,并提供一个API,让科学家轻松检索与工作相关的特定蛋白质结构。 正是这种结构和生物作用的未知性,通过宏基因组学发现的新蛋白质,甚至可以称为蛋白质宇宙的「暗物质」。 近些年,基因测序方面的进步让编目数十亿宏基因组蛋白质序列成为可能。 事实上,借助于这种新的结构预测能力,Meta在短短两周内用一个由大约2000个GPU组成的集群上,预测出了图谱中超过6亿个宏基因组蛋白质的序列。

    42240编辑于 2023-01-07
  • 【辰辉创聚生物】包涵体蛋白纯化|可溶性蛋白表达|大肠杆菌蛋白表达|原核蛋白表达

    在生物技术与分子生物学中,原核蛋白表达体系(尤其是大肠杆菌蛋白表达)因操作简便、生长速度快、成本低廉,是获取重组蛋白的重要途径。 因此,在工程过程中,提升可溶性蛋白表达与完善包涵体蛋白的纯化与复性策略,是实现高效、活性蛋白回收的关键。可溶性蛋白表达策略避免目标蛋白形成沉淀、提高可溶性表达是首选路径。 6、低温适应菌株:如 ArcticExpress 系统携带冷适应伴侣,可在极低温下表达提高可溶性。 通过上述策略,可显著在原核蛋白表达 / 大肠杆菌蛋白表达系统中提升可溶性蛋白表达比率,从而降低进入包涵体途径的蛋白量。包涵体蛋白纯化流程当可溶性表达不足时,包涵体表达成为高产获取目标蛋白的重要替代。 (2)蛋白溶解(Solubilization)传统方法利用高浓度变性剂(如 6–8 M 尿素或 Guanidine-HCl)及还原剂(DTT/TCEP)彻底展开蛋白结构。

    36710编辑于 2025-09-02
  • 来自专栏医学数据库百科

    蛋白功能预测

    我们在遇到一些新的蛋白的时候,经常需要去了解这个蛋白的功能。如果是一个新的还没有功能注释的蛋白,一般数据库就用不了了。这个时候就可以使用 NetGo 来对蛋白的序列进行功能注释了。 ? NetGo基于三重信息来对蛋白序列进行功能预测: 基于已知的功能信息信息(GO数据库) 基于STRING蛋白相互作用数据库进行注释 如果没有互作蛋白的可以进行同源转换进行注释。 数据库评价 对于蛋白功能预测的话,已知的蛋白基本上都已经基于GO预测好了。如果我们研究的是已知常规蛋白的话,其实可以去类似Genecards或NCBI的gene数据库直接看的。 这个数据库更多的可以用于新发现的蛋白的预测,或者说一个基因不同转录本之间的研究,看有没有功能的区别。

    92810发布于 2020-06-01
  • 来自专栏DrugOne

    蛋白语言模型改进蛋白复合物预测

    AlphaFold-Multimer 就提升了蛋白质复合物结构的预测水平,但其准确性依然取决于多序列比对(MSA)结果。 同时,蛋白质语言模型也在不同的工作中被广泛应用,它可以捕捉到序列中的约束和共进化信息。 图 2:不同方法在不同域上的 DockQ 比较 作者还可视化了 5D6H、6KIP、6FYH、4LJO 这 4 个 PDB 结构,如图 3 所示,结果显示用 ColAttn 方法能精准预测而使用 AlphaFold-Multimer 在第 6-12 层构造的 ColAttn 在识别同源序列上比前几层更加精确。 图 6:不同层上 DockQ 得分 4 总结 本文基于预训练蛋白语言模型,探索了一些 MSA 配对算法构建有效间相互作用的效果,这篇文章也是首次将蛋白语言模型用来构造联合 MSA,实验结果证明本文提出的

    73320编辑于 2022-11-28
  • 【辰辉创聚生物】膜蛋白表达|无细胞蛋白表达|重组蛋白表达生产

    高可控性无细胞系统可以精确控制反应条件,如温度、pH、离子强度和底物浓度等,从而优化蛋白质的表达和折叠过程。这种可控性对于膜蛋白等复杂蛋白的表达至关重要。3. 无细胞蛋白表达系统在膜蛋白研究中的应用1. 膜蛋白的表达和纯化膜蛋白由于其疏水性和结构复杂性,传统的细胞表达系统难以高效表达和纯化。 膜蛋白的功能研究无细胞系统能够在体外合成具有功能的膜蛋白,如离子通道、受体和转运蛋白等,为其功能研究提供了便利。通过与膜片钳技术、荧光标记和质谱分析等方法结合,可以深入探讨膜蛋白的功能机制。4. 膜蛋白的药物筛选膜蛋白是许多药物的靶点,如G蛋白偶联受体(GPCR)和离子通道等。无细胞系统能够在体外合成目标膜蛋白,并进行高通量药物筛选,为新药的开发提供了有效的平台。 此外,结合计算模拟和结构生物学技术,也有助于深入探讨膜蛋白的功能机制。无细胞蛋白表达系统作为一种高效、可控和灵活的蛋白合成方法,在膜蛋白研究中具有重要应用价值。

    36610编辑于 2025-09-09
  • 来自专栏量子位

    AlphaFold对手来了:Meta发布6亿“暗物质”蛋白预测结果,仅用2周完成

    Meta的蛋白质预测大模型ESMFold,刚刚公布了其最新成果: 6亿多种蛋白结构预测结果,而且还是“蛋白质中的暗物质”——宏基因组蛋白(Metagenomic Proteins)。 宏基因组蛋白,简单来说就是特定时刻下,环境微生物表达的所有蛋白。 它们来自细菌、病毒和其他尚未确定特征的微生物,数量非常庞大。 另外,在单个英伟达V100 GPU上,ESMFold可以在14.2秒内对含有384个残基的蛋白质进行预测,比AlphaFold2快6倍。 而对于较短的序列,它甚至比AlphaFold2快了60倍。 看到这点,你或许会疑惑:预测蛋白质结构的模型,和语言模型有什么关系? 一方面,从数据层面来看,语言和蛋白质结构都具有离散性。 不过需要说明的一点是,Meta的研究人员也表示,这6亿多个预测出来的蛋白质结构目前还没有被定性,还需后续的核验、分类等。 ......

    48620编辑于 2022-12-08
  • 【辰辉创聚生物】哺乳动物细胞蛋白表达|HEK293蛋白表达|CHO细胞蛋白表达|哺乳蛋白瞬时表达

    哺乳动物蛋白表达是指将目标基因导入哺乳动物细胞(如CHO、HEK293等)后,利用其与人类高度相似的转录、翻译及翻译后修饰机制,在细胞内合成并加工目标蛋白的过程。 其优势在于适合快速验证蛋白功能、小规模制备和结构分析。例如,研究者常在 HEK293E 中快速获得融合蛋白或重组受体蛋白,用于体外功能实验。 蛋白表达培养悬浮培养配合优化培养基(如 Expi293 系统),可在一周内获得毫克至克级蛋白产量。4. 磷酸化、乙酰化、甲基化等修饰:调控蛋白功能和定位;4、内质网和高尔基体的质量控制:能降解错误折叠蛋白,保证产物一致性。 哺乳动物细胞蛋白表达系统因其天然的折叠与修饰能力,成为表达结构复杂、功能敏感蛋白的首选平台。

    38310编辑于 2025-08-27
  • 【辰辉创聚生物】可溶性蛋白表达|大肠杆菌蛋白表达|蛋白表达纯化

    然而,由于异源蛋白表达过程中常出现蛋白易聚集成包涵体、降解或表达水平低等问题,导致可溶性表达效率不高。因此,实现重组蛋白在 E. coli 中的可溶表达,是确保后续纯化、结构功能研究与应用的关键。 ③.蛋白毒性,对宿主生长造成抑制,影响表达。④.蛋白降解,长时间表达或表达条件不当,宿主蛋白酶作用造成目标蛋白损耗。因此,提升可溶性表达,对科研与产业都具有重要意义。 6.分泌表达途径将目标蛋白导入周质空间或培养上清,可以利用较低蛋白酶活性和氧化环境有利于二硫键形成。常用信号肽如 PelB、OmpA、PhoA 等,经过 Sec、SRP 或 TAT 分泌通路实现导出。 融合标签与纯化标签融合提高表达量专利中提到一种复合融合标签结构(T7 tag + His6 + Strep II + EK 切割位点),克隆到 N 端,经过密码子优化,表达量较常规 His 标签提高了约 表达溶解性检测 细胞破碎后离心,取上清与沉淀分析 SDS–PAGE 比较溶解和包涵体表达的比例6.

    35810编辑于 2025-09-11
  • 【辰辉创聚生物】酵母蛋白表达|酵母表达系统|异源蛋白表达|真核蛋白表达

    酵母是真核生物中最常用的异源蛋白表达平台之一。 酵母蛋白表达宿主系统1、酿酒酵母 (S. cerevisiae)作为最早被用于异源蛋白表达的真核宿主,酿酒酵母的遗传背景清晰,分子生物学工具完善,适合基础研究和结构相对简单的蛋白表达。 折叠效率与伴侣蛋白共表达在高水平表达过程中,外源蛋白容易在内质网中错误折叠或聚集,引发内质网应激反应。 为提高蛋白折叠与分泌效率,研究者常采用以下策略:共表达分子伴侣蛋白(如 BiP、PDI),增强折叠能力;诱导内质网未折叠蛋白反应(UPR),提高宿主细胞对折叠负担的耐受性;通过基因工程方式优化宿主的折叠环境 ,使其更适合表达大分子或复杂结构蛋白

    37610编辑于 2025-08-28
  • 来自专栏DrugAI

    Science | 靶向无序蛋白的新一代结合蛋白设计

    研究人员提出了一种通用方法,设计可结合无结构蛋白区域的结合蛋白,其侧链能够嵌入互补的结合口袋中。研究人员成功设计了39种结合多种多样无结构靶标的蛋白,其中34种设计的解离常数在百皮摩尔至百纳摩尔之间。 这项研究为解决无结构蛋白和肽的识别难题迈出了关键一步。 自然进化已发展出多种机制来识别无结构蛋白质区域,如抗体、MHC复合物、TPR结构、Armadillo重复蛋白等,但通用的肽识别工程仍面临挑战。 尽管已有研究尝试泛化某些天然蛋白的结合模式,但开发具有全新特异性的结合蛋白仍然困难。 研究人员先在6条合成序列上进行了测试,在平均每个靶标8个设计中获得了高亲和力结合,且多为10~100纳摩尔范围。 应用示例 蛋白组学富集:设计子可用于富集低丰度蛋白(如WASH复合体、PER2等),对研究信号通路具有价值。 疾病靶点识别:用于识别突变型肽段(如CTN4),在临床质谱检测中具有潜力。

    16020编辑于 2026-01-06
  • 来自专栏生信技能树

    蛋白质组学第6期 搜库软件之 MaxQuant 结果数据介绍

    1.错误分析 我们上期教程中缩写的实验设计部分,输出的结果只有一个combined 文件夹,且在 蛋白定量的结果里只出现了两列定量丰富。 ? img ? 我们要做的LFQ定量,应该是每一种细胞的6个raw文件(3个对照+3个实验)进行定量。 也就是说应该输出两个combined的文件,且每个proteinGroup 里有6列定量的信息,也就是每个样本都会有一个定量信息。实验设计要重新设置。 三. img 1)细胞一:OVCA429 点击Maxquant 打开一个窗口,先导入第一种细胞的6个样本,命名实验为每个样本的名字,这样最后定量的结果会输出每个样本的定量信息。 ? 四 输出结果基本认识 summary 包含了6个样本分别的参数 一级谱图数 二级谱图数 鉴定谱图数等信息。 ? img ? img proGroups 这里包含了最重要的蛋白定量信息 ? ?

    23.2K1811发布于 2019-08-06
  • 来自专栏智药邦

    AlphaFold新竞争对手出现,ESMFold预测了6亿种蛋白质结构

    2022年7月,DeepMind声称AlphaFold已经确定了地球上几乎所有已知生物体中大约2亿种蛋白质的结构。如今,另一家科技巨头也加入了蛋白质结构预测的“军备竞赛”。 据Nature最新新闻报道,Meta(前身为Facebook)的研究人员开发了一种蛋白质结构预测模型ESMFold,预测了来自细菌、病毒和其他尚未表征的微生物的约6亿种蛋白质的结构。 用ESMFold进行单序列结构预测的比较 ESMFold的优势之一是它提供了比现有原子分辨率结构预测方法更快的预测速度,这在某种程度上使它能够弥补包含数十亿序列的蛋白质序列数据库的快速增长与蛋白质结构和功能数据库的缓慢发展之间的差距 绝大多数编码潜在蛋白质的DNA条目来自从未培养过且科学未知的生物体。 总的来说,Meta团队预测了超过6.17亿种蛋白质的结构。 Meta AI蛋白质团队的研究负责人Alexander Rives说,“这些是我们最不了解的结构,这些是非常神秘的蛋白质。我认为它们提供了深入了解生物学的潜力。”

    1.1K10编辑于 2022-11-16
  • 来自专栏Y大宽

    hypothetical protein假设蛋白

    这些蛋白质,无论是孤儿还是保守的假设蛋白质,占每个新测序基因组中编码的蛋白质的约20%至40%。 假设蛋白是在基因组分析过程中由基因预测软件产生。 通过把hypothetical protein与已知的家族domains进行比较,可以获得保守结构域,进而可以把这些假设蛋白归类到某一蛋白质家族中,即使它们还没有被体内实验证实。 hypothetical protein的功能也可以通过同源建模进行预测,在这种预测中,假设蛋白要与已知三维结构的蛋白序列进行对齐,并且,通过这种方法,如果结构被预测,那么假设蛋白的功能也可以由计算来确定 此外,注释假设蛋白功能的方法包括通过 结构基因组学方法对这些蛋白进行三维结构确定,理解辅基/金属结合的本质和模式,与已知功能和已注释的可能的催化位点和调节位点的蛋白的折叠相似性等。

    3.9K52发布于 2018-09-30
  • 来自专栏DrugOne

    InstructPLM: 对齐蛋白质语言模型以遵循蛋白结构指令

    这些遗传变异为蛋白质工程提供了丰富的蛋白质资源。在蛋白质工程中,一个典型的挑战是蛋白质序列设计,也称为蛋白质反向折叠,它需要找到能够折叠成特定蛋白质主链结构的氨基酸序列。 高度精确的蛋白质序列设计可以生成更有效的酶、改进的基于蛋白质的治疗方法,以及用于工业目的的工程蛋白质,如生物燃料生产和环境修复。 作者提出的模型InstructPLM,采用了一个轻量级的交叉注意力层,将一个固定的蛋白质主链编码器与一个固定的蛋白质语言模型解码器对齐,旨在教授蛋白质语言模型按照蛋白质结构指令设计序列。 模型部分 InstructPLM的整体模型架构由三个部分组成:一个蛋白质语言解码器,一个蛋白质主链编码器,一个蛋白质结构到序列的adapter。 具体来说,作者在PETase(PDB代码:7SH6)和L-MDH(Uniprot:A0A319AA41)上评估InstructPLM。

    45010编辑于 2024-06-04
  • 来自专栏蛋白表达与生物实验技术

    无细胞蛋白表达系统的发展:从传统蛋白表达系统到自动化蛋白筛选系统

    随着蛋白研究需求不断增加,研究人员需要更快的蛋白表达速度以及更高通量的蛋白筛选能力。 什么是无细胞蛋白表达系统无细胞蛋白表达系统是一种在体外环境中完成蛋白合成的技术。该系统通过提取细胞中的转录翻译组件,在体外重建蛋白合成所需的分子机器。 无细胞蛋白表达系统的优势相比传统细胞蛋白表达系统,无细胞蛋白表达系统具有多个优势。快速表达传统蛋白表达系统通常需要数天时间完成培养和诱导,而无细胞蛋白表达系统可以在数小时内完成蛋白合成。 高通量蛋白筛选在蛋白工程研究中,研究人员往往需要筛选大量蛋白突变体。无细胞蛋白筛选系统能够在微量反应体系中同时表达多个蛋白构建体。 适用于复杂蛋白某些膜蛋白或毒性蛋白在细胞表达系统中难以表达,而无细胞蛋白表达系统可以绕过细胞生长限制。

    12710编辑于 2026-03-20
  • 来自专栏智药邦

    Science丨结合蛋白大语言模型的快速蛋白进化方法

    蛋白质的计算设计和突变可以获得新的功能,这一直是生物工程的核心。随着越来越多基于AI的算法出现,整个领域也在关注快速进化任何蛋白质序列的算法。 本研究开发了一个新的模型EVOLVEpro,一种结合蛋白大语言模型(PLMs),主动学习和回归模型的创新蛋白质工程方法,能够在仅需少量实验数据的情况下快速提升蛋白的活性。 EVOLVEpro的工作原理是利用PLM来编码蛋白质序列至连续的潜在空间,通过回归模型学习蛋白活性与潜在空间的映射关系。 通过对CRISPR核酸酶、编辑酶Bxb1、T7 RNA聚合酶等其他蛋白的优化,EVOLVEpro也展现出其对多种蛋白活性的提升潜力。 研究结果表明,EVOLVEpro是一种强大的普适性工具,可以在生物学和医学的蛋白质工程中广泛应用,尤其适用于那些难以通过高通量筛选的蛋白进化任务。

    47910编辑于 2024-12-19
领券