首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信小驿站

    从pdb文件中提取蛋白质序列

    提取蛋白质结构的所有序列 save 1ywt.fasta 仅提取蛋白质结构的特定chain的序列 save 1ywt.fasta, chain A ? ?

    4.9K20发布于 2020-09-08
  • 《数字图像处理》第 11 章 - 特征提取

    gray_enhanced, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, blockSize=11 gray_enhanced, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, blockSize=11 np.std(y) > 1e-6 else 0.0 # 3.5 中心矩(2阶,手动计算,避免精度丢失) x_centered = x - x_mean y_centered = y - y_mean m11 :.2f}") print(f"y坐标:均值={y_mean:.2f},方差={y_var:.2f},偏度={y_skew:.2f},峰度={y_kurt:.2f}") print(f"2阶中心矩:m11 gray_enhanced, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, blockSize=11

    26210编辑于 2026-01-21
  • 来自专栏数据科学(冷冻工厂)

    RNA-seq 详细教程:结果汇总与提取11

    提取 提取显著差异表达基因 让我们首先创建包含我们的阈值标准的变量。

    60120编辑于 2023-02-27
  • 来自专栏科技记者

    脚本分享—gbk文件中提取蛋白质序列以及注释信息

    脚本简介: 本脚本用于从 GenBank(GBK)格式文件中提取蛋白质序列,并将结果输出为 FASTA 格式文件。 主要功能包括: 提取 CDS 区域的蛋白质序列; 可根据参数选择是否在序列标题中附加蛋白质的功能注释; 该脚本适用于基因组注释分析、蛋白质功能预测等常见生物信息学任务。 查看脚本帮助文档: python Gbk_extea_protein.py -h 脚本使用方法: 1)脚本准备文件如下图所示 2)注意事项 GBK文件从NCBI GeneBank数据库下载,文件中必须包含蛋白质文件 ; 对于基因组较大的真核生物,如人基因组,gbk文件有多个染色体组成,不包含蛋白序列文件,这样的gbk文件无法使用脚本提取蛋白质序列; 程序依赖于biopython模块,需要提前安装好; 实战演习 # 只提取蛋白质序列和蛋白质ID python Gbk_extea_protein.py -g NC_000913.gbk -a F -o NC_000913_protein.faa # 提取蛋白质序列以及序列的注释信息

    46710编辑于 2025-05-09
  • 来自专栏数据科学(冷冻工厂)

    RNA-seq 详细教程:结果汇总与提取11

    提取提取显著差异表达基因让我们首先创建包含我们的阈值标准的变量。

    69230编辑于 2023-01-29
  • 来自专栏前端进阶学习交流

    pandas提取11月和12月数据,如何做?

    问题如下所示:提取11月和12月 这个合适吗 二、实现过程 这里【瑜亮老师】给了一个指导,如下所示:数据只要对就行了,这个格式是可以的。 后来【隔壁山楂】还给了一个有意思的思路:直接大于等于11,这个结果也只有11和12月 经过指导,这个方法顺利地解决了粉丝的问题。

    29110编辑于 2024-02-21
  • 【辰辉创聚生物】蛋白质组学:裂解化学、机械破碎与分馏策略在蛋白提取中的分子机制解析

    在生命科学研究流程中,蛋白提取常被视为下游分析前的准备步骤,但从蛋白质组学与系统生物学的角度看,它实际上决定了后续数据质量的理论上限。 蛋白提取的本质并非单纯的物理破碎,而是在细胞结构崩解的瞬间,通过化学与热力学手段将蛋白质组的生化状态加以保存。 四、复杂样本的特异性挑战不同生物基质对蛋白提取提出了差异化挑战。植物样本中常见的多酚和多糖会在裂解过程中干扰蛋白稳定性,多酚氧化后易与蛋白形成共价交联,而多糖则显著提高溶液黏度。 体液样本虽然不存在物理屏障,但其蛋白组成高度不均衡,高丰度蛋白可能掩盖关键信号分子。基础提取步骤的首要目标,是确保样本在体外条件下保持稳定,避免凝血或补体系统的非特异性激活。 五、总结总体而言,蛋白提取是一项融合机械工程、胶体化学与酶学调控的系统技术。其目标是在破坏细胞结构的同时,最大限度保留蛋白质组的真实状态。

    10310编辑于 2026-03-09
  • 来自专栏技术探究

    爬虫系列(11)Scrapy 数据的提取和保存以及Pipeline的介绍。

    1.Scrapy提取项目 从网页中提取数据,Scrapy 使用基于 XPath 和 CSS 表达式的技术叫做选择器。 代码的下面行显示了不同类型的数据的提取: 选择 li 标签内的数据: response.xpath('//ul/li') 对于选择描述: response.xpath('//ul/li/text()') 数据的提取 3.1 控制台打印 import scrapy class DoubanSpider(scrapy.Spider): name = 'douban' allwed_url cssselect 1.0.3, parsel 1.3.1, w3lib 1.18.0, Twiste d 17.9.0, Python 3.6.3 (v3.6.3:2c5fed8, Oct 3 2017, 18:11 Item Scrapy进程可通过使用蜘蛛提取来自网页中的数据。

    3.1K30发布于 2019-07-10
  • 【辰辉创聚生物】重组蛋白表达纯化|蛋白表达定制|蛋白修饰|原核表达蛋白

    该系统因培养快速、成本低廉、表达量高而广泛应用于科研与工业,但其缺乏真核生物的复杂后翻译修饰,且部分蛋白易形成包涵体,需要通过优化表达条件和纯化策略来获得功能性蛋白。 原核蛋白表达宿主菌株与表达载体的选择1. C41、C43 等突变株:对有毒或难表达蛋白更为耐受,常用于膜蛋白或代谢负担较大的蛋白。2. 质粒拷贝数与选择标记:高拷贝质粒能提高表达量,但可能增加宿主负担;低拷贝质粒适合对宿主敏感或有毒的目标蛋白。重组蛋白表达纯化策略1. 例如使用携带冷激蛋白promoter的表达载体,在较低温度(如11℃)下诱导,可显著提高可溶表达几率。蛋白表达定制服务1.

    64510编辑于 2025-08-25
  • 来自专栏生信宝典

    如何快速从基因组中提取基因、转录本、蛋白、启动子、非编码序列?

    ): git clone https://github.com/gpertea/gffread cd gffread make release 提取转录本序列、CDS和蛋白序列 gffread -h可以参考所有可用参数 # 获取蛋白序列 gffread GRCh38.gtf -g GRCh38.fa -y GRCh38.protein.fa 内容如下 head GRCh38.protein.fa >ENST00000382410 ensembl_havana 3 gene 4 87250 5 97094 6 . 7 + 8 . 9 gene_id 10 ENSG00000178591 11 havana 3 transcript 4 87250 5 97094 6 . 7 + 8 . 9 gene_id 10 ENSG00000178591 11 提取基因序列的操作也类似于提取启动子序列。

    6.7K10编辑于 2022-01-18
  • 来自专栏HONEYWELL

    TRICONEX TM11-5L-88 CPU可以一次提取多个指令

    TRICONEX TM11-5L-88 CPU可以一次提取多个指令与数表示相关的是一个CPU可以表示的数的大小和精度,图片其中一个处理切换不必要器件的方法称为时脉闸控,即关闭对不必要器件的时钟频率(有效的禁止器件

    23840编辑于 2023-04-27
  • 【辰辉创聚生物】包涵体蛋白纯化|可溶性蛋白表达|大肠杆菌蛋白表达|原核蛋白表达

    在生物技术与分子生物学中,原核蛋白表达体系(尤其是大肠杆菌蛋白表达)因操作简便、生长速度快、成本低廉,是获取重组蛋白的重要途径。 然而,在高水平表达时,目标蛋白往往以包涵体蛋白形式沉淀,形成不可溶的聚集物。这种现象虽影响生物活性蛋白得率,但其高表达量、易纯化等特性使得包涵体蛋白纯化成为不可忽视的技术路线。 因此,在工程过程中,提升可溶性蛋白表达与完善包涵体蛋白的纯化与复性策略,是实现高效、活性蛋白回收的关键。可溶性蛋白表达策略避免目标蛋白形成沉淀、提高可溶性表达是首选路径。 4、伴侣蛋白共表达:如 DnaK–DnaJ–GroEL/ES 蛋白折叠体系,以及过氧化还原系统 DsbA/DsbC 可改善折叠,尤其针对含多二硫键蛋白。 通过上述策略,可显著在原核蛋白表达 / 大肠杆菌蛋白表达系统中提升可溶性蛋白表达比率,从而降低进入包涵体途径的蛋白量。包涵体蛋白纯化流程当可溶性表达不足时,包涵体表达成为高产获取目标蛋白的重要替代。

    36710编辑于 2025-09-02
  • 来自专栏医学数据库百科

    蛋白功能预测

    我们在遇到一些新的蛋白的时候,经常需要去了解这个蛋白的功能。如果是一个新的还没有功能注释的蛋白,一般数据库就用不了了。这个时候就可以使用 NetGo 来对蛋白的序列进行功能注释了。 ? NetGo基于三重信息来对蛋白序列进行功能预测: 基于已知的功能信息信息(GO数据库) 基于STRING蛋白相互作用数据库进行注释 如果没有互作蛋白的可以进行同源转换进行注释。 数据库评价 对于蛋白功能预测的话,已知的蛋白基本上都已经基于GO预测好了。如果我们研究的是已知常规蛋白的话,其实可以去类似Genecards或NCBI的gene数据库直接看的。 这个数据库更多的可以用于新发现的蛋白的预测,或者说一个基因不同转录本之间的研究,看有没有功能的区别。

    92810发布于 2020-06-01
  • 来自专栏DrugOne

    蛋白语言模型改进蛋白复合物预测

    本文提出了 ColAttn 方法,该方法利用蛋白质语言模型识别复合物的间相互作用,并进一步结合多序列比对方法来提升结构预测准确性。 1 介绍 现在有许多深度学习模型在计算生物结构。 AlphaFold-Multimer 就提升了蛋白质复合物结构的预测水平,但其准确性依然取决于多序列比对(MSA)结果。 同时,蛋白质语言模型也在不同的工作中被广泛应用,它可以捕捉到序列中的约束和共进化信息。 本文中,作者首次提出了 MSA 配对算法 ColAttn,该算法把蛋白语言模型的输出组合成联合 MSAs 形式,利用 MSA Transformer 中的注意力得分从单链中识别配对同源物。 图 6:不同层上 DockQ 得分 4 总结 本文基于预训练蛋白语言模型,探索了一些 MSA 配对算法构建有效间相互作用的效果,这篇文章也是首次将蛋白语言模型用来构造联合 MSA,实验结果证明本文提出的

    73420编辑于 2022-11-28
  • 来自专栏图像处理与模式识别研究所

    前景提取

    plt.subplot(121) plt.imshow(orgb) plt.axis('off') plt.subplot(122) plt.imshow(ogc) plt.axis('off') 算法:提取图像前景时 如果用户干预提取过程,用户在原始图像的副本中(或者与原始图像大小相等的任意一幅图像),用白色标注将提取为前景的区域,用黑色标注将作为背景的区域。

    2K10编辑于 2022-05-28
  • 【辰辉创聚生物】膜蛋白表达|无细胞蛋白表达|重组蛋白表达生产

    无细胞蛋白表达系统的原理无细胞蛋白表达系统是一种在体外重组蛋白合成的方法,通常以大肠杆菌、酵母或哺乳动物细胞为来源,通过提取细胞裂解液,保留其中的转录和翻译机制,构建体外表达体系。 无细胞蛋白表达系统的优势1. 高效快速无细胞表达系统能够在数小时内完成蛋白质的合成,显著缩短了实验周期。例如,使用大肠杆菌提取物的CFPS系统,能够在4小时内合成出高浓度的目标蛋白。2. 灵活性和多样性无细胞系统可以使用不同来源的细胞提取物,如大肠杆菌、酵母或哺乳动物细胞,满足不同蛋白表达的需求。此外,系统可以方便地进行高通量筛选和多种蛋白的并行表达。4. 无细胞蛋白表达系统在膜蛋白研究中的应用1. 膜蛋白的表达和纯化膜蛋白由于其疏水性和结构复杂性,传统的细胞表达系统难以高效表达和纯化。 此外,结合计算模拟和结构生物学技术,也有助于深入探讨膜蛋白的功能机制。无细胞蛋白表达系统作为一种高效、可控和灵活的蛋白合成方法,在膜蛋白研究中具有重要应用价值。

    36710编辑于 2025-09-09
  • 【辰辉创聚生物】哺乳动物细胞蛋白表达|HEK293蛋白表达|CHO细胞蛋白表达|哺乳蛋白瞬时表达

    哺乳动物蛋白表达是指将目标基因导入哺乳动物细胞(如CHO、HEK293等)后,利用其与人类高度相似的转录、翻译及翻译后修饰机制,在细胞内合成并加工目标蛋白的过程。 其优势在于适合快速验证蛋白功能、小规模制备和结构分析。例如,研究者常在 HEK293E 中快速获得融合蛋白或重组受体蛋白,用于体外功能实验。 蛋白表达培养悬浮培养配合优化培养基(如 Expi293 系统),可在一周内获得毫克至克级蛋白产量。4. 磷酸化、乙酰化、甲基化等修饰:调控蛋白功能和定位;4、内质网和高尔基体的质量控制:能降解错误折叠蛋白,保证产物一致性。 哺乳动物细胞蛋白表达系统因其天然的折叠与修饰能力,成为表达结构复杂、功能敏感蛋白的首选平台。

    38410编辑于 2025-08-27
  • 【辰辉创聚生物】可溶性蛋白表达|大肠杆菌蛋白表达|蛋白表达纯化

    然而,由于异源蛋白表达过程中常出现蛋白易聚集成包涵体、降解或表达水平低等问题,导致可溶性表达效率不高。因此,实现重组蛋白在 E. coli 中的可溶表达,是确保后续纯化、结构功能研究与应用的关键。 可溶性蛋白表达的背景与挑战E. coli 表达系统是目前广泛使用的重组蛋白表达平台,具有成熟的遗传工具、可高密度培养、表达速率快、成本低廉等显著优势。 ③.蛋白毒性,对宿主生长造成抑制,影响表达。④.蛋白降解,长时间表达或表达条件不当,宿主蛋白酶作用造成目标蛋白损耗。因此,提升可溶性表达,对科研与产业都具有重要意义。 分泌表达:信号肽与分泌通路应用通过优化信号肽(如 PelB、MalE)引导目标蛋白进入周质空间,减少蛋白酶降解并利于折叠。 可溶性蛋白表达策略与建议流程1.

    36210编辑于 2025-09-11
  • 来自专栏深度学习和计算机视觉

    OpenCV视频分析背景提取与前景提取

    基本思想 OpenCV中支持的两种背景提取算法都是基于模型密度评估,然后在像素级对图像进行前景与背景分类的方法,它们具有相同的假设前提 – 各个像素之间是没有相关性的,跟它们算法思想不同的方法主要是基于马尔可夫随机场理论 基于像素分类的背景分析方法 自适应的背景提取(无参数化/ KNN) 基于GMM的背景提取 基于模糊积分的背景提取 这些背景建模的方法一般都可以分为如下三步完成 背景初始化阶段(背景建模提取) 前景检测阶段

    1.9K10编辑于 2021-12-13
  • 来自专栏贾志刚-OpenCV学堂

    OpenCV视频分析背景提取与前景提取

    阅读本文,用时3~5mins 基本思想 OpenCV中支持的两种背景提取算法都是基于模型密度评估,然后在像素级对图像进行前景与背景分类的方法,它们具有相同的假设前提 – 各个像素之间是没有相关性的,跟它们算法思想不同的方法主要是基于马尔可夫随机场理论 基于像素分类的背景分析方法 自适应的背景提取(无参数化/ KNN) 基于GMM的背景提取 基于模糊积分的背景提取 这些背景建模的方法一般都可以分为如下三步完成 背景初始化阶段(背景建模提取) 前景检测阶段

    5.4K45发布于 2019-05-22
领券