首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信小驿站

    从pdb文件中提取蛋白质序列

    提取蛋白质结构的所有序列 save 1ywt.fasta 仅提取蛋白质结构的特定chain的序列 save 1ywt.fasta, chain A ? ?

    4.9K20发布于 2020-09-08
  • 来自专栏科技记者

    脚本分享—gbk文件中提取蛋白质序列以及注释信息

    脚本简介: 本脚本用于从 GenBank(GBK)格式文件中提取蛋白质序列,并将结果输出为 FASTA 格式文件。 主要功能包括: 提取 CDS 区域的蛋白质序列; 可根据参数选择是否在序列标题中附加蛋白质的功能注释; 该脚本适用于基因组注释分析、蛋白质功能预测等常见生物信息学任务。 查看脚本帮助文档: python Gbk_extea_protein.py -h 脚本使用方法: 1)脚本准备文件如下图所示 2)注意事项 GBK文件从NCBI GeneBank数据库下载,文件中必须包含蛋白质文件 ; 对于基因组较大的真核生物,如人基因组,gbk文件有多个染色体组成,不包含蛋白序列文件,这样的gbk文件无法使用脚本提取蛋白质序列; 程序依赖于biopython模块,需要提前安装好; 实战演习 # 只提取蛋白质序列和蛋白质ID python Gbk_extea_protein.py -g NC_000913.gbk -a F -o NC_000913_protein.faa # 提取蛋白质序列以及序列的注释信息

    46710编辑于 2025-05-09
  • 来自专栏python3

    Python爬虫10-页面解析数据提取

    search、findall函数的使用案例:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac16_RE2.py 一、页面解析和数据提取

    71620发布于 2020-01-17
  • 来自专栏前端开发

    javascript内容提取10个字附换行

    .replace(/'/g, '''); let result = `

    ${escapedContent}

    `; // 当字符串的字符数超过10 时,用div包裹 if (contentString.length > 10) { result = `
    ${result}
    `; } return result;}// 使用示例:// 短字符串(少于等于10个字符)const shortString = "短内容";// 长字符串(超过10个字符)const longString = "这是一个超过10个字符的长内容字符串";// 调用函数获取innerHTML字符串const shortHtml = wrapStringContentInDivs(shortString / 短字符串结果:

    短内容

    console.log("长字符串结果:", longHtml);// 长字符串结果:

    这是一个超过10

    13110编辑于 2025-09-01
  • 来自专栏生信技能树

    蛋白质组学第10期 定量方法介绍

    定量蛋白质组学 对处不同时期、不同条件下蛋白质表达水平变化的研究,识别功能模块和路径,监控疾病的生物标志物,这些研究都需要对蛋白质进行鉴定和定量 参考文献(Quantitative mass spectrometry ,不使用含有稳定同位素的化合物蛋白质。 在保留时间(retention time, RT)轴上, 根据肽段母 离子的质荷比提取不同保留时间下的相应同位素峰 簇的信号强度, 重构 XIC, 并利用 XIC 的面积或信号 加和等指标作为肽段的定量结果 蛋白质无需标记,样本所需蛋白总量少,实验耗费低;无需复杂的标记步骤,操作简单,耗时短;适用范围广:不受样品条件限制,几乎可对任何物种的各类蛋白质进行鉴定 要求高:对液相色谱分离及串联质谱鉴定的稳定性和重复性要求较高 蛋白提取 - 2.胰酶酶切消化,形成酶切肽段 - 3.每个样本添加不同的ITRAQ试剂 - 4.等量混合各个样本。

    6.3K57发布于 2019-09-12
  • 来自专栏FreeBuf

    从Windows 10 SSH-Agent中提取SSH私钥

    背景 在这个周末我安装了Windows 10 Spring Update,最令我期待的就是它的内置OpenSSH工具,这意味着Windows管理员不再需要使用Putty和PPK格式的密钥了。 我在这里发布了一些PoC代码,从注册表中提取并重构RSA私钥。 在Windows 10中使用OpenSSH 测试要做的第一件事就是使用OpenSSH生成几个密钥对并将它们添加到ssh-agent中。 最后,在将公钥添加到Ubuntu box之后,我验证了我可以从Windows 10进入SSH,而不需要解密我的私钥(因为ssh-agent正在为我处理): ? 在证明可以从注册表中提取私钥后,我将PoC分享到了GitHub。

    3.5K30发布于 2018-07-30
  • 来自专栏Python私房菜

    实战 | Python批量提取Win10锁屏壁纸

    使用Win10的朋友会发现,每次开机锁屏界面都会有不一样的漂亮图片,这些图片通常选自优秀的摄影作品,十分精美。 ? 借助Python,我们可以用简单的几行代码,批量提取这些精美的锁屏图片。把喜欢的图片设置成桌面背景,就不用担心被替换掉啦。 提取原理 Win10系统会自动下载最新的锁屏壁纸,并将他们保存在一个系统文件夹中,路径是: 1C:\Users\[用户名]\AppData\Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy 代码会把提取出来的图片保存在wallpapers文件夹下,所以代码文件所在的目录没有wallpapers文件夹,需要手工创建一个。 ? 在代码文件旁新建一个wallpapers文件夹 执行上面这段Python代码,再打开wallpapers文件夹,就可以看到提取出的锁屏图片了。 ?

    81331发布于 2018-10-18
  • 来自专栏程序员的知识天地

    Python实战 | 批量提取Win10锁屏壁纸

    使用Win10的朋友会发现,每次开机锁屏界面都会有不一样的漂亮图片,这些图片通常选自优秀的摄影作品,十分精美。但是由于系统会自动更换这些图片,所以就算再好看的图片,也许下次开机之后就被替换掉了。 借助Python,我们可以用简单的几行代码,批量提取这些精美的锁屏图片。把喜欢的图片设置成桌面背景,就不用担心被替换掉啦。 提取原理 Win10系统会自动下载最新的锁屏壁纸,并将他们保存在一个系统文件夹中,路径是 C:\Users\[用户名]\AppData\Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy 代码会把提取出来的图片保存在wallpapers文件夹下,所以代码文件所在的目录没有wallpapers文件夹,需要手工创建一个。 ? 在代码文件旁新建一个wallpapers文件夹 执行上面这段Python代码,再打开wallpapers文件夹,就可以看到提取出的锁屏图片了。 ? 提取出的锁屏图片

    1.2K20发布于 2019-05-08
  • 【辰辉创聚生物】蛋白质组学:裂解化学、机械破碎与分馏策略在蛋白提取中的分子机制解析

    在生命科学研究流程中,蛋白提取常被视为下游分析前的准备步骤,但从蛋白质组学与系统生物学的角度看,它实际上决定了后续数据质量的理论上限。 蛋白提取的本质并非单纯的物理破碎,而是在细胞结构崩解的瞬间,通过化学与热力学手段将蛋白质组的生化状态加以保存。 四、复杂样本的特异性挑战不同生物基质对蛋白提取提出了差异化挑战。植物样本中常见的多酚和多糖会在裂解过程中干扰蛋白稳定性,多酚氧化后易与蛋白形成共价交联,而多糖则显著提高溶液黏度。 体液样本虽然不存在物理屏障,但其蛋白组成高度不均衡,高丰度蛋白可能掩盖关键信号分子。基础提取步骤的首要目标,是确保样本在体外条件下保持稳定,避免凝血或补体系统的非特异性激活。 五、总结总体而言,蛋白提取是一项融合机械工程、胶体化学与酶学调控的系统技术。其目标是在破坏细胞结构的同时,最大限度保留蛋白质组的真实状态。

    10310编辑于 2026-03-09
  • 【辰辉创聚生物】重组蛋白表达纯化|蛋白表达定制|蛋白修饰|原核表达蛋白

    该系统因培养快速、成本低廉、表达量高而广泛应用于科研与工业,但其缺乏真核生物的复杂后翻译修饰,且部分蛋白易形成包涵体,需要通过优化表达条件和纯化策略来获得功能性蛋白。 原核蛋白表达宿主菌株与表达载体的选择1. C41、C43 等突变株:对有毒或难表达蛋白更为耐受,常用于膜蛋白或代谢负担较大的蛋白。2. 质粒拷贝数与选择标记:高拷贝质粒能提高表达量,但可能增加宿主负担;低拷贝质粒适合对宿主敏感或有毒的目标蛋白。重组蛋白表达纯化策略1. 例如使用携带冷激蛋白promoter的表达载体,在较低温度(如11℃)下诱导,可显著提高可溶表达几率。蛋白表达定制服务1.

    64510编辑于 2025-08-25
  • 来自专栏膨胀的面包

    Win10锁屏壁纸怎么提取保存到本地

    Win10 默认的锁屏方式变成了壁纸锁屏,而且每次锁屏的壁纸都会不一样,这些壁纸非常精美,看起来比 win10 本身自带的桌面壁纸还要出色,但是通常情况下我们很难找到这些锁屏壁纸的位置,如何保存这些高清精美的 win10 锁屏壁纸呢? 保存方法 自动查找方法: 此方法需要借助第三方工具,直接使用第三方工具进行保存,常用的就是软媒魔方的美化大师,直接使用聚焦壁纸功能就可以直接将 win10 锁屏壁纸给保存到本地! ? Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy\LocalState\Assets 注意:这里的abc是我们win10

    2.5K30发布于 2021-06-15
  • 来自专栏生信宝典

    如何快速从基因组中提取基因、转录本、蛋白、启动子、非编码序列?

    查看下文件内容和格式 基因组序列文件为FASTA格式,查看命令和内容如下(测试文件,只有1条染色体): # 查看前10行,每行查看前40个字符 # FASTA序列一般比较长,查看前面一部分字符是一个常用的方式 ): git clone https://github.com/gpertea/gffread cd gffread make release 提取转录本序列、CDS和蛋白序列 gffread -h可以参考所有可用参数 # 获取蛋白序列 gffread GRCh38.gtf -g GRCh38.fa -y GRCh38.protein.fa 内容如下 head GRCh38.protein.fa >ENST00000382410 ' 1 chr20 2 ensembl_havana 3 gene 4 87250 5 97094 6 . 7 + 8 . 9 gene_id 10 提取基因序列的操作也类似于提取启动子序列。

    6.7K10编辑于 2022-01-18
  • 【辰辉创聚生物】包涵体蛋白纯化|可溶性蛋白表达|大肠杆菌蛋白表达|原核蛋白表达

    在生物技术与分子生物学中,原核蛋白表达体系(尤其是大肠杆菌蛋白表达)因操作简便、生长速度快、成本低廉,是获取重组蛋白的重要途径。 然而,在高水平表达时,目标蛋白往往以包涵体蛋白形式沉淀,形成不可溶的聚集物。这种现象虽影响生物活性蛋白得率,但其高表达量、易纯化等特性使得包涵体蛋白纯化成为不可忽视的技术路线。 因此,在工程过程中,提升可溶性蛋白表达与完善包涵体蛋白的纯化与复性策略,是实现高效、活性蛋白回收的关键。可溶性蛋白表达策略避免目标蛋白形成沉淀、提高可溶性表达是首选路径。 4、伴侣蛋白共表达:如 DnaK–DnaJ–GroEL/ES 蛋白折叠体系,以及过氧化还原系统 DsbA/DsbC 可改善折叠,尤其针对含多二硫键蛋白。 通过上述策略,可显著在原核蛋白表达 / 大肠杆菌蛋白表达系统中提升可溶性蛋白表达比率,从而降低进入包涵体途径的蛋白量。包涵体蛋白纯化流程当可溶性表达不足时,包涵体表达成为高产获取目标蛋白的重要替代。

    36710编辑于 2025-09-02
  • 来自专栏医学数据库百科

    蛋白功能预测

    我们在遇到一些新的蛋白的时候,经常需要去了解这个蛋白的功能。如果是一个新的还没有功能注释的蛋白,一般数据库就用不了了。这个时候就可以使用 NetGo 来对蛋白的序列进行功能注释了。 ? NetGo基于三重信息来对蛋白序列进行功能预测: 基于已知的功能信息信息(GO数据库) 基于STRING蛋白相互作用数据库进行注释 如果没有互作蛋白的可以进行同源转换进行注释。 数据库评价 对于蛋白功能预测的话,已知的蛋白基本上都已经基于GO预测好了。如果我们研究的是已知常规蛋白的话,其实可以去类似Genecards或NCBI的gene数据库直接看的。 这个数据库更多的可以用于新发现的蛋白的预测,或者说一个基因不同转录本之间的研究,看有没有功能的区别。

    92810发布于 2020-06-01
  • 来自专栏DrugOne

    蛋白语言模型改进蛋白复合物预测

    本文提出了 ColAttn 方法,该方法利用蛋白质语言模型识别复合物的间相互作用,并进一步结合多序列比对方法来提升结构预测准确性。 1 介绍 现在有许多深度学习模型在计算生物结构。 AlphaFold-Multimer 就提升了蛋白质复合物结构的预测水平,但其准确性依然取决于多序列比对(MSA)结果。 同时,蛋白质语言模型也在不同的工作中被广泛应用,它可以捕捉到序列中的约束和共进化信息。 图 3:结构可视化 不同 MSA 方法具有不同的优势,作者任意结合两种方法组合成 10 个模型,取 Top-5 DockQ 平均得分,如图 4 所示,混合策略都显著好于相应的单个策略。 图 6:不同层上 DockQ 得分 4 总结 本文基于预训练蛋白语言模型,探索了一些 MSA 配对算法构建有效间相互作用的效果,这篇文章也是首次将蛋白语言模型用来构造联合 MSA,实验结果证明本文提出的

    73420编辑于 2022-11-28
  • 来自专栏黑泽君的专栏

    Win10锁屏壁纸位置在哪? 默认锁屏壁纸怎么提取

      Win10默认系统下载的壁纸怎么下载?在哪里找出来呢?首先它是要设置为Windows聚焦才会自动从微软的服务器上去下载壁纸。这些都是随机下载的。每个人的都Win10 都有可能不一样。 Win10锁屏壁纸位置:   C:\Users\Bruce\AppData\Local\Packages\Microsoft.Windows.ContentDeliveryManager_cw5n1h2txyewy

    20.4K10发布于 2018-10-11
  • 来自专栏CDA数据分析师

    创业公司从数据中提取出商业价值的10个思路

    10、高续订率 必有数据的企业通常有很高的更新率,可有可无的数据业务相对有较低的续订率。 理想情况下,我们寻找第二年数据有 90%-95%续订率的企业。

    93080发布于 2018-02-24
  • 来自专栏完美Excel

    Excel公式练习84:提取单元格中的10位数字

    今天的练习是:如下图1所示的数据,每个单元格中包含由换行符分隔的3个数字,现在需要提取其中10位长的数字,如图1中的B列所示。 ? 图1 先不看下面的答案,自已试试。 ,10)&CHAR(10),CHAR(10)&A2&CHAR(10)),10) 在单元格中搜索前后都是空格且中间是10位数的数字。 (A2,SEARCH(CHAR(10),A2,1)-1+2,FIND(CHAR(10),A2,FIND(CHAR(10),A2)+1)-(SEARCH(CHAR(10),A2,1)-1+2)))=10, MID(A2,SEARCH(CHAR(10),A2,1)-1+2,FIND(CHAR(10),A2,FIND(CHAR(10),A2)+1)-(SEARCH(CHAR(10),A2,1)-1+2)),IF (LEN(RIGHT(A2,LEN(A2)-FIND(CHAR(10),A2,FIND(CHAR(10),A2)+1)))=10,RIGHT(A2,LEN(A2)-FIND(CHAR(10),A2,FIND

    3.4K30发布于 2021-07-12
  • 来自专栏图像处理与模式识别研究所

    前景提取

    plt.subplot(121) plt.imshow(orgb) plt.axis('off') plt.subplot(122) plt.imshow(ogc) plt.axis('off') 算法:提取图像前景时 如果用户干预提取过程,用户在原始图像的副本中(或者与原始图像大小相等的任意一幅图像),用白色标注将提取为前景的区域,用黑色标注将作为背景的区域。

    2K10编辑于 2022-05-28
  • 【辰辉创聚生物】膜蛋白表达|无细胞蛋白表达|重组蛋白表达生产

    无细胞蛋白表达系统的原理无细胞蛋白表达系统是一种在体外重组蛋白合成的方法,通常以大肠杆菌、酵母或哺乳动物细胞为来源,通过提取细胞裂解液,保留其中的转录和翻译机制,构建体外表达体系。 无细胞蛋白表达系统的优势1. 高效快速无细胞表达系统能够在数小时内完成蛋白质的合成,显著缩短了实验周期。例如,使用大肠杆菌提取物的CFPS系统,能够在4小时内合成出高浓度的目标蛋白。2. 灵活性和多样性无细胞系统可以使用不同来源的细胞提取物,如大肠杆菌、酵母或哺乳动物细胞,满足不同蛋白表达的需求。此外,系统可以方便地进行高通量筛选和多种蛋白的并行表达。4. 无细胞蛋白表达系统在膜蛋白研究中的应用1. 膜蛋白的表达和纯化膜蛋白由于其疏水性和结构复杂性,传统的细胞表达系统难以高效表达和纯化。 此外,结合计算模拟和结构生物学技术,也有助于深入探讨膜蛋白的功能机制。无细胞蛋白表达系统作为一种高效、可控和灵活的蛋白合成方法,在膜蛋白研究中具有重要应用价值。

    36710编辑于 2025-09-09
领券