首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信修炼手册

    biopython简介

    biopython和bioperl, biojava项目类似,都是Open Bioinformatics Foundation组织的项目之一,旨在提供一个编程接口,方便生物信息数据的处理。 biopython基于python这个简单易学的编程语言,提供了一系列处理常见生物信息任务的接口,具体可以完成以下几种任务 1. 对常用的文件格式,比如fasta, blast等,进行读写 2. 基因组数据的可视化 biopython采用了面向对象的开发模式,将各个功能封装成了不同的class。学习biopython, 就是对不同class及其方法的学习过程。 Bio.Graphics, 提供了基因组数据的可视化功能 学习biopython, 不仅可以学习它处理各项任务的具体语法,还可以学习其源代码的组织结构,提供我们的编码能力。

    1.2K30发布于 2021-01-11
  • 来自专栏生物信息云

    Biopython | 介绍和安装

    1.Biopython介绍 Biopython是Python的最大,最受欢迎的生物信息学软件包。它包含许多用于常规生物信息学任务的不同子模块。 官网:https://biopython.org/ (1). 特征 Biopython是可移植的,清晰的并且具有易于学习的语法。下面列出了一些突出的功能 - 解释性的,交互式和面向对象的。 目标 Biopython的目标是通过python语言提供对生物信息学的简单,标准和广泛的访问。下面列出了Biopython的特定目标 - 提供对生物信息学资源的标准化访问。 //更多请阅读:https://www.yiibai.com/biopython/biopython_introduction.html 2.安装 pip install biopython 安装成功 PS F:\gitHub\note> pip install biopython Collecting biopython Downloading biopython-1.80-cp310-cp310

    1.8K10编辑于 2022-12-16
  • 来自专栏DrugOne

    BioPython安装与入门

    BioPython简介 Biopython工程是一个使用Python来开发计算分子生物学工具的国际团体。 Biopython官网(http://www.biopython.org)为使用和研究生物信息学的开发者提供了一个在线的 资源库,包括模块、脚本以及一些基于Python的软件的网站链接。 一般来讲,Biopython致力于通过创造高质量的和可重复利用的模块及 类,从而使得Python在生物信息学中的应用变得更加容易。 Biopython的特点包括解析各种生物信息学格式的文件(BLAST, Clustalw, FASTA, Genbank...),访问在线的服务器(NCBI,Expasy...) ---- BioPython安装:通过pip安装 pip install biopython 测试安装 ? ---- 入门小实例: ? ----

    1.1K20发布于 2021-01-28
  • 来自专栏DrugScience

    BioPython-PDB-1

    使用: 最近有很多蛋白结构要分析 就找到了这个 简单看下,使用的ide还是jupyter notebook 官网链接: https://biopython-cn.readthedocs.io/zh_CN /latest/ 好吧有中文教程 简介(从官网扒下来的): Biopython工程是一个使用Python来开发计算分子生物学工具的国际团体。 51.653, -89.304, 8.833], dtype=float32) GitHub地址: https://github.com/luskyqi1995/pubchem/blob/master/biopython

    1.1K10发布于 2021-02-04
  • 来自专栏生信修炼手册

    使用biopython查询NCBI数据库

    biopython将Eutils工具进行了封装,通过Bio.Entrez子模块,可以在python环境中与NCBI进行交互。 E-utilities是由8个小程序组成的工具集,能够将符合语法规则的URL转换为对应数据库的检索条件,并返回检索结果,是Entrez检索系统和NCBI数据库的接口,biopython也提供了对应的功能 EGQuery 该方法用于统计检索项在各个数据库中检索到的条目,用法如下 >>> handle = Entrez.egquery(term="biopython") >>> record = Entrez.read 'CorrectedQuery', 'SpelledQuery']) >>> record['Query'] 'biopythooon' >>> record['CorrectedQuery'] 'biopython

    1.8K30发布于 2021-01-11
  • 来自专栏生信修炼手册

    使用biopython处理序列数据

    序列是基因组学数据的基本单位,对于序列先关信息的存储,有以下两种常用的文件格式 1. fasta 2. genebank 通过biopython, 我们可以方便的读取这些格式的文件,并提取其中的信息。 针对格式转换这一常见场景,用法如下 >>> count = SeqIO.convert("input.gb", "genbank", "out.fasta", "fasta") 以上3个子模块层层渐进,构建了biopython

    1.6K20发布于 2021-01-11
  • 来自专栏生信修炼手册

    序列比对在biopython中的处理

    biopython中,支持对序列比对的结果进行读写,解析,以及运行序列比对的程序。 在biopython中,为不同格式,不同软件提供了统一的接口,方便我们的使用 1. subprocess.PIPE, stderr=subprocess.PIPE, shell=True) >>> align = AlignIO.read(child.stdout, "fasta") 对于局部比对而言,biopython 解析blast的输出 biopython中blast默认的输出格式为xml, 解析其输出的用法如下 >>> from Bio.Blast import NCBIXML >>> blast_records 对于序列比对结果的运行和解析,通过biopython可以很好的将其整合到python生态中,对于用python构建一套完整的pipeline,非常的方便。

    3.6K20发布于 2021-01-11
  • 来自专栏生信修炼手册

    使用biopython解析kegg数据库

    biopython中,通过Bio.KEGG模块,对kegg官方的API进行了封装,允许在python环境中使用kegg API。 对于KEGG数据的解析,biopython还提供了专门的解析函数,但是解析函数并不完整,目前只覆盖了compound, map, enzyme等子数据库。 Intramolecular transferases;', 'Phosphotransferases (phosphomutases)'] >>> record.entry '5.4.2.2' 通过biopython 'RFC4', 'RFC2', 'RFC5', 'RFC3', 'SSBP1', 'PMS2', 'MLH1', 'MSH6', 'MSH2', 'MSH3', 'MLH3', 'EXO1'] 通过biopython

    2K10发布于 2021-01-25
  • 来自专栏小明的数据分析笔记本

    BioPython分割大fastq为小fastq

    目的:自己手头的测序数据文件有点大,电脑运行不起来,想将其分开成几份单独运行 原文地址 https://biopython.org/wiki/Splitlargefile It useful to be

    1K30发布于 2020-03-03
  • 来自专栏BioIT爱好者

    为什么 Biopython 的在线 BLAST 这么慢?

    NCBIWWW 基本用法 首先,我们来看一下提供了基于 API 在线比对的 Biopython 模块。 Biopython 中的 BLAST 提供了 over the Internet 和 locally 两种选择:Bio.Blast.NCBIWWW 主要是基于 NCBI BLAST API 用于在线比对 目前,qblast(biopython==1.7.4)仅适用于 blastn,blastp,blastx,tblast 和 tblastx。 第二个参数指定要搜索的数据库。 有关可选的 BLAST 参数的更多信息,请参考 NCBI 自己的文档或 Biopython 内置的文档: >>> from Bio.Blast import NCBIWWW >>> help(NCBIWWW.qblast 因此我们可以打开保存的文件进行输入: >>> result_handle = open("my_blast.xml") 现在我们已经将 BLAST 结果重新放回了句柄中,下一步,如果我们准备对它们进行处理,我们可以参考 Biopython

    2.6K10发布于 2021-10-15
  • 来自专栏生信情报站

    生物信息中的Python 02 | 用biopython解析序列

    上一篇文章生物信息中的Python 01 | 从零开始处理基因序列自己造轮子实现了序列的基础操作,但是在Python的世界里,一项工作只要重复的次数多了,那么一定就会有大神来开发相应的包来解决,这个包名就是 Biopython 3、安装Biopython,这里有两种方案: 3.1 用pip安装Biopython,在cmd命令窗口输入 下载Python的包管理工具:pip https://pypi.org/project/pip pip install biopython ? 3.2 直接用安装包安装 二、Biopython 基础用法 1 读取常见的序列文件格式(fasta,gb) from Bio import SeqIO # 读取包含单个序列 Fasta 格式文件 fa_seq IUPAC (International Union of Pure and Applied Chemistry ) 是一个制定化学相关标准的组织,Biopython 所使用的编码表就是由它制定的,想了解详细细节可以参考

    2.7K10发布于 2021-01-13
  • 来自专栏生信修炼手册

    进化树在biopython中的可视化

    biopython中,通过Bio.Phylo子模块,可以方便的访问和展示树状结构中的信息 1. 订制分支颜色 在biopython中,将tree文件转换为xml格式之后,可以详细订制每个分支的颜色,示例如下 >>> tree = tree.as_phyloxml() >>> tree.root.color xml格式的结果也可以输出到文件中,方便后续使用,保存的方式如下 >>> Phylo.write(tree, "tree.xml", "phyloxml") 相比ggtree等专业的树状结构可视化程序,biopython

    1.8K20发布于 2021-01-11
  • 来自专栏生信修炼手册

    使用biopython可视化染色体和基因元件

    biopython中,通过BiolGraphics子模块可以对基因组结构进行可视化,支持线性和圈图两种可视化方式。 除了圈图之外,biopython还可以绘制染色体图。 相比circos,biopython的track可能没有那么多种丰富的表现形式,但是也有其独特性。

    1.4K20发布于 2021-01-11
  • 来自专栏生物信息学、python、R、linux

    biopython - 比较两个序列的相似性

    比较序列相似性(sequence similarity)可以考虑用biopython或者emboss的几种比对方法。 1.

    4.4K10发布于 2020-08-14
  • 来自专栏DrugScience

    Python每日一谈|No.15.模块(包)的安装

    上一谈中我们使用了Python自带的包进行使用来阐述 这一部分,我们来看看第三方python包,如何安装,如何使用 以BioPython为例,难度低,用途比较广 biopython网站:https: //biopython.org/wiki/Documentation biopython简介 Biopython是Python的最大,最受欢迎的生物信息学软件包。 biopython版本的话 pip install biopython==version 2.conda conda是一个强大的开源的软件包管理系统和环境管理系统 你可以在这个网站上查询需要安装的 下面来看下离线状态下如何安装python的第三方包 首先,我们要找到软件的官网 然后下载其文件:http://biopython.org/DIST/biopython-1.78.zip 下载完成后 下面是biopython中对于结构的解析 ?

    86420发布于 2021-03-16
  • 来自专栏科技记者

    脚本分享—gbk文件中提取核苷酸序列以及注释信息

    提取特定类型的基因功能元件序列 脚本可从 GBK 格式的注释文件中提取三类常见的功能元件序列: CDS(编码序列) rRNA(核糖体RNA) tRNA(转运RNA) 自动读取并解析 GenBank 格式文件 使用 Biopython 安装biopython模块: # 使用pip安装 pip install biopython # 使用conda安装 conda install -c bioconda biopython 查看脚本帮助文档 脚本准备文件如下图所示 2)注意事项 若 GBK 文件中不包含完整的基因组序列(如部分注释文件),可通过参数 -f 提供一个对应的基因组 FASTA 文件,脚本会从中提取 feature 对应的核酸序列; 程序依赖于biopython

    40800编辑于 2025-05-10
  • 来自专栏科技记者

    脚本分享—gbk文件中提取蛋白质序列以及注释信息

    安装biopython模块: # 使用pip安装 pip install biopython # 使用conda安装 conda install -c bioconda biopython 查看脚本帮助文档 GeneBank数据库下载,文件中必须包含蛋白质文件; 对于基因组较大的真核生物,如人基因组,gbk文件有多个染色体组成,不包含蛋白序列文件,这样的gbk文件无法使用脚本提取蛋白质序列; 程序依赖于biopython

    43610编辑于 2025-05-09
  • 来自专栏开源服务指南

    突破内网限制,自由访问 NAS:网络穿透方案大合集! | 开源日报 No.199

    编译为电路,使零知识证明实际可行 受传统编程语言(如 JavaScript、Scala 和 Rust)影响,在易读性和易用性方面具有很强的重点 提供开发人员工具来检查电路,包括单元测试、集成测试和控制台功能 biopython /biopythonhttps://github.com/biopython/biopython Stars: 4.1k License: NOASSERTION picture biopython

    60510编辑于 2024-02-29
  • 来自专栏小明的数据分析笔记本

    gb格式注释文件转换成gff3注释文件格式

    openjdk-8-jre-headless 不知道这三个有什么区别,然后使用命令apt install openjdk-8-jre-headless安装了第三个 第三个工具是python脚本 需要安装biopython 和bcbio-gff 直接使用pip安装 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple biopython pip install -i https://pypi.tuna.tsinghua.edu.cn/simple bcbio-gf 直接自己写脚本,参考的是 https://biopython.org/wiki/GFF_Parsing

    8.1K30发布于 2020-07-17
  • 来自专栏生信技能树

    CPAT和CPC2软件安装报错的思考

    安装前的网上查询信息,得知CPC2软件依赖python和biopython。 思考:CPC2能否与依赖python3.7的CPAT共同安装在同一个环境? 官网信息提示:CPC2可手动安装也可通过conda安装,且需提供安装python2.7 和biopython1.70。 conda create -n python #创建python新环境 $ conda activate python $ conda install python=2.7 $ conda install biopython /filter2_transcript_exon.fa -o ./02cpc2/cpc2_result.txt 思考:CPC2正常使用的情况下,是否需要测试依赖软件python2.7 和biopython1.70 测试结果: $ python –V #显示python版本2.7.15,表示python正常; $ import Bio #报错,表示biopython异常。

    1.5K30编辑于 2022-06-08
领券