首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏微生态与微进化

    NCBI Refseq有重要更新!

    NCBI的Refseq数据库是我们常用的基因组数据库,尤其是其Reference和Representative基因组,为不同物种筛选的代表基因组,具有非冗余性,常用于基因组注释分类等。 在往期文章三大基础公共数据库介绍中介绍了NCBI的genome数据浏览及下载方法: 地址: https://www.ncbi.nlm.nih.gov/genome/browse 主页示意: FTP一栏中的 G为Genebank下载链接,R为Refseq下载链接,下载这个表即可得基因组链接列表: 或者我们也可以直接进入Refseq的FTP: 地址: ftp://ftp.ncbi.nlm.nih.gov/

    1.6K30编辑于 2022-05-05
  • 来自专栏生信情报站

    NCBI 上传测序数据

    1、登录或注册用户 网址:https://www.ncbi.nlm.nih.gov/account/ ? 2、进入SRA 网址:https://submit.ncbi.nlm.nih.gov/ 向下滚动,找到Sequence Read Archive (SRA)工具,点击Submit ? u011262253/article/details/107190684 ascp -i /mnt/h/work/aspera.openssh -QT -l100m -k1 -d /mnt/h/work/ncbi_upload /raw/ subasp@upload.ncbi.nlm.nih.gov:uploads/your_email_id ? 也就是我们常用的基因表达数据,这里可以上传处理后的数据,如count和TPM,FPKM等 BioProject & BioSample:这是NCBI的核心组织架构,一篇文章就是一个BioProject,

    1.9K40发布于 2021-04-16
  • 来自专栏yw的数据分析

    NCBI下载sra数据(新)

      今天要上NCBI下载sra数据发现没有下载的链接,网上查发现都是老的方法,NCBI页面已经变更,于是看了NCBI的help,并且记录下来新版的sra数据下载方法,要用NCBI的工具SRA Toolkit 方法1 NCBI告知的方法(中断不能继续下载) 下载SRA Tookit https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi? 下载后直接解压到某个指定位置 搜索SRA并获取accesion list 在NCBI sra页面(https://www.ncbi.nlm.nih.gov/sra)输入登陆号( accession number 更详情的请查看prefetch 帮助:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi? view=toolkit_doc&f=prefetch 方法2使用wget 下载 以下是NCBI 存放SRR5483089的路径 ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant

    2.9K90发布于 2018-04-28
  • 来自专栏生信宝典

    生信软件系列 - NCBI使用

    做生物研究的对NCBI都不陌生,网站资源、软件丰富,也在不停地迭代更新,越来越容易使用。本文是较早时用于内部培训的资料,最近翻出来看下,还是有一些有意思的点在里面,故分享出来,供大家评阅。 NCBI有着最丰富的基因组信息,基因组序列、转录本序列、蛋白序列、GFF文件等都可以在此下载。从ENSEMBL下载对应信息见 NGS基础 - 参考基因组和基因注释文件 ? 染色体的组装和注释介绍 ? NCBI核苷酸数据库展示的格式就是GeneBank里面数据的组织模式,各部分的注释如图中红色字体的标注。 ? ? NCBI页面右侧侧边栏提供了一些简单实用的工具,获取部分区域的序列。 NCBI Gene页可以做为整体了解一个基因的功能、表达、已有研究的初始页面。页面分为很多版块,从头到尾阅读完之后,对这个基因的研究可以认识到30%-50%。 ? GEO和SRA是NCBI上存储芯片和测序数据的2个中药版块,下面展示了如何在这些地方下载数据。 ? ? ? ? NCBI map viewer对于不编程获得基因的有用信息提供了较大便利。 ? ? ?

    1.8K50发布于 2019-05-09
  • 来自专栏生物信息学

    下载NCBI SRA数据的最佳方法

    高通量的原始数据通常情况下会上传到NCBI的SRA(Sequence Read Archive)数据库。当我们需要用到这些数据的时候,就需要合适的方法来下载。 常见的下载方法: aspera 工具下载 wget, curl 命令直接下载 NCBI官方的 SRA Toolkit 进行下载 很多教程建议使用 aspera 来实现高速下载,但是很多时候折腾配置了很久 同样,NCBI也指出了wget可能存在不能完整下载全部数据的问题。 下载安装SRA Toolkit: https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=software ? 如果你有其他的更好的下载方法,欢迎留言或者私信后台交流~ 参考: https://github.com/ncbi/sra-tools https://github.com/ncbi/sra-tools

    2.5K20发布于 2020-04-14
  • 来自专栏生物信息学、python、R、linux

    Aspera下载NCBI和EBI文件

    Aspera使用: 使用说明:https://www.internationalgenome.org/faq/how-download-files-using-aspera Aspera 高速下载 NCBI 数据下载: ascp -T -l 200M -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh \ --host=ftp-private.ncbi.nlm.nih.gov 500m,默认似乎是10m/s的速度,比较慢 -k 断点续传,一般设置为值1 -P 用于SSH身份验证的TCP端口,一般是33001 --host=string ftp的host名,NCBI 的为ftp-private.ncbi.nlm.nih.gov;EBI的为fasp.sra.ebi.ac.uk。 --user=string 用户名,NCBI的为anonftp,EBI的为era-fasp。 --mode=string 选择模式,上传为 send,下载为 recv。

    3.6K61发布于 2020-04-01
  • 来自专栏生信情报站

    NCBI生物分类数据库(Taxonomy)

    介绍 Taxonomy : NCBI公共序列数据库中所有生物的策划分类和命名法。目前包含地球上大概10%的物种。 我们现在查询到底包含有有多少物种,进入统计页面:。 查询某个物种的全部核酸序列和蛋白序列 进入 NCBI 首页 点击Taxonomy,进入物种分类数据库 进入 Taxonomy 首页,输入human,点击Search 浏览该物种下的核酸序列或蛋白序列 查看某个物种的其他信息(蛋白结构,基因,测序数据,相关文献等) https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi? mode=Root 进入首页,我们以人类为例:输入human,点击Go 点击Homo sapiens 大家会看到在NCBI中关于人类的目前几乎全部的生物数据。 /pub/taxonomy/ 1. gi_taxid 标识的数据 NCBI早在2016年已经宣布逐渐停用,这部分信息不再关注 2. taxcat 标识的数据 ncbi提供有不同格式的压缩包,解压后都只有一个

    3.5K10发布于 2021-01-13
  • 来自专栏医学数据库百科

    MeSH: NCBI主题词数据库

    所以今天就介绍一下关于 MESH 主题词数据库 MeSH : https://www.ncbi.nlm.nih.gov/mesh 主题词 医学主题词 (Medical Subject Headings

    3.1K11编辑于 2022-02-08
  • 来自专栏生信修炼手册

    使用biopython查询NCBI数据库

    NCBI网站是最常用的生物信息数据库之一,集成了pubmed,genebank等子数据库。最简便的用法当然是直接在网站上检索,为了方便检索,NCBI提供了自己的检索系统,称之为Entrez。 对于想要在命令行访问NCBI的人而言,NCBI也提供了Eutils工具,可以通过对应的API在命令行操作。 biopython将Eutils工具进行了封装,通过Bio.Entrez子模块,可以在python环境中与NCBI进行交互。 E-utilities是由8个小程序组成的工具集,能够将符合语法规则的URL转换为对应数据库的检索条件,并返回检索结果,是Entrez检索系统和NCBI数据库的接口,biopython也提供了对应的功能 EPost 该方法用于上传待查询的ID到NCBI服务器,一次可以上传多个ID, 用法如下 >>> id_list = ["19304878", "18606172", "16403221", "16377612

    1.8K30发布于 2021-01-11
  • 来自专栏作图丫

    如何在NCBI中下载SRA数据?

    目前,在NCBI中下载SRA数据主要有三种方式: 利用Aspera工具下载。 利用SRA Toolkit下载。 利用wget命令直接下载。 获取ftp地址 进入NCBI网页后,按如下步骤操作: Step1.设置NCBI的分类为:SRA Step2.输入感兴趣的样本号:IRIS_313-11156,点击Search,弹出四条item,说明该样本分四次 其中-c 50 参数是指若下载过程中断,会自动尝试50次继续下载: wget -c 50 https://sra-downloadb.st-va.ncbi.nlm.nih.gov/sos2/sra-pub-run

    3.2K32编辑于 2022-03-29
  • 来自专栏Y大宽

    ncbi下载sra数据的几种种方式

    SRR1972917,2015-04-14 13:59:24,2015-04-14 13:56:53,4377867,884329134,4377867,202,486,,https://sra-download.ncbi.nlm.nih.gov SRR1972918,2015-04-14 13:58:26,2015-04-14 13:56:34,3856384,778989568,3856384,202,457,,https://sra-download.ncbi.nlm.nih.gov cat runinfo.txt | cut -f 1 -d ","|grep SRR > sra.ids 然后下载即可,注意不要下载,这只是示例,因为里面包含大量数据,如果想下载看下空间du -hs ~/ncbi

    4.4K40发布于 2019-06-24
  • 来自专栏BioIT爱好者

    Python 获取 NCBI 基因名 SSL 证书异常?

    即想要通过 Python 在线获取某个转录本对应的基因 symbol 时,发现出现 SSL 无法获取本地证书:unable to get local issuer certificate (_ssl.c:1056)!

    1.3K30发布于 2021-10-15
  • 来自专栏医学数据库百科

    除了pubmed, ncbi还有哪些数据库

    关于pubmed,这个是属于NCBI旗下的一个文献检索网站。 ? 但,NCBI并不是只有pubmed。它是一个全面的医学信息检索的数据库。旗下包括了各种和医学研究相关的数据库。 ? Books Books(https://www.ncbi.nlm.nih.gov/books)是一个可以免费在线访问生命科学和医疗保健方面的书籍和文件。同样的输入关键词即可返回和和关键词有关的书籍。 MedGen MedGen(https://www.ncbi.nlm.nih.gov/medgen/)是一个用来检索遗传性疾病有关的基因信息的数据库。 Taxonomy Taxonomy(https://www.ncbi.nlm.nih.gov/taxonomy/)是一个汇总了所有物种序列信息的数据库。 总的来说 以上就是简单介绍了一个可能会用到但是又不是被提起的NCBI数据库。其他一些经典的类似OMIM, GENE, GEO, SNP, SRA这些有需要了解的。可以自己百度一下。

    2.4K20发布于 2021-07-28
  • 来自专栏生信情报站

    生物信息中的Python 03 | 自动化操作NCBI

    比如,老板让你比对自己测定序列与 NCBI 库中序列,并构建相应的进化树,而这个序列需要大于100条。 使用固定的URL语法,将一组标准输入参数转换为各种NCBI软件组件搜索和检索所请求数据所需的值。 /gene/DATA/ASN_BINARY/Mammalia/Homo_sapiens.ags.gz 下载格式转换工具:ftp://ftp.ncbi.nlm.nih.gov/toolbox/ncbi_tools /converters/by_program/gene2xml/linux64.gene2xml.gz 在终端依次运行下列命令 mkdir ncbi cd ncbi mkdir ags mkdir tool cd tool wget ftp://ftp.ncbi.nlm.nih.gov/toolbox/ncbi_tools/converters/by_program/gene2xml/linux64

    1.3K10发布于 2021-01-13
  • 来自专栏Y大宽

    批量导入NCBI下载到本地的引文到Endnote

    Endnote可以批量导入pdf格式文件。但对下载到本地的引文无法批量导入。如果本地有很多这种引文,那一个个导入很麻烦。可以用以下批处理命令实现一次导入

    2.6K00发布于 2019-04-18
  • 来自专栏小明的数据分析笔记本

    杂记:NCBI下载测序数据;小麦GO富集分析

    NCBI下载原始数据 我是使用conda安装的这个软件,首先激活虚拟环境 conda activate download_raw_data 下载 prefetch SRR10193119 ? image.png 默认是保存在 ncbi 文件夹下,这个相对还是挺快的,2.5个G,4分钟左右就下载好了 这样是sra格式的数据,还需要借助 fasterq-dump转换成 fastq fasterq-dump

    1.4K20发布于 2021-05-07
  • 来自专栏数据挖掘

    数据挖掘—NCBI中获取某基因序列和转录起始位点

    数据挖掘—NCBI中获取某基因序列和转录起始位点记录下从NCBI数据库中获取某基因序列和转录起始位点,以MYC基因为例1 基因序列NCBI中搜到MYC基因,选择物种为人类。 NCBI中直接检索NM_002467,其第一个碱基的位置极为MYC的主要TSS,可在上述得到的MYC基因序列中检索部分序列,确定转录起始位点参考教程:https://www.bilibili.com/video

    3K21编辑于 2025-05-26
  • 来自专栏数据挖掘

    动物物种鉴定—使用NCBI工具Primer-BLAST设计qPCR引物

    动物物种鉴定—使用NCBI工具Primer-BLAST设计qPCR引物最近遇到一个项目,大概是检测一块组织,如牛 (Bos taurus)中,是否含有羊 (Ovis aries)、猪 (Sus scrofa 1.COI基因序列确定NCBI中检索某物种线粒体基因组序列(官方认定),以牛 (Bos taurus)为例,可在NCBI Nucleotide(https://www.ncbi.nlm.nih.gov/ AI工具可能出错以牛 (Bos taurus)的NC_006853.1为例,可以在NCBI中直接检索NC_006853.1,在其中页面中检索COX1,也就是COI基因,确定COI基因的位置,如在5687 Primer-BLAST根据COI基因序列设置qPCR引物引物设计时候,chatgpt推荐在设计前先做多序列比对,但是这一步我没有做了,直接进行的引物设计可以在当前页面直接跳转到Primer-BLAST设计页面(也可以在NCBI

    1.4K20编辑于 2025-10-16
  • 来自专栏Y大宽

    用SeqinR包在NCBI获取基因组序列并分析

    下载保存后可以用read.fasta打开 ########################## 用SeqinR包获取序列并进行统计 ########################## 比如,在NCBI

    2.8K30发布于 2019-03-04
  • 来自专栏数据库

    ——三种NCBI常见数据库

    本期小编为大家带来的是NCBI上的三个重要的数据库—NR/NT,Taxonomy和RefSeq。 NR和NT库都可以通过NCBI(National Center for Biotechnology Information,美国国立生物技术信息中心)进行在线BLAST,也可以在ftp://ftp.ncbi.nih.gov (NCBI genomic reference sequences),RefSeq_protein(NCBI protein reference sequences)和RefSeq transpans( NCBI transpans reference sequences)具有生物意义上的非冗余基因,转录本和蛋白质序列,是经过NCBI和其他组织校正的数据库,使用人类基因命名委员会定义的术语,并且包括了官方的基因符号和可选的符号 refseq序列是NCBI筛选过的非冗余数据库,一般可信度比较高。 NCBI作为生信分析最牛逼的网站,还包含有很多其他重要的数据库,后面几期小编将为大家逐个介绍,敬请关注! 供稿人:微生物事业部 韩娜

    3.6K110发布于 2018-02-05
领券