首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信技能树

    生物信息学流程框架的4个流派

    Bioinformatics, Volume 18, Issue 3, May 2017, Pages 530–536, https://doi.org/10.1093/bib/bbw020 值得推荐,非常好的整理了目前生物信息学界的各个 主要是下面的4种: 第一个是基于通配符 比如Nextflow、Snakemake等等,这方面的各种教程多如牛毛,我这里就不赘述了,大家根据关键词搜索即可自行学习。 跟着jimmy学docker系列之第4讲:docker容器资源调度问题(MAC版本) 使用阿里云+Docker分析RNA-Seq与ChIP-Seq Docker应用之一键化安装Wordpress(无需代码基础

    1.8K50发布于 2020-12-17
  • 来自专栏Y大宽

    通过简单数据熟悉Linux下生物信息学各种操作4

    原地址 几点说明 1.非简单翻译,所有代码均可运行,为了辅助理解,基本每步代码都有结果,需要比较的进行了整合 2.原文中的软件都下载最新版本 3.原文中有少量代码是错误的,这里进行了修正 4. 对于需要的一些知识背景,在这里进行了注释或链接到他人博客 ---- 一共4部分 通过简单数据熟悉Linux下生物信息学各种操作1 通过简单数据熟悉Linux下生物信息学各种操作2 通过简单数据熟悉 Linux下生物信息学各种操作3 通过简单数据熟悉Linux下生物信息学各种操作4 ---- 20 Pileup和Coverage 上面已经得到的mutation files 需要用到前面的内容 20.1 DP=2;I16=2,0,0,0,34,578,0,0,120,7200,0,0,2,4,0,0;QS=1,0;MQ0F=0 PL 0,6,31 NC_002549 8 DP=4;I16=4,0,0,0,68,1156,0,0,240,14400,0,0,13,75,0,0;QS=1,0;MQ0F=0 PL 0,12,50 NC_002549

    94830发布于 2019-07-03
  • 来自专栏生信挖掘姬

    基础生物信息学

    生物信息学序列分析是了解这些序列的核心,这本书简单介绍了DNA, RNA和蛋白质序列的研究。 生物信息学(Bioinformatics )涉及生成,可视化,分析,存储和检索大量的生物信息。 原始形式的生物医学数据(包括DNA序列)的生成不涉及生物信息学技能。但是为了使该序列可用,必须对其进行分析,注释和重新生成适合数据库的格式。这些都属于生物信息学分析范畴。 其中许多分析可以自动化,但需要具有生物信息学技能或经验的人来分析和支持。 一旦拿到数据,您如何分析数据呢?有没有DNA和蛋白质序列文件之类的文本呢? 生物信息学是最早接受科学技术的领域之一。网页是传播信息的工具,本书中我们将使用许多网页。 最后,生物信息学活动通常涉及大量数据。即使如果您只关注一个基因,那么仍然会有大量的数据连接到该单个序列。 尽管如此,生物信息学领域面临的最大的挑战之一是信息的绝对泛滥以及如何生成,可视化,分析,存储和检索这些数据,这无论怎么强调都不为过。

    74560发布于 2020-06-05
  • 来自专栏生信菜鸟团

    读《理解生物信息学

    生物信息学不只是画图那么简单,而《理解生物信息学》就是为那些想进一步理解生物信息学的好奇者准备的礼物。说起这个礼物,大约是在2017年的某个周末一个加班的下午,在一位同事工位上偶遇的。 可以是说这本书的内容是对我生物信息学背景知识的补充和扩展,特别是对一个半路出家的生物信息学工作者而言。 每一章的每个小节都有一个流程图以帮助读者记忆该小节所涵盖的主题 每一章都配有教科书级别的插图,助于我们理解相关的概念 每一章末都列了一些研究文献和专业著作的参考文献以帮助读者进一步扩展知识、发展技能 字符表和名词解释 《理解生物信息学 这不像《细胞分子生物学》那样讲的全是生物的知识,也不是《R语言数据科学》那样讲的全是编程的技巧,《理解生物信息学》是一本真正意义上的生信书籍。

    79221编辑于 2022-04-08
  • 来自专栏R语言交流中心

    R语言相识生物信息学

    1.NBDC(NationalBioscience Database Center) 链接:https://biosciencedbc.jp/en 简介:本网站主要收集了目前流行的生物信息学专业的数据库 Biostars 链接:https://www.biostars.org/ 介绍:生物信息学相关知识的讨论,问题的回答 网站截图: ? 3. Bioconductor 链接: http://www.bioconductor.org/ 介绍:本网站集中了大量的生物信息学相关的R包,并都附有相关的教程 网站链接: ? 4. OMMIC TOOLS 链接:https://omictools.com/transcriptomics-category 介绍:生物信息学分析以及相关的组学数据库平台集合。 网站截图: ?

    1.5K20发布于 2019-07-31
  • 来自专栏生信宝典

    43个生物信息学“事实”

    HGAP assembler is actually an elaborate front-end hiding three thousand slave laborers all running GAP4

    57010编辑于 2022-01-18
  • 来自专栏生信菜鸟团

    生物信息学必备工具—SAMtools

    广泛兼容性:与其他生物信息学工具和流程兼容。 易于集成:可以轻松集成到自动化的生物信息学分析流程中。 强大的数据过滤和查询功能:能够高效地过滤和查询特定的数据。 这些优势使Samtools成为生物信息学领域研究人员广泛使用的关键工具之一。 ....... 4如何安装 conda 安装 首选推荐Conda安装,非常简单 #codna create -n wes #先创建小环境,如果已经创建,可以忽略 conda activate wes conda 注意需要时绝对路径 make make install 未指定目录安装,非管理员用户会报错 5高频用法 samtools 有39个子命令,但是最常用的功能就是对bam文件排序后构建索引,然后进行后续的生物信息学分析 d0.sam ## 产生的bam文件大小 3.1G 12月 12 15:37 d0.bam ## 以示例来说存储空间相差了9倍 6其余子命令参数及用法 sort samtools sort -@ 4

    3.8K10编辑于 2023-12-14
  • 来自专栏生物信息学

    所以你想做生物信息学

    所以你想做生物信息学? 作者:Mario F. 生物信息学的大部分工作是关于如何更聪明地工作,而不是单纯依赖更强大的硬件。 台式机?笔记本?云端? 以下是快速指南: 笔记本电脑 - 便携性强,适合日常开发。 操作系统对决:Linux VS macOS VS Windows 生物信息学中会用到很多命令行工具,其中一些工具的使用难度较高。 处理器(CPU):4 核或以上,现代处理器。并行计算能加速比对任务。 显卡(GPU):不重要(除非你做深度学习)。大多数生物信息学工具依赖 CPU。 欢迎来到生物信息学的世界! 接下来:我们将讨论 Conda、Docker 和 Mamba,因为安装生物信息学工具不应该像打最终 Boss 那样困难。

    56510编辑于 2025-09-04
  • 来自专栏生物信息学

    如何成为顶级生物信息学

    如何成为顶级的生物信息学家?看你的研究。所以Shirley将生物信息学研究(注意,不是生物信息学者本人)的水平划分成五个层次。 但如果这些学者是认真对待生物信息学的研究,这个回答不OK。许多0级生物信息学家们从来不读或者不发表生物学期刊上的论文,也不参加生物学的会议,因此这个级别属于“未入门级”。 根据人以类聚,物以群分的原则,0级生物信息学家们通常只阅读自己或者其他0级生物信息学家的论文,并且,并且引用也是自引或者被同级别的学者引用。因此这类研究就是浪费资源。 这就需要生物信息学家具有非常扎实的生物学知识,并且能够自己提出有意思的生物学问题。生物信息学家可以领导一个生物学的项目,并且实验学的合作者能够相信预测的正确性以及意义,并乐意开展实验验证。 在这个级别,生物信息学家要在巨型项目产生的海量数据的整合和模拟中发挥关键作用。做这个级别工作的生物信息学家一般具有良好的1级和2级的研究记录,并且在团队研究中要具有非凡的领导才能。

    1.2K10发布于 2020-04-14
  • 来自专栏深度学习

    生物信息学】基因富集分析enrichment

    4. david.ncifcrf.gov/ ChatGPT DAVID(Database for Annotation, Visualization, and Integrated Discovery)是一个功能注释和生物信息学分析工具 它通过使用多种生物信息学数据库和资源,如Gene Ontology(GO)数据库、KEGG(Kyoto Encyclopedia of Genes and Genomes)通路数据库、PubMed文献数据库等

    57210编辑于 2024-07-30
  • 来自专栏BioIT爱好者

    顶级生物信息学 RSS 订阅源

    今天主要来给大家推荐一些常用的生物信息学的 RSS 订阅源,通过这些订阅源你可以及时掌握和了解到一些比较前沿的生物信息学研究资讯。 使用 inoreader 跟踪各种订阅源最新资讯 1. 更新频率 4 posts / week 2. 更新频率 9 posts / day 4. 更新频率 4 posts / year 9. 进入我们的在线课程,开始您的生物信息学教育! 更新频率 1 post / week 19.

    2K20发布于 2021-10-15
  • 来自专栏深度学习

    生物信息学】层次聚类过程

    \delta δ B C D E A 1 3 2 4 \delta δ B C D E A 1 3 2 4 2 δ \delta δ B CD E A 1 2 4

    36710编辑于 2024-07-30
  • 来自专栏生信技能树

    【资源分享】生物信息学编程实战

    市面上唯一适合生物信息学从业者的教学视频 直接复制链接 https://ke.qq.com/course/285055 到浏览器即可打开购买 永不打折,但是会下架,请抓紧机会购买! 4 >chr_4 9 4 2 7 3 04:hg38每条染色体的基因、转录本分布 题目 对GTF注释文件进行探究,统计每条染色体基因数 library("illuminaHumanv4.db") ls('package:illuminaHumanv4.db') probe2entrezID=toTable(illuminaHumanv4ENTREZID ) probe2symbol=toTable(illuminaHumanv4SYMBOL) probe2genename=toTable(illuminaHumanv4GENENAME) my_probe (illuminaHumanv4ENTREZID)),30) my_symbol_gene = sample(unique(mappedRkeys(illuminaHumanv4SYMBOL)),30)

    4.2K50发布于 2018-06-07
  • 来自专栏生信技能树

    生物信息学软件工具的大致分类

    我这里把生物信息学软件工具按照使用难易程度的大致分成3类: 网页工具(最易上手) 云平台(有门槛,比如需要看视频教程) 编程语言(起码三五个月的学习) 其中网页工具和云平台都不是针对专门的生物信息学工程师设计的 云平台(有门槛,比如需要看视频教程) 生物信息学云平台提供了在线的计算和数据存储服务,使研究人员能够在云环境中进行生物信息学数据分析和处理,而无需购买和维护本地服务器。 snpEff_latest_core.zip unzip snpEff_latest_core.zip ## java -jar snpEff.jar download GRCh37.75 ## java -Xmx4G 其实这个也应该是我们生物信息学软件的理想下载模式,目前借助于conda我们勉强能实现在服务器上面使用单一命令任意安装绝大部分生物信息学软件。 openssh-server sudo apt install -y vim tree nginx htop cmake sudo apt install --fix-missing libcurl4-

    1.2K30编辑于 2023-11-21
  • 来自专栏生信菜鸟团

    生物信息学常见文件格式

    43910编辑于 2024-07-10
  • 来自专栏小汪Waud

    生物信息学常见数据格式

    生物信息学里常见的数据格式主要有fasta,fastq,gff/gtf。 1 FASTA FASTA是一种基于文本用于表示核酸序列或蛋白质的氨基酸序列的格式。 第4行: 碱基质量行,根据ASCII表,用一个字符代表碱基质量的好坏,与第二行的测序结果是一一对应的,可以简单理解为对应位置碱基的质量值,越大说明测序的质量越好。

    1.5K30编辑于 2023-02-03
  • 来自专栏DrugOne

    Python生物信息学③提取差异基因

    使用的数据集是GSE5583,来自于2006年的基因芯片结果,该芯片目的是提取野生型和HDAC1小鼠胚胎干细胞用于Affymetrix微阵列上的差异RNA。

    1.8K30发布于 2021-01-28
  • 来自专栏R语言小白

    生物信息学常见数据格式

    生信技能树学习笔记fasta一种基于文本用于表示核酸序列或多肽序列的格式,缩写为fa特征:两部分-id行:以“>”开头,有时候会包含注释信息-序列行:一个字母表示一个碱基/氨基酸,ATCGN 或 20种氨基酸fastq一种保存生物序列(通常为核酸序列)及其测序质量得分信息的文本格式通常有四行第一行 @开头,之后为序列的标识符以及描述信息第二行 为序列信息,如ATCG第三行 +开头,之后可以再次加上序列的标识符以及描述信息第四行 为碱基质量值,长度与第二行一一对应gff图片

    53950编辑于 2023-02-17
  • 来自专栏生物信息云

    生物信息学入门必须了解的名词

    生物信息学(bioinformatics):综合计算机科学、信息技术和数学的理论和方法来研究生物信息的交叉学科。 物种树(Species tree): 是指代表一组物种进化过程的系统树,映物种实际种系发生的树 MP 最大简约法(maximal parsimony):假设4种核苷酸或者20中氨基酸可以突变为与其自身不同的任何一种 SwissProt:SwissProt数据库是经过注释的蛋白序列数据库,由欧洲生物信息学研究所(EBI)维护。每个条目包括蛋白质序列、引用文献、分类学信息和注释等。

    3.3K63发布于 2020-04-21
  • 来自专栏Y-StarryDreamer

    机器学习在生物信息学中的探索

    导言机器学习是我一直深入研究和应用的领域,其在生物信息学中的应用尤为引人注目。通过让计算机从数据中学习模式,机器学习为处理生物信息学中的复杂问题提供了新的思路。 我理解监督学习、无监督学习和强化学习等方法的区别和适用场景,这些方法在生物信息学中有着广泛的应用。基因组学中的应用在基因组学领域,机器学习的应用为我们解读和理解基因组数据提供了强大的工具。 蛋白质组学蛋白质组学作为生物信息学领域的重要组成部分,研究生物体内所有蛋白质的组成和功能。 AlphaFold 的成功标志着机器学习在生物信息学领域的深入应用,为我们更深入地理解蛋白质的结构和功能提供了强大的工具。

    77800编辑于 2023-12-20
领券