首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 5-4 向量化

    本系列是《玩转机器学习教程》一个整理的视频笔记。前一小节实现了简单线性回归,但是性能比较低。本小节主要介绍使用向量化的方式提升性能。

    89920发布于 2019-11-13
  • 来自专栏R语言学习

    表达差异基因分析

    1安装BiocManage,再安装DESeq2包 > # <差异基因分析> > # 1.判断是否有BiocManager包,若不存在则安装 > options(repos=structure(c(CRAN sample_info.txt",header = T,row.names = 1) > coldata <- coldata[, c("condition", "type")] image.png 4.制作dds对象,构建差异基因分析所需的数据格式

    1.6K00发布于 2020-09-22
  • 来自专栏Y大宽

    差异基因检测方法

    差异基因的检测方法很多,但生物学家偏好使用的是fold change(FC)和t-test。猜测因为一是它们比较简单,二来好解释。 (2)随着作者的cut off(德尔塔value)被选择,需要权衡差异基因数目和假阳性结果的数目(FDR). 继而,有基于贝叶斯理论的moerated t-test。也是最常用的。

    2K30发布于 2018-11-09
  • 来自专栏coding for love

    5-4 使用 webpack-dev-server 实现请求转发

    请求转发,其实是使用 webpack-dev-server 的代理功能来实现的,本节为大家介绍 webpack-dev-server 的代理功能和主要使用场景。

    2.8K20发布于 2020-05-09
  • 来自专栏单细胞

    pseudobulks单细胞差异基因分析

    之前绘制过FindMarkers/FindAllmarkers差异分析后的单细胞差异基因火山图,除了FindMarkers/FindAllmarkers这种方法以外,pseudobulks是另一种单细胞差异基因分析的方法

    1.5K10编辑于 2024-08-15
  • 来自专栏单细胞天地

    不同谱系的差异基因分类注释

    下面这个get_var_genes_pseudotime函数是作者包装好的(https://github.com/IStevant/XX-XY-mouse-gonad-scRNA-seq/blob/master/scripts/XX_analysis_dm.R),很长但不难理解。只需要自己进入作者的代码,将其中的变量替换成自己现有的变量,一步步操作理解即可。

    1.3K31发布于 2020-03-30
  • 来自专栏生信修炼手册

    揭秘差异基因功能富集分析

    其次,我们还需要一点统计学手段,差异基因的数目是成百上千的,每个基因又参与多个生物学过程,直接将所有差异基因的功能汇总,会得到非常多的信息,由于数量庞大,所以看起来是杂乱无章的,没有任何规律可言,所以需要借助统计学手段 ,去挖掘差异基因集中在哪些生物学过程,也就是我们常说的富集分析。 pathway 19 40 not in pathway 281 6800 从两个角度将基因进行分类,是否为差异基因,是否位于待研究的通路上,就可以得到上述表格了。 第一列之和为差异基因的总数,第二列之和为非差异基因的总数。 由于该方法不需要对基因事先过滤,所以不会丢掉某些差异基因,能够挖掘出的信息量也会增加,近年来也是越来越受欢迎。 在后续文章中,会详细介绍不同工具的使用方法。

    1.7K21发布于 2020-05-08
  • 来自专栏单细胞

    单细胞差异基因火山图绘制

    做完单细胞差异基因分析(FindMarkers/FindAllmarkers)之后,按照常规流程绘制出来的火山图看上去会很奇怪。1、为什么火山图顶部聚集了很多基因?

    97810编辑于 2024-06-27
  • 来自专栏医学数据库百科

    年龄相关差异基因分析数据库

    对于差异基因的除了基本的注释,作者还基于多个免疫相关的数据库(ImmPort(https://www.immport.org/), InnateDB (https://www.innatedb.ca/) 检索功能:基于自己的目的来检索数据 下载功能(有的数据库有):下载分析的所有数据库 这里就简单的介绍一下检索功能 差异基因检索 在数据库检索方面,我们可以用来分析不同组织在具体哪个年龄段的差异基因有哪些

    1.8K20发布于 2021-08-23
  • 来自专栏生信小驿站

    优化差异基因分析的三板斧

    经常会遇到的难题是,差异分析结果并不满意,包括:1差异基因太少,一个数据集坐下来,只找到几百个差异基因2热图不满意。所以我经过自己的经验和总结,找到了三种方法来优化差异分析。 示例: ? 这样可能导致我们想寻找的N和T分组的差异基因受到很大的影响。 比如说,转换以前我们只能在两组中找到300多个差异分析,而经过转换,差异分析数目达到了5000多个,差异基因数目增加了十倍不止,这就给我们后续分析提供很大的空间。

    79820发布于 2020-05-08
  • 来自专栏生物信息云

    基因芯片数据挖掘分析表达差异基因

    5) 差异基因表达分析: 经过预处理,探针水平数据转变为基因表达数据。为了便于应用一些统计和数学术语,基因表达数据仍采用矩阵形式。 ? A.芯片数据的差异分析主要包括三种方法: 1. limma包的可扩展性非常强,单通道(one channel)或者双通道(tow channel)数据都可以分析差异基因,甚至也包括了定量PCR和RNA-seq。 2.

    3.6K60发布于 2019-08-07
  • 来自专栏生信菜鸟团

    一起画个圈圈看差异基因

    最近朋友看论文,看到了个展示差异基因的好看图,说想给自己的差异基因也来画一个,我研究了下,实现挺简单,现成的R包circlize 就可以做,那我们就一起来画一个圈圈吧! 1.首先加载包和分析好的差异分析结果数据,差异基因需要注释到基因组上的具体位置,所以还需要下载基因组gtf注释文件来注释差异基因结果。 ####示例画差异基因圈图,物种为小鼠,选择其它物种时记得替换#### ####0.加载工具包#### #画基因组圈图 library(circlize) #读取gtf文件来注释差异基因 library 2.注释差异基因数据 ####2.注释差异基因数据#### gene_up_mete=gtf_data[match(gene_up,gtf_data$gene_name),] bed1=cbind(gene_up_mete 最后把我们注释好的差异基因,添加为此图的内圈,一组组的添加上去就可以了。

    1.3K20编辑于 2022-04-08
  • 来自专栏DrugOne

    Python生物信息学③提取差异基因

    使用的数据集是GSE5583,来自于2006年的基因芯片结果,该芯片目的是提取野生型和HDAC1小鼠胚胎干细胞用于Affymetrix微阵列上的差异RNA。

    1.8K30发布于 2021-01-28
  • 来自专栏生信技能树

    药物预测之差异基因为什么不行

    现在让我们一起看看差异基因能不能进行药物预测! ,目前看来,top30%的和bottom 30%的样品分组,得到的差异基因数量是最多的。 不过也并不是说,差异基因数量越多越好啦。这里仅仅是展现一个分析方法而已。 PGx_Responder = NR PGx_Responder = R 25 126 113 我们任意选择一个差异基因列表的 那我们根据药物敏感程度分组后的差异基因一般来说会作为该药物的特征基因集,如果它没有太大的意义,前面几万篇文章都错了吗?

    1.6K20发布于 2021-10-12
  • 来自专栏R语言数据分析指南

    ggpolt2构建差异基因热图

    ❝本节分享如何基于差异基因分析的结果来绘制热图,主要还是基于ggplot2体系来实现,针对以往的代码风格,这次小编通过拆分数据定义每一部分的函数来编写新的代码,希望对各位观众老爷能有新的帮助,数据和代码已经被打包并上传到小编的

    48820编辑于 2023-10-17
  • 来自专栏生信宝典

    BIC无代码绘制差异基因火山图

    无代码绘制差异基因火山图 Volcano plot | 别再问我这为什么是火山图 一文解释了火山图如何解读。不太难看懂,而一旦看懂了,图也就知道怎么绘制了。 假设我们已经有了一个差异基因鉴定后的表格文件 590e7b6b-c279-40da-b1d2-1017464cea02.untrt.vs.trt.results.txt (看到这一串无规律的符号做文件名就知道这是我们平台输出的差异分析结果了 Padj越小转换后的值越大,越在图的上方; Gene expression change status variable这是一个可选参数,是说文件中是否已经根据某个阈值做了差异基因标记,哪些上调了,哪些下调了 上图中的两条垂直虚线和一条水平虚线是参数DE genes filtering threshold控制的,如果你筛选差异基因的标准(生成level列中哪些上调、哪些下调的标准)不是默认标志,则需要修改这个值为你设置的阈值

    1.2K31发布于 2021-04-29
  • 来自专栏生信技能树

    你确定你的差异基因找对了吗?

    然后,文章就使用这样的表达矩阵和分组信息,去找差异基因了,找毒品上瘾与否不同组的人的差异表达基因,毫无疑问,这样的差异分析,即使把阈值调的再低,也没多少统计学显著性的基因能被找出来的。 ?

    1.6K20发布于 2019-09-27
  • 来自专栏生物信息云

    GEO数据库表达谱差异基因分析

    关于GEO数据库表达谱差异基因分析,网上有很多教程,但很多都不系统,几乎千篇一律,而且都是直接使用整理好的矩阵文件来操作的。 我们之前也讲过芯片数据的处理和分析流程,不了解的小伙伴们先读一下之前的文章:基因芯片数据挖掘分析表达差异基因。今天公众号:BioInfoCloud将从GEO芯片的原始数据进行分析,为大家详细的讲解。 cervical.cancer.exprs.txt",sep = "\t",quote = row.names= F) 通过以上方法,就可以整理出一个真正属于我们自己的矩阵文件,最后,对自己的矩阵文件求差异基因 fdr",coef = 2,number = 200000) write.table(allDiff,file = "limmaTab.xls",sep = "\t",quote = F) 可以看到,差异基因已经输出在

    9.5K2118发布于 2019-08-07
  • 来自专栏数据挖掘

    转录组—多分组的差异基因的聚类分析

    转录组—多分组的差异基因的聚类分析好久没写帖子了,实在是没有时间。这次的需求是将以下这张图(全部分组差异基因聚类),去除control组之后重新聚类。 这张图的分组信息见下图,可见是一个多分组的差异基因的比较,具体做了以下的组间比较。 在以往的分析中,我们往往关注2分组之间的差异基因聚类(即使是多分组,也是把相应的2分组单独挑出来分析),但是有一点是即使在不同的组间分析中,不管是用limma、还是edgeR、deseq2分析,计算后对应的基因矩阵值的是一致的 我们先把每个分组,如B_vs_A、C_vs_A等,每个分组的差异基因保存出来,如下图,每个分组的DEG.xlsx,包含了该分组的全部差异基因(logFC=1、adj.P<0.05)。 基本思路是把,取每个分组(不包含A组,即control组)的差异基因的gene_id列,取出来做并集。然后在总的(包含全部基因、全部分组的基因表达矩阵)中,提取对应的行,再做聚类分析。

    1.1K11编辑于 2024-10-18
  • 来自专栏生信宝典

    你做的差异基因方法不合适?

    上一步,我们鉴定出了重要的干扰因素和解释变量可能对表达定量带来影响。scater允许在后续统计模型中引入这些变量来屏蔽技术操作带来的影响,或者可以给函数normaliseExprs()提供一个设计矩阵design matrix来直接移除干扰因素的影响。在这一章先不涉及这些。

    2.1K40发布于 2019-05-09
领券