首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生物信息云

    TCGA数据挖掘(四):表达差异分析4

    在之前我们的文章:TCGA数据挖掘(三):表达差异分析中,我们利用的是TCGAbiolinks包中的TCGAanalyze_DEA函数进行差异表达分析,我们也提到可以选择基于limma或edgeR包进行分析 ,TCGA数据挖掘(三):表达差异分析这一讲中我们利用的是edgeR包,之后我们在文章:TCGA数据挖掘(四):表达差异分析(2)和TCGA数据挖掘(四):表达差异分析(3)中分别也介绍了其他方法的差异分析 ,包括edgeR和DESeq包,今天这一讲,我们就利用TCGAbiolinks包中的TCGAanalyze_DEA函数基于limma包进行差异分析。 method = "quantile", qnt.cut = 0.25) 表达差异分析 这里利用的是TCGAbiolinks包中的TCGAanalyze_DEA函数,是基于limma包的差异分析

    4.9K51发布于 2019-09-18
  • 来自专栏生信技能树

    4个分组不做差异分析然后取交集?

    基于表达量矩阵的差异分析过程可以看我8年前的芯片教程,推文在: 解读GEO数据存放规律及下载,一文就够 解读SRA数据库规律一文就够 从GEO数据库下载得到表达矩阵 一文就够 GSEA分析一文就够(单机版 +R语言版) 根据分组信息做差异分析- 这个一文不够的 差异分析得到的结果注释一文就够 针对不同表达量矩阵格式,里面有大量的包可以选择。 因为现阶段传统bulk转录组测序项目成为了标准品,无论大家在哪个公司测序都是几百块钱一个样品,简单的3分组的6个样品,就包括了定量和普通差异分析富集分析的服务,因为都是流程化的。 最近看到了一个4个分组不做差异分析取交集,文章是:《Expression patterns and prognostic potential of circular RNAs in mantle cell 然后展现每个分组的合格的circRNAs交集,并没有差异分析: 并没有差异分析 学徒作业 根据文章里面提到的这个GSE159808数据集的分组: naive B cells (green; n =

    64820编辑于 2023-02-27
  • 来自专栏微光点亮星辰

    Oracle 与 MySQL 的差异分析4):SQL写法

    Oracle 与 MySQL 的差异分析4):SQL写法 1 常量查询 1.1 Oracle select 7*8from dual; 1.2 MySQL MySQL 中没有DUAL表,查询一个常量时可以不用 insert intot_test1(abc) values(“2015”); 4 NULL和空字符串 4.1 Oracle 对于字符类型字段,null 和“空字符串”是等价的,都要用is null 或 6.2 MySQL 可以这样 insert 多条数据: insert intot_test4 values(“11”),(“12”),(“13”); 7 组函数 MySQL 中组函数在 select 语句中可以随意使用

    1.4K21发布于 2020-04-10
  • 来自专栏生信小驿站

    差异分析

    duplicated(genes$ENTREZID),] x$genes <- genes x 数据预处理 从原始尺度转换 对于差异表达和相关分析,基因表达很少在原始计数水平上考虑,因为文库测序的深度更大会导致更高的计数 相反,通常的做法是将原始计数转换为可以解决这种库大小差异的规模。 在我们的分析中,CPM和log-CPM转换经常使用,尽管它们没有考虑RPKM和FPKM值所做的特征长度差异。 假设条件之间的异构体使用没有差异差异表达分析着眼于条件之间的基因表达变化,而不是比较多个基因的表达或得出绝对表达水平的结论。 换句话说,基因长度对于感兴趣的比较保持不变,任何观察到的差异都是条件变化的结果,而不是基因长度的变化。

    1.1K10发布于 2018-08-27
  • 来自专栏生信小驿站

    差异分析

    统计差异基因数目 tfit <- treat(vfit, lfc=1) dt <- decideTests(tfit) summary(dt) BasalvsLP BasalvsML LPvsML dt[,1:2], circle.col=c("turquoise", "salmon")) write.fit(tfit, dt, file="results.txt") #使用topTreat输出差异基因信息 差异基因可视化 为了总结目测所有基因的结果,可以使用plotMD函数生成显示来自线性模型的log-FC与平均对数-CPM值拟合的均值 - 差异图,其中突出显示差异表达的基因。

    97430发布于 2018-08-27
  • 来自专栏生信小驿站

    差异分析

    样品的无监督聚类 检查基因表达分析最重要的探索性策略之一是多维定标(MDS)图或类似的图。 该图以无监督的方式显示了样本之间的相似性和不相似性,以便人们可以了解在进行正式测试之前可以检测差异表达的程度。 如果样本以任何这些维度中的给定因子聚类,则表明该因子有助于表达差异,并且值得包括在线性建模中。另一方面,影响很小或没有影响的因素可能会被排除在下游分析之外。 差异表达分析 创建一个设计矩阵和对比 在这项研究中,我们感兴趣的是看到哪些基因在三种细胞群体之间的不同水平上表达。 在我们的分析中,假设基础数据是正态分布的,假设线性模型符合数据。 在Basal和ML之间发现总共8,510个DE基因(4,338个下调基因和4,172个上调基因),并且在LP和ML之间发现总共5,340个DE基因(2,895个下调和2,445个上调)。

    1.1K50发布于 2018-08-27
  • 来自专栏数据科学(冷冻工厂)

    RNA-seq 差异分析的点点滴滴(4

    引言 本系列[1]将开展全新的转录组分析专栏,主要针对使用DESeq2时可能出现的问题和方法进行展开。 提升速度与并行计算的思考 对于大多数分析任务,上述步骤的耗时通常不会超过30秒。 4个核心上。 作为BPPARAM的另一种选择,用户可以在分析开始时注册核心,然后在调用函数时只需设置parallel=TRUE即可。 library("BiocParallel") register(MulticoreParam(4)) P值与校正后的P值 可以根据最小的P值对结果表格进行排序。 (dds, coef=2, type="normal") resAsh <- lfcShrink(dds, coef=2, type="ashr") par(mfrow=c(1,3), mar=c(4,4,2,1

    35010编辑于 2024-12-30
  • 来自专栏生信补给站

    差异分析|DESeq2完成配对样本的差异分析

    本文为群中小伙伴进行的一次差异分析探索的记录。 前段时间拿到一个RNA-seq测序数据(病人的癌和癌旁样本,共5对)及公司做的差异分析结果(1200+差异基因),公司告知用的是配对样本的DESeq分析。 可以看到常规的DESeq2分析比limma voom分析多了一些差异基因,但是和公司给的1200+的差异基因还是差远了。 subject <- factor(c(1,2,3,4,5,1,2,3,4,5)) coldata <- data.frame(row.names = colnames(data), condition 总结来说,由于算法的不同,不同差异分析的R包得到的差异基因数量不完全一致。重要的是,针对配对的样本,如果不进行配对分析而用常规的差异分析,这样的结果可能会大不相同。

    7.8K42发布于 2021-03-03
  • 来自专栏R语言数据分析

    基因差异表达分析

    差异表达分析理论基于RNA-seq的差异表达分析Differential expression analysis的背景及标准流程。 在线分析差异表达基因GEO数据库介绍(四):GEO2R在线分析筛选差异基因_哔哩哔哩_bilibili利用R语言进行生信分析R语言基础及学习教程1、R语言学习学习视频可以参考生信技能树相关视频:【生信技能树 】生信人应该这样学R语言_哔哩哔哩_bilibiliR语言基础知识可参考:R语言基础1-腾讯云开发者社区-腾讯云R语言基础2-腾讯云开发者社区-腾讯云R语言基础3-腾讯云开发者社区-腾讯云R语言基础4( 数据挖掘全流程分析TCGA数据库下载及全流程分析(更新中)表达芯片数据分析1-腾讯云开发者社区-腾讯云表达芯片数据分析2-腾讯云开发者社区-腾讯云表达芯片数据分析3——基因差异分析绘制火山图及差异基因热图 -腾讯云开发者社区-腾讯云表达芯片数据分析4——复杂数据及其分析(多分组数据)-腾讯云开发者社区-腾讯云表达芯片数据分析5——多组数据联合分析-腾讯云开发者社区-腾讯云最新更新于 2024.10.22

    49920编辑于 2024-10-22
  • 来自专栏R语言&linux

    下游表达分析——差异表达分析

    match(colnames(rawcount), group$run_accession), c("run_accession","sample_title")]group# 差异分析方案为 cellwidth = 30,cluster_rows = T, cluster_cols = T, width = 7.5,height = 7)三、差异表达分析 1.edge 差异分析p value 看显著程度 FDR:校正后的p值logFC看差异程度 fold change,取log之后通过正负号来判断上调和下调rm(list = ls())options(stringsAsFactors lrt <- glmLRT(fit, contrast=c(1,-1)) # 提取过滤差异分析结果DEG_edgeR <- as.data.frame(topTags(lrt, n=nrow(DEG), airwayData.Rdata")lnameexpress_cpm1 <- rownames_to_column(as.data.frame(express_cpm) ,var = "ID")# 读取差异分析结果

    94610编辑于 2023-11-01
  • 来自专栏芒果先生聊生信

    差异分析03,一切差异皆可检

    因此,检测基因表达差异时,起码要检测兴趣基因的mRNA和protein,所以要用到RT-PCR和Western blot。 ? 正如我们在生信分析的总结中所说,差异表达是研究的起点,也是研究的难点。 虽然万事开头难,但是千里之行始于足下,检测差异表达是第一步。下面我们结合文献,一起感受下,如何检测差异表达。 检测差异表达分为入门(细胞)、进阶(动物)和高阶(测序)三个段位。 入门级别 差异表达的检测一般是放在文章的Figure1,入门级别是从细胞水平入手的。检测方法包括qRT-PCR、Western blot、免疫组化(包括免疫荧光),生信分析可辅助证明。 ? 补充图Figure1中图A和图B是生信分析结果。图A是韦恩图对多个数据库的检测结果取交集;图B是对耗竭性CD8+T细胞中的TOX进行对比分析,箱型图。 图a和图b是多维分析和GO分析不同组别中差异表达的基因。 ? 图c是热图展示差异表达的基因,图d是热图展示染色质调控相关的基因,图e是对图d的可视化视图展示;图f显示RNA质谱分析的结果。

    65310发布于 2020-07-07
  • 来自专栏图形学与OpenGL

    实验4 差异可视化

    了解差异可视化知识,了解和学习差异可视化中热点图、星图、平行坐标图等常见图表类型; 2. 学习并掌握R中差异可视化绘制相关函数。 二. 实验内容 1.

    84920发布于 2018-10-09
  • 来自专栏数据科学(冷冻工厂)

    ATAC-seq分析差异分析(10)

    在这里,我们将采用类似于 Diffbind 中的方法,并在 ATACseq 分析中合理建立。1. myReport <- makebedtable(KidneyMinusHindbrain, "KidneyMinusHindbrain.html", getwd())browseURL(myReport)4. 差异注释在最后一部分,我们可以将我们的差异 ATACseq 区域注释到基因,然后使用基因信息来测试 GO 集的富集。 由于我们有 TSS +/- 500bp 范围内的区域子集,此时我们可以使用标准富集分析。这里我们使用clusterProfiler来识别富集。 DB_ATAC <- as.data.frame(anno_KidneyMinusHindbrain)DB_ATAC[1, ]图片由于我们有 TSS +/- 500bp 范围内的区域子集,此时我们可以使用标准富集分析

    1.1K20编辑于 2023-01-27
  • 来自专栏数据科学(冷冻工厂)

    ATAC-seq分析差异分析(10)

    在这里,我们将采用类似于 Diffbind 中的方法,并在 ATACseq 分析中合理建立。 1. myReport <- makebedtable(KidneyMinusHindbrain, "KidneyMinusHindbrain.html", getwd()) browseURL(myReport) 4. 差异注释 在最后一部分,我们可以将我们的差异 ATACseq 区域注释到基因,然后使用基因信息来测试 GO 集的富集。 由于我们有 TSS +/- 500bp 范围内的区域子集,此时我们可以使用标准富集分析。这里我们使用clusterProfiler来识别富集。 as.data.frame(anno_KidneyMinusHindbrain) DB_ATAC[1, ] DB_ATAC 由于我们有 TSS +/- 500bp 范围内的区域子集,此时我们可以使用标准富集分析

    57220编辑于 2023-02-27
  • 来自专栏生信星球

    meta分析整合多次差异分析结果

    分别对两个数据集做差异分析,然后画 Venn 图取重叠部分。 优点:逻辑简单,读者一看就懂。 缺点:存在严重的**“漏斗效应”**。 ,deg1和deg2是两个数据各自差异分析的结果表格。 如果是多次差异分析,也同样支持,准备多次差异分析的结果,然后后续代码rma的method参数从FE改为REML即可。 2.数据清洗 1.两个差异分析结果都需要有Symbol、logFC和SE(标准误)列。 差异分析常用的三大R包中,deseq2直接提供了SE值,即lfcSE 列。 4.两个差异分析结果数据取交集。

    17710编辑于 2026-01-27
  • 来自专栏芒果先生聊生信

    TIMER做差异分析散点图

    前面,我们已经分享oncomine数据库做转录水平的差异分析,并推荐用oncomine+GEPIA双验证模式做差异分析。 对于单基因的差异分析,尤其是与肿瘤浸润免疫细胞表型相关的分析,芒果建议采用这种方法,确实做到统筹兼顾,有局部聚焦(oncomine)和全局通览(TIMER)的神奇效果。 TIMER数据库也是可以做差异表达分析的,而且还不错呢。在Diff Exp选项输入基因名称,点击submit即可生成。 ? TIMER (Tumor Immune Estimation Resource)数据库也是用高通量测序(RNA-Seq表达谱)数据分析肿瘤组织中免疫细胞的浸润情况,主要提供B cells, CD4+ T 差异表达分析。 ? 相关性分析。 ? ? 最后的评估模块其实是该数据库的特色。在掌握下载TCGA数据路数据的条件下,结合该数据库的这种功能,接近更高层次的论文。 ?

    2.2K30发布于 2020-06-24
  • 来自专栏生信技能树

    多分组差异分析续集

    大家学习到的通常是两个组的样本进行差异分析,然后走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。 这些流程的视频教程都在B站和GitHub了,目录如下: 第一讲:GEO,表达芯片与R 第二讲:从GEO下载数据得到表达量矩阵 第三讲:对表达量矩阵用GSEA软件做分析 第四讲:根据分组信息做差异分析 第五讲 :对差异基因结果做GO/KEGG超几何分布检验富集分析 第六讲:指定基因分组boxplot指定基因list画热图 第七讲:根据差异基因list获取string数据库的PPI网络数据 第八讲:PPI网络数据用 比如拿某一组的样本与剩余其它组所有样本进行比较,这样的差异分析策略还是蛮流行的!我前面在生信技能树也写过教程:如果你的分组比较多,差异分析策略有哪些?

    1.5K10发布于 2019-12-12
  • 来自专栏微生态与微进化

    组间差异分析:Anosim

    无论是野外环境样品,还是室内试验样品,一般我们都会设置样方或平行样来增强分析的准确性,必要时还会进行区组设计,因此在数据分析中需要进行组间差异的比较判别。 tests)来计算显著性,R语言vegan包含有多种非参数检验方法,包括Anosim、Adonis、MRPP等,不同方法在统计量的选择、零模型等方面存在差异。 Anosim分析(Analysis of similarities)是一种基于置换检验和秩和检验的非参数检验方法,用来检验组间的差异是否显著大于组内差异,从而判断分组是否有意义。 Anosim分析使用距离进行分析,默认为method="bray",可以选择其他距离(和vegdist()函数相同),也可以直接使用距离矩阵进行分析。 在R中我们可以使用vegan包中的anosim()函数进行分析,这里我们微生物群落数据为例进行分析: #读取抽平后的OTU_table和环境因子信息 data=read.csv("otu_table.csv

    2.8K21编辑于 2022-05-05
  • 来自专栏生物信息学、python、R、linux

    limma做RNAseq差异分析

    limma是一个很强大的用于分析芯片的R包,也可以用于RNA-Seq的差异分析 以两个组比较为例:首先输入count表达矩阵,这里也跟其他差异分析R包一样,不要输入已经标准化的数据。 ://stats.stackexchange.com/questions/160255/voom-mean-variance-trend-plot-how-to-interpret-the-plot 差异分析 __biz=MzI4NjMxOTA3OA==&mid=2247483987&idx=1&sn=aa2ca81e7fe128edaaedc47479c517c9&chksm=ebdf8adadca803cc31261a1ccabf8a6bdb835ce12b670cc01969fcfde51cfdb991d0619e7695&

    4.1K40发布于 2020-04-01
  • 来自专栏空间转录组

    空间生态位差异分析

    这种多模态分析的特点包括:整合基因与空间信息:结合基因表达数据与细胞的空间位置,分析空间中不同细胞类型的分布模式。 组织学信息挖掘:利用组织学图像特征(如纹理、颜色分布)来辅助细胞功能分析。2. 灵活扩展性:用户可以根据自己的需求调整分析流程,例如调整邻近性阈值或空间尺度。 并行计算:支持大规模并行计算,显著缩短运行时间。4. 与其他工具的集成 CellCharter 兼容多种常用的空间转录组分析工具,能够无缝接入现有的分析工作流程:Scanpy/Squidpy可以轻松与这些工具共享数据并进行扩展分析。 组织发育研究:追踪和分析发育过程中细胞的空间动态变化。疾病微环境研究:如炎症组织中的细胞行为分析。 figsize=(5,5),    ncols=1,    library_id=['Lung9_Rep2'],)可视化聚类结果(这些不同的Cluster就代表不同的Niches)还可以比较不同样本件Niche的差异

    64800编辑于 2025-05-29
领券