首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏医学和生信笔记

    GSVA和ssGSEA

    网上常见的根据通路对样本打分的方法说的就是这个GSVA。 ssGSEA是GSVA的一种特殊类型,二者没有本质上的区别,除了这两种,还有zscore和plage方法,都是通过GSVA包实现的。 下载之后使用clusterProfiler的read.gmt函数直接读取,然后使用split变成GSVA需要的格式。 <- split(genesets$gene, genesets$term) class(genesets4gsva) ## [1] "list" length(genesets4gsva) ## [ GSVA分析 下面就开始进行GSVA分析了,代码其实非常简单: library(GSVA) expr_geneset <- gsva(expr = as.matrix(expr), # 不能是data.frame gset.idx.list = genesets4gsva, method="gsva",

    1.8K40编辑于 2023-08-30
  • 来自专栏生信学习111

    GSVA和细胞通讯

    1 GSVA 什么是GSVA,可以用于分析基因集在不同样本或组中的表达差异情况。 #day10,单样本和多样本都可以 library(Seurat) library(GSVA) library(clusterProfiler) #load("../.. scRNA table(Idents(seu.obj)) #为啥不一样呢,因为我没注释,好的回去注释一下 exp = AverageExpression(seu.obj)[[1]] # 平均值做GSVA gsva #评价基因集的表达情况用zscoreParam gsvapar <- zscoreParam(exp, h_list) #这个函数更新之后改写法了,和以前不太一样了 ES = gsva(gsvapar ,] exp[1:4,1:4] #跟以前不太一样了,多了,"treat","control",因为这是两份组的 gsvapar <- zscoreParam(exp, h_list) ES = gsva

    54610编辑于 2024-06-27
  • 来自专栏单细胞学习小组

    day 10 GSVA和CellChat

    GSVA单样本和多样本都适用输入数据GSVA可视化rm(list = ls())library(Seurat)library(GSVA)library(clusterProfiler)load(".. AggregateExpression(seu.obj)[[1]]exp = as.matrix(exp)exp = exp[rowSums(exp)>0,] ;exp[1:4,1:4]## GSVA 官网下载gmt文件 并读取h_df = read.gmt("h.all.v2023.2.Hs.symbols.gmt")[,c(2,1)]h_list = unstack(h_df)ES = gsva (exp, h_list)#ES = gsva(gsvaParam(exp,h_list,maxDiff = T)) #针对R4.4.0ES[1:4,1:4]#可视化library(pheatmap)pheatmap rowSums(exp)>0,] h_df = read.gmt("h.all.v2023.2.Hs.symbols.gmt")[,c(2,1)]h_list = unstack(h_df)ES = gsva

    45110编辑于 2024-07-01
  • 来自专栏生信技能树

    单细胞数据的GSVA

    单细胞数据的GSVA和芯片、bulk转录组的GSVA没有本质区别,就使用AverageExpression获取平均表达量得到新的表达矩阵再计算即可。 1.加载数据和R包 获得每种细胞的平均表达量 rm(list = ls()) library(Seurat) library(GSVA) library(clusterProfiler) load(" 0.05426134 0.02747031 Seurat v5 提示建议用AggregateExpression做伪bulk转录组分析,那个是用来求和的,目前查到的文献和教程都是使用平均值,这里就木有改动. 2.做GSVA GSEA-msigdb官网 h_df = read.gmt("h.all.v2023.2.Hs.symbols.gmt")[,c(2,1)] h_list = unstack(h_df) ES = gsva

    65110编辑于 2024-07-05
  • 来自专栏单细胞天地

    单细胞GSVA分析该用什么数据?

    经常有人问我单细胞GSVA分析应该用Seurat对象中的哪个数据,因为我此前的推文《单细胞转录组高级分析五:GSEA与GSVA分析》用的counts数据,后面有一篇推文《非人物种的GSEA&GSVA分析 小结:scale.data数据并不能加快GSVA的运行时间。 分析结果对比 为了客观地对比不同数据运行GSVA之后的差异,我用pearson相关性热图给大家展示。 **从左上到右下的对角线代表相同细胞用不同数据运行GSVA分析后结果的相关性。**为了节省计算时间,我只取了前100个细胞计算相关性。 小结:GSVA分析使用counts数据和data数据没有差别,但是使用scale.data数据会影响结果。 减少基因数量可行吗? 写这篇推文时我突发奇想:使用高变基因来做GSVA分析可行吗? 原始表达矩阵与4000高变基因表达矩阵的GSVA结果相关性 ? 原始表达矩阵与6000高变基因表达矩阵的GSVA结果相关性 ? 原始表达矩阵与8000高变基因表达矩阵的GSVA结果相关性 ?

    4.9K21发布于 2021-03-25
  • 来自专栏生信技能树

    PGSEA和GSVA你会怎么选择呢?

    虽然有ssGSEA这样的单样本的分析,但仍然不够,也有GSVA这样的算法来弥补,这里要介绍的是另外一个包,PGSEA。 使用GSVA方法计算某基因集在各个样本的表现 安装PGSEA这个R包 安装并且查看 PDF教程: ## try http:// if https:// URLs are not supported source

    1.5K80发布于 2018-07-27
  • 来自专栏生信技能树

    单细胞GSVA分析专用R包

    默认开启全部线程计算 gsva.res <- gsva(expr, genesets, method="gsva") #> Warning: Calling gsva(expr=., gset.idx.list gsva'). #> Warning in .gsva(expr, mapped.gset.idx.list, method, kcdf, rnaseq, abs.ranking, #> : Some gsva.df <- data.frame(Genesets=rownames(gsva.res), gsva.res, check.names = F) gsva_d = gsva.res[sample (nrow(gsva.res),30),] pheatmap::pheatmap(gsva_d, show_colnames = T, scale = "row" GSVA(基因集变异分析) GSVA 是一种用于评估基因集在不同样本或条件下变异的方法,它可以提供基因集水平上的表达变化信息,而不是单个基因。

    72910编辑于 2024-11-21
  • 来自专栏生信技能树

    百万级单细胞GSVA如何提速?

    那么,当我们遇到大数据量的时候,如何加速单细胞的GSVA分析呢? 首先是加载这个经典的数据集: library(gplots) library(ggplot2) library(clusterProfiler) library(org.Hs.eg.db) library(GSVA ) # BiocManager::install('GSVA') library(GSEABase) # install.packages('devtools') # devtools::install_github 分析是在细胞水平做 尽管可以使用parallel.sz进行加速,但是数据量大的依然非常耗费计算机资源,耗费时间: # 非常耗费计算机资源,耗费时间哦 es.max <- gsva(as.matrix( ') 提速一:使用亚群水平进行GSVA分析 这样从原来的单个细胞 变成 注释后的亚群,样本量直接降级。

    63310编辑于 2025-01-01
  • 来自专栏生信技能树

    gsea或者gsva所需要的gmt文件

    KEGGCollection(keggId), setName=keggId) }, gs, names(gs))) gsc 有了前面的 GeneSetCollection 对象 就可以很容易去做GSVA 分析: # 需要一个普通的表达量矩阵,X es.max <- gsva(X, gsc, mx.diff=FALSE, verbose=FALSE,

    3.8K30编辑于 2022-04-15
  • 来自专栏生信技能树

    GSVA可以理解为pathway级别的差异分析

    GSVA分析的文章发表于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同样是broad 研究生出品,其在 2005年PNAS发表的gsea已经高达1.4万的引用了,不过这个GSVA才不到300。 去年我就介绍过一波它的分析流程,在:使用GSVA方法计算某基因集在各个样本的表现 非常简单的代码,所以各个培训机构,公司人员都开始学习和二次创作进而分享。 考虑到最近邮箱接收的GSVA提问比较多,我这里还是得再次归纳总结一波,这次我准备从GSVA其实就是pathway级别的差异分析的角度来分享。 GSVA)值,我们把它当作一般的矩阵文件,进行差异表达分析,热图绘制,火山图绘制。

    2.8K10发布于 2019-10-09
  • 来自专栏生信菜鸟团

    【生信文献200篇】69 简单的GSVA网页工具

    GSVA富集分析方法相连,提出了一种新的预测纳米材料NPs毒性的方法,并做了网络工具toxFlow。 02 背景 GSVA GSVA,Gene Set Variation Analysis 基因集变异分析。 GSVA 方法的第一篇文章发表于2013年:GSVA: gene set variation analysis for microarray and RNA-Seq data | SpringerLink 03 流程 数据标准化:研究人员建议将数据归一化 GSVA分析 NPs的相似性分析 NPs的毒性预测 GSVA分析可以单独使用,我们在此处也只关注GSVA网页工具。 研究人员设置了三个参数: GSVA执行次数:the number of bootstrap iterations to be performed by GSVA; 最大值及最小值:the maximum

    2.1K30发布于 2021-10-12
  • 来自专栏量子化学

    使用UniMoVib进行GSVA广义子系统振动分析

    最近笔者对GSVA方法的计算方法进行了简化,原GSVA方法需要用户手动构建子系统的非冗余内坐标集合,新方法将不再需要这一繁杂的步骤,相关的文章请见 Theor. Chem. 与此同时,笔者将GSVA的新计算方法写入了UniMoVib程序 https://github.com/zorkzou/UniMoVib 这样我们将可以很方便地进行GSVA分析了。 3. 实例 在这一节中,笔者将对三种不同的GSVA方法应用场景进行介绍:(1) 处于能量极小点体系的GSVA分析;(2) 处于过渡态体系的GSVA分析;(3) 柔性扫描路径下的GSVA分析。 /gsva-paper-examples/transition-state-gsva 找到。 假如我们对反应中心区域进行GSVA分析,会得到什么结果呢? 假如我们只选取质子转移的部分(S85, H65, O64)来做GSVA分析,结果得到内禀片段振动中并没有虚频振动的存在。

    96410发布于 2021-06-16
  • 来自专栏单细胞测序

    单细胞测序—标准分析流程(4)—GSEA与GSVA

    单细胞测序—标准分析流程(4)—GSEA与GSVA这部分代码是我综合了好几篇帖子手打的代码主要参考的是单细胞绘图之GSEA & GSVA再调用GSVA函数出问题时主要参考:GSEA和GSVA,再也不用去下载 )expr <- as.matrix(expr)#gsva1 <- gsva(gsvaParam(xpr,geneset_list,kcdf="Gaussian",method = "gsva",parallel.sz gsva1 <- gsva(gsvaParam(expr, geneset_list)):使用gsva函数进行基因集变异分析,输入为表达矩阵和基因集列表,输出每个基因集在不同细胞中的活性评分。 mydata <- t(as.data.frame(gsva1)) %>% as.data.frame():将GSVA结果转置并转换为数据框形式。 最终将热图保存为GSVA_heatmap.pdf文件。总结来说,这段代码进行了基因集变异分析(GSVA),找出了在不同组别(STIM vs.

    2.6K13编辑于 2025-12-02
  • 来自专栏生信技能树

    RNA-seq入门实战(八):GSVA——基因集变异分析

    GSVA简单介绍 官方文档:GSVA: gene set variation analysis (bioconductor.org)不错的一篇文章:GSVA的使用 - raisok 定义基因集变异分析( "); setwd("6.GSVA") ---- 2.下载GSVA分析所需的基因集 GSVA分析常用MSigDB数据库中基因集,也可以自定义基因集进行分析。 GSVA的运行 使用GSVA需要输入基因表达矩阵和基因集。 ,"gsva_go_matrix.csv") 运行完GSVAgsva_mat内容如下,可以发现行名变成了基因集通路名,每个样品都会有对应通路的GSVA评分: ---- 4. limma差异分析 得到 GSVA结果可视化:热图、火山图、发散条形图/柱形偏差图 与常规差异分析结果展示类似,GSVA结果可视化一般也用热图、火山图展示 5.1 热图 #### 对GSVA的差异分析结果进行热图可视化 ####

    11K113编辑于 2022-07-26
  • 来自专栏生信技能树

    三阴性乳腺癌表达数据探索笔记之GSVA分析

    GSVA,SSGSEA, PGSEA GSVA与GSEA的差别在于,这种方法不需要对基因进行排序,因此也意味着不需要首先进行其他的统计学分析,如基因在样本之间的表达差异,如变化倍数,然后根据变化值从高到低进行排序 ID转换结果 第二步:进行GSVA分析,获得GSVA得分矩阵 X=dat table(group_list) ## Molecular Signatures Database (MSigDb GSVA得分矩阵 第三步:对GSVA得分矩阵分别进行差异分析 adjPvalueCutoff <- 0.001 logFCcutoff <- log2(2) es_deg <- ') #将所有GSVA的得分差异显著的结果保存为一个csv,便于检查 ? GSVA得分差异矩阵热图 结果解读: GSVA对数据库中的每一个通路在每个样本中算了一个值,相当于GSEA的enrichment score, 如果得分越高,说明这个通路在该样本中被改变的越严重。

    4.9K42发布于 2020-10-26
  • 来自专栏单细胞

    获取KEGG通路的基因列表 做单细胞GSEA、GSVA分析

    使用KEGG通路的基因列表进行单细胞GSEA GSVA分析的过程,我们需要遵循以下步骤: 获取KEGG通路的基因列表:这通常涉及使用专门的R包,如KEGGREST或biomaRt,来查询KEGG数据库并检索特定通路的基因列表 执行GSVA分析:使用GSVA包对单细胞数据执行基因集变异分析(GSVA),根据KEGG通路的基因列表评估每个单细胞样本的通路活性。 可视化GSVA结果:最后,基于GSVA分析结果,绘制热图或其他类型的图表来展示不同单细胞样本中通路活性的变化。 今天我们主要关注第一步,如何获取KEGG通路的基因列表? 问题来源 不管是转录组数据还是单细胞数据都可以做gsva分析。gsva需要两个文件作为输入: 1. 表达矩阵 2. 基因集 表达矩阵容易获得,但是如果我们想做kegg数据库的通路分析怎么办? );print(getwd()) #gssea.res <- gsva(expr, genesets_GO [1:50], method="ssgsea",kcdf="Poisson",min.sz

    1.6K10编辑于 2024-03-22
  • 来自专栏生信技能树

    使用GSVA方法计算某基因集在各个样本的表现

    文章发表于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同样是broad 研究生出品,其在2005年PNAS 发表的gsea已经高达1.4万的引用了,不过这个GSVA才不到300。 /biocLite.R") options(BioC_mirror="http://mirrors.ustc.edu.cn/bioc/") biocLite("GSVA") library(GSVA) /bioc/vignettes/GSVA/inst/doc/GSVA.pdf 其实核心函数就是gsva(),需要两个输入:the gene expression data and a collection 不同算法在转录组测序数据的表现 前面我们说到过gsva函数还提供了另外3个算法,这里就不细细讲解了。

    10.1K41发布于 2018-07-27
  • 来自专栏生信技能树

    GSVA或者GSEA各种算法都是可以自定义基因集的

    GSVA分析的文章发表于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同样是broad 研究生出品,其在 2005年PNAS发表的gsea已经高达1.4万的引用了,不过这个GSVA才不到300。 去年我就介绍过一波它的分析流程,在:使用GSVA方法计算某基因集在各个样本的表现 非常简单的代码,所以各个培训机构,公司人员都开始学习和二次创作进而分享。 (file.path(d,gmtfile)) egmt <- GSEA(geneList, TERM2GENE=geneset, verbose=FALSE) head(egmt) 如果是GSVA ,就: library(GSVA) # BiocManager::install('GSVA') geneset <- getGmt(file.path(d,gmtfile))

    4.2K20发布于 2019-12-23
  • 来自专栏生信补给站

    scRNA分析|单细胞GSVA + limma差异分析-celltype分组?样本分组?

    此外还可以进行GSVA分析,基因集变异分析即GSVA(Gene set variation analysis), 是一种非参数、无监督的分析方法,可以分析 不同的目标基因集 在不同样本中的富集程度。 一 载入R包 数据 1, 获取表达矩阵 如果想计算celltype的GSVA结果,可以使用 AverageExpression 函数计算 不同celltype之间的表达量均值矩阵; 如果计算每个细胞的GSVAGSVA分析 1, GSVA分析 数据准备好后,加载GSVA包,一个gsva函数就可以得到GSVA的结果了。 library(GSVA) gsva.kegg <- gsva(expr, gset.idx.list = human_KEGG_Set, kcdf="Gaussian", <- gsva(expr2, gset.idx.list = keggSet, kcdf="Gaussian",method = "gsva", parallel.sz=1)

    2.8K51编辑于 2023-08-25
  • 来自专栏单细胞

    Nature系列|免疫浸润分析使用ssGSEA、GSVA都可以吗

    获取KEGG通路的基因列表 做单细胞GSEA、GSVA分析(代码版)获取msigdb所有通路或者特定通路、基因代码(代码版)Msigdb如何查找特定基因集合(网页版)富集分析必看:GSVA 的思路与用法 method="gsva"):队列型研究,需比较组间差异、做下游统计建模你关心中等表达的稳定趋势,希望分数对跨样本比较更平滑折中:用 GSVA::gsva() 同一接口里跑 method="ssgsea " 或 "gsva",两者都算一遍,选择更稳定/更符合生物学的。 空间转录组:对 spot 做 ssGSEA/GSVA 后,用组织学区域或细胞解卷积结果交叉验证。 /inst/doc/GSVA.html#:~:text=Gene%20set%20variation%20analysis%20,wise

    46810编辑于 2025-11-01
领券