背景介绍 单细胞数据分析在近几年一直是个热点,今天小编为大家带来的这篇文章,作者通过非负矩阵分解 (NMF) 分析了来自 33 个 CRC 肿瘤样本的单细胞 RNA-seq 数据的总共 65,362 个单细胞 03 m6A介导的巨噬细胞分析 本研究从骨髓细胞中提取了总共 5822 个巨噬细胞,并分为肿瘤相关巨噬细胞(5586 个细胞)和正常巨噬细胞(236 个),获得了五个主要的 m6A-mac 集群,包括四个具有 网络调控分析显示,在这些m6A T细胞簇中,TFs的表达存在显著差异(图4D)。 然后,根据 m6A 介导的 TME 细胞的所有 DEG,本研究使用 GSVA 计算 m6A 子评分,并通过对来自8个和11个CRC队列的1892和2315例CRC患者的OS和RFS进行meta分析,探讨它们在 图 6 小编总结 本研究首次通过单细胞测序分析方法,鉴定了TME细胞特异性RNA m6A修饰的细胞亚型,揭示了m6A甲基化介导的肿瘤微环境细胞间通讯在调控肿瘤生长和抗肿瘤免疫调节过程中的作用。
http://bioconductor.org/books/release/OSCA/overview.html 标准化是在剔除不合格细胞之后,尽可能消除细胞文库间大小的差异性,从而得到准确、有意义的分析结果 而取log之后的减法即为除法,可以表示log FoldChange 由于单细胞测序结果的稀疏性,很多基因的表达值为0,无法取log。 无论是例2,还是例3,在经过标准化之后的差异分析结果就是基因1真实相对上调;基因2-99表面相对下调,其实本质为non-DEG。 (3) 从对之后的分析影响来看,作者认为composition bias对于单细胞之后的聚类分群、Top marker gene结影响不会很大。但如果想进行单基因水平的分析,还是最好消除这种误差。 对于单细胞测序结果来说,因为表达矩阵的稀疏性,上述的函数方法不太适合。可以设置calculateSumFactors()函数的cluster参数。
引言 本系列开启R中单细胞RNA-seq数据分析教程[1],持续更新,欢迎关注,转发! 简介 现在,很少有人只进行一次单细胞RNA测序实验并仅产生一份数据。 原因很直接:目前的单细胞RNA测序技术每次只能捕捉到有限样本的分子状态。为了在多个实验和不同条件下对众多样本进行测量,通常需要对来自不同实验的单细胞RNA测序数据进行联合分析。 ,以及一些计算方法,比如demuxlet 和scSplit,能够在一定程度上将多个样本合并进行单细胞RNA测序库的构建和测序,但像组织分离这样的步骤仍然需要针对不同样本单独进行。 因此,建议在进行其他分析,例如识别聚类标记和进行可视化时,改用未经校正的表达值,方法是将DefaultAssay 切换回RNA。 它就像校正后的 PCA,因此应该明确告诉 Seurat 在后续分析中使用harmony 校正,包括制作 UMAP 嵌入和识别细胞聚类。
单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 ---- 1.数据读入 Cell Ranger生成的主要表格文件主要包括 使用CreateSeuratObject生成Seurat对象,后续分析都是在该对象上进行操作。 y = c(sceList[[2]],sceList[[3]],sceList[[4]], sceList[[5]],sceList[[6] y = c(sceList[[2]],sceList[[3]],sceList[[4]], sceList[[5]],sceList[[6]
单细胞测序技术的发展日新月异,新的分析工具也层出不穷。每个工具都有它的优势与不足,在没有权威工具和流程的单细胞生信江湖里,多掌握几种分析方法和工具,探索数据时常常会有意想不到的惊喜。 往期专题 单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony 单细胞分析十八般武艺2:LIGER 单细胞分析十八般武艺3:fastMNN 单细胞分析十八般武艺4:velocyto 单细胞分析十八般武艺 library(devtools) install_github("saeyslab/nichenetr") NicheNet分析实践 数据来源 本文的分析数据和代码来自NicheNet官方分析单细胞数据的教程 = nichenet_output$ligand_target_heatmap ggsave("Heatmap_ligand-target.png", p, width = 12, height = 6) 往期回顾 OSCA单细胞数据分析笔记-5 Quality control clustree—聚类可视化利器 肺的正常上皮细胞可以分成这5群 ---- ---- ---- 如果你对单细胞转录组研究感兴趣
背景介绍 单细胞研究一直是近些年的热点,今天小编为大家带来的这篇文章,作者通过单细胞与转录组数据,基于恶性细胞标志物的表达构建了胃腺癌 (STAD) 患者生存不良的多基因风险评分 (PRS)。 单细胞数据:GSE134520。 、AADAC、NPC2、COL10A1、PRKCSH、RAMP1、PRR15L、TUBA1A、CXCR6 和 UPP1)[图 4A]。 在数据集 GSE84437(图 6A)、GSE6229(图 6B)和 GSE26942(图 6C)中,高风险组患者的 OS 短于低风险组患者。 基于对组织和单细胞表达数据的综合分析,提出了一种基于恶性细胞亚群标记的 PRS,可以识别出存活率低的 STAD 患者。
单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1:https://cloud.tencent.com/developer/article/2055573单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析 2:https://cloud.tencent.com/developer/article/2072069单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析3:https://cloud.tencent.com /developer/article/2078159单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析4:https://cloud.tencent.com/developer/article/2078348 单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析5:https://cloud.tencent.com/developer/article/2084580图片代码解析# Part 4: SingleR 感觉作者提供的这些单细胞的数据的代码有些冗余,其实不用这么多的代码就可以解决上面的问题。
对干扰素的应激导致细胞类型特异性基因表达发生变化,这使得对所有数据的联合分析变得困难。 在这里,我们展示了我们的整合策略,如 Stuart 和 Butler 等人,2018 年 所述,执行整合分析以促进常见细胞类型的识别并进行比较分析。 目的以下教程旨在为您概述使用 Seurat 整合后对复杂细胞类型进行的各种比较分析。 整体分析现在我们可以对所有细胞进行一个综合分析! 刺激 CD14 单核细胞后 CD14 表达降低,这可能导致监督分析框架中发生错误分类,强调了整合分析的价值。
Palantir/blob/master/notebooks/Palantir_sample_notebook.ipynb Palantir是一个2019年在nature biotechnology提出的用于单细胞数据轨迹推断的 unzip Palantir-master cd Palantir-master pip install . 2)示例数据 需要准备.h5ad的单细胞数据(count表达矩阵)格式,官方提供示例数据可直接下载 pd.DataFrame(ad.obsm['X_umap'], index=ad.obs_names) # umap可视化 sc.pl.embedding(ad, basis='umap') 3、轨迹推断分析
一、安装软件 1.1 Cell Ranger 下载安装(需注册) Cell Ranger 是 10X genomics 官网提供的单细胞数据分析软件。 可以直接输入 Illumina 原始数据 BCL 或 FASTQ 格式,Cell Ranger 集成了 10 x genomics 单细胞数据分析的一整套流程模块,可以直接进行碱基识别,文库拆分、细胞拆分 、输出表达定量矩阵、降维(pca),聚类以及可视化,配合另一套 Loupe Browser 软件,可以非常简单的探索单细胞数据。 ,输入文件为 Cell Ranger分析之后生成的.cLoupe 文件即可直接使用。 r-seurat mamba create -n umi_tools -y umi_tools 二、下载参考序列 10x genomics 官网提供了人和小鼠的参考基因组可以直接用于 cellranger 分析
scanpy和seurat是最常用的分析的单细胞的工具,seurat基于R,而scanpy基于python。 =sc.read_10x_mtx('data/filtered_gene_bc_matrices/hg19', var_names='gene_symbols', cache=True) #读取单细胞测序文件 sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt']) sc.pp.scale(adata, max_value=10) PCA主成分分析
在使用seurat进行单细胞分析的时候,大多数的教程都是用计数矩阵作为数据输入,但是我发现一些新手朋友对于不同数据库来源(GEO、BD)的数据或者想要去复现、借鉴一个感兴趣的文章中的下机数据时,不知道怎么把数据处理成 Seurat可以读入的计数矩阵,所以本篇文章就详细介绍单细胞数据的上游分析。 Expires=1712352870&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=lAp0t6wo-oNLmAhcfNGu6Nqie6OOcWcWoZWx9Lj2JxE8Gj1Do8p2rVYH Expires=1712352870&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=lAp0t6wo-oNLmAhcfNGu6Nqie6OOcWcWoZWx9Lj2JxE8Gj1Do8p2rVYH 总的来说,大家获取数据的方式有两种,根据自己的研究目标、预算以及时间来决定是使用自己的测序数据还是依赖于公共数据库中的数据,无论哪种方式,弄懂上游分析对于下游分析有益无害哦~
单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入 ---- 1. ###============1、准备原始分析数据 fs = list.files('. <- FeatureScatter(sce.all.filt1, feature1 = "nCount_RNA", feature2 = "nFeature_RNA") plot1 + plot2 6. 数据标准化 基因的表达矩阵需要经过标准化后才能进行后续的分析。
在对单细胞数据进行差异表达分析的时候,可以从全细胞和元细胞两个角度去考虑。 基于全细胞目前常见的单细胞转录组计算差异表达基因方法有DESeq2、edgeR、limma、MAST、SCDE (Single Cell Differential Expression)、Seurat 所有步骤旨在优化数据质量、减少噪声并提取重要的基因特征,为后续的分析(如聚类和差异表达分析)做准备。最终,处理后的数据存储在 adata 对象中。 使用SEACells聚合细胞,然后在元细胞水平上,执行差异表达分析。 总结: 本节我们选择元细胞作为分析策略避免生物学噪音和dropout的干扰。
导读 本文将学习跨条件执行单细胞整合,以识别彼此相似的细胞。 1. 目标 跨条件对齐相同的细胞类型。 2. 挑战 对齐相似细胞类型的细胞,这样就不会因为样本、条件、模式或批次之间的差异而在后续分析中进行聚类。 3. 推荐 建议先不整合分析,再决定是否进行整合。 4. 这将使下游的结果更具可解释性(即 DE 分析、配体-受体分析)。在本课中,将介绍跨条件的样本整合,该教程改编自 Seurat v3 Guided Integration Tutorial[1]。 具体来说,这种整合方法期望组中至少一个单细胞子集之间存在“对应”或共享的生物状态。整合分析的步骤如下图所示: 应用的不同步骤如下: 典型相关分析 (CCA): CCA 识别条件/组之间的共享变异源。 IntegrateData(anchorset = integ_anchors, normalization.method = "SCT") 6.
raw.githubusercontent.com/farrellja/URD/master/URD-Install.R") library(URD) 因为没有找到提供的测试数据集,就用之前用seurat分析过的不同时期的心脏单细胞数据跑一边吧
非负矩阵分解是一种用于分析高维数据的方法,它可以从一组非负数据向量中提取稀疏且有意义的特征。 该方法非常适合分解单细胞RNA测序数据,有效地将大型的复杂矩阵(基因数量乘以细胞数量)分解为几个可解释的基因程序。 非负矩阵相关内容请参阅既往推文:单细胞非负矩阵分解分析python版(cNMF)学习:https://mp.weixin.qq.com/s/aTIR8eJHhXFiQZBvO72fOw转录组非负矩阵分解 geneNMF分析流程1.导入rm(list = ls())library(GeneNMF)library(Seurat)library(ggplot2)library(UCell)library(patchwork ,FSTL1,LUM# 6: DCN,GPX3,IGFBP6,LUM,MMP26.基因program的siganture分数library(UCell)mp.genes
image.png 下面就是跟单细胞一样的流程:降维聚类 brain <- RunPCA(brain, assay = "SCT", verbose = FALSE) brain <- FindNeighbors
,pseudobulks方法要优于single-cell分析方法,指出现在的很多发表的差异分析方法是错误的,会有太多的假阳性 Our findings suggest that many published 图1:系统性评测 目的就是看差异分析方法能不能得到最接近生物学差异的结果,因此作者使用了真实实验得到的数据,而不是模拟的数据。 为了比较每个方法对bulk、scRNA处理的一致性,测定了area under the concordance curve (AUCC) ,其中前6个(也就是常见的edgeR、DESeq2、limma) 那么这里作者想:如果我先不整合,直接对每个细胞进行接下来的统计分析,效果如何呢? 人和小鼠的scRNA数据对比,人的生物学重复波动要更大,因此解决单细胞组织差异性,对于差异分析至关重要