首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏单细胞天地

    OSCA单细胞数据分析笔记6—Normalization

    http://bioconductor.org/books/release/OSCA/overview.html 标准化是在剔除不合格细胞之后,尽可能消除细胞文库间大小的差异性,从而得到准确、有意义的分析结果 而取log之后的减法即为除法,可以表示log FoldChange 由于单细胞测序结果的稀疏性,很多基因的表达值为0,无法取log。 无论是例2,还是例3,在经过标准化之后的差异分析结果就是基因1真实相对上调;基因2-99表面相对下调,其实本质为non-DEG。 (3) 从对之后的分析影响来看,作者认为composition bias对于单细胞之后的聚类分群、Top marker gene结影响不会很大。但如果想进行单基因水平的分析,还是最好消除这种误差。 (4) 如何最大化避免composition bias 对于传统的Bulk RNA-seq数据,DESeq2包的estimateSizeFactorsFromMatrix()函数、edgeR包的calcNormFactors

    1.7K41发布于 2021-04-29
  • 来自专栏生物信息云

    单细胞专题 | 6.单细胞下游分析——不同类型的数据读入

    单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 ---- 1.数据读入 Cell Ranger生成的主要表格文件主要包括 使用CreateSeuratObject生成Seurat对象,后续分析都是在该对象上进行操作。 y = c(sceList[[2]],sceList[[3]],sceList[[4]], sceList[[5]],sceList[[6] 我们后面的大量分析包括对数据的降维、聚类分群、注释、等都是可以写入到Seurat对象来保存。 ----

    4.6K41编辑于 2022-12-16
  • 来自专栏生物信息学、python、R、linux

    scanpy分析单细胞数据

    scanpy和seurat是最常用的分析单细胞的工具,seurat基于R,而scanpy基于python。 linux下用pip安装scanpy pip install scanpy 下载测试数据 mkdir data wget http://cf.10xgenomics.com/samples/cell-exp =sc.read_10x_mtx('data/filtered_gene_bc_matrices/hg19', var_names='gene_symbols', cache=True) #读取单细胞测序文件 sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt']) sc.pp.scale(adata, max_value=10) PCA主成分分析 使用标准化的数据进行可视化 sc.pl.umap(adata, color=['CST3', 'NKG7', 'PPBP'], use_raw=False) ?

    2.4K20发布于 2020-12-21
  • 来自专栏R语言数据分析

    单细胞数据分析3(单细胞数据自动注释)

    使用GSE218208数据为例library(celldex)#使用celldex包里的注释数据#下载到本地library(SingleR)ls("package:celldex")f = ".. file.exists(f)){ ref <- celldex::BlueprintEncodeData() save(ref,file = f)}ref <- get(load(f))#把里面的数据提取出来生成新的数据

    67510编辑于 2023-10-15
  • 来自专栏作图丫

    单细胞+m6A相关分析~

    背景介绍 单细胞数据分析在近几年一直是个热点,今天小编为大家带来的这篇文章,作者通过非负矩阵分解 (NMF) 分析了来自 33 个 CRC 肿瘤样本的单细胞 RNA-seq 数据的总共 65,362 个单细胞 数据介绍 本研究从SMC 数据集中收集了 23 名 CRC 患者的65,362 个 scRNA-seq 数据集的基因表达和表型矩阵。 结果显示来自 SMC 数据集的 CRC 中六种细胞类型的 m6A 调节因子的表达确实不同(图 1E)。 网络调控分析显示,在这些m6A T细胞簇中,TFs的表达存在显著差异(图4D)。 图 6 小编总结 本研究首次通过单细胞测序分析方法,鉴定了TME细胞特异性RNA m6A修饰的细胞亚型,揭示了m6A甲基化介导的肿瘤微环境细胞间通讯在调控肿瘤生长和抗肿瘤免疫调节过程中的作用。

    53720编辑于 2022-12-04
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析数据整合(九)

    导读 本文将学习跨条件执行单细胞整合,以识别彼此相似的细胞。 1. 目标 跨条件对齐相同的细胞类型。 2. 想要识别存在于数据集中所有的细胞类型,因此希望观察每个簇中两个样本/条件/模态中的细胞表示。这将使下游的结果更具可解释性(即 DE 分析、配体-受体分析)。 如果细胞按样本、条件、批次、数据集、模态进行聚类,则整合步骤可以极大地改善聚类和下游分析。 具体来说,这种整合方法期望组中至少一个单细胞子集之间存在“对应”或共享的生物状态。整合分析的步骤如下图所示: 应用的不同步骤如下: 典型相关分析 (CCA): CCA 识别条件/组之间的共享变异源。 执行相互分析,如果两个细胞在两个方向上都是best buddies,那么这些细胞将被标记为anchors,以将两个数据集“锚定”在一起。

    1.2K30编辑于 2023-02-27
  • 来自专栏生物信息学、python、R、linux

    URD包分析单细胞数据

    source("https://raw.githubusercontent.com/farrellja/URD/master/URD-Install.R") library(URD) 因为没有找到提供的测试数据集 ,就用之前用seurat分析过的不同时期的心脏单细胞数据跑一边吧。 1.导入数据 library(URD) # Create an URD object, which will filter the data, then normalize and log-transform

    2K20发布于 2020-12-29
  • 来自专栏天意生信俱乐部

    单细胞数据分析 | 单细胞计数矩阵(Seurat)

    在使用seurat进行单细胞分析的时候,大多数的教程都是用计数矩阵作为数据输入,但是我发现一些新手朋友对于不同数据库来源(GEO、BD)的数据或者想要去复现、借鉴一个感兴趣的文章中的下机数据时,不知道怎么把数据处理成 Seurat可以读入的计数矩阵,所以本篇文章就详细介绍单细胞数据的上游分析。 10X平台数据 上游分析主要涉及的步骤就两个:比对和质控。我们可以先从10X平台官网了解一些软件和方法。 以下是读取GEO数据的几种常见方式,特别是如何将其导入Seurat进行分析。 1. 总的来说,大家获取数据的方式有两种,根据自己的研究目标、预算以及时间来决定是使用自己的测序数据还是依赖于公共数据库中的数据,无论哪种方式,弄懂上游分析对于下游分析有益无害哦~

    86510编辑于 2025-02-18
  • 来自专栏生物信息学、python、R、linux

    SCmut||分析单细胞数据突变

    单细胞RNA测序(scRNA-seq)和DNA测序(scDNA-seq)都可以应用于细胞水平基因组分析。对于突变分析,scDNA-seq似乎更常见。 scRNA-seq通常具有更大的数据量和更好的数据质量。但目前DNA测序中检测突变的方法多种多样,尚不清楚这些方法是否可以用于scRNA-seq数据。 对Bulk RNAseq或scDNA-seq数据开发的突变检测方法不适用于scRNA-seq数据,因为它们会产生过多的假阳性。 他们将SCmut应用于几个scRNA-seq数据集。在scRNA-seq乳腺癌数据集中,SCmut可以识别许多高度可信的细胞水平突变,这些突变在许多细胞中都反复出现,并且在不同样品中保持一致。 在(i)中,发现的细胞水平突变在肿瘤细胞和非肿瘤细胞之间被很好地分开,在(ii)中,突变被同时在两个独立的数据集中发现。

    1.2K10发布于 2020-09-03
  • 来自专栏生信喵实验柴

    利用cellranger分析单细胞数据

    背景 当前的单细胞测序主要采用 illumina 测序平台进行测序,一般为双末端测序,测序完成之后首先需要对 illumina 测序数据进行质控过滤,过滤条件与其他分析类似。 单细胞分析流程 单细胞数据处理主要包括 illumina 数据碱基识别,数据质控过滤,生成 feature-count 矩阵等过程。这些过程都可以使用 cellranger 完成。 4.2 细胞计数质控(cell QC) 细胞计数质控是单细胞数据分析中非常重要的内容。因为 10xgenomics 是采用液滴型的捕获细胞方法。 在单细胞分析中需要将这些多细胞以及空细胞都过滤掉,只对单细胞结果进行分析。那么如何判断是否为单细胞呢? 一个简单的判断是根据 reads 数据的多少,例如空细胞 reads 条数少,单细胞正好,多细胞最多。

    3.4K12编辑于 2022-10-25
  • 来自专栏天意生信俱乐部

    单细胞数据分析|差异表达分析

    在对单细胞数据进行差异表达分析的时候,可以从全细胞和元细胞两个角度去考虑。 基于全细胞目前常见的单细胞转录组计算差异表达基因方法有DESeq2、edgeR、limma、MAST、SCDE (Single Cell Differential Expression)、Seurat 所有步骤旨在优化数据质量、减少噪声并提取重要的基因特征,为后续的分析(如聚类和差异表达分析)做准备。最终,处理后的数据存储在 adata 对象中。 使用SEACells聚合细胞,然后在元细胞水平上,执行差异表达分析。 总结: 本节我们选择元细胞作为分析策略避免生物学噪音和dropout的干扰。

    88110编辑于 2025-01-22
  • 来自专栏R语言数据分析

    单细胞数据分析1

    基础知识单细胞数据的应用方向图片单细胞数据的存放位置图片单细胞数据分析流程图片高变基因:方差最大的2000个基因。marker基因:每个细胞簇中表达显著的基因。 10X的输入数据是固定的三个文件,在工作目录下新建01_data/,把三个文件放进去。 ]@scale.data[30:34,1:3]5.1 线性降维PCApbmc <- RunPCA(pbmc, features = VariableFeatures(pbmc))##只选择了高变化基因分析 dims = 1:2, reduction = "pca")#每个主成分对应基因的热图DimHeatmap(pbmc, dims = 1:15, cells = 500)# 应该选多少个主成分进行后续分析 RunUMAP(pbmc, dims = 1:10)DimPlot(pbmc, reduction = "umap")#DimPlot(pbmc, reduction = "umap",label=T)6.

    94920编辑于 2023-10-15
  • 来自专栏数据科学(冷冻工厂)

    R中单细胞RNA-seq分析教程 (6)

    引言 本系列开启R中单细胞RNA-seq数据分析教程[1],持续更新,欢迎关注,转发! 简介 现在,很少有人只进行一次单细胞RNA测序实验并仅产生一份数据。 原因很直接:目前的单细胞RNA测序技术每次只能捕捉到有限样本的分子状态。为了在多个实验和不同条件下对众多样本进行测量,通常需要对来自不同实验的单细胞RNA测序数据进行联合分析。 因此,与处理常规RNA-seq数据一样,批次效应往往是需要解决的关键干扰因素。 在本教程将介绍几种单细胞RNA测序数据整合的方法。需要记住的是,目前还没有一种整合方法能够适用于所有情况。 使用Seurat进行数据整合 Seurat内置了数据整合流程。简单来说,它首先对需要整合的数据集执行典型相关分析(CCA),独立旋转它们以最大化两数据集之间的协方差。 值得一提的是,Seurat 还提供了另一种整合分析策略,即数据转移。当存在一个已注释的参考数据集,并且想要使用参考数据来辅助新查询数据的细胞类型/状态注释时,就会使用到它。

    56810编辑于 2024-12-30
  • 来自专栏单细胞天地

    单细胞分析十八般武艺6:NicheNet

    单细胞测序技术的发展日新月异,新的分析工具也层出不穷。每个工具都有它的优势与不足,在没有权威工具和流程的单细胞生信江湖里,多掌握几种分析方法和工具,探索数据时常常会有意想不到的惊喜。 往期专题 单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony 单细胞分析十八般武艺2:LIGER 单细胞分析十八般武艺3:fastMNN 单细胞分析十八般武艺4:velocyto 单细胞分析十八般武艺 5:monocle3 NicheNet简介 分析原理 大多数细胞通讯的分析方法主要依据公共数据库的配体-受体配对关系,以及配体、受体在细胞亚群的表达情况来推断细胞之间发生了哪些通讯关系,但是配体-受体相互作用如何导致受体细胞内下游靶基因表达变化的分析则很少有方法涉及 library(devtools) install_github("saeyslab/nichenetr") NicheNet分析实践 数据来源 本文的分析数据和代码来自NicheNet官方分析单细胞数据的教程 往期回顾 OSCA单细胞数据分析笔记-5 Quality control clustree—聚类可视化利器 肺的正常上皮细胞可以分成这5群 ---- ---- ---- 如果你对单细胞转录组研究感兴趣

    11K31发布于 2021-04-29
  • 来自专栏生物信息学、python、R、linux

    cellranger分析单细胞测序数据

    一般从公司拿到单细胞测序原始数据是这样的: ? image.png 因此第一步就需要把这些数据按照I1 R1 R2 用zcat追加起来 for i in `ls rawdata/Day1/*gz|cut -d '/' -f3 | cut -d '_' zcat rawdata/Day1/${i}_R2_001.fastq.gz >> mergedata/Day1/Day1_S1_L001_R2_001.fastq done cellranger的数据输入为存储数据的文件夹 cellranger count --id=Day1 \ #fastq文件目录 --fastqs=fastq/ \ #注释文件 --transcriptome=cellranger_rn6 \ --sample =Day1 \ --localcores=10 从cellranger得到表达矩阵就可以导入Seurat分析啦 欢迎关注~

    1.6K30发布于 2020-04-01
  • 来自专栏单细胞天地

    单细胞GSVA分析该用什么数据

    经常有人问我单细胞GSVA分析应该用Seurat对象中的哪个数据,因为我此前的推文《单细胞转录组高级分析五:GSEA与GSVA分析》用的counts数据,后面有一篇推文《非人物种的GSEA&GSVA分析 小结:scale.data数据并不能加快GSVA的运行时间。 分析结果对比 为了客观地对比不同数据运行GSVA之后的差异,我用pearson相关性热图给大家展示。 **从左上到右下的对角线代表相同细胞用不同数据运行GSVA分析后结果的相关性。**为了节省计算时间,我只取了前100个细胞计算相关性。 小结:GSVA分析使用counts数据和data数据没有差别,但是使用scale.data数据会影响结果。 减少基因数量可行吗? 写这篇推文时我突发奇想:使用高变基因来做GSVA分析可行吗? 小结:不能使用高变基因的表达矩阵代替原始表达矩阵做GSVA分析。 交流探讨:如果您阅读此文有所疑惑,或有不同见解,亦或其他单细胞需求,可以点击阅读原文联系。 ?

    4.9K21发布于 2021-03-25
  • 来自专栏生物信息学、python、R、linux

    单细胞数据拟时序分析-destiny

    单细胞数据分析常用到建立trajectory和pseudoTime,拟时序分析可以用 Diffusion( Destiny R package) #Diffusion PseudoTime Analysis image.png 给每个细胞添加注释信息,如这个细胞的类型或者属于的类群 palette(cube_helix(6)) #用cube_helix创建连续的颜色 #palette(hue_pal()(6 image.png detiny的数据输入格式为Biobase包建立的ExpressionSet格式的文件,如果我们的数据是表达矩阵,则数据需要转化成这个格式,如seurat包里面的数据Seurat.object

    4.1K20发布于 2020-04-01
  • 来自专栏用户7627119的专栏

    公开数据单细胞挖掘6+分思路

    4个单细胞RNA-Seq数据集和20个TCGA bulk RNA-Seq数据集中的免疫功能相关基因,使用了无监督聚类区分出主要的免疫功能类型。 Immune Checkpoint Therapies 实体瘤中癌症特异性免疫预后特征及其与免疫检查点治疗的关系 http://mpvideo.qpic.cn/0bf2n4bvuaad3mahbugq6vpvg36dljxqgwqa.f10002 二、 分析流程 三、 结果解读 1.肿瘤scRNA-Seq分析确定具有免疫特征的主要亚群 在单细胞水平上进行肿瘤转录组分析可以准确表征免疫细胞浸润,所以作者首先针对单细胞转录数据进行分析。 包进行单细胞分析,对经过log转换的TPM值(transcript per million)进行t-SNE聚类(图1.a-黑色素瘤的细胞聚类)。 整体研究思路与普通预后分析并无太大区别,只是scRNA-Seq可以更准确地在单细胞水平上表征实体瘤中的免疫浸润。

    71430编辑于 2022-09-21
  • 来自专栏作图丫

    单细胞与转录组结合分析轻松可发6+!

    背景介绍 单细胞研究一直是近些年的热点,今天小编为大家带来的这篇文章,作者通过单细胞与转录组数据,基于恶性细胞标志物的表达构建了胃腺癌 (STAD) 患者生存不良的多基因风险评分 (PRS)。 数据介绍 表达数据:GSE66229, GSE113255, GSE84437, GSE26942。TCGA-STAD数据单细胞数据:GSE134520。 本研究发现,上调基因(图 1D)和下调基因(图 1E)在三个数据集中变化很大。因此,本研究又进行了稳健的秩聚合分析,选择了 50 个稳健的恶性标志物和 50 个稳健的非恶性标志物。 在数据集 GSE84437(图 6A)、GSE6229(图 6B)和 GSE26942(图 6C)中,高风险组患者的 OS 短于低风险组患者。 基于对组织和单细胞表达数据的综合分析,提出了一种基于恶性细胞亚群标记的 PRS,可以识别出存活率低的 STAD 患者。

    67830编辑于 2022-12-04
  • 来自专栏文献分享及代码学习

    单细胞数据复现-肺癌文章代码复现6

    单细胞数据复现-肺癌文章代码复现1https://cloud.tencent.com/developer/article/1992648 单细胞数据复现-肺癌文章代码复现2https://cloud.tencent.com /developer/article/1995619 单细胞数据复现-肺癌文章代码复现3https://cloud.tencent.com/developer/article/1996043 单细胞数据复现 -肺癌文章代码复现4https://cloud.tencent.com/developer/article/2006654 单细胞数据复现-肺癌文章代码复现5https://cloud.tencent.com /developer/article/2008487 前面通过对epi和str的细胞类群进行分析后,确定了更精确的细胞分群,准备在将imm进行分析后,整合三个的结果,进行结果的相关性分析。 "#7294D4", p032 = "#5B1A18", p033 = "#9C964A", p034 = "#FD6467", Alveolar_Macrophages1 = "#6bAEd6

    67520编辑于 2022-05-23
领券