首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生物信息云

    单细胞专题 | 7.单细胞下游分析——常规分析流程案例一

    单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入 ---- 1. NormalizeData(sce, normalization.method = "LogNormalize", scale.factor = 10000) 7. #判断最终选取的主成分数,这里我判断16个 P7 <- ElbowPlot(sce) # 鉴定数据集的可用维度,虚线以上的为可用维度 sce <- JackStraw(object = sce, num.replicate 100) sce <- ScoreJackStraw(object = sce, dims = 1:20) P8 <- JackStrawPlot(object = sce, dims = 1:18) P7

    6.6K25编辑于 2022-12-16
  • 来自专栏数据科学(冷冻工厂)

    R中单细胞RNA-seq分析教程 (7)

    引言 本系列开启R中单细胞RNA-seq数据分析教程[1],持续更新,欢迎关注,转发! 2.3. LIGAR 通过集成非负矩阵分解来识别共享和数据集特定的因素,以进行联合分析。该方法的详细数学原理可以在 论文 中找到。 使用 MNN 进行数据整合 MNN,由 EMBL-EBI 的 John Marioni 实验室开发,是最早为单细胞 RNA 测序数据整合或批次校正开发的算法之一。 进行这种分析时,首先需要一个优质的参考数据集。 分析结果作为一种降维表示,会保存在 Seurat 对象中(默认名称为 "rss")。之后,可以利用这种降维表示进行 tSNE/UMAP 可视化和聚类分析等。

    46300编辑于 2025-01-02
  • 来自专栏单细胞天地

    单细胞分析十八般武艺7:CellChat

    单细胞测序技术的发展日新月异,新的分析工具也层出不穷。每个工具都有它的优势与不足,在没有权威工具和流程的单细胞生信江湖里,多掌握几种分析方法和工具,探索数据时常常会有意想不到的惊喜。 往期回顾 单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony 单细胞分析十八般武艺2:LIGER 单细胞分析十八般武艺3:fastMNN 单细胞分析十八般武艺4:velocyto 单细胞分析十八般武艺 5:monocle3 单细胞分析十八般武艺6:NicheNet CellChat简介 CellChat的特点 全面的数据:大多数的细胞通讯分析方法通常只考虑配体/受体基因对,往往忽略了多亚基复合物受体和其他信号辅助因子 ,我们继续使用《单细胞分析十八般武艺6:NicheNet》的数据。 往期回顾 Barcoding || 海量单细胞的关键技术 单细胞转录组下游分析是否有必要删除线粒体和核糖体基因 细胞亚群注释神器SingleR把它的参考数据库放在了celldex包 ---- --

    4.8K43发布于 2021-04-29
  • 来自专栏单细胞天地

    OSCA单细胞数据分析笔记7—Feature selection

    4.1 仅保留高变基因信息(不建议) 4.2 标记高变基因,降维设置subset.row=参数(建议) 5、补充:关于“技术误差”的进一步分解 ---- 1、背景知识 1.1 为什么要挑选特定的基因 单细胞数据分析的主要在于考虑细胞

    2.2K41发布于 2021-05-18
  • 来自专栏文献分享及代码学习

    单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析7

    单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1:https://cloud.tencent.com/developer/article/2055573单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析 2:https://cloud.tencent.com/developer/article/2072069单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析3:https://cloud.tencent.com /developer/article/2078159单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析4:https://cloud.tencent.com/developer/article/2078348 单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析5:https://cloud.tencent.com/developer/article/2084580单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析 = c("3533EL","3571DL","36186L","36639L", "366C5L","37EACL","38FE7L

    1.4K50编辑于 2022-08-29
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:整合

    对干扰素的应激导致细胞类型特异性基因表达发生变化,这使得对所有数据的联合分析变得困难。 在这里,我们展示了我们的整合策略,如 Stuart 和 Butler 等人,2018 年 所述,执行整合分析以促进常见细胞类型的识别并进行比较分析。 整体分析现在我们可以对所有细胞进行一个综合分析! 例如,我们可以计算簇 7(NK 细胞)中无论条件如何,都是保守的标记基因。 刺激 CD14 单核细胞后 CD14 表达降低,这可能导致监督分析框架中发生错误分类,强调了整合分析的价值。

    90910编辑于 2023-01-19
  • 来自专栏单细胞天地

    单细胞分析工具--Palantir轨迹分析

    Palantir/blob/master/notebooks/Palantir_sample_notebook.ipynb Palantir是一个2019年在nature biotechnology提出的用于单细胞数据轨迹推断的 unzip Palantir-master cd Palantir-master pip install . 2)示例数据 需要准备.h5ad的单细胞数据(count表达矩阵)格式,官方提供示例数据可直接下载 amazonaws.com/palantir/marrow_sample_scseq_counts.h5ad Seurat对象转为h5ad格式,参考笔记:https://www.jianshu.com/p/5b26d7bc37b7 pd.DataFrame(ad.obsm['X_umap'], index=ad.obs_names) # umap可视化 sc.pl.embedding(ad, basis='umap') 3、轨迹推断分析

    2.7K20编辑于 2023-02-16
  • 来自专栏生信喵实验柴

    单细胞分析环境搭建

    一、安装软件 1.1 Cell Ranger 下载安装(需注册) Cell Ranger 是 10X genomics 官网提供的单细胞数据分析软件。 可以直接输入 Illumina 原始数据 BCL 或 FASTQ 格式,Cell Ranger 集成了 10 x genomics 单细胞数据分析的一整套流程模块,可以直接进行碱基识别,文库拆分、细胞拆分 、输出表达定量矩阵、降维(pca),聚类以及可视化,配合另一套 Loupe Browser 软件,可以非常简单的探索单细胞数据。 ,输入文件为 Cell Ranger分析之后生成的.cLoupe 文件即可直接使用。 .version%7D 基因组下载,版本 References - 2020-A (July 7, 2020) #人基因组 wget https://cf.10xgenomics.com/supp/cell-exp

    80210编辑于 2022-10-25
  • 来自专栏生物信息学、python、R、linux

    scanpy分析单细胞数据

    scanpy和seurat是最常用的分析单细胞的工具,seurat基于R,而scanpy基于python。 =sc.read_10x_mtx('data/filtered_gene_bc_matrices/hg19', var_names='gene_symbols', cache=True) #读取单细胞测序文件 sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt']) sc.pp.scale(adata, max_value=10) PCA主成分分析 使用标准化的数据进行可视化 sc.pl.umap(adata, color=['CST3', 'NKG7', 'PPBP'], use_raw=False) ? leidenalg #或 pip3 install leidenalg sc.tl.leiden(adata) sc.pl.umap(adata, color=['leiden', 'CST3', 'NKG7'

    2.4K20发布于 2020-12-21
  • 来自专栏天意生信俱乐部

    单细胞数据分析 | 单细胞计数矩阵(Seurat)

    在使用seurat进行单细胞分析的时候,大多数的教程都是用计数矩阵作为数据输入,但是我发现一些新手朋友对于不同数据库来源(GEO、BD)的数据或者想要去复现、借鉴一个感兴趣的文章中的下机数据时,不知道怎么把数据处理成 Seurat可以读入的计数矩阵,所以本篇文章就详细介绍单细胞数据的上游分析。 “Software Analysis”的界面提供了3种工具: Cell Ranger:比对质控需要用到的软件 Cloud Analysis:在线云分析软件,提供fastq文件即可分析 Loupe Browser 以下是读取GEO数据的几种常见方式,特别是如何将其导入Seurat进行分析。 1. 总的来说,大家获取数据的方式有两种,根据自己的研究目标、预算以及时间来决定是使用自己的测序数据还是依赖于公共数据库中的数据,无论哪种方式,弄懂上游分析对于下游分析有益无害哦~

    86510编辑于 2025-02-18
  • 来自专栏天意生信俱乐部

    单细胞数据分析|差异表达分析

    在对单细胞数据进行差异表达分析的时候,可以从全细胞和元细胞两个角度去考虑。 基于全细胞目前常见的单细胞转录组计算差异表达基因方法有DESeq2、edgeR、limma、MAST、SCDE (Single Cell Differential Expression)、Seurat 所有步骤旨在优化数据质量、减少噪声并提取重要的基因特征,为后续的分析(如聚类和差异表达分析)做准备。最终,处理后的数据存储在 adata 对象中。 使用SEACells聚合细胞,然后在元细胞水平上,执行差异表达分析。 总结: 本节我们选择元细胞作为分析策略避免生物学噪音和dropout的干扰。

    88110编辑于 2025-01-22
  • 来自专栏R语言数据分析

    单细胞数据分析3(单细胞数据自动注释)

    67410编辑于 2023-10-15
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:数据整合(九)

    导读 本文将学习跨条件执行单细胞整合,以识别彼此相似的细胞。 1. 目标 跨条件对齐相同的细胞类型。 2. 挑战 对齐相似细胞类型的细胞,这样就不会因为样本、条件、模式或批次之间的差异而在后续分析中进行聚类。 3. 推荐 建议先不整合分析,再决定是否进行整合。 4. 这将使下游的结果更具可解释性(即 DE 分析、配体-受体分析)。在本课中,将介绍跨条件的样本整合,该教程改编自 Seurat v3 Guided Integration Tutorial[1]。 具体来说,这种整合方法期望组中至少一个单细胞子集之间存在“对应”或共享的生物状态。整合分析的步骤如下图所示: 应用的不同步骤如下: 典型相关分析 (CCA): CCA 识别条件/组之间的共享变异源。 split.by 参数添加到DimPlot()函数来做到这一点: # 通过样本分割 UMAP DimPlot(seurat_integrated, split.by = "sample") 7.

    1.2K30编辑于 2023-02-27
  • 来自专栏生物信息学、python、R、linux

    URD包分析单细胞数据

    raw.githubusercontent.com/farrellja/URD/master/URD-Install.R") library(URD) 因为没有找到提供的测试数据集,就用之前用seurat分析过的不同时期的心脏单细胞数据跑一边吧

    2K20发布于 2020-12-29
  • 来自专栏生物信息学、python、R、linux

    单细胞空间转录组分析

    image.png 下面就是跟单细胞一样的流程:降维聚类 brain <- RunPCA(brain, assay = "SCT", verbose = FALSE) brain <- FindNeighbors

    1.2K10发布于 2020-04-01
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:marker鉴定(11)

    我们之前的聚类分析结果如下: 记住,我们在聚类分析中遇到了以下问题: 簇 7 和 20 的细胞类型标识是什么? 对应于相同细胞类型的簇是否具有生物学意义的差异?这些细胞类型是否存在亚群? 特定簇之间的标记识别: 该分析探讨了特定簇之间的差异表达基因。用于确定上述分析中似乎代表相同细胞类型(即具有相似标记)的簇之间基因表达的差异。 5. 计算每个条件的基因水平 p 值,然后使用 MetaDE R 包中的元分析方法跨组组合。 在我们开始我们的标记识别之前,我们将明确设置我们的默认分析,我们想要使用标准化数据,而不是簇数据。 7. 识别每个簇的markers 关于分析的最后一组问题涉及对应于相同细胞类型的簇是否具有生物学意义的差异。有时返回的标记列表不能充分分离某些簇。 我们知道另一个激活标志物是 CD69,而幼或记忆细胞的标志物包括 SELL 和 CCR7 基因。有趣的是,SELL 基因也位居榜首。

    1.2K40编辑于 2023-02-27
  • 来自专栏单细胞天地

    单细胞差异分析方法评测

    ,pseudobulks方法要优于single-cell分析方法,指出现在的很多发表的差异分析方法是错误的,会有太多的假阳性 Our findings suggest that many published 图1:系统性评测 目的就是看差异分析方法能不能得到最接近生物学差异的结果,因此作者使用了真实实验得到的数据,而不是模拟的数据。 它们的逻辑是:先把生物重复的样本整合,形成“pseudobulks”,再进行统计分析,而不是直接进行单个细胞间的比较,这两种逻辑的方法差异还是很明显的(图d)。 那么这里作者想:如果我先不整合,直接对每个细胞进行接下来的统计分析,效果如何呢? 人和小鼠的scRNA数据对比,人的生物学重复波动要更大,因此解决单细胞组织差异性,对于差异分析至关重要

    4.6K41发布于 2021-11-15
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析之质控(四)

    学习目标 知道如何导入和读取数据,并了解数据的质控,能够对数据进行质控和分析。 1. 质控准备 在基因表达定量后,需要将这些数据导入到 R 中,以生成用于执行 QC(质控)。 由于样本是 PBMC,预计包含免疫细胞,例如: B细胞 T细胞 NK细胞 单核细胞 巨噬细胞 巨核细胞(可能) 推荐在质控或分析前,对自己的样本有充分的了解,这对于后续的分析十分有帮助。 3. 倾向于优先分析,但数据管理的许多其他重要方面,往往在第一次看到新数据中被忽视。哈佛大学的生物医学数据管理[4] 很好的讲述了这一过程。 数据管理的一个重要方面是组织。 对于处理和分析数据的每个实验,通过创建计划的存储空间(目录结构)来组织被认为是最佳实践。 通常,检测到的基因少于 100 个的细胞不被考虑用于分析。 当使用 Read10X() 函数读入数据时,Seurat 会自动为每个单元格创建一些元数据。

    1.1K22编辑于 2023-02-27
  • 来自专栏数据科学(冷冻工厂)

    单细胞|Signac 进行 Motif 分析

    引言 本教程将指导您如何在Signac平台上进行DNA序列的基序(Motif)分析。 会介绍两种基序分析的方法:一种是在一组差异可访问的峰值中寻找出现频率较高的基序;另一种是在不同细胞群组间进行基序活性的差异分析。 对于像单细胞染色质可及性测序(scATAC-seq)这样的稀疏数据,通常需要在 FindMarkers() 函数中调低 min.pct 的阈值,因为默认值(0.1)是针对单细胞 RNA 测序(scRNA-seq MotifPlot( object = mouse_brain, motifs = head(rownames(enriched.motifs)) ) Mef 家族的基序,尤其是 Mef2c,在单细胞染色质可及性测序 计算基序活性 还可以通过执行 chromVAR 分析来为每个细胞计算基序活性得分。这不仅使能够按细胞查看基序活性,还为提供了一种识别不同细胞类型中活性差异基序的新方法。

    32710编辑于 2024-12-30
  • 来自专栏生物信息学、python、R、linux

    SCmut||分析单细胞数据突变

    单细胞RNA测序(scRNA-seq)和DNA测序(scDNA-seq)都可以应用于细胞水平基因组分析。对于突变分析,scDNA-seq似乎更常见。

    1.2K10发布于 2020-09-03
领券