首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏单细胞天地

    OSCA单细胞数据分析笔记9—Clustering

    分群是我们分析scRNA-seq的一个工具,是真正开始结合生物学背景知识的开始。我们可以灵活采用不同的算法、分辨率获得我们“满意”的分群结果。 二、基于图聚类的分群 ? 虽然进行生物水平的可解释性不高,但可实现从所有细胞中,抽取k个有代表性表达情况的细胞的目的,用于某些特定的分析场景。 例如 clusterRows {bluster}提供一种联合图聚类与k-均值聚类的方法,可明显的优势是相对于单纯图聚类大大提高了分析速度。 往期回顾 NC单细胞文章复现(三):复杂热图 scPhere——用地球仪来展示降维结果 2021第一期生信入门微信群答疑精选200题 开机,写bug ---- ---- ---- 如果你对单细胞转录组研究感兴趣 ,但又不知道如何入门,也许你可以关注一下下面的课程 生信爆款入门-2021第4期 数据挖掘(GEO,TCGA,单细胞)2021第4期 明码标价之共享96线程384G内存服务器 ?

    2.7K21发布于 2021-07-02
  • 来自专栏单细胞天地

    单细胞分析十八般武艺9:DoubletFinder

    使用DoubletFinder之类的软件分析doublets。需要注意的是,dedoublets还没有权威方法,这些方法可能会过滤一些真正的单细胞。 DoubletFinder简介 分析原理 依据单细胞表达矩阵建立的低维空间中,表达特征相似的细胞彼此之间距离更近。 需要注意的是DoubletFinder对相同细胞类型构成的doublets不敏感,因为这些细胞在表达特征上与真实的单细胞没有明显的差异。 分析流程 ? DoubletFinder工作流程示意图 实际分析中主要有以下四步: 使用单细胞数据创建seurat对象,并进行数据标准化、降维,最好进行聚类和细胞类型鉴定; 使用BCmvn(均值-方差标准化双峰系数) 对比《单细胞分析十八般武艺8:Garnett》中使用Gernett分类器鉴定的结果(下图),我发现一个有意思的现象:DoubletFinder识别的doublets与Garnett定义为Unknown的类型有一些是重合的

    13.3K68发布于 2021-05-18
  • 来自专栏数据科学(冷冻工厂)

    R中单细胞RNA-seq分析教程 (9)

    引言 本系列开启 R 中单细胞RNA-seq数据分析教程[1],持续更新,欢迎关注,转发! 利用注释好的参考数据集辅助新数据分析 随着全球范围内单细胞RNA测序(scRNA-seq)数据的不断增多,特别是在人类细胞图谱(HCA)项目的推动下,大量注释详尽的图谱级scRNA-seq数据集已公开可用 因此,在分析新的相关数据集时,若不利用这些资源来辅助分析,尤其是帮助注释,将是一种资源浪费。这与之前的情况不同,之前处理的是多个地位平等的数据集整合。 在这里,有一个已经注释好的参考数据集和一个待分析的查询数据集。当然,仍可采用前文提到的相同方法,将参考数据集与查询数据集整合,随后进行参考-查询联合分析或以查询为中心的分析。 seurat_ref, group.by="celltype") plot3 <- FeaturePlot(seurat_ref, c("SOX2","DCX","FOXG1","EMX1","DLX2","LHX9"

    35310编辑于 2025-02-18
  • 来自专栏文献分享及代码学习

    单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析9

    单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析1:https://cloud.tencent.com/developer/article/2055573单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析 2:https://cloud.tencent.com/developer/article/2072069单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析3:https://cloud.tencent.com /developer/article/2078159单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析4:https://cloud.tencent.com/developer/article/2078348 单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析5:https://cloud.tencent.com/developer/article/2084580单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析 6:https://cloud.tencent.com/developer/article/2085385单细胞代码解析-妇科癌症单细胞转录组及染色质可及性分析7:https://cloud.tencent.com

    71320编辑于 2022-08-30
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:整合

    在这里,我们展示了我们的整合策略,如 Stuart 和 Butler 等人,2018 年 所述,执行整合分析以促进常见细胞类型的识别并进行比较分析。 整体分析现在我们可以对所有细胞进行一个综合分析! = c("CD3D", "SELL", "CREM", "CD8A", "GNLY", "CD79A", "FCGR3A", "CCL2", "PPBP"), min.cutoff = "q9" T", `3` = "CD16 Mono", `4` = "B", `5` = "CD8 T", `6` = "T activated", `7` = "NK", `8` = "DC", `9` 刺激 CD14 单核细胞后 CD14 表达降低,这可能导致监督分析框架中发生错误分类,强调了整合分析的价值。

    90910编辑于 2023-01-19
  • 来自专栏生物信息云

    单细胞专题 | 9.如何人工注释单细胞类群?

    单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入 单细胞专题 | 7.单细胞下游分析——常规分析流程案例一 单细胞专题 | 8.单细胞类型注释之SingleR包详解 1.细胞类型的marker基因 单细胞人工注释依赖于marker gene的调查,简单来说,就是收集各种细胞类型的标志物 SingleR包注释的结果和人工审核的结果一起判断,用于后续的分析,这里可以只选择上皮细胞进行后续的分析,因为这个类群是很确定的癌细胞。 实际上我做的大量肿瘤单细胞数据分析项目里面,需要有一些背景知识哦!

    8.7K21编辑于 2022-12-16
  • 来自专栏单细胞天地

    单细胞分析工具--Palantir轨迹分析

    Palantir/blob/master/notebooks/Palantir_sample_notebook.ipynb Palantir是一个2019年在nature biotechnology提出的用于单细胞数据轨迹推断的 unzip Palantir-master cd Palantir-master pip install . 2)示例数据 需要准备.h5ad的单细胞数据(count表达矩阵)格式,官方提供示例数据可直接下载 pd.DataFrame(ad.obsm['X_umap'], index=ad.obs_names) # umap可视化 sc.pl.embedding(ad, basis='umap') 3、轨迹推断分析

    2.7K20编辑于 2023-02-16
  • 来自专栏生信喵实验柴

    单细胞分析环境搭建

    一、安装软件 1.1 Cell Ranger 下载安装(需注册) Cell Ranger 是 10X genomics 官网提供的单细胞数据分析软件。 可以直接输入 Illumina 原始数据 BCL 或 FASTQ 格式,Cell Ranger 集成了 10 x genomics 单细胞数据分析的一整套流程模块,可以直接进行碱基识别,文库拆分、细胞拆分 、输出表达定量矩阵、降维(pca),聚类以及可视化,配合另一套 Loupe Browser 软件,可以非常简单的探索单细胞数据。 ,输入文件为 Cell Ranger分析之后生成的.cLoupe 文件即可直接使用。 r-seurat mamba create -n umi_tools -y umi_tools 二、下载参考序列 10x genomics 官网提供了人和小鼠的参考基因组可以直接用于 cellranger 分析

    80210编辑于 2022-10-25
  • 来自专栏生物信息学、python、R、linux

    scanpy分析单细胞数据

    scanpy和seurat是最常用的分析单细胞的工具,seurat基于R,而scanpy基于python。 =sc.read_10x_mtx('data/filtered_gene_bc_matrices/hg19', var_names='gene_symbols', cache=True) #读取单细胞测序文件 sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt']) sc.pp.scale(adata, max_value=10) PCA主成分分析

    2.4K20发布于 2020-12-21
  • 来自专栏文献分享及代码学习

    单细胞数据复现-肺癌文章代码复现9

    单细胞数据复现-肺癌文章代码复现1https://cloud.tencent.com/developer/article/1992648单细胞数据复现-肺癌文章代码复现2https://cloud.tencent.com /developer/article/1995619单细胞数据复现-肺癌文章代码复现3https://cloud.tencent.com/developer/article/1996043单细胞数据复现 /developer/article/2008487单细胞数据复现-肺癌文章代码复现6https://cloud.tencent.com/developer/article/2008704单细胞数据复现 /results", width = 10, height = 9, units = "cm")图片就感觉原代码可视化出来的这几个图好丑,应该是要改参数,但是我们的重点不是分析可以进行吗,我就没改,如果友友觉得需要可视化的很漂亮 因此对上面的一系列的流程结果进行总结,可以发现是首先流程性的分析,然后开始对注释后的亚群进行了精细的分析,将不同的细胞类群叶放到脚本里面进行分析

    1.1K40编辑于 2022-07-11
  • 来自专栏天意生信俱乐部

    单细胞数据分析 | 单细胞计数矩阵(Seurat)

    在使用seurat进行单细胞分析的时候,大多数的教程都是用计数矩阵作为数据输入,但是我发现一些新手朋友对于不同数据库来源(GEO、BD)的数据或者想要去复现、借鉴一个感兴趣的文章中的下机数据时,不知道怎么把数据处理成 Seurat可以读入的计数矩阵,所以本篇文章就详细介绍单细胞数据的上游分析。 “Software Analysis”的界面提供了3种工具: Cell Ranger:比对质控需要用到的软件 Cloud Analysis:在线云分析软件,提供fastq文件即可分析 Loupe Browser 以下是读取GEO数据的几种常见方式,特别是如何将其导入Seurat进行分析。 1. 总的来说,大家获取数据的方式有两种,根据自己的研究目标、预算以及时间来决定是使用自己的测序数据还是依赖于公共数据库中的数据,无论哪种方式,弄懂上游分析对于下游分析有益无害哦~

    86510编辑于 2025-02-18
  • 来自专栏生物信息云

    单细胞专题 | 7.单细胞下游分析——常规分析流程案例一

    单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入 ---- 1. 9.降维聚类 sce <- RunPCA(object = sce, pc.genes = VariableFeatures(sce)) P5 <- DimPlot(object = sce , reduction meta.data$seurat_clusters) tsne_pos <- Embeddings(sce,'tsne') dat <- cbind(tsne_pos,phe) head(dat) P9 element_line(size=1, colour = "black"))+ guides(colour = guide_legend(override.aes = list(size=5))) P9

    6.6K25编辑于 2022-12-16
  • 来自专栏天意生信俱乐部

    单细胞数据分析|差异表达分析

    在对单细胞数据进行差异表达分析的时候,可以从全细胞和元细胞两个角度去考虑。 基于全细胞目前常见的单细胞转录组计算差异表达基因方法有DESeq2、edgeR、limma、MAST、SCDE (Single Cell Differential Expression)、Seurat 所有步骤旨在优化数据质量、减少噪声并提取重要的基因特征,为后续的分析(如聚类和差异表达分析)做准备。最终,处理后的数据存储在 adata 对象中。 使用SEACells聚合细胞,然后在元细胞水平上,执行差异表达分析。 总结: 本节我们选择元细胞作为分析策略避免生物学噪音和dropout的干扰。

    88110编辑于 2025-01-22
  • 来自专栏R语言数据分析

    单细胞数据分析3(单细胞数据自动注释)

    pred.scRNA$pruned.labels#查看注释准确性 plotScoreHeatmap(pred.scRNA, clusters=pred.scRNA@rownames, fontsize.row = 9,

    67410编辑于 2023-10-15
  • 来自专栏生物信息学、python、R、linux

    URD包分析单细胞数据

    raw.githubusercontent.com/farrellja/URD/master/URD-Install.R") library(URD) 因为没有找到提供的测试数据集,就用之前用seurat分析过的不同时期的心脏单细胞数据跑一边吧

    2K20发布于 2020-12-29
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:数据整合(九)

    导读 本文将学习跨条件执行单细胞整合,以识别彼此相似的细胞。 1. 目标 跨条件对齐相同的细胞类型。 2. 挑战 对齐相似细胞类型的细胞,这样就不会因为样本、条件、模式或批次之间的差异而在后续分析中进行聚类。 3. 推荐 建议先不整合分析,再决定是否进行整合。 4. 这将使下游的结果更具可解释性(即 DE 分析、配体-受体分析)。在本课中,将介绍跨条件的样本整合,该教程改编自 Seurat v3 Guided Integration Tutorial[1]。 如果细胞按样本、条件、批次、数据集、模态进行聚类,则整合步骤可以极大地改善聚类和下游分析。 具体来说,这种整合方法期望组中至少一个单细胞子集之间存在“对应”或共享的生物状态。整合分析的步骤如下图所示: 应用的不同步骤如下: 典型相关分析 (CCA): CCA 识别条件/组之间的共享变异源。

    1.2K30编辑于 2023-02-27
  • 来自专栏分析工具

    单细胞geneNMF分析流程学习

    非负矩阵分解是一种用于分析高维数据的方法,它可以从一组非负数据向量中提取稀疏且有意义的特征。 该方法非常适合分解单细胞RNA测序数据,有效地将大型的复杂矩阵(基因数量乘以细胞数量)分解为几个可解释的基因程序。 非负矩阵相关内容请参阅既往推文:单细胞非负矩阵分解分析python版(cNMF)学习:https://mp.weixin.qq.com/s/aTIR8eJHhXFiQZBvO72fOw转录组非负矩阵分解 geneNMF分析流程1.导入rm(list = ls())library(GeneNMF)library(Seurat)library(ggplot2)library(UCell)library(patchwork "MYDGF" "IGFBP5"# # $MP8# [1] "BANK1" "MS4A1" "IGHM" "CD79A" "IGHD" "CD22" # # $MP9# [1] "VWF"

    80500编辑于 2025-04-16
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:marker鉴定(11)

    我们之前的聚类分析结果如下: 记住,我们在聚类分析中遇到了以下问题: 簇 7 和 20 的细胞类型标识是什么? 对应于相同细胞类型的簇是否具有生物学意义的差异?这些细胞类型是否存在亚群? 特定簇之间的标记识别: 该分析探讨了特定簇之间的差异表达基因。用于确定上述分析中似乎代表相同细胞类型(即具有相似标记)的簇之间基因表达的差异。 5. 计算每个条件的基因水平 p 值,然后使用 MetaDE R 包中的元分析方法跨组组合。 在我们开始我们的标记识别之前,我们将明确设置我们的默认分析,我们想要使用标准化数据,而不是簇数据。 Activated T cells", "8" = "NK cells", "9" 探索细胞类型的子集以发现细胞亚群 > Web[1] 在条件 ctrl 和 stim 之间执行差异表达分析 如果试图确定细胞类型或细胞状态之间的情况,可以进行轨迹分析或谱系追踪: 分化过程 随时间变化的表达情况

    1.2K40编辑于 2023-02-27
  • 来自专栏生物信息学、python、R、linux

    单细胞空间转录组分析

    image.png 下面就是跟单细胞一样的流程:降维聚类 brain <- RunPCA(brain, assay = "SCT", verbose = FALSE) brain <- FindNeighbors

    1.2K10发布于 2020-04-01
  • 来自专栏单细胞天地

    单细胞差异分析方法评测

    ,pseudobulks方法要优于single-cell分析方法,指出现在的很多发表的差异分析方法是错误的,会有太多的假阳性 Our findings suggest that many published 图1:系统性评测 目的就是看差异分析方法能不能得到最接近生物学差异的结果,因此作者使用了真实实验得到的数据,而不是模拟的数据。 它们的逻辑是:先把生物重复的样本整合,形成“pseudobulks”,再进行统计分析,而不是直接进行单个细胞间的比较,这两种逻辑的方法差异还是很明显的(图d)。 那么这里作者想:如果我先不整合,直接对每个细胞进行接下来的统计分析,效果如何呢? 人和小鼠的scRNA数据对比,人的生物学重复波动要更大,因此解决单细胞组织差异性,对于差异分析至关重要

    4.6K41发布于 2021-11-15
领券