首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析: Scanpy 核心绘图 (2)

    引言 本系列讲解 使用 Scanpy 分析单细胞(scRNA-seq)数据 教程[1],持续更新,欢迎关注,转发! 基于已知标记基因识别细胞簇 通常,细胞簇需要利用众所周知的标记基因来进行标注。 这些信息可以用来按如下方式手动注释细胞: # create a dictionary to map cluster to annotation label cluster2annotation = { "0": "Monocytes", "1": "NK", "2": "T-cell", "3": "Dendritic", "4": "Dendritic", type", legend_loc="on data", frameon=False, legend_fontsize=10, legend_fontoutline=2, "clusters", dendrogram=True, colorbar_title="mean z-score", layer="scaled", vmin=-2,

    52510编辑于 2025-07-24
  • 课前准备---单细胞VDJ分析导论2

    这些重组事件发生在称为互补决定区(CDR) 3的连接处,而CDR1和CDR2完全在V基因区域内发现。由于CDR是与同源抗原结合的区域,它们,特别是CDR3区域,一直是大多数下游分析的重点。 然而,配对链测序现在是可能的,最显著的是通过单细胞技术,允许配对链适应性免疫受体的大规模分析。 需要注意的是,植入套件不能明确地与scRNA-seq分析工具包交互,这对于一些用户在确定单细胞数据集的相关分析策略时可能具有挑战性。 大多数单细胞免疫库分析工具旨在将scTCR/BCR-seq数据与这些单细胞数据格式相结合,以便进行进一步的探索,例如执行过滤和质量控制检查,克隆分型,克隆扩增量化和克隆多样性估计。 scRepertoire将TCR/BCR数据附加到单细胞元数据中,可用于仅基因组分析和与基因表达数据的组合分析

    1.1K20编辑于 2024-07-02
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:多模态 reference mapping (2)

    内容 在本示例中,我们将展示如何利用一个已经建立的参考数据集来解读单细胞RNA测序(scRNA-seq)查询: 根据参考数据集定义的细胞状态集,对每个查询细胞进行标注。 我们以之前使用加权最近邻分析(WNN)方法分析过的人类BMNC的CITE-seq参考集作为比对标准。 该分析旨在找出转录组数据的最佳转换方式,以最准确地反映加权最近邻(WNN)图中的结构特征。 我们首先需要将这些数据拆分成8个独立的Seurat对象,对应每位捐献者,然后分别进行映射分析。 需要注意的是,这些数据对象都已经通过参考集被整合到了一个共同的分析空间中。之后,我们就能够将这些数据的分析结果一并展现出来。

    41410编辑于 2024-05-17
  • 来自专栏生物信息云

    单细胞专题 | 2.如何开始单细胞RNASeq数据分析

    在我们分析之前,最好是先阅读一下相关的文献综述。对于单细胞数据的分析,我找了几篇相关的文献综述。 2015年,开发了基于encapsulation和barcode的分析。在过去的5年里,单细胞分析变得大众化,大多数学术机构都有专门的核心设施来进行单细胞表达、表观基因组或其他分析2.数据矩阵生成和质量控制 单细胞分析的一个关键技术进步是barcode的发展,它允许大规模并行化,同时保持成本最低。barcode被添加到在逆转录过程中的RNA分子中,允许识别单个细胞和独特的分子。 分析管道的下一步是质量控制(QC),例如识别每个barcode的counts数,每个barcode的基因数,以及每个barcode的线粒体基因counts 的比例(图2)。 环境RNA是存在于单细胞溶液中的RNA,在包裹过程中被整合到油滴中。我们通常使用SoupX,它可以从空液滴中估计周围的RNA污染(图2)。

    2.3K11编辑于 2022-06-13
  • 来自专栏数据科学(冷冻工厂)

    Signac|成年小鼠大脑 单细胞ATAC分析2

    引言 在本教程中,我们将探讨由10x Genomics公司提供的成年小鼠大脑细胞的单细胞ATAC-seq数据集。本教程中使用的所有相关文件均可在10x Genomics官方网站上获取。 我们通过在不同的系统上进行相同的分析,来展示其性能以及对不同组织类型的适用性,并提供了一个来自不同物种的示例。 Neurod6","Rorb","Syt6"), pt.size = 0.1, max.cutoff = 'q95', ncol = 3 ) 与 scRNA-seq 数据整合 为了更好地解读单细胞 ATAC-seq数据,我们可以根据来自相同生物体系(即成年小鼠大脑)的单细胞RNA测序(scRNA-seq)实验结果, # Load the pre-processed scRNA-seq data allen_rna head(da_peaks) ## p_val avg_log2FC pct.1 pct.2 p_val_adj ## chr4-

    33610编辑于 2024-06-18
  • 来自专栏R语言数据分析

    单细胞数据分析2(练习GSE218208)

    3, min.features = 200) exp = pbmc[["RNA"]]@counts;dim(exp) exp[1:4,1:4] 2. 0.25) save(pbmc.markers,file = f) } load(f) mks = pbmc.markers %>% group_by(cluster) %>% top_n(n = 2, wt = avg_log2FC) mks g = unique(mks$gene) g 5.makergene的可视化 DoHeatmap(pbmc, features = g) + NoLegend ()+ scale_fill_gradientn(colors = c("#2fa1dd", "white", "#f87669")) DotPlot(pbmc, features = g,cols /supp/markers.txt",header = F) gt = split(a[,2],a[,1]) DotPlot(pbmc, features = gt,cols = "RdYlBu")

    71710编辑于 2023-10-15
  • 来自专栏单细胞天地

    单细胞分析十八般武艺2:LIGER

    单细胞测序技术的发展日新月异,新的分析工具也层出不穷。每个工具都有它的优势与不足,在没有权威工具和流程的单细胞生信江湖里,多掌握几种分析方法和工具,探索数据时常常会有意想不到的惊喜。 往期专题 单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony LIGER简介 LIGER能够跨个体、物种和方法(基因表达、表观遗传或空间数据)识别共有的细胞类型,以及数据集特有的特征 ,提供对不同单细胞数据集的统一分析。 iNMD分解矩阵后的“因子”,相当于PCA降维之后的"PC"轴;但是iNMD的因子比 PCA的PC轴可解释性更强,在单细胞数据分析中,每个因子常常对应一种细胞类型。 往期回顾 OSCA单细胞数据分析笔记-3 SingleCellExperiment数据结构 单细胞揭示不同类型转录重构助力人类前列腺癌研究进展 细胞亚群的特异性标记基因也许真的很难 明码标价之公共数据库探索

    6.1K61发布于 2021-04-16
  • 来自专栏生信技能树

    2个分组的单细胞项目标准分析

    而且确实目前做一个单细胞项目从经费上来说已经不再是下血本了,比如某公司推出来的2个分组的单细胞项目标准分析,一般来说每个分组是3个单细胞10x样品,也就是说6个单细胞样品从送样,建库,测序(100G)数据量 我相信你肯定是有自己想探索的生命科学领域问题,如果你不知道这样的2个分组的单细胞项目标准分析可以出哪些图表,得到哪些生物学问题,这里可以跟我们一起读一下2021年5月发表的文章,标题是:《Single-cell 标准的2个分组的单细胞项目 实验设计如下所示: 实验设计 目前都是10x方法的单细胞转录组,全部自动化出数据,就可以进行标准分析啦! 各自细胞亚群在2分组的表达量差异分析 前面的数据分成了十多个细胞亚群,就可以在2分组做十多次差异分析,每次分析都有上下调基因列表。 至少需要把每个单细胞亚群独立提取,然后进行重新鸡尾酒疗法并且根据生物学2分组进行差异分析,并且对多个差异分析的上下调基因进行交集展现。

    1.7K50发布于 2021-11-23
  • 来自专栏单细胞天地

    OSCA单细胞数据分析笔记-2—R与Bioconductor

    对应原版教程2-3章 http://bioconductor.org/books/release/OSCA/ (对R基本了解的读者可跳过这一节) 1、简介 R语言是生信人最熟悉的编程语言之一,其核心在于有上万个 其主要包含了许多专门用于分析某一类生信数据的包。(当然也包含一些数据包) ? Bioconductor 2、基础操作 2.1 设置镜像 提高下载安装包的速度。 p=1 关于R的一些基础知识就简单介绍这么多了;相信来了解scRNA-seq数据分析的读者多少对R也已经比较了解了。 13个不同组织器官的超10万个细胞才85个亚群(单细胞ATAC路在何方) ---- ---- ---- 如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程 数据挖掘(GEO ,TCGA,单细胞)2021第2期 生信爆款入门-2021第2期 96核心384G内存的超级服务器(共享)使用权一年 ?

    1.2K10发布于 2021-04-16
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:整合

    对干扰素的应激导致细胞类型特异性基因表达发生变化,这使得对所有数据的联合分析变得困难。 在这里,我们展示了我们的整合策略,如 Stuart 和 Butler 等人,2018 年 所述,执行整合分析以促进常见细胞类型的识别并进行比较分析。 目的以下教程旨在为您概述使用 Seurat 整合后对复杂细胞类型进行的各种比较分析。 整体分析现在我们可以对所有细胞进行一个综合分析! 刺激 CD14 单核细胞后 CD14 表达降低,这可能导致监督分析框架中发生错误分类,强调了整合分析的价值。

    90910编辑于 2023-01-19
  • 来自专栏生信菜鸟团

    单细胞 一文打通 拟时序分析monocle2

    单细胞 一文打通 拟时序分析monocle2 上个月发了一文全打通系列之后,有人问还有没有后续。 肯定有呀 关于monocle2,最难的一步好像在软件的正确安装,因为有的版本中,某些函数总是报错,需要找到正确的版本。 这次排版不太好,还请见谅。 lowerDetectionLimit = 0.5, expressionFamily = negbinomial.size()) 归一化 差异分析 (cds)$stim), "State_Stim_summary.xlsx", colnames=T, rownames=T) getwd() 设置谁是root ##we set the state 2 as root ########state 2 #这里设置谁为root??

    1.6K20编辑于 2023-09-09
  • 来自专栏生信学习111

    单细胞day2

    . . . . 2 4 7 5 . . . 1 .稀疏矩阵是存储0值比较多的数据用的,用“.”表示0,可以节省空间,单细胞矩阵0值比较多。 例如,如果一个细胞中有5个基因的表达量分别为1, 2, 3, 4, 5,那么该细胞的nCount_RNA值就是1+2+3+4+5 = 15。 注意一下4降维聚类分析4.1为什么要降维降维是通过数学或统计方法将高维数据映射到低维空间的过程,目的是保留数据中的主要变化和模式,同时减少数据的复杂性和计算负担。 这使得数据能够更容易地可视化、分析和理解,帮助发现隐藏在数据中的结构和关系。例如,如果有数以万计的基因,每个细胞的表达数据就是一个数以万计的维度。 4.2用什么降维主成分分析(PCA):通过线性变换将数据映射到低维空间,保留数据中方差最大的方向。t分布邻域嵌入(t-SNE):非线性降维方法,能够保留高维空间中数据点之间的局部相似性关系。

    81910编辑于 2024-06-19
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析 | 基因组区域的可视化 (2)

    在基因组轨迹图上添加额外的数据 多模态单细胞数据集能够为每个细胞提供多种实验测量结果。 目前,已经有一些方法能够同时测量单细胞的染色质数据(比如染色质的可及性)以及同一细胞的其他数据,比如基因表达或线粒体基因型。 tile_plot, peak_plot, gene_plot, link_plot), expression.plot = expr_plot, heights = c(10, 6, 1, 2,

    35310编辑于 2024-12-30
  • 来自专栏数据科学(冷冻工厂)

    R中单细胞RNA-seq数据分析教程 (2)

    引言 本系列开启R中单细胞RNA-seq数据分析教程[1],持续更新,欢迎关注,转发! 导入Seurat包 首先,请确认你的R软件已经安装了Seurat这个包。 plot2 <- FeatureScatter(seurat, feature1 = "nCount_RNA", feature2 = "nFeature_RNA") plot1 + plot2 鉴于基因数量与转录本数量之间存在相关性 单细胞RNA-seq数据分析中最常用的标准化方法与TPM(每百万读数的转录本数)概念类似 - 即对每个细胞的特征表达量进行标准化,然后乘以一个缩放因子(默认为10000)。 因此,在深入分析scRNA-seq数据之前,进行恰当的特征选择是非常必要的。 在Seurat或者更广泛地说,在单细胞RNA-seq数据分析中,这一步通常涉及到识别表达水平在细胞间变化最大的高变异性特征/基因。

    56510编辑于 2024-12-30
  • 课前准备-单细胞联合ATAC数据分析(SnapATAC2

    作者,Evil Genius目前分析scATAC的几款软件包括signac(R版本)、ArchR(R版本)、epiScanpy(python版本)、 SnapATAC2(python版本),各自都发了大文章 :https://kzhang.org/SnapATAC2/tutorials/pbmc.html主流的分析:scATAC基础分析单细胞RNA和ATAC联合分析、ATAC的区域差异分析、ATAC的多样本联合分析 、多组学分析(ATAC + RNA)。 大家只要玩明白其中的一个,单细胞联合ATAC分析就不是问题。今天我们分享的是snapATAC2,2024年1月发表于Nature Methods。 RNA与ATAC的联合分析import warningswarnings.filterwarnings("ignore")import snapatac2 as snapimport anndata as

    57610编辑于 2024-06-20
  • 来自专栏单细胞

    空间单细胞转录组cell2location分析流程学习

    Cell2location 是一个用于空间转录组学数据分析的工具。它是一个基于贝叶斯统计模型的Python包,旨在利用空间转录组数据和单细胞转录组数据来进行细胞类型的空间解构。 通过将单细胞转录组数据中的细胞类型信息投射到空间转录组数据中,Cell2location 可以估算不同细胞类型在空间位置中的丰度分布。 结合单细胞和空间数据:Cell2location允许用户结合单细胞RNA-seq数据与空间转录组数据,使得在细胞分辨率不高的空间数据中可以更好地推断出各类细胞的分布模式。 RCTD去卷积分析学习和整理: https://mp.weixin.qq.com/s/_Zdxu9bn-ldoMQJXK8uwIA单细胞空间转录组分析流程学习python版(三): https://mp.weixin.qq.com /s/wt4nVi8pTFwQMNN8Ipj_mA单细胞空间转录组分析流程学习(二): https://mp.weixin.qq.com/s/8AFeq50Dc91cI_6jdQZfFg单细胞空间转录组分析流程学习

    96611编辑于 2024-10-21
  • 单细胞day2

    1、 getwd() 查找工作目录2、今天大部分时间都在安装包。问题层出不穷 mac系统部署环境。

    19610编辑于 2024-06-19
  • 来自专栏单细胞天地

    单细胞分析工具--Palantir轨迹分析

    Palantir/blob/master/notebooks/Palantir_sample_notebook.ipynb Palantir是一个2019年在nature biotechnology提出的用于单细胞数据轨迹推断的 unzip Palantir-master cd Palantir-master pip install . 2)示例数据 需要准备.h5ad的单细胞数据(count表达矩阵)格式,官方提供示例数据可直接下载 ## (1) scanpy #PCA降维 sc.pp.pca(ad) #UMAP降维 sc.pp.neighbors(ad) sc.tl.umap(ad) ## (2) Seurat seurat_pca pd.DataFrame(ad.obsm['X_umap'], index=ad.obs_names) # umap可视化 sc.pl.embedding(ad, basis='umap') 3、轨迹推断分析 basis='umap', layer='MAGIC_imputed_data', color=['CD34', 'MPO', 'GATA1', 'IRF8']) ## (2)

    2.7K20编辑于 2023-02-16
  • 来自专栏生信喵实验柴

    单细胞分析环境搭建

    一、安装软件 1.1 Cell Ranger 下载安装(需注册) Cell Ranger 是 10X genomics 官网提供的单细胞数据分析软件。 可以直接输入 Illumina 原始数据 BCL 或 FASTQ 格式,Cell Ranger 集成了 10 x genomics 单细胞数据分析的一整套流程模块,可以直接进行碱基识别,文库拆分、细胞拆分 、输出表达定量矩阵、降维(pca),聚类以及可视化,配合另一套 Loupe Browser 软件,可以非常简单的探索单细胞数据。 ,输入文件为 Cell Ranger分析之后生成的.cLoupe 文件即可直接使用。 unzip bcl2fastq2-v2-20-0-linux-x86-64.zip # 上面下载到的 yum install -y bcl2fastq2-v2.20.0.422-Linux-x86_64

    80210编辑于 2022-10-25
  • 来自专栏生物信息学、python、R、linux

    scanpy分析单细胞数据

    scanpy和seurat是最常用的分析单细胞的工具,seurat基于R,而scanpy基于python。 import scanpy as sc sc.settings.verbosity = 3 # verbosity: errors (0), warnings (1), info (2) =sc.read_10x_mtx('data/filtered_gene_bc_matrices/hg19', var_names='gene_symbols', cache=True) #读取单细胞测序文件 sc.pp.regress_out(adata, ['total_counts', 'pct_counts_mt']) sc.pp.scale(adata, max_value=10) PCA主成分分析

    2.4K20发布于 2020-12-21
领券