首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信学习111

    单细胞day2

    sample1_barcodes.tsv.gz" "GSM7306054_sample1_features.tsv.gz"[3] "GSM7306054_sample1_matrix.mtx.gz" 1.2单细胞文件组织的要求对文件是有要求的 Seurat对象2.1读取文件读取文件用的是Read10X这个函数,接受的参数是文件夹名称,文件夹里面三个数据合并在一起才是完整的单细胞表达矩阵,每个都只是存储了一部分> rm(list = ls()) . . . . 2 4 7 5 . . . 1 .稀疏矩阵是存储0值比较多的数据用的,用“.”表示0,可以节省空间,单细胞矩阵0值比较多。 例如,如果一个细胞中有5个基因的表达量分别为1, 2, 3, 4, 5,那么该细胞的nCount_RNA值就是1+2+3+4+5 = 15。 2.7 管道符号%>%是向后传递,类似于linux里面的 |3 质控3.1 质控的指标线粒体基因含量不能过高;线粒体基因的表达水平在单细胞RNA测序中是一个重要的质控指标。

    81710编辑于 2024-06-19
  • 单细胞day2

    1、 getwd() 查找工作目录2、今天大部分时间都在安装包。问题层出不穷 mac系统部署环境。

    19610编辑于 2024-06-19
  • 来自专栏单细胞测序

    单细胞测序—2次分群

    单细胞测序—2次分群 Seurat里的FindClusters函数设置的resolution数值越大,分群的数量就越多,但是当单细胞数量太多的时候,会遇到resolution再变大,分群的数量也不再增加的情况 这里的示例数据seu.obj.Rdata是GSE218208降维聚类分群的结果,参照单细胞测序—GSE218208(流程简化) rm(list = ls()) library(Seurat) library (dplyr) load("../2.GSE218208/seu.obj.Rdata") p1 = DimPlot(seu.obj, reduction = "umap",label=T)+NoLegend ) %>% pull(gene);top10 ## [1] "JCHAIN" "IGKC" "MZB1" "PACSIN1" "WNT10A" "MAP1A" "VASH2" = DimPlot(seu.obj,label = T)+NoLegend() p1+p2 对比二次分群前的结果,可以看到DC被进一步划分为M1,M0两群。

    61011编辑于 2024-07-31
  • 来自专栏数据科学(冷冻工厂)

    单细胞Seurat - 数据处理 (2)

    本系列持续更新Seurat单细胞分析教程,欢迎关注! 标准化 从数据集中删除不需要的细胞后,下一步是数据标准化。 我们和其他人已经为单细胞预处理开发了替代工作流程,但不做出这些假设。对于感兴趣的用户,请查看 SCTransform() 标准化工作流程,论文[1]中描述了该方法。 在下游分析中关注这些基因有助于突出单细胞数据集中的生物信号。 默认情况下Seurat每个数据集返回 2,000 个特征。这些将用于下游分析,例如 PCA。 rownames(pbmc) pbmc <- ScaleData(pbmc, features = all.genes) 如何消除不需要的变异源 在 Seurat 中,使用 ScaleData() 函数从单细胞数据集中删除不需要的变异源 对于第一个主成分,Seurat 输出具有最大正负载荷的基因列表,代表在数据集中的单细胞之间表现出相关(或反相关)的基因模块。

    76910编辑于 2024-02-22
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析: Scanpy 核心绘图 (2)

    引言 本系列讲解 使用 Scanpy 分析单细胞(scRNA-seq)数据 教程[1],持续更新,欢迎关注,转发! 基于已知标记基因识别细胞簇 通常,细胞簇需要利用众所周知的标记基因来进行标注。 这些信息可以用来按如下方式手动注释细胞: # create a dictionary to map cluster to annotation label cluster2annotation = { "0": "Monocytes", "1": "NK", "2": "T-cell", "3": "Dendritic", "4": "Dendritic", type", legend_loc="on data", frameon=False, legend_fontsize=10, legend_fontoutline=2, "clusters", dendrogram=True, colorbar_title="mean z-score", layer="scaled", vmin=-2,

    52510编辑于 2025-07-24
  • 来自专栏生物信息云

    单细胞专题 | 2.如何开始单细胞RNASeq数据分析

    Med. 50. 【2】Chen, G., Ning, B., and Shi, T. (2019). 2.数据矩阵生成和质量控制 单细胞分析的一个关键技术进步是barcode的发展,它允许大规模并行化,同时保持成本最低。barcode被添加到在逆转录过程中的RNA分子中,允许识别单个细胞和独特的分子。 现在有几种doublet检测工具可用,包括DoubletDecon,Scrublet和DoubletFinder(图2)。 环境RNA是存在于单细胞溶液中的RNA,在包裹过程中被整合到油滴中。我们通常使用SoupX,它可以从空液滴中估计周围的RNA污染(图2)。 为了从每种细胞类型调用峰,将从相同细胞类型获得的所有片段聚合以构建伪批量ATAC数据集和MACS2,分别针对每种细胞类型进行。

    2.3K11编辑于 2022-06-13
  • 课前准备-单细胞新版velocity(cellrank 2

    作者,Evil Genius参考文章CellRank 2: unified fate mapping in multiview single-cell data(nature methods),2024 官网示例在cellrank documentation分析框架CellRank 2为使用马尔可夫链研究单细胞命运决策提供了统一的框架自动确定初始和最终状态,计算命运概率,绘制轨迹特异性基因表达趋势图表, 并识别谱系相关基因采用概率系统描述,其中每个细胞构成马尔可夫链中的一个状态,边缘表示细胞-细胞转移概率CellRank 2提供了一组基于基因表达、RNA速率、伪时间、发育潜力、实验时间点和代谢标记数据的转换概率的不同 to=https%3A%2F%2Fcellrank.readthedocs.io%2Fen%2Flatest%2Freferences.html%23id21">Reuter et al., 2019, to=https%3A%2F%2Fcellrank.readthedocs.io%2Fen%2Flatest%2Freferences.html%23id4">Reuter et al., 2022].

    1.8K10编辑于 2024-06-17
  • 来自专栏数据科学(冷冻工厂)

    ingest和BBKNN进行单细胞整合(2

    引言 本系列讲解 使用Scanpy分析单细胞(scRNA-seq)数据教程[1],持续更新,欢迎关注,转发! BBKNN BBKNN 可以很好地解决批次效应。 adatas = [adata_all[adata_all.obs["batch"] == i].copy() for i in ["1", "2", "3"]] sc.settings.verbosity adata_query = adata_concat[adata_concat.obs["batch"].isin(["1", "2", "3"])].copy() 接下来的图表有点难以阅读,因此我们转而查看下面的混淆矩阵 import matplotlib.pyplot as plt fig, axes = plt.subplots(, , figsize=(, )) for batch, ax in zip(["1", "2"

    33600编辑于 2025-07-08
  • 课前准备---单细胞VDJ分析导论2

    这些链是一个复杂过程的产物,涉及由RAG1和RAG2蛋白介导的可变(V)、多样性(D)和连接(J)基因片段的基因重组,分别发生在胸腺和骨髓中发育中的T细胞和B细胞中。 这些重组事件发生在称为互补决定区(CDR) 3的连接处,而CDR1和CDR2完全在V基因区域内发现。由于CDR是与同源抗原结合的区域,它们,特别是CDR3区域,一直是大多数下游分析的重点。 传统上,TCR/BCR的聚类基于两个主要标准:(1)使用相同的V和J基因;(2)CDR3长度。具有满足前者而不满足后者的受体结构的细胞表明发生了随机的N/P核苷酸插入。 目前已有几种基于编辑距离或相似性度量的基序聚类方法,如GLIPH、GLIPH2、ClusTCR、GIANA、tcrdist、tcrdist3和iSMART。 大多数单细胞免疫库分析工具旨在将scTCR/BCR-seq数据与这些单细胞数据格式相结合,以便进行进一步的探索,例如执行过滤和质量控制检查,克隆分型,克隆扩增量化和克隆多样性估计。

    1.1K20编辑于 2024-07-02
  • 来自专栏数据科学(冷冻工厂)

    单细胞分析:多模态 reference mapping (2)

    内容 在本示例中,我们将展示如何利用一个已经建立的参考数据集来解读单细胞RNA测序(scRNA-seq)查询: 根据参考数据集定义的细胞状态集,对每个查询细胞进行标注。 ") Example 2:绘制人类骨髓细胞图谱 Data 例如,我们将由人类细胞图谱项目生成的,来自八位不同捐献者的人类骨髓单核细胞(BMNC)数据集进行了映射。 , reduction.key = "wnnUMAP_", return.model = TRUE) DimPlot(bm, group.by = "celltype.l2" <- DimPlot(hcabm40k.batches[[2]], reduction = 'ref.umap', group.by = 'predicted.celltype', label.size = 3) p1 + p2 + plot_layout(guides = "collect") 我们还可以把所有的数据对象合并成一个统一的数据集。

    41410编辑于 2024-05-17
  • 来自专栏文献分享及代码学习

    单细胞数据复现-肺癌文章代码复现2

    "cm") ##label:标签 DimPlot(seu_obj, group.by = "SCT_snn_res.0.2", label = T, label.size = 5) #ggsave2( , g2m.genes) seu_obj@meta.data$CC.Diff <- seu_obj@meta.data$S.Score - seu_obj@meta.data$G2M.Score if(T){ g2m_genes <- cc.genes$g2m.genes g2m_genes <- CaseMatch(search=g2m_genes, match=rownames(seu_obj =g2m_genes, s.features=s_genes) tmp <- RunPCA(seu_obj, features = c(g2m_genes, s_genes), verbose = 可以发现是一个很标准的单细胞数据处理的分析方法,明天对后面的分群的处理的代码接着进行拆解啦。

    2.4K20编辑于 2022-05-07
  • 来自专栏生信菜鸟团

    病毒感染相关单细胞文献复现-2

    ❝接上周复现的单细胞推文,文献中还有亚群细分的数据,所以我这周针对stem cell亚群的细分进行复现,复现只能大致与文章中的数据相似并不能做到完全一致,主要是结合文章中marker gene和人工注释 ',"LGR5","OLFM4","MKI67","LYZ1","Defa21", "ATOH1","SIS", "Ascl2", "Slc12a2", ='Lgr5 Stem' celltype[celltype$ClusterID %in% c(1,2),2]='Cycling Enterocyte' celltype[celltype $ClusterID %in% c(3,4),2]='Cycling Stem' celltype[celltype$ClusterID %in% c(5),2]='Paneth' celltype [celltype$ClusterID %in% c(6),2]='TA' celltype[celltype$ClusterID %in% c(7),2]='T' head(celltype

    36520编辑于 2023-09-09
  • 来自专栏数据科学(冷冻工厂)

    Signac|成年小鼠大脑 单细胞ATAC分析(2

    引言 在本教程中,我们将探讨由10x Genomics公司提供的成年小鼠大脑细胞的单细胞ATAC-seq数据集。本教程中使用的所有相关文件均可在10x Genomics官方网站上获取。 Neurod6","Rorb","Syt6"), pt.size = 0.1, max.cutoff = 'q95', ncol = 3 ) 与 scRNA-seq 数据整合 为了更好地解读单细胞 ATAC-seq数据,我们可以根据来自相同生物体系(即成年小鼠大脑)的单细胞RNA测序(scRNA-seq)实验结果, # Load the pre-processed scRNA-seq data allen_rna head(da_peaks) ## p_val avg_log2FC pct.1 pct.2 p_val_adj ## chr4- max.cutoff = 'q95' ) plot1 | plot2 open_l23 <- rownames(da_peaks[da_peaks$avg_log2FC > 3, ]) open_l456

    33410编辑于 2024-06-18
  • 来自专栏生信技能树

    python单细胞学习笔记-day2

    前面,我们生信技能树的讲师小洁老师与萌老师新开了一个学习班:《掌握Python,解锁单细胞数据的无限可能》,身为技能树的一员,近水楼台先得月,学起! 下面是我的学习笔记,希望可以给你带来一点参考 目前使用的软件为:使用vscode 的插件配置 touch day2.ipynb 06:05 首先简单介绍jupyter lab的使用 这种框框称为一个cell Markdown 类型:M 切换到代码类型:Y 31:55 python语法规则 1.print() 用于打印结果 jupter lab 里面默认自带打印效果 如果有多个内容要打印,需要写print() 2. 错误信息提示字段元素必须是 2 元组或 3 元组,但你提供了一个单独的数字 '3',这不符合 NumPy 数组的创建规则。 例如: import numpy as np # 错误写法 # n3 = np.array([1, 2], [3, 4]) # 正确写法 n3 = np.array([[1, 2], [3, 4]])

    55600编辑于 2025-01-11
  • 来自专栏单细胞

    CytoTRACE2单细胞分化潜力预测工具学习

    2、目前建议该工具仅使用在老鼠和人,其他物种需要谨慎使用。 同时我认为使用者也应结合自己数据的实际情况进行判断,在已经明确不同细胞系的分化先后顺序时可以不使用该工具。 提取数据/运行CytoTRACE2# 提取表达矩阵信息expression_data <- GetAssayData(sub_dat,layer = "counts")# 运行CytoTRACE2cytotrace2 = expression_data)# 导出图片plots$CytoTRACE2_UMAPplots$CytoTRACE2_Potency_UMAPplots$CytoTRACE2_Relative_UMAPplots CytoTRACE2_UMAP展示了不同细胞的预测打分,按照颜色进行了划分。越是红色越靠近全谱系的分化状态,而越是接近蓝色则靠近已经分化完成的状态。 CytoTRACE2_Potency_UMAP跟上图类似 CytoTRACE2_Relative_UMAP直接用分值进行映射 CytoTRACE2_Boxplot_byPheno更加直观的展示了分值

    77510编辑于 2024-09-18
  • 来自专栏R语言数据分析

    单细胞数据分析2(练习GSE218208)

    3, min.features = 200) exp = pbmc[["RNA"]]@counts;dim(exp) exp[1:4,1:4] 2. 0.25) save(pbmc.markers,file = f) } load(f) mks = pbmc.markers %>% group_by(cluster) %>% top_n(n = 2, wt = avg_log2FC) mks g = unique(mks$gene) g 5.makergene的可视化 DoHeatmap(pbmc, features = g) + NoLegend ()+ scale_fill_gradientn(colors = c("#2fa1dd", "white", "#f87669")) DotPlot(pbmc, features = g,cols /supp/markers.txt",header = F) gt = split(a[,2],a[,1]) DotPlot(pbmc, features = gt,cols = "RdYlBu")

    71710编辑于 2023-10-15
  • 来自专栏单细胞天地

    单细胞分析十八般武艺2:LIGER

    单细胞测序技术的发展日新月异,新的分析工具也层出不穷。每个工具都有它的优势与不足,在没有权威工具和流程的单细胞生信江湖里,多掌握几种分析方法和工具,探索数据时常常会有意想不到的惊喜。 往期专题 单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony LIGER简介 LIGER能够跨个体、物种和方法(基因表达、表观遗传或空间数据)识别共有的细胞类型,以及数据集特有的特征 ,提供对不同单细胞数据集的统一分析。 往期回顾 OSCA单细胞数据分析笔记-3 SingleCellExperiment数据结构 单细胞揭示不同类型转录重构助力人类前列腺癌研究进展 细胞亚群的特异性标记基因也许真的很难 明码标价之公共数据库探索 ---- ---- ---- 如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程 数据挖掘(GEO,TCGA,单细胞)2021第2期 生信爆款入门-2021第2期 96

    6.1K61发布于 2021-04-16
  • 来自专栏单细胞天地

    NC单细胞文章复现(七):Gene expression signatures(2)

    这些发现揭示了单细胞测序分析能揭示与临床预后相关细胞状态的能力,但这些细胞状态还没有在肿瘤真实世界样本中没被发现。 ? 我们继续探索。 到了这里,这篇文献的单细胞部分就学习完了,花了一个月的时间断断续续把这个系列共7篇笔记写完。 这是很标准的单细胞分析流程。当然,文章中也加了一些免疫组化的实验方法,加以验证。还有一部分外显子测序,这又是另外一个需要学习的领域了,在单细胞学习的路上,感恩得到了“单细胞天地”公众号团队的答疑解惑。 往期回顾 多组学分析肺结核队列的记忆T细胞状态 单细胞混样测序至少可以区分性别 构建seurat对象之初就应该是把基因名字转换好 OSCA单细胞数据分析笔记9—Clustering ---- -- -- ---- 如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程 生信爆款入门-2021第4期 数据挖掘(GEO,TCGA,单细胞)2021第4期 明码标价之共享96线程

    94120发布于 2021-07-02
  • 来自专栏生信技能树

    2个分组的单细胞项目标准分析

    而且确实目前做一个单细胞项目从经费上来说已经不再是下血本了,比如某公司推出来的2个分组的单细胞项目标准分析,一般来说每个分组是3个单细胞10x样品,也就是说6个单细胞样品从送样,建库,测序(100G)数据量 再加上降维聚类分群,生物学命名,看2个分组的不同细胞亚群比例差异,看同一个细胞亚群在2个分组是否有表达量上下调以及通路变化。这一套,就10万块钱! 标准的2个分组的单细胞项目 实验设计如下所示: 实验设计 目前都是10x方法的单细胞转录组,全部自动化出数据,就可以进行标准分析啦! 各自细胞亚群在2分组的表达量差异分析 前面的数据分成了十多个细胞亚群,就可以在2分组做十多次差异分析,每次分析都有上下调基因列表。 至少需要把每个单细胞亚群独立提取,然后进行重新鸡尾酒疗法并且根据生物学2分组进行差异分析,并且对多个差异分析的上下调基因进行交集展现。

    1.7K50发布于 2021-11-23
  • 来自专栏生信马拉松

    生信马拉松 Day24 单细胞-2

    1. dgMatrix是稀疏矩阵2. 线粒体基因比例特别高的,往往细胞表达的nCount比较大,可以通过percent.mt过滤3. 此时行内数字相同仍然可以进行行内比较,但不能进行基因间的比较,pca实际上和普通转录组的是一样的5. scale和normalize不一样,无论如何翻译,先做normalize再scale,但如果下载的单细胞数据是 Seurat.Rmd是单细胞的标准流程,小洁老师常用的是自己整理的2.GSE218208文件夹的内容9. 单细胞分析标记一定要看看参考文献怎么说的12. AUCell评分是打分的机制,给一组基因,其中基因表达量高或者比例大会导致各个簇评分有差别,pct.1是在本簇里的基因表达情况,pct.2是除本簇之外的基因表达的情况注意AUCell分析中有一行FindMarkers

    26310编辑于 2024-03-26
领券