介绍 文章对已知的多种细胞系混合后进行单细胞10X RNA测序,研究多克隆之间的互作模式。我们这里介绍里面的单细胞测序基因表达细胞分类操作。 不过文章选用的是已知固有SNP进行分类,基因表达分类用于和SNP分类进行比较。 b5%8b%e5%ba%8fqc%e5%b7%b2%e7%9f%a5%e6%a0%b7%e6%9c%acsnp/ 根据测序的细胞系个数设定参数, n_pcs是主成分分析时主成分个数, clust_res FetchData(seuObj, vars = c('cell_quality')) seuObj <- seuObj[, which(cq$cell_quality == 'normal')] 进行细胞分类 FindClusters(seuObj, resolution = clust_res, verbose = FALSE) 原文出处 http://www.thecodesearch.com/2021/02/04/10x单细胞测序细胞分类
干细胞的分类■ 根据干细胞来源划分胚胎干细胞 (ESCs):胚胎干细胞 (ESCs) 由于其再分化的能力远高于成体干细胞,拥有分化为三个胚层的细胞的多种分化潜能。 Tips: 成体干细胞通过细胞分裂增殖的方式补充死亡细胞,并能使受损的组织再生,其中包括:造血干细胞 (HSCs),生殖干细胞 (GSCs),间充质干细胞 (MSCs),神经干细胞 (NSCs),视网膜干细胞 血小板成素及其类似物与多种细胞因子结合,包括干细胞因子和白细胞介素 (例如 IL-3、IL-6、IL-11),在它们的共同作用下促进造血干细胞产生成熟巨核细胞群,进而形成血小板,同时无需补充血清或与饲养细胞共培养 TGF-β1√√√TGF-β3√BMP-4√√√Activin A√IL-3√√SCF√Flt3-ligand√GM-CSF√G-CSF√M-CSF√LIF√√TPO√VEGF165√FGF-8b√IL-6√ Acta medica Iranica vol. 55,1 (2017): 6-23.7. Di Buduo, Christian A., et al.
该笔记通过从内置 CellTypist 模型或用户训练的自定义模型中检索最可能的细胞类型标签来展示 scRNA-seq 查询数据的细胞类型分类。 本笔记仅介绍主要步骤和关键参数。 /7]: Immune_All_AddPIP.pkl Downloading model [5/7]: Cells_Intestinal_Tract.pkl Downloading model [6/ 3 Immune_All_AddPIP.pkl 4 Cells_Intestinal_Tract.pkl 5 Cells_Lung_Airway.pkl 6 免疫细胞的分类非常详细。 一些模型元信息。 您还可以打开多数投票分类器 (majority_voting = True),它会在过度聚类方法后以增加运行时间为代价细化本地子簇内的细胞身份。
单细胞数据分析中常用的降维方法包括 PCA,以及 UMAP,tSNE。对多个细胞进行聚类分群。细胞亚群分类是 10X ScRNA-seq 数据分析的核心步骤,不同软件有不同的算法。 在常规 RNA-seq 项目中,一般样本不多,实验处理效应组合数通常不会超过 10 种(例如,2 类病人× 3 个时间点取样 = 6 种处理组合),因此每个实验处理效应在所有因素的总体效应中占比都比较大 这里定义的“维度”并不代表细胞类型的数目,而是对细胞分类时需要用到的一个参数。 这里定义的“维度”并不代表细胞类型的数目,而是对细胞分类时需要用到的一个参数。 所以我们需要在 12 到 15 之间进行选择,(官网的建议10),我们选取 15,即前 15 个主成分用于细胞的分类。
Figure 1 02 基于11个焦亡调控基因的亚型分类 作者使用四个GEO数据集,OS数据和临床信息创建了一个队列。 为了构建能够量化每位患者的模型,作者使用 LASSO-Cox回归模型以最小λ保留22个差异基因中的6个,并使用这6个基因构建与焦亡相关的特征评分(图4D,表1)。 Figure 5 06 细胞焦亡相关调控因子与肿瘤微环境 作者在队列中分析了细胞焦亡基因与TME细胞的浸润情况(图6E-G)。 免疫激活相关细胞,如激活的T细胞、NK细胞、M1巨噬细胞、树突状细胞、中性粒细胞,与焦亡模型呈负相关。较高的分数与静息记忆细胞、单核细胞、肥大细胞、癌症相关成纤维细胞和内皮细胞密切相关。 Figure 6 07 细胞焦亡模型在Anti-PD1/PD-L1免疫治疗中的作用 作者首先在ACRG队列和TCGA-STAD队列中检查了不同细胞焦亡模型免疫检查点的表达变化,发现低评分组免疫检查点基因表达水平较高
血液细胞数据库 数据库对于数据科学家来说,就像金矿一般。一个针对特定问题的数据库,可以为研究团队提供非常大的帮助。因为我们不用再费力去搜集和存储数据了。 本算法所用数据库就来自Kaggle平台,共包括12500张增强的血液细胞图片。 ? 数据库分为4个类别,每个类别包括约3000张图片。为了便于训练,我们将图片的大小缩减为80x80x3。 ? 前处理 我们需要将血液细胞图像作为numpy数组导入,并输入到神经网络中进行训练。
前面我们演示了 一个完美的单细胞亚群随机森林分离器是如何炼成的,以及 LASSO回归也可以用来做单细胞分类 的两个机器学习算法可以用来做单细胞分类器,而且效果杠杠的。 值得一提的是,SVM通常应用于二元分类变量预测,但是经过一些改进也可以勉强对多元分类变量预测,同时基于SVM的SVR也可以预测连续变量。 训练SVM单细胞分类器 首先,复制粘贴前面的 一个完美的单细胞亚群随机森林分离器是如何炼成的 ,就可以把单细胞表达量矩阵划分为训练集和测试集,然后走标准代码 训练SVM单细胞分类器 : library( summary(model) save(model,file = 'svm_output.Rdata') 可以看到,用法其实就一句话代码而已,得到的SVM单细胞分类器模型如下所示 : > summary 好一点哦,跟 LASSO回归也可以用来做单细胞分类 的效果不相上下。
,详见:我在单细胞天地的教程:是否是免疫细胞很容易区分那是否是肿瘤细胞呢? 现在我们就可以来复现文章里面的免疫细胞亚群再分类了,如下: ? 免疫细胞亚群再分类 这幅图超级容易理解,就是13431个免疫细胞,可以继续细分为不同的亚群,如上所述。 图表复现03—单细胞区分免疫细胞和肿瘤细胞 知道我是把全部的2万多个细胞的表达矩阵读入R,变成了Seurat对象,然后判断了细胞是否属于免疫细胞哈。 Freq 1 Fibroblasts 91 2 DC 170 3 NK_cell 496 4 CMP 551 5 Neutrophils 645 6 T-cells", "pDCs", "B-cells-M", "MF-Monocytes") # free_annotation <- c("0","1", "2", "3", "4", "5", "6"
前面的 一个完美的单细胞亚群随机森林分离器是如何炼成的 有一个评价是这样的机器学习模型都是黑箱子,其实随机森林还好,它可以拿到具体的每个分类的重要的基因列表,有点类似于每个单细胞亚群的特异性高表达量基因 ,就可以拿到上面代码里面的两个rdata文件哈,然后得到的 rf_importances 这个数据里面有各个单细胞亚群对应的基因。 虽然随机森林已经是很完美了,但是机器学习的算法非常多,我们有必要多用几个看看效果,接下来就演示一下LASSO回归,它也可以用来做单细胞分类。 训练LASSO回归模型 首先,复制粘贴前面的 一个完美的单细胞亚群随机森林分离器是如何炼成的 ,就可以把单细胞表达量矩阵划分为训练集和测试集,然后走标准代码训练LASSO回归模型: # family= 好一点哦,主要占比极低的树突细胞和血小板区分的比较好: 模型效果更好 当然了,如果是系统性学习过机器学习算法,理论上我们的这样的分类器应该是有评价指标,而不是简单的肉眼看。
如果您的组织类型不存在分类器我们的仓库中,或者数据中不包含您期望的细胞类型,那么您需要生成自己的分类器。 训练分类器的第一步是加载单细胞数据。 20, PAX3 4 expressed between: gene1 value1 value2, gene2 value1 value2 expressed between: PAX6 10 20, check_marker输出的值和plot_marker绘制的值是分类器可以选择的cell 数量的估计值。然而,它使用启发式快速找到候选细胞,并不能完全匹配标记所选择的细胞。 查看分类基因 Garnett 分类是使用多项弹性-网络回归训练(multinomial elastic-net regression)。这意味着选择某些基因作为区分细胞类型的相关基因。 参数是分类器,您想查看哪个节点(如果您的树是分层的)—使用“root”作为顶部节点,使用父细胞类型名称作为其他节点,使用db作为您的物种。
前面我们演示了 一个完美的单细胞亚群随机森林分离器是如何炼成的,以及 LASSO回归也可以用来做单细胞分类 的两个机器学习算法可以用来做单细胞分类器,而且效果杠杠的。 而且也尝试了多种机器学习的算法,比如:不输于LASSO的SVM单细胞分类器 无论是随机森林,LASSO回归,还是支持向量机, 他们的模型都是有点抽象,不容易直观的可视化解释清楚。 -0.04970561 AAACCGTGCTTCCG 2.2197621 -0.2741145 -0.5625993 -0.04970561 我们的决策树模型就是把这2000个基因组合一下,来划分细胞的分类 box.col="green", border.col="blue", split.col="red", split.cex=1.2 ) 如下所示,虽然是有6个单细胞亚群 然后是HLA-DRA可以区分B细胞以及树突细胞和其它细胞,其中B细胞以及树突细胞的区分靠CST3 然后T细胞里面的CD4靠NKG7区分出来,然后CD8和NK细胞靠FCER1G区分 这样的模型就非常容易解释清楚
para_01 自从近200年前细胞被确立为生命的基本单位以来,生物学家一直致力于表征和分类构成每个器官和生物体的无数不同细胞类型。 在过去的十年里,科学技术飞速发展,使得研究人员可以通过记录神经元的活动模式来对其进行功能分类,并根据其表达的基因进行分子分类。然而,目前对大多数神经系统中的细胞在分子、形态和功能描述之间仍存在脱节。 研究结果表明,t-type 并不总是能反映神经元在功能或形态(形状)上的分类,但它与神经元在视顶盖中的位置相关。荧光标记显示了两种不同的t-type。(改编自参考文献1的图6。) para_10 那么,细胞“类型”最终应该如何定义?需要牢记的是,分类学的目的(无论是细胞类型还是物种)并不是要解释所有可观察到的表型多样性,而是要提供一个实用且逻辑一致的参考框架。 para_12 单细胞转录组学彻底改变了科学家对细胞的理解和分类方式,特别是在能够在整个发育过程中评估大量神经元的情况下。然而,目前对人脑中细胞类型的估计相差数个数量级。
单细胞学习笔记-day4 python单细胞学习笔记-day4(续) python单细胞学习笔记-day5 今天继续学习视频:python_day6 ! touch day6.ipynb 课前准备操作到 23:52 本次课程需要用到的模块,提前安装好: 永久镜像设置: #永久设置镜像 pip config set global.index-url https sc.logging.print_header() # 查看主要包库的版本 sc.settings.set_figure_params(dpi=80, facecolor="white") 2.读取数据 day6/ data文件夹下面是标准的10x上游cellranger的输出结果:barcodes.tsv genes.tsv matrix.mtx adata = sc.read_10x_mtx( "day6/ # 转换成矩阵 adata[0:6, ['CD3D','TCL1A','MS4A1']].X.toarray() # 转换成数据框 adata[0:6, ['CD3D','TCL1A','MS4A1'
单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 ---- 1.数据读入 Cell Ranger生成的主要表格文件主要包括 y = c(sceList[[2]],sceList[[3]],sceList[[4]], sceList[[5]],sceList[[6] y = c(sceList[[2]],sceList[[3]],sceList[[4]], sceList[[5]],sceList[[6] barcodes,所有定量的基因和每个细胞的UMI矩阵。
在我们的实现中,为了效果的展示,我们仅仅是展示3级分类,在大多数的中小型电商系统中,三级分类完全足够应对SKU的分类。 需求分析 先来分析分类都包含哪些元素,以jd为例: ? logo(logo) 有的分类文字前面会有小标 分类展示主图(img_url) 主标题(title) 副标题/Slogan 图片跳转地址(img_link_url)-- 大多数时候我们点击分类都会分类Id 首次展示,仅仅读取一级分类(Root) 根据一级分类查询二三级子分类 编码实现 查询一级分类 Service实现 1.在com.liferunner.service中创建service 接口ICategoryService.java */ private String subName; /** * 分类类型 1:一级大分类 2:二级分类 3:三级小分类 [ { "id": "slide-100002", "imageUrl": "http://www.life-runner.com/2019/11/CpoxxF0ZmH6AeuRrAAEZviPhyQ0768
图 1 最后,本研究通过分别使用 scRNA 数据中 23 个 m6A 调节因子的表达,显示了感兴趣的四种细胞类型(成纤维细胞、巨噬细胞、T 细胞和 B 细胞)的 m6A 特殊 NMF 簇的比例,结果如图 03 m6A介导的巨噬细胞分析 本研究从骨髓细胞中提取了总共 5822 个巨噬细胞,并分为肿瘤相关巨噬细胞(5586 个细胞)和正常巨噬细胞(236 个),获得了五个主要的 m6A-mac 集群,包括四个具有 NMF算法识别出总共5个m6A相关细胞簇,命名为methy-T-C1至methy-T-C5(图4B),这些m6A相关T细胞簇与肿瘤上皮细胞之间的配体-受体连接数量不同(图4C)。 亚簇到肿瘤上皮细胞肿(图 6A )。 图 6 小编总结 本研究首次通过单细胞测序分析方法,鉴定了TME细胞特异性RNA m6A修饰的细胞亚型,揭示了m6A甲基化介导的肿瘤微环境细胞间通讯在调控肿瘤生长和抗肿瘤免疫调节过程中的作用。
Immune Checkpoint Therapies 实体瘤中癌症特异性免疫预后特征及其与免疫检查点治疗的关系 http://mpvideo.qpic.cn/0bf2n4bvuaad3mahbugq6vpvg36dljxqgwqa.f10002 对于黑色素瘤和乳腺癌,确定了三个免疫功能亚群(NK+T细胞、B细胞、混合细胞功能-嗜酸性粒细胞/中性粒细胞/趋化因子/细胞周期,单核/巨噬/树突状细胞MoMaDC)。 对于胶质母细胞瘤和头颈癌,因为B细胞功能的富集未形成显著的特征,所以只确定了两个主要的免疫功能亚群(NK+T+B细胞、混合细胞功能-中性粒细胞/细胞周期,单核/巨噬/树突状细胞MoMaDC)。 对于结直肠癌,确定了四个主要的免疫功能亚群(NK+T细胞、B细胞、MoMaDC、无特殊特征)。 另外,确定了两个主要的免疫功能亚群:cluster 1具有较高的NK细胞,T细胞和B细胞功能富集,cluster 2具有较高的MoMaDC,小胶质细胞和Toll-类受体(TLR)功能富集(图2.a),该结果与先前对
今天将分享细胞荧光显微喉癌分类完整实现版本,为了方便大家学习理解整个流程,将整个流程步骤进行了整理,并给出详细的步骤结果。感兴趣的朋友赶紧动手试一试吧。 HEp-2细胞,因其表达多种细胞核抗原,成为IIF实验的理想基质,尽管存在来源争议,现认为是人类乳突病毒相关宫颈腺癌细胞。 二、HEp-2_cell_classification2018任务 细胞荧光显微喉癌6分类:包含均质,斑点,核仁,着丝粒,核膜,高尔基。 3、训练结果和验证结果 4、验证集分类结果 5、测试集分类结果
细胞文库标准化之平衡的差异基因? 3.2 根据外参转录本的标准化 ---- 1、背景知识 1.1 为什么要标准化 因为在制备单细胞文库时,排除低质量细胞的前提下,最理想的测序结果就是每个细胞的文库大小均相同,这样不同细胞的相同基因水平才具有可比性 用一个指标(size factor)评价每一个细胞受到的技术误差大小、方向(相对所有细胞文库的均值,而不是绝对意义上的偏离标准文库的距离)。然后分别根据每个细胞的指标的值进行对该细胞的标准化。 factor对该细胞的所有基因表达进行归一化处理,即基因表达量除以细胞文库因子。 (2)适用情形 之前提到的细胞文库size factor标准化相当于是把所有细胞的文库大小拉到同一水平进行基因的比较; 但是如果观察的目的之一就是细胞内基因表达总量的变化,例如T细胞激活前后等,具体要结合生物背景知识了
单细胞数据复现-肺癌文章代码复现1https://cloud.tencent.com/developer/article/1992648 单细胞数据复现-肺癌文章代码复现2https://cloud.tencent.com /developer/article/1995619 单细胞数据复现-肺癌文章代码复现3https://cloud.tencent.com/developer/article/1996043 单细胞数据复现 /developer/article/2008487 前面通过对epi和str的细胞类群进行分析后,确定了更精确的细胞分群,准备在将imm进行分析后,整合三个的结果,进行结果的相关性分析。 "#7294D4", p032 = "#5B1A18", p033 = "#9C964A", p034 = "#FD6467", Alveolar_Macrophages1 = "#6bAEd6 /results", width = 20, height = 20, units = "cm") 淋巴细胞和骨髓细胞分析 ##subsetting imm_lympho <- subset(imm_anno