导语 细胞焦亡在胰腺癌中的作用仍然未知。 背景介绍 今天小编为大家带来一篇细胞焦亡构建预后模型+实验验证发表高分文章的例子。 综上,模型中与细胞焦亡相关的基因特征有助于预测PAAD预后。 04 验证预后模型 为了验证预后模型的准确性,从GEO获得了186名胰腺癌患者,并使用训练集中的相同公式计算了风险评分。 结果显示,风险评分与免疫评分(P=0.0071),基质评分(P=0.0024)和ESTIMATE评分(P=0.0019,图7A–C)显著相关。 使用CIBERSORT算法计算PAAD患者中22种免疫细胞亚型的比例,并将P值<0.05的阈值视为临界标准(图7D)。高危组B细胞记忆、巨噬细胞M1和肥大细胞静息的浸润水平均高于低危组。 然而,低危组活化的B细胞幼稚细胞、T细胞CD8、单核细胞和肥大细胞的浸润水平高于高危组(图7E)。 图7 此外,作者评估了风险评分与五个免疫细胞之间的相关性。
摘要 大语言模型(LLMs)正通过助力 “虚拟细胞” 的开发来变革细胞生物学 —— 虚拟细胞是能表征、预测并推理细胞状态与行为的计算系统。本研究对用于虚拟细胞建模的大语言模型进行了全面综述。 提出了一个统一的分类体系,将现有方法归为2大范式:作为 “神谕” 的大语言模型(用于直接细胞建模)和作为 “智能体” 的大语言模型(用于协调复杂科学任务)。 明确了3大核心任务 —— 细胞表征、扰动预测和基因调控推断,并综述了与之相关的模型、数据集、评估基准,以及在可扩展性、泛化性和可解释性方面的关键挑战。 引言 图1 细胞多尺度组织示意图 图2 基于人工智能的虚拟细胞建模主要任务概述 作为神谕/智能体的大语言模型:用于虚拟细胞研究 图3 大语言模型邂逅虚拟细胞的分类体系 详细总结 思维导图 核心任务定义
看到了一个新鲜出炉的肿瘤病人单细胞图谱文章:《Single-cell sequencing reveals the role of IL-33+ endothelial subsets in promoting early gastric cancer progression》,因为是国产科研成果所以单细胞测序数据在:https://ngdc.cncb.ac.cn/gsa-human/browse/HRA010477 可以看到, 仅仅是7个病人,但是文章写到:We constructed a single-cell atlas for 184,426 high-quality cells from gastric male HRS1569311 Sample7 Patients with early gastric cancer 关于胃癌疾病进展 胃癌的疾病进展通常遵循一定的病理过程,从慢性非萎缩性胃炎(Non 这个文章另外的值得一提的优点是图表很漂亮,提供全部的绘图代码,以及表格很齐全,很多信息大家做单细胞的都用得上!
这些例外包括4、5、6、7引用的研究。 Para_02 我们使用来自56项研究(包括46项scRNA-seq和10项snRNA-seq)的7,886,247个单细胞谱数据集训练了SCimilarity模型,其中包含203个Cell Ontology (扩展数据图 7d)。 肌成纤维细胞的存在与 ILD 数据集、COVID-19 和 PDAC 中纤维母细胞的存在呈正相关(r2 = 0.48;扩展数据图 7a、b)。 SCimilarity细胞类型注释被限制在了7个最相似但比三个作者提供的注释(B细胞、T细胞和巨噬细胞)更详细的Cell Ontology术语上。
单细胞专题 | 1.单细胞测序(10×genomics技术)的原理 单细胞专题 | 2.如何开始单细胞RNASeq数据分析 单细胞专题 | 3.单细胞转录组的上游分析-从BCL到FASTQ 单细胞专题 | 4.单细胞转录组的上游分析-从SRA到FASTQ 单细胞专题 | 5.单细胞转录组的上游分析-从FASTQ到count矩阵 单细胞专题 | 6.单细胞下游分析——不同类型的数据读入 ---- 1. NormalizeData(sce, normalization.method = "LogNormalize", scale.factor = 10000) 7. #判断最终选取的主成分数,这里我判断16个 P7 <- ElbowPlot(sce) # 鉴定数据集的可用维度,虚线以上的为可用维度 sce <- JackStraw(object = sce, num.replicate 100) sce <- ScoreJackStraw(object = sce, dims = 1:20) P8 <- JackStrawPlot(object = sce, dims = 1:18) P7
引言 本系列讲解 单细胞(scRNA-seq)中RNA“速率”分析教程 动态建模 我们采用广义动态模型来解析完整的转录动态过程。 我们运行动态模型,以学习剪接动力学的完整转录动态。 该模型在基于似然的期望最大化框架中求解,通过迭代估计反应速率参数和细胞特异性潜在变量(即转录状态和细胞内潜在时间),从而学习每个基因的未剪接/剪接相轨迹。 这些参数有助于更好地理解细胞身份和表型异质性。 潜在时间 动态模型可恢复潜在的细胞过程的潜在时间。这种潜在时间代表细胞的内部时钟,仅根据转录动态,近似细胞分化过程中经历的实际时间。
Spring MVC提供了以下几种途径输出模型数据: ModelAndView 控制器处理方法的返回值是ModelAndView,则其既包含视图信息,也包含模型数据信息 // success.jsp 返回的目标页面 ; return modelAndView; } } Map&Model Spring MVC 在内部使用了一个org.springframework.ui.Model接口存储模型数据 ,具体步骤: 1)SpringMVC在调用方法前会创建一个隐含的数据模型,作为模型数据的存储容器, 成为”隐含模型” 2)如果方法的入参类型为Map或Model,会将隐含模型的引用传递给这些入参。 3)在方法体内,可以通过这个入参对象访问到模型中的所有数据,也可以向模型中添加新的属性数据 Spring Web MVC 提供Model、Map或ModelMap让我们能去暴露渲染视图需要的模型数据。 @SessionAttributes 除了可以通过属性名指定需要放到会话中的属性处,还可以通过模型属性的对象类型指定哪些模型属性需要放到会话中 @SessionAttributes(types=User.class
刷到了一个2022的巨噬细胞相关的单细胞综述文章:《Macrophage diversity in cancer revisited in the era of single-cell omics》,这篇综述文章深入探讨了肿瘤相关巨噬细胞 (Tumor-Associated Macrophages, TAMs)的单细胞亚群,并根据其特征基因、富集通路及潜在功能,将TAMs分为7个不同的亚群。 将TAMs分为7个不同的亚群 如下所示: 1. IFN-TAMs(干扰素诱导TAMs) 高表达IFN调控基因,如CXCL10、PDL1和ISG15。 类似M1样巨噬细胞,但表现出免疫抑制功能。 Inflam-TAMs(炎症细胞因子富集型TAMs) 表达炎性细胞因子,如IL1B、CXCL1/2/3/8、CCL3和CCL3L1。 在肿瘤相关炎症反应中可能起招募和调控免疫细胞的作用。 4. RTM-TAMs(组织驻留型TAMs) 类似正常组织驻留巨噬细胞,表达LYVE1、HES1和FOLR2。 在肿瘤侵袭和进展中可能发挥促进作用。 7.
单细胞数据复现-肺癌文章代码复现1https://cloud.tencent.com/developer/article/1992648单细胞数据复现-肺癌文章代码复现2https://cloud.tencent.com /developer/article/1995619单细胞数据复现-肺癌文章代码复现3https://cloud.tencent.com/developer/article/1996043单细胞数据复现 ", path = "output/fig4", width = 30, height = 35, units = "cm")没有出来,怀疑是heatmap没有加载出来ggsave2("SuppFig7C.png <- read_excel("CD8_T_cells_exhausted.xlsx", skip = 1)cytotoxicity <- c("PRF1", "IFNG", "GNLY", "NKG7" , "GZMB", "GZMA", "GZMH", "KLRK1", "KLRB1", "KLRD1", "CTSW", "CST7")T_cell_markers <- list(T_exhausted
鉴于偏差和偏差来源的多样性,需要对机器学习模型中的相关起源和类型的偏差进行敏感性评估。 本文的观点集中在与基于人类单细胞数据训练的机器学习模型相关的偏差上。 Para_04 为了识别与单细胞ML模型相关的偏差,我们首先总结了基于机器学习的单细胞基因组学领域的最新进展,并简要说明了基于人类单细胞样本的ML模型开发流程。 在评估基于人类单细胞数据训练的ML模型的伦理性时,所有这些偏差都应被考虑在内。 因此,在单细胞研究中考虑可能影响模型性能的社会偏见——过去和现在的——是有意义的。 这种策略常用于纠正单细胞数据中的细胞周期效应。 类似的方法已被提出用于建模(并纠正)昼夜节律,并且可以扩展用于使用细胞数据的代谢通量模型来纠正饮食影响。
前面,我们生信技能树的讲师小洁老师与萌老师新开了一个学习班:《掌握Python,解锁单细胞数据的无限可能》,身为技能树的一员,近水楼台先得月,学起! 下面是我的学习笔记,希望可以给你带来一点参考 今天继续学习视频:python_day6剩余部分和python_day7视频 !一口气学完吧! 续:python单细胞学习笔记-day6 6.2 marker基因可视化 细胞cluster注释,搜集的已知细胞类型的marker基因: CD4 T IL7R CD14+ Mono CD14 CD14+ Mono LYZ B MS4A1 CD8 T CD8A NK GNLY NK NKG7 FCGR3A+ Mono FCGR3A FCGR3A+ Mono MS4A7 DC FCER1A DC CST3 ,线的高度表示基因在细胞中的表达水平 sc.pl.tracksplot(adata,markers,'leiden',figsize=(15,4)) 7.细胞类型注释 使用官网的定义: new_cluster_names
让我们一起来看看这个GSE190856的脓毒症小鼠模型单细胞转录组数据吧。 首先呢, 研究团队做单细胞转录组的时候,筛选了免疫细胞,所以降维聚类分群后主要是免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群: 主要是免疫细胞亚群 ,所以降维聚类分群后主要是免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群,但是我发现里面仍然是有少量的 上皮细胞,内皮细胞,成纤维细胞 [celltype$ClusterID %in% c( 5 ),2]='Bcells' celltype[celltype$ClusterID %in% c( 7 ),2]='Tcells' 而且可以看到,里面的 内皮细胞和成纤维细胞占比还不少哦,不过上皮细胞确实很稀少了。
尽管已有一些针对单细胞RNA-seq(scRNA-seq)数据的基石模型(如Geneformer、scGPT等),但这些模型并不适用于scATAC-seq数据。 EpiFoundation通过创新的跨模态预训练方法,利用非零峰值集和基因表达信息来指导模型学习细胞表示,从而在多个下游任务中表现出色。 在模型训练过程中,EpiFoundation首先将非零峰值及其对应的染色体信息转换为输入嵌入,然后通过Transformer块生成细胞表示。最后,模型通过预测基因的二元表达来完成峰值到基因的对齐任务。 这一过程不仅提高了模型的效率,还确保了细胞表示能够准确反映表型信息。 下游任务表现 EpiFoundation在多个下游任务中表现出色,包括细胞类型注释、批次校正和基因表达预测。 随着单细胞测序技术的不断发展,EpiFoundation有望成为该领域的重要基石模型,推动单细胞多组学研究的进一步深入。
特别是,我们讨论了细胞图谱作为细胞普查;作为身体中跨模态和尺度的细胞三维地图;作为连接基因型原因与表型效应的地图;作为发育的四维地图;最终,作为统一所有这些方面并帮助变革医学的生物学基础模型。 在这里,我们探讨了细胞图谱的五个当前和未来的视角:作为细胞普查、三维地图、时间发育地图、基因型到表型地图以及细胞生物学的多模式基础模型(图1)。 在实验方面,人类细胞图谱(HCA)必须收集为算法的规模和需求量身定制的数据,以便它们能够学习适当的模型。 最近,像SCimilarity22这样的方法则专注于学习在新定义的任务中表现良好的基础模型,例如在整个图谱中查询整个细胞概况。 Para_04 我们预计许多其他任务将使用基础模型来解决。 基础模型对于跨尺度整合(作为多模态地图的细胞图谱)和跨身体整合(为最终的细胞普查)也将至关重要。
= "scRNA.Rdata")p2 <- DimPlot(scRNA, reduction = "umap",label = T,pt.size = 0.5) + NoLegend()p1+p2# 7. Bubble diagrammarkers.to.plot = c("CD3D", "CREM", "HSPH1", "SELL", "GIMAP5", "CACYBP", "GNLY", "NKG7" Cell type annotation7.
引言 本系列开启R中单细胞RNA-seq数据分析教程[1],持续更新,欢迎关注,转发! 2.3. (例如混合具有不同表达特征的细胞)。 它通过两个不同样本/批次之间的细胞的相互最近邻来估计细胞特定的校正向量,以引入对查询细胞降维(例如 PCA)的校正。MNN 还引入了一个排序机制,因此也支持两个以上样本/批次的整合。 ,两个样本的细胞似乎以一种合理的模式混合。 与使用外部参考数据集通过相似性来表示数据中的细胞不同,CSS 首先对每个待整合的单细胞 RNA 测序样本进行细胞聚类,然后使用这些聚类得到的平均表达谱作为参考,来计算相似性。
Torch7搭建卷积神经网络详细教程已经详细的介绍啦Module模块,这里再次基础上再给出一些上Container、 Transfer Functions Layers和 Simple Layers模块的理解 并在后面给出一些简单的模型训练方法。下述程序在itorch qtconsole下运行。 上一篇博文讲到Module主要有四个函数(详细见Torch7搭建卷积神经网络详细教程),但是注意以下几点:forward函数的input必须和backward的函数的input一致,否则梯度更新会有问题 上述函数的具体使用方法可以看Torch7的官方API以及帮助文档。接下来仅介绍一些模型训练所需要的关键函数。 将image包导入当前运行环境,随机生成一张1通道32x32的彩色图像,如下 ?
Expires=1674686023&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci03LjEuMC50YXIueHoiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2NzQ2ODYwMjN9fX1dfQ -5JNocePNKou89k9AOEGoatr6xa9z1VPkOj33FTpG25OpfQowpBrwvNhFF27qoSqw7EcjSWm53zB4QsYqMR~Bi-5MXTEplAxusXnE5A1HtVOo31lsL7cavd88ez9yFcSDIf65 ~KJR6KqDzqYS3NAcm3MKBWWSeIVAwOWAuHaQONeAew8X4fMb3ql85CpeaCWrQdB-vlUVkQbM0gJY2S7MQ9SJ0B5qUc7qo9UWLXATw index,其他物种可以是用cellranger自行构建#>>>down10Xref.sh# Human reference (GRCh38) md5sum: dfd654de39bff23917471e7fcc7a00cdwget Referencehttps://mp.weixin.qq.com/s/cu7r7iY2AEKLBdHALzYaCQhttps://mp.weixin.qq.com/s/VWUmJZnzT7m_7QDjxkbrJwhttps
单细胞测序技术的发展日新月异,新的分析工具也层出不穷。每个工具都有它的优势与不足,在没有权威工具和流程的单细胞生信江湖里,多掌握几种分析方法和工具,探索数据时常常会有意想不到的惊喜。 往期回顾 单细胞初级8讲和高级分析8讲 单细胞分析十八般武艺1:harmony 单细胞分析十八般武艺2:LIGER 单细胞分析十八般武艺3:fastMNN 单细胞分析十八般武艺4:velocyto 单细胞分析十八般武艺 5:monocle3 单细胞分析十八般武艺6:NicheNet CellChat简介 CellChat的特点 全面的数据:大多数的细胞通讯分析方法通常只考虑配体/受体基因对,往往忽略了多亚基复合物受体和其他信号辅助因子 CellChat的作者人工挑选了2021个经过验证的细胞通讯关系,构建了新的细胞通讯参考数据库——CellChatDB。 往期回顾 Barcoding || 海量单细胞的关键技术 单细胞转录组下游分析是否有必要删除线粒体和核糖体基因 细胞亚群注释神器SingleR把它的参考数据库放在了celldex包 ---- --
对应原版教程第8章http://bioconductor.org/books/release/OSCA/overview.htm 细胞的测序结果一般都有1万多的基因。 如何从中抽取出能够最大程度表征细胞间异质性的基因是本小节的主要目的。 ? 4.1 仅保留高变基因信息(不建议) 4.2 标记高变基因,降维设置subset.row=参数(建议) 5、补充:关于“技术误差”的进一步分解 ---- 1、背景知识 1.1 为什么要挑选特定的基因 单细胞数据分析的主要在于考虑细胞 (群)之间的异质性,最直接的方式就是通过相同基因在不同细胞间的差异表达来描述。 但后面计算细胞间的距离是基于log-counts的方法,因此使用方法2.1可能会更具有统一性。