首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信学习111

    细胞5 拟时序分析

    1 拟时序分析拟时序分析是为了探索自己感兴趣的几种细胞之间的发育关系,一般不是用全部类型的细胞来做的。 "T_cells" "Monocyte" "Endothelial_cells" [5] "Smooth_muscle_cells" "NK_cell" 在做拟时序分析的时候,因为是采用差异基因进行排序的,所以要求是两类细胞或者两类以上(要选择的细胞亲缘关系要近一点,有分化的可能性,完全不挨着的细胞不太行)。 这个细胞发育轨迹图,plot_ordering_genes画的图纵坐标是基因表达量的变异性,,横坐标是每个基因在所有细胞种的平均表达量。 sc_cds <- orderCells(sc_cds)#细胞排序,拟时序分析假设细胞状态的变化是连续的,通过排序可以模拟细胞从一个状态逐渐发展到另一个状态的过程,这样才方便推算分化过程。

    67910编辑于 2024-06-26
  • 来自专栏DrugOne

    大语言模型邂逅虚拟细胞

    摘要 大语言模型(LLMs)正通过助力 “虚拟细胞” 的开发来变革细胞生物学 —— 虚拟细胞是能表征、预测并推理细胞状态与行为的计算系统。本研究对用于虚拟细胞建模的大语言模型进行了全面综述。 提出了一个统一的分类体系,将现有方法归为2大范式:作为 “神谕” 的大语言模型(用于直接细胞建模)和作为 “智能体” 的大语言模型(用于协调复杂科学任务)。 明确了3大核心任务 —— 细胞表征、扰动预测和基因调控推断,并综述了与之相关的模型、数据集、评估基准,以及在可扩展性、泛化性和可解释性方面的关键挑战。 引言 图1 细胞多尺度组织示意图 图2 基于人工智能的虚拟细胞建模主要任务概述 作为神谕/智能体的大语言模型:用于虚拟细胞研究 图3 大语言模型邂逅虚拟细胞的分类体系 详细总结 思维导图 核心任务定义

    12710编辑于 2025-11-17
  • 来自专栏生信菜鸟团

    细胞图谱 | Nature 的人类细胞图谱基础模型,SCimilarity 框架

    Para_02 最类似于我们的查询的细胞来自在一种设计用于扩展造血干细胞(HSCs)的3D水凝胶系统中培养了5天的PBMCs(图5a和补充表7)。 ◉ UMAP嵌入来自SCimilarity查询模型潜在空间的细胞谱图(点),分别来自原始3D水凝胶培养系统2的天0(d)或天5(e),或者来自复制实验的天8(f),根据FM SCimilarity得分( 虽然原始的第5天数据2与我们的第8天复制数据在相对细胞丰度上有所不同(方法),但在第8天的实验中,SCimilarity预测10.1%的细胞为HSCs(图5g)。 得分最高的前50个细胞的平均特征谱被SCimilarity嵌入,并用作SCimilarity细胞搜索模型的输入查询,在图4和图5中的分析中一直使用。 Foundation model benchmarking 基础模型基准测试 Para_01 SCimilarity、scGPT5(版本0.2.1,2023年6月23日模型)和scFoundation80

    89400编辑于 2025-03-06
  • 来自专栏数据科学(冷冻工厂)

    细胞RNA“速率”分析:模型学习

    引言 本系列讲解 单细胞(scRNA-seq)中RNA“速率”分析教程 动态建模 我们采用广义动态模型来解析完整的转录动态过程。 该模型在基于似然的期望最大化框架中求解,通过迭代估计反应速率参数和细胞特异性潜在变量(即转录状态和细胞内潜在时间),从而学习每个基因的未剪接/剪接相轨迹。 因此,您可以考虑将结果存储起来以便后续重复使用,使用 adata.write('data/pancreas.h5ad') 进行存储,稍后可以用 adata = scv.read('data/pancreas.h5ad #adata.write('data/pancreas.h5ad', compression='gzip') #adata = scv.read('data/pancreas.h5ad') scv.pl.velocity_embedding_stream 潜在时间 动态模型可恢复潜在的细胞过程的潜在时间。这种潜在时间代表细胞的内部时钟,仅根据转录动态,近似细胞分化过程中经历的实际时间。

    28210编辑于 2025-06-08
  • 来自专栏生信技能树

    细胞入门必读5篇cns综述

    细胞入门必读5篇cns综述,希望对大家有帮助! 综述-单细胞转录组学分析细胞通讯 单细胞多组学在解析癌细胞可塑性和肿瘤异质性中的应用 综述:高维单细胞RNA测序数据分析工具(下) 综述:高维单细胞RNA测序数据分析工具(中) 综述:高维单细胞RNA测序数据分析工具 (上) 单细胞RNA-seq数据分析最佳实践(下) 单细胞RNA-seq数据分析最佳实践(中) 单细胞RNA-seq数据分析最佳实践(上) 回顾:单细胞入门-读一篇scRNA-seq综述 单细胞测序技术将彻底改变整个生物科学 一篇文章带你走进单细胞的天地 单细胞转录组分析综述 单细胞转录组方法篇——下 Single cell RNA-seq 方法篇-上 如果不自己亲自研读综述 你指望去哪里获得单细胞转录组技术以及数据分析的基础知识

    74931编辑于 2023-09-04
  • 来自专栏生信菜鸟团

    细胞 | 人类单细胞数据的机器学习模型中的偏差

    遵循先前的定义,这些定义突出了偏差带来的不希望有的社会后果4,5,我们将偏差定义为机器学习模型输出的系统性扭曲,这种扭曲会导致道德上和/或社会上不希望的效果,例如歧视、误诊以及治疗不足或过度治疗。 鉴于偏差和偏差来源的多样性,需要对机器学习模型中的相关起源和类型的偏差进行敏感性评估。 本文的观点集中在与基于人类单细胞数据训练的机器学习模型相关的偏差上。 Para_04 为了识别与单细胞ML模型相关的偏差,我们首先总结了基于机器学习的单细胞基因组学领域的最新进展,并简要说明了基于人类单细胞样本的ML模型开发流程。 在评估基于人类单细胞数据训练的ML模型的伦理性时,所有这些偏差都应被考虑在内。 我们为越来越多旨在减轻单细胞相关偏见的文献贡献了自己的观点:(1)审查数据类别以确保全面采样,(2)收集更大和更多样化的数据集,(3)推进协变量测试和数据校正,(4)促进单细胞处理方面的进一步努力,(5

    38710编辑于 2025-04-18
  • 来自专栏生信技能树

    脓毒症小鼠模型细胞(中性粒细胞这么就丢了呢)

    让我们一起来看看这个GSE190856的脓毒症小鼠模型细胞转录组数据吧。 首先呢, 研究团队做单细胞转录组的时候,筛选了免疫细胞,所以降维聚类分群后主要是免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群: 主要是免疫细胞亚群 project = gsub('^GSM[0-9]*_','',pro) , min.cells = 5, ,所以降维聚类分群后主要是免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群,但是我发现里面仍然是有少量的 上皮细胞,内皮细胞,成纤维细胞 [celltype$ClusterID %in% c( 5 ),2]='Bcells' celltype[celltype$ClusterID %in% c( 7 ),2]='Tcells'

    66510编辑于 2023-02-27
  • 来自专栏实验盒

    EpiFoundation:单细胞ATAC-seq基础模型

    尽管已有一些针对单细胞RNA-seq(scRNA-seq)数据的基石模型(如Geneformer、scGPT等),但这些模型并不适用于scATAC-seq数据。 EpiFoundation通过创新的跨模态预训练方法,利用非零峰值集和基因表达信息来指导模型学习细胞表示,从而在多个下游任务中表现出色。 在模型训练过程中,EpiFoundation首先将非零峰值及其对应的染色体信息转换为输入嵌入,然后通过Transformer块生成细胞表示。最后,模型通过预测基因的二元表达来完成峰值到基因的对齐任务。 这一过程不仅提高了模型的效率,还确保了细胞表示能够准确反映表型信息。 下游任务表现 EpiFoundation在多个下游任务中表现出色,包括细胞类型注释、批次校正和基因表达预测。 随着单细胞测序技术的不断发展,EpiFoundation有望成为该领域的重要基石模型,推动单细胞多组学研究的进一步深入。

    47110编辑于 2025-02-19
  • 来自专栏生信菜鸟团

    前瞻 | Nature | 人类细胞图谱:从细胞普查到统一的基础模型

    特别是,我们讨论了细胞图谱作为细胞普查;作为身体中跨模态和尺度的细胞三维地图;作为连接基因型原因与表型效应的地图;作为发育的四维地图;最终,作为统一所有这些方面并帮助变革医学的生物学基础模型。 在这里,我们探讨了细胞图谱的五个当前和未来的视角:作为细胞普查、三维地图、时间发育地图、基因型到表型地图以及细胞生物学的多模式基础模型(图1)。 在实验方面,人类细胞图谱(HCA)必须收集为算法的规模和需求量身定制的数据,以便它们能够学习适当的模型。 最近,像SCimilarity22这样的方法则专注于学习在新定义的任务中表现良好的基础模型,例如在整个图谱中查询整个细胞概况。 Para_04 我们预计许多其他任务将使用基础模型来解决。 基础模型对于跨尺度整合(作为多模态地图的细胞图谱)和跨身体整合(为最终的细胞普查)也将至关重要。

    45010编辑于 2025-02-06
  • 来自专栏生信技能树

    python单细胞学习笔记-day5

    前面,我们生信技能树的讲师小洁老师与萌老师新开了一个学习班:《掌握Python,解锁单细胞数据的无限可能》,身为技能树的一员,近水楼台先得月,学起!下面是我的学习笔记,希望可以给你带来一点参考。 前面的学习笔记: python单细胞学习笔记-day1 python单细胞学习笔记-day2 python单细胞学习笔记-day3 python单细胞学习笔记-day4 python单细胞学习笔记-day4 (续) 今天继续学习视频:python_day5 ! touch day5.ipynb 课前复习到 30:29 plotnine语法 plotnine是python版的ggplot2,有一些细节不同。 iris) + geom_point(aes(x='sepal_length', y='petal_length'), color='blue')) 修改其他属性 size=5

    37000编辑于 2025-01-22
  • 来自专栏文献分享及代码学习

    细胞数据复现-肺癌文章代码复现5

    细胞数据复现-肺癌文章代码复现1https://cloud.tencent.com/developer/article/1992648 单细胞数据复现-肺癌文章代码复现2https://cloud.tencent.com /developer/article/1995619 单细胞数据复现-肺癌文章代码复现3https://cloud.tencent.com/developer/article/1996043 单细胞数据复现 ", Endothelial2 = "#FEB24C", Endothelial3 = "#fd8d3C", Endothelial4 = "#FC4E2A", Endothelial5 "Endothelial5" 这个时候发现单细胞的分析在前面还是很像的,但是根据自己研究的样本以及生物学问题的来源不一样,后面是需要进行不同的包的调取,还有个性化分析的,所以无论是做植物还是动物的,多读一些最新的单细胞组学的文章都是能学到很多的内容的

    1.1K20编辑于 2022-05-22
  • 来自专栏智能生信

    深度学习模型在单细胞数据的分析

    作者在此篇综述文章中主要提到了深度学习模型对于单细胞测序领域具有巨大的潜力。目前已经在单细胞领域中应用了大量深度学习模型来进行数据分析,但仍有许多挑战和可能的新发展有待探索。 二、为单细胞研究开发匹配的深度学习模型 通过推广深度学习模型的设计和优化,单细胞数据的高度异质性可以在广泛的课题领域中进行分析。 最佳拟合学习模型模型的选择通常是由一个特定的目标驱动的,例如,无论是细胞聚类还是细胞分类,以及特征顺序是否重要,还是不同模式之间的拓扑关系是否重要。 由于单细胞生物学中可用的注释数据有限,因此有应用主动学习(交互式地建议新的数据标记来训练模型)来建立基于少数训练样本的模型的空间。 基于模型的深度学习有望进一步深入分析单细胞生物学。结构或拓扑感知方法,以及受物理启发和生物启发的框架将信息集成到深度学习模型中,用于其他应用;在单细胞生物学中也可能有类似的应用。

    1.6K10编辑于 2022-04-06
  • 来自专栏R语言及实用科研软件

    🤩 mLLMCelltype | 多种大语言模型助力细胞类型注释!~

    mLLMCelltype是一个迭代式多大语言模型(Multi-LLM)共识框架,专为单细胞RNA测序数据的细胞类型注释而设计。 主要特点 多LLM共识架构:汇集多种大语言模型的集体智慧,克服单一模型的局限性和偏见 结构化讨论过程:使大语言模型能够通过多轮协作讨论分享推理、评估证据并改进注释 透明的不确定性量化:提供定量指标(共识比例和香农熵 )来识别需要专家审查的模糊细胞群体 幻觉减少:跨模型讨论通过批判性评估主动抑制不准确或无支持的预测 对输入噪声的鲁棒性:通过集体错误修正,即使在标记基因列表不完美的情况下也能保持高准确性 层次注释支持: ('your_data.h5ad') # 检查是否已计算leiden聚类,如果没有,则计算 if'leiden'notin adata.obs.columns: print("计算leiden HLCA 参考注释是通过一个分层框架生成的,包含 5 个粒度级别,从广泛的标签(第 1 级:免疫细胞、上皮细胞等)到精细的细胞类型(第 5 级:例如,初始 CD4 T 细胞)。

    75510编辑于 2025-04-21
  • 来自专栏花花单细胞学习小组003

    细胞学习小组003期 Day5

    This is the homework of Huahua's scRNA-seq study group003 Day5.The content of today is the processing single-cell RNA-seq data.Device nameHD72201200Full device nameHD72201200Processor12th Gen Intel(R) Core(TM) i5- nCount_RNA是细胞内检测到的分子总数。nFeature_RNA过低,表示该细胞可能已死/将死或是空液滴。 太高的nCount_RNA和/或nFeature_RNA表明“细胞”实际上可以是两个或多个细胞。 结合线粒体基因count数除去异常值,即可除去大多数双峰/死细胞/空液滴,因此它们过滤是常见的预处理步骤。

    31810编辑于 2024-07-03
  • 来自专栏数据科学(冷冻工厂)

    R中单细胞RNA-seq分析教程 (5)

    接下来,会重新识别这些细胞的高变基因,因为在这些细胞之间,代表背侧端脑细胞与其他细胞的差异的基因不再是有用的。 seurat_dorsal <- subset(seurat, subset = RNA_snn_res.1 %in% c(0,2,5,6,10)) seurat_dorsal <- FindVariableFeatures G2M 细胞不再集中在单独的聚类中,但它仍然干扰了细胞类型分化的轨迹。例如,EOMES+ 细胞被分布在两个不同的群体中。需要进一步减少细胞周期的影响。 可以尝试利用这个选项,进一步减少细胞周期的影响;不过在这之前,需要为每个细胞生成细胞周期相关的评分,以描述它们的细胞周期状态。 if (is(seurat_dorsal[['RNA']], 'Assay5')){ expr <- LayerData(seurat_dorsal, assay = "RNA", layer

    28610编辑于 2024-12-30
  • 来自专栏毛利学Python

    yolov5模型转换NCNN模型部署

    写作原因:最近看了下nihui大佬的ncnn,练习着将yolov5训练的模型转换成ncnn模型并部署,同时借鉴了网上优秀的博文,记录一下,如有不对的地方,请多多指教。 说明:pytorch模型转换成onnx模型,及onnx模型简化和转ncnn模型在引用的文章中都有详细的说明,可移步至引用文章中查看。 图1 其实yolov5 v1-v5版本在训练完后,使用onnx2ncnn.exe将简化后的onnx模型转换成ncnn模型时主要出现这个问题。 V6版本在输出上和前5个版本有一点不同,这里针对1-5版本。 下面说下修改的是什么,这样就可以知道自己的模型应该修改哪里了。

    3.1K20编辑于 2022-09-22
  • 来自专栏生信技能树

    5种方式美化你的单细胞umap散点图

    我们生信技能树的单细胞月更群里面经常看到小伙伴提出的图片美化需求,这就来看看单细胞umap美化工具吧! 端到端的单细胞管道SCP-整合流程 端到端的单细胞管道SCP-细胞质控 端到端的单细胞管道SCP-标准流程 端到端的单细胞管道SCP-快速开始 SCP—为单细胞分析设计的端到端解决方案 端到端的单细胞管道 ,每个亚群的细胞数这些信息: 2、坐标改成 左下小箭头,也是大家非常常见的需求! R 包,主要通过结合细胞之间的相似性来恢复丢失特征中的信号,从而实现细胞特征的“卷积”。 (椒盐风格这个词我在一篇单细胞文献中遇到过,现在找不见了,当时还专门在群里问了来着哈哈哈哈) 还可以轻松地修改配色: # 修改颜色 # Set color palette pal <- viridis(

    10.8K00编辑于 2025-01-11
  • 来自专栏单细胞天地

    OSCA单细胞数据分析笔记-5 Quality control

    如下结果,会剔除33个cell qc.lib <- df$sum < 1e5 qc.nexprs <- df$detected < 5e3 qc.spike <- df$altexps_ERCC_percent SpikeProp=sum(qc.spike), MitoProp=sum(qc.mito), Total=sum(discard)) # DataFrame with 1 row and 5 SpikeProp=sum(qc.spike2), MitoProp=sum(qc.mito2), Total=sum(discard2)) # DataFrame with 1 row and 5 相关代码如下 library(scRNAseq) sce.grun <- GrunPancreasData() #这个sce里有5个batch,其中有两个是有问题的(ERCC占比过高) sce.grun 往期回顾 单细胞分析十八般武艺4:velocyto clustree—聚类可视化利器 肺的正常上皮细胞可以分成这5群 明码标价之10X转录组原始测序数据的cellranger流程 ---- --

    1.9K30发布于 2021-04-29
  • 来自专栏单细胞天地

    读取h5ad格式的单细胞文件

    首先是,读取h5ad格式的单细胞文件,这里以两个样本,数据链接是 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi? /GSE153643_RAW/GSM4648564_adipose_raw_counts.h5ad', "h5seurat", overwrite = TRUE,assay = "RNA ") scRNA <- LoadH5Seurat(". 函数,然后一个LoadH5Seurat即可。 去除细胞效应和基因效应 06.单细胞转录组数据的降维聚类分群 07.单细胞转录组数据处理之细胞亚群注释 08.把拿到的亚群进行更细致的分群 09.单细胞转录组数据处理之细胞亚群比例比较 最基础的往往是降维聚类分群

    10K42编辑于 2022-01-17
  • 来自专栏生信补给站

    Seurat_V5|单细胞转录组 + 蛋白,WNN方法分析单细胞多模态数据

    前面Seurat V5|一个函数就能解决多种去批次方法,按需尝试提到V5的升级部分(https://satijalab.org/seurat/articles/get_started_v5_new)主要体现在 4个方面,本次介绍 Seurat V5 的WNN方法分析单细胞多模态数据,本文以转录组+蛋白组数据为例。 一 载入R包,数据 使用SeuratData中的bmcite数据示例,展示CITEseq数据中的单细胞转录组和蛋白数据的结合 。 3,WNN 对于每个细胞,我们根据RNA和蛋白质相似性的加权组合识别数据集中的多模态邻居,并将结果存储在neighbors插槽中,注意reduction.list中的pca 和 apca 要和前面单独分析时定义的名字一致 rna_TRDC","rna_MPO","rna_AVP"), reduction = 'wnn.umap', max.cutoff = 3, ncol = 3) p5

    88910编辑于 2024-03-25
领券