首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >颠覆认知:单细胞分析Seurat和Scanpy处理结果差异竟然这么大

颠覆认知:单细胞分析Seurat和Scanpy处理结果差异竟然这么大

作者头像
简说基因
发布2025-11-24 15:03:57
发布2025-11-24 15:03:57
2650
举报
文章被收录于专栏:简说基因简说基因

Seurat 和 Scanpy 是单细胞数据分析的两大工具。通常认为:同类工具分析结果都差不多。喜欢R就用Seurat,喜欢Python就用Scanpy。

但是,这篇预印本文章的结果却颠覆了人们的认知:

当都使用默认参数时,两者输出结果差异非常大。

研究通过 PBMC 数据集对比分析,发现 Seurat 与 Scanpy 在关键分析步骤中存在明显分歧:高可变基因筛选的杰卡德指数仅为 0.22,PCA 特征向量、SNN 图构建及聚类结果均有显著差异,差异表达分析中显著标记基因重叠度也仅为 0.62。这些差异源于算法默认参数不同,如 Seurat 采用 Bonferroni 校正和数据裁剪,而 Scanpy 默认使用 Benjamini-Hochberg 校正且不进行数据裁剪。

版本差异同样造成结果波动,Seurat v5 与 v4、Scanpy v1.9 与 v1.4 在差异表达分析中标记基因集差异显著,Cell Ranger v7 与 v6 因内含子计数默认设置不同,也导致下游分析结果偏差。此外,工具对数据降采样的耐受性存在差异,多数分析步骤在保留不足 5% 测序 reads 或 25% 细胞时,仍能维持与全量数据相近的稳定性。

这要求研究人员以后在选择分析工具和版本时要非常小心。也要求开发者在开发工具时要注意透明性,明确使用的算法,以及每一个参数的用途。

参考文献:

The impact of package selection and versioning on single-cell RNA-seq analysis

推荐阅读

中国银河生信云平台(UseGalaxy.cn)致力于零代码生信分析。平台拥有海量计算资源、3000 多个生信工具和数十条生信流程,并且为用户提供 200G 免费存储空间。我们还为进阶用户提供高质量课程培训:

培训课程 | 第2期《RNA-seq数据分析实战》,现在报名,即可获得上期课件和直播回放视频

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 简说基因 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档