首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Nat. Biomed. Eng. | 面向功能性磁共振成像分析的通用基础模型

Nat. Biomed. Eng. | 面向功能性磁共振成像分析的通用基础模型

作者头像
DrugAI
发布2026-04-28 10:30:38
发布2026-04-28 10:30:38
210
举报

DRUGONE

功能性磁共振成像(fMRI)是研究脑功能和神经疾病的重要工具,但现有分析方法通常依赖复杂的预处理流程和任务特定模型,导致结果在不同数据集和任务之间难以复现和迁移。

针对这一问题,研究人员提出了一种通用fMRI基础模型——NeuroSTORM。该模型直接从四维fMRI体数据中学习可泛化的表示,并通过大规模预训练实现跨任务迁移能力。其训练数据覆盖超过50,000名受试者、2865万帧fMRI数据,涵盖不同年龄、中心和实验条件。实验结果表明,NeuroSTORM在多个下游任务中均优于现有方法,包括人口统计预测、表型预测、疾病诊断、个体识别以及脑状态分类。在多中心临床数据中,该模型在17类疾病诊断任务中取得最佳表现,同时能够有效预测心理与认知表型。整体来看,该研究提出的框架为构建标准化、可迁移的fMRI分析模型提供了重要基础。

fMRI作为一种无创脑成像技术,广泛应用于神经科学研究、疾病诊断以及脑机接口等领域。然而,尽管深度学习方法在解析脑信号方面取得进展,当前fMRI分析仍面临严重碎片化问题。

不同研究通常采用不同的数据格式、预处理流程和模型设计,这种差异导致结果难以复现,并限制了模型在新任务中的迁移能力。此外,许多方法依赖特定任务设计,缺乏通用性。

基础模型的兴起为这一问题提供了新的解决思路。通过大规模预训练,模型能够学习通用表示,并在多任务中共享。然而,将这一理念应用于fMRI仍然具有挑战。一方面,fMRI数据是高维四维体数据,计算成本极高;另一方面,传统方法通常通过脑区划分或连接矩阵降维,这会丢失关键空间信息并引入偏差。

因此,研究人员提出,需要一种能够直接处理原始4D fMRI数据、同时具备高效计算能力和泛化能力的基础模型框架。

方法

NeuroSTORM采用统一框架,直接对原始四维fMRI数据进行建模。

在结构设计上,模型基于一种改进的时空建模架构,将状态空间模型与窗口机制结合,以降低计算复杂度并捕捉长程依赖关系。同时,通过掩码自编码策略进行自监督预训练,使模型能够从数据中学习稳定的时空特征表示。

为了应对fMRI数据中存在的高度冗余问题,研究人员引入时空冗余丢弃机制,在训练过程中有选择地去除重复信息,从而迫使模型学习更具信息量的表示。

在下游任务适配方面,模型采用轻量级提示调优策略,仅需调整少量参数即可完成任务迁移。这种设计在保持性能的同时显著降低了计算成本。

整体而言,该方法实现了从原始脑信号到通用表示的端到端学习。

图1:NeuroSTORM整体框架与数据体系。

结果

年龄与性别预测能力

研究人员首先评估模型在基础人口统计预测任务中的表现。结果显示,NeuroSTORM在多个数据集上均优于ROI方法和体素级方法。

例如,在HCP-YA数据集上,性别分类准确率达到约93%,显著高于对比方法。在年龄预测任务中,模型同样取得最低误差,显示出其对脑结构变化的敏感性。

此外,在数据稀缺情况下,模型仍保持较高性能,即使只使用部分训练数据,其性能下降也明显小于其他方法,体现出良好的数据效率。

图2:年龄与性别预测性能。

表型预测能力

在表型预测任务中,NeuroSTORM能够从脑活动模式中推断认知、情绪、语言等多维特征。

实验结果表明,该模型在多个指标上均优于现有方法,并在数据减少时仍保持稳定表现。这表明模型能够捕捉复杂脑功能网络与行为之间的关系。

在临床数据中,模型对精神疾病相关指标(如情绪、认知等)同样表现出较强预测能力,说明其具有潜在临床应用价值。

图3:表型预测结果。

疾病诊断能力

在多种神经与精神疾病数据集上,NeuroSTORM均取得最佳或接近最佳表现。

例如,在ADHD、精神分裂症等任务中,模型显著优于现有方法。这一结果表明,其学习到的表示具有较强的疾病区分能力。

同时,在训练数据减少的情况下,模型性能下降较缓,进一步证明其泛化能力。

图4:疾病诊断结果。

个体识别能力

在fMRI重识别任务中,NeuroSTORM能够准确区分不同个体的脑信号特征。

实验结果显示,其识别准确率和平均精度均显著高于其他方法,说明模型嵌入空间能够有效保留个体特征信息。

这一能力对于脑数据检索和个体特征分析具有重要意义。

图5:fMRI个体识别性能。

脑状态分类能力

在脑状态分类任务中,模型能够识别不同认知任务或实验条件下的脑活动模式。

NeuroSTORM在多个任务中均取得最高准确率,并在低数据条件下仍保持优势。这表明其在捕捉动态脑状态方面具有强大能力。在药物状态分类实验中,模型还能区分药物作用前后的脑状态变化,显示出对功能变化的敏感性。

图6:脑状态分类结果。

讨论

该研究提出的NeuroSTORM为fMRI分析提供了一种通用基础模型框架,成功解决了长期存在的可复现性与可迁移性问题。

其核心优势在于直接处理原始4D数据,避免信息损失,同时通过大规模预训练学习稳定的时空表示。此外,轻量级任务适配机制使模型能够高效应用于多种任务。

与传统ROI方法相比,该模型能够保留更丰富的空间信息,从而在多项任务中取得更好表现。同时,其在数据稀缺场景下的优异表现,说明其具有实际应用潜力。

然而,该方法仍存在一定局限,例如训练数据存在人群偏差,以及对任务特异性信号的建模仍有提升空间。未来可通过引入多模态数据(如EEG、DTI)以及更丰富的先验知识进一步改进。

总体而言,该研究标志着脑影像分析从“任务模型”向“基础模型”转变,为构建通用脑科学AI系统提供了重要方向。

整理 | DrugOne团队

参考资料

Wang, C., Jiang, Y., Peng, Z. et al. Towards a general-purpose foundation model for functional MRI analysis. Nat. Biomed. Eng (2026).

https://doi.org/10.1038/s41551-026-01666-y

内容为【DrugOne】公众号原创|转载请注明来源

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-04-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugOne 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档