Nat. Biomed. Eng. | 面向功能性磁共振成像分析的通用基础模型

DrugAI

发布于 2026-04-28 10:30:38

210

DRUGONE

功能性磁共振成像（fMRI）是研究脑功能和神经疾病的重要工具，但现有分析方法通常依赖复杂的预处理流程和任务特定模型，导致结果在不同数据集和任务之间难以复现和迁移。

针对这一问题，研究人员提出了一种通用fMRI基础模型——NeuroSTORM。该模型直接从四维fMRI体数据中学习可泛化的表示，并通过大规模预训练实现跨任务迁移能力。其训练数据覆盖超过50,000名受试者、2865万帧fMRI数据，涵盖不同年龄、中心和实验条件。实验结果表明，NeuroSTORM在多个下游任务中均优于现有方法，包括人口统计预测、表型预测、疾病诊断、个体识别以及脑状态分类。在多中心临床数据中，该模型在17类疾病诊断任务中取得最佳表现，同时能够有效预测心理与认知表型。整体来看，该研究提出的框架为构建标准化、可迁移的fMRI分析模型提供了重要基础。

fMRI作为一种无创脑成像技术，广泛应用于神经科学研究、疾病诊断以及脑机接口等领域。然而，尽管深度学习方法在解析脑信号方面取得进展，当前fMRI分析仍面临严重碎片化问题。

不同研究通常采用不同的数据格式、预处理流程和模型设计，这种差异导致结果难以复现，并限制了模型在新任务中的迁移能力。此外，许多方法依赖特定任务设计，缺乏通用性。

基础模型的兴起为这一问题提供了新的解决思路。通过大规模预训练，模型能够学习通用表示，并在多任务中共享。然而，将这一理念应用于fMRI仍然具有挑战。一方面，fMRI数据是高维四维体数据，计算成本极高；另一方面，传统方法通常通过脑区划分或连接矩阵降维，这会丢失关键空间信息并引入偏差。

因此，研究人员提出，需要一种能够直接处理原始4D fMRI数据、同时具备高效计算能力和泛化能力的基础模型框架。

方法

NeuroSTORM采用统一框架，直接对原始四维fMRI数据进行建模。

在结构设计上，模型基于一种改进的时空建模架构，将状态空间模型与窗口机制结合，以降低计算复杂度并捕捉长程依赖关系。同时，通过掩码自编码策略进行自监督预训练，使模型能够从数据中学习稳定的时空特征表示。

为了应对fMRI数据中存在的高度冗余问题，研究人员引入时空冗余丢弃机制，在训练过程中有选择地去除重复信息，从而迫使模型学习更具信息量的表示。

在下游任务适配方面，模型采用轻量级提示调优策略，仅需调整少量参数即可完成任务迁移。这种设计在保持性能的同时显著降低了计算成本。

整体而言，该方法实现了从原始脑信号到通用表示的端到端学习。

图1：NeuroSTORM整体框架与数据体系。

结果

年龄与性别预测能力

研究人员首先评估模型在基础人口统计预测任务中的表现。结果显示，NeuroSTORM在多个数据集上均优于ROI方法和体素级方法。

例如，在HCP-YA数据集上，性别分类准确率达到约93%，显著高于对比方法。在年龄预测任务中，模型同样取得最低误差，显示出其对脑结构变化的敏感性。

此外，在数据稀缺情况下，模型仍保持较高性能，即使只使用部分训练数据，其性能下降也明显小于其他方法，体现出良好的数据效率。

图2：年龄与性别预测性能。

表型预测能力

在表型预测任务中，NeuroSTORM能够从脑活动模式中推断认知、情绪、语言等多维特征。

实验结果表明，该模型在多个指标上均优于现有方法，并在数据减少时仍保持稳定表现。这表明模型能够捕捉复杂脑功能网络与行为之间的关系。

在临床数据中，模型对精神疾病相关指标（如情绪、认知等）同样表现出较强预测能力，说明其具有潜在临床应用价值。

图3：表型预测结果。

疾病诊断能力

在多种神经与精神疾病数据集上，NeuroSTORM均取得最佳或接近最佳表现。

例如，在ADHD、精神分裂症等任务中，模型显著优于现有方法。这一结果表明，其学习到的表示具有较强的疾病区分能力。

同时，在训练数据减少的情况下，模型性能下降较缓，进一步证明其泛化能力。

图4：疾病诊断结果。

个体识别能力

在fMRI重识别任务中，NeuroSTORM能够准确区分不同个体的脑信号特征。

实验结果显示，其识别准确率和平均精度均显著高于其他方法，说明模型嵌入空间能够有效保留个体特征信息。

这一能力对于脑数据检索和个体特征分析具有重要意义。

图5：fMRI个体识别性能。

脑状态分类能力

在脑状态分类任务中，模型能够识别不同认知任务或实验条件下的脑活动模式。

NeuroSTORM在多个任务中均取得最高准确率，并在低数据条件下仍保持优势。这表明其在捕捉动态脑状态方面具有强大能力。在药物状态分类实验中，模型还能区分药物作用前后的脑状态变化，显示出对功能变化的敏感性。

图6：脑状态分类结果。

讨论

该研究提出的NeuroSTORM为fMRI分析提供了一种通用基础模型框架，成功解决了长期存在的可复现性与可迁移性问题。

其核心优势在于直接处理原始4D数据，避免信息损失，同时通过大规模预训练学习稳定的时空表示。此外，轻量级任务适配机制使模型能够高效应用于多种任务。

与传统ROI方法相比，该模型能够保留更丰富的空间信息，从而在多项任务中取得更好表现。同时，其在数据稀缺场景下的优异表现，说明其具有实际应用潜力。

然而，该方法仍存在一定局限，例如训练数据存在人群偏差，以及对任务特异性信号的建模仍有提升空间。未来可通过引入多模态数据（如EEG、DTI）以及更丰富的先验知识进一步改进。

总体而言，该研究标志着脑影像分析从“任务模型”向“基础模型”转变，为构建通用脑科学AI系统提供了重要方向。

整理 | DrugOne团队

参考资料

Wang, C., Jiang, Y., Peng, Z. et al. Towards a general-purpose foundation model for functional MRI analysis. Nat. Biomed. Eng (2026).

https://doi.org/10.1038/s41551-026-01666-y

内容为【DrugOne】公众号原创｜转载请注明来源

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-04-26，如有侵权请联系 cloudcommunity@tencent.com 删除

模型

本文分享自 DrugOne 微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度

Nat. Biomed. Eng. | 面向功能性磁共振成像分析的通用基础模型

Nat. Biomed. Eng. | 面向功能性磁共振成像分析的通用基础模型

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐