
在癌症研究和肿瘤学领域,关于AI智能体能力的研究证据正在迅速积累。从自主优化药物设计与开发流程到为具体临床病例提出个性化治疗策略,AI智能体已经能够处理高度复杂、需要多步骤推理和决策的问题,而这些问题在以往几代人工智能系统中几乎无法实现。尽管该领域发展迅速,许多从事转化医学和临床肿瘤学研究的科研人员与医生仍然对AI智能体的具体能力、局限性以及相关的伦理或监管框架缺乏清晰认识。
针对这一关键问题,德累斯顿工业大学、亚琛工业大学以及谷歌DeepMind等机构的研究人员于2026年1月12日在《Nature Reviews Cancer》发表综述文章,题为“Artificial intelligence agents in cancer research and oncology”。

该综述旨在为癌症研究人员和肿瘤学家提供一份关于AI智能体的入门指南。作者阐述了AI智能体如何区别于并超越传统人工智能系统,全面讨论了其在癌症研究中的现有和新兴应用,并从学术研究、临床实践以及工业研发等多个视角探讨了这一技术在现实世界落地过程中面临的挑战。
背景
尽管“智能体”这一概念早在数十年前便已提出,但随着大语言模型(LLMs)的突破性进展(图1a),该概念在近几年重新焕发生机,人类也已经开始在实际工作中广泛使用这些模型(图1b)。AI公司Anthropic对智能体的定义是:“智能体是一类系统,其中大语言模型能够动态引导自身的推理流程和工具使用方式,并在完成任务的过程中保持自主控制。”。在非医学领域,配备多种工具的大语言模型驱动型AI智能体(图1c)已对多个行业产生颠覆性影响。软件工程、旅行预订、客户支持等众多任务现已能够通过AI智能体实现部分或完全自动化。

图1 AI智能体架构类型
近年来,AI智能体也逐渐成为医疗健康和生物医学研究领域的讨论焦点。商业领域已开始对基于智能体的研究与开发工具进行大规模投入以用于科研流程,其中制药研究尤为适合AI智能体的应用。在科研场景中,AI系统可以持续扫描成千上万篇新发表的研究文献,识别人类研究者可能忽略的潜在模式,自动设计计算实验以验证新假设,生成潜在的新型治疗分子结构,并对患者数据进行全面分析以确定最优治疗策略。上述工作可以在持续运行的状态下完成,且仅需人类提供一个高层次的指令。与此同时,医院系统也日益希望借助AI智能体对复杂任务提供自动化支持,例如优化肿瘤学中的诊断流程。到2025年,这些能力已不再停留在科幻设想层面,其技术基础已经成熟,并已有多项概念验证研究证明了其可行性。
在该综述中,作者系统介绍了基于LLM的智能体的基本原理,概述了其在癌症研究和肿瘤学中的应用前景,并分析了其带来的机遇与挑战。总体而言,本文为理解AI智能体这一新兴范式及其对未来癌症研究和临床医疗实践的深远影响,提供了一个清晰的框架。
AI智能体及多智能体系统
许多现实世界的问题求解任务需要最新信息或超出模型静态训练数据范围的动态交互。AI智能体是在LLM基础上赋予其访问外部信息源并与软件系统交互能力的系统。在最基本的层面上,它们只是将LLM与工具通过简单脚本进行串联(图1c)。作为智能体核心的LLM并不严格需要额外训练即可使用,因为其已具备推理能力。只需提供合适的提示并告知其可用工具,LLM即可有效调用这些工具。进一步地,LLM也可以针对工具使用进行专门训练,以在代理式工作流程中表现更佳。
AI智能体之间还可以相互连接,形成多智能体系统。最简单的形式是一个LLM的输出作为另一个LLM的输入(图1d)。最早的LLM多智能体系统之一是2023年GitHub项目BabyAGI。LLM智能体可以通过反复调用工具并对输出进行反思的方式迭代工作(图1e),这种迭代式工具调用指模型与外部软件交互以获取信息或执行操作。近年来,多智能体系统被进一步概念化为多个LLM协同工作。在这类系统中,每个LLM可承担不同职能或代表特定视角(图1f)。此外,智能体还能够自我改进。
AI模型的基准评测
基准测试是用于量化模型在特定任务上表现的评估数据集。Humanity’s Last Exam是一项面向通用LLM的基准测试,包含2700道横跨多个学科的高难度问题。截至2025年初,顶尖模型在该测试中的得分约为18%,这一结果清晰地表明当前AI系统与人类专家水平之间仍存在显著差距。对于AI智能体而言,评测基准需要更加复杂,不仅要评估结果的正确性,还应考量工作流的效率、成本以及伦理维度。已有一些专门框架被提出,例如用于计算生物学中AI智能体评估的BixBench。但总体而言,针对生物医学智能体的相关基准仍然严重不足。特别是在医学应用中,这类基准还必须纳入伦理因素,并考虑在不同医疗系统之间的互操作性和泛化能力。
癌症研究中的AI智能体
AI智能体的应用在生物医学数据科学领域尤为成熟。在这一领域中,研究人员通常使用计算工具来分析数据集(图2a)。这种人类与计算工具之间的交互既可以完全由智能体独立完成,也可以由智能体与人类协同完成(图2b)。

图2 癌症研究中的AI智能体
AI智能体覆盖了广泛的人类科研活动。诸如ResearchAgent和BioDiscoveryAgent等框架展示了基于LLM的系统在接收用户提示后,它们能够在无需逐步人工指导的情况下,通过综合科学文献和数据集,自主生成新的研究问题和潜在假设。Coscientist展示了AI如何能够自主规划并执行计算实验,包括与肿瘤学高度相关的药物设计流程。Agent Laboratory旨在自动化从文献分析到论文发表的通用科研管线。在未来,这类自主AI系统可能从根本上改变科研的开展方式。高效的研究智能体在技术上并不难实现,但其最终效用取决于领域知识以及系统各组成部分的技术能力。此外,研究智能体的技术能力主要由其所依赖的LLM及其可用工具决定。
肿瘤学中的AI智能体
在肿瘤学中,临床决策往往依赖于对来自多种来源数据的综合分析。一个典型例子是多学科肿瘤讨论,在该流程中,不同专业背景的人类专家协同合作,为癌症患者制定最佳治疗方案,并将建议传达给患者。从理论上讲,这类工作流程非常适合由基于LLM的AI智能体实现(图3)。尽管截至2025年,尚无AI智能体系统被正式整合进常规肿瘤学临床实践,但已有多项经过严格验证的概念验证研究发表,同时学术界与商业界对这一领域的兴趣正在迅速增长。

图3 用于肿瘤治疗决策的多智能体框架
未来方向
癌症研究与肿瘤学将不可避免地经历“智能体化”,预计这一进程将经历三个阶段。
阶段1:基于界面的集成。在初始阶段,基于智能体的系统很可能通过易于使用的界面运行,其形式类似于当前可在消费级设备上使用的ChatGPT等用户界面。这类系统独立于临床信息系统和科研数据库运行。智能体仅处理由临床医生或研究人员明确提供的数据,例如上传的患者病历、研究数据集或文献,并通过对话形式输出结果。事实上,这一进程已经在进行中。然而,其主要风险在于这类工具大多尚未受到监管,此类工具可能会导致患者隐私数据泄露。
阶段2:在监督授权下的深度系统集成。在这一阶段,智能体将获得对临床环境中患者记录以及科研环境中数据库与文献的直接、受权限控制的访问。与依赖人工上传数据不同,这类系统能够动态识别并调取相关信息。尽管如此,它们仍将主要以助手的身份运作,处于一种监督框架之下,所有建议在实施之前都必须经过人类专业人员的审查与批准。
阶段3:具备自主能动性的主动系统参与。在科研场景中,这可能表现为直接控制实验室机器人,根据不断迭代更新的假设来设计并执行实验;在临床场景中,这类系统则可能独立开具诊断检查或调整药物剂量。这一阶段标志着从“辅助型智能”向“协作型智能”的根本性转变,即AI智能体不再只是咨询工具,而是成为临床与科研工作流程中的积极参与者。从技术角度看,第三阶段系统已经逐渐具备可行性;然而,围绕这一技术的监管与伦理框架仍亟需系统性地加以构建。
代理式人工智能领域仍处于起步阶段,存在诸多亟待研究界主动应对的局限性与开放性挑战。首先,需要确保能够对肿瘤学中智能体系统的性能进行准确评估;其次,必须使智能体的行为与人类的伦理约束保持一致;第三,需要为智能体在临床常规中的应用做好基础设施层面的准备。尽管在验证、监管和系统整合方面仍存在挑战,但迈向更具自主性的人工智能协作体的总体轨迹是可行的,并有望显著提升科研与临床运作的效率,从而加速科学发现与医疗服务的转化进程。
参考链接:
Truhn, D., Azizi, S., Zou, J. et al. Artificial intelligence agents in cancer research and oncology. Nat Rev Cancer (2026).
https://doi.org/10.1038/s41568-025-00900-0
--------- End ---------