研究团队
李向阳,王亦涵,梁军丽,王馨语,周鹏飞,赵奇,章宇航,宋骐:中国科学技术大学计算机科学与技术学院
#知识增强
,#语言模型,#多模态模型,#时序模型,#领域应用
引用本文: Li X-Y, Wang Y H, Liang J L, et al. Knowledge-enhanced AI models for domain-specific application: a survey. Sci China Inf Sci, 2026, 69(4): 141101, https://doi.org/10.1007/s11432-025-4635-0
研究意义
知识增强模型为解决当前人工智能模型在实际应用中的各种限制提供了一种有效的解决方案。例如,传统模型往往面临可移植性差、可解释性不足、容易过拟合和更新维护成本高等问题。知识增强模型通过整合来自外部知识库或领域专家的知识,能够在模型训练和推理过程中引入额外的信息,从而提高模型的泛化能力和适应性。这种方式不仅可以提升模型在复杂和动态环境中的表现,还能够加强其在多样化应用中的可操作性。随着人工智能技术的不断进步,知识增强模型被广泛应用于基础学科、医疗、工业等多个领域,推动了人工智能的跨领域融合和深度发展,为各行各业的智能化转型提供了强大的支持。通过弥合模型原始数据与专业知识之间的差距,知识增强模型有望推动更多行业的智能化应用,提升智能系统的可信度,并推动各行业的创新发展。
本文工作
本文对知识增强模型领域的研究进行了系统和深入的综述,从以下4个维度进行了分类:知识类型、模型类型、模型执行阶段、领域应用。
1、知识类型
知识是知识增强模型的核心组成部分,决定了模型能如何获得、存储和利用外部知识。本文首先对知识进行了详细地分类,并主要讨论了两大类显式知识:结构化数据(包括知识图谱、数据库和表格等,这些知识具备清晰的结构,便于存储、提取和处理)和显式规则(包括政策、公式和公理等,主要由专家或领域知识库提供,常常用于规范化模型输出,避免模型出现错误的推理结果)。
2、模型类型
模型是实现知识增强的关键手段,依据输入数据的不同类型,模型可以分为语言模型(处理文本数据,主要应用于自然语言理解与生成任务)、多模态模型(处理来自不同模态的数据,通过结合不同模态的信息,这些模型可以执行跨模态的任务)和时序模型(处理具有时间维度的数据)。
3、模型执行阶段
模型执行阶段决定了知识在模型推理中的作用方式。本文提出将知识融入模型的过程分为三个主要阶段:
执行前阶段(Pre-execution):在模型正式进行推理之前,将外部知识注入模型。
执行中阶段(In-execution):知识在模型推理过程中动态地与模型交互。
执行后阶段(Post-execution):在模型输出结果后,使用外部知识对模型的输出进行修正或优化。
知识增强语言模型(小型预训练语言模型)
知识增强语言模型(大语言模型)
知识增强多模态语言模型
知识增强时序模型
4、领域应用
知识增强模型在多个领域中展现了重要的应用价值,尤其是在处理具有复杂结构和专业知识的任务时,能够显著提升模型的性能。本文重点探讨了以下几个领域的应用:
AI for Science:在基础科学领域,知识增强模型广泛应用于物理、化学和生物等学科的研究中,帮助解决复杂的科学问题,如药物发现、材料设计等。通过引入领域特定的知识,模型能更好地理解和推理科学数据,推动科研进展。
AI for Medicine:在医学领域,知识增强模型被用于医学影像分析、疾病诊断、临床决策支持等任务。通过整合医学专业知识,这些模型能够提高诊断的准确性,帮助医生做出更精准的决策。
AI for Industry:在工业领域,知识增强模型被应用于设备故障诊断、生产过程优化、资源调度等。通过融合工程和制造领域的知识,模型能够更有效地解决实际工业问题,提升生产效率和产品质量。
通过对文献的梳理,本文总结了知识增强模型在近年来的研究进展,并指出了当前亟待解决的挑战,如动态知识更新、跨领域迁移、隐式与显式知识的整合等问题。未来,知识增强模型在解决这些问题的基础上,将推动更加智能和高效的系统发展,充分发挥其在各个行业中的应用潜力。