面向认知技术的事实型信息检索中的特殊要素
Special Elements of Factographic Information Retrieval for Cognitive Technology
https://link.springer.com/book/10.1007/978-3-031-76516-2

摘要:
本文阐述了一种构建信息系统的构想,该系统包含认知模块与模式识别模块,可为认知技术领域的研究者与开发者提供支持。通过分析多篇认知技术相关文献,提取出事实型信息检索的关键术语,并建议将其存储于事实型数据库中。该事实型信息检索的特殊要素包括:一种模式识别算法、三个事实型数据库,以及一个认知工具与方法库。其中,第一个数据库收录认知技术领域的专用关键词;第二个数据库收录事实型信息检索所需的专用参数与数据;第三个数据库则以“检索文档模式”的形式存储认知技术领域文献的描述信息。文中简要介绍了该事实型信息检索在分析模型中的关键有效性指标:即推荐列表的平均长度——该指标用于评估面向认知技术的事实型信息检索系统的效能。最后,概述了主要研究成果。
关键词:信息检索 · 事实型数据库 · 认知技术
1 引言
具备事实型信息检索(FIR)功能的信息系统,对于科研人员快速检索认知技术(CT)相关关键词所对应的事实信息至关重要。本节将对该研究领域作简要综述。信息检索[1]与事实型信息检索[2]是信息系统与信息技术中的重要工具;随着文本数据规模的急剧增长,以及从中快速定位所需信息需求的不断提升,此类任务日益重要且备受关注。文献[3]或[4,5]等论文与专著中已探讨了事实型信息系统与神经网络当前面临的一些问题。具备事实型信息检索功能的信息系统属于问答系统(QA系统)[3]的一个特例。神经网络(NN)[4],即神经网络理论[5],以及卷积神经网络(CNN)[6],已被应用于事实型信息检索。本文结构如下:第1节简述研究领域背景;第2节引入关键术语;第3节介绍事实型信息检索的重要组成要素;第4节简要呈现主要结果;第5节最终总结核心成果。
2 事实型信息检索的关键词
本文分析了多篇认知技术(CT)相关文献,从中提取出事实型信息检索(FIR)的重要关键词,并建议将这些关键词存储于事实型数据库中。表1展示了部分此类关键词(即科技文献的特殊特征)示例;表1中的关键词被存入事实型数据库I。

3 事实型信息检索的要素
事实型信息检索的特殊要素如图1所示,包括:一种模式识别算法、三个事实型数据库,以及一个认知工具与方法库。

第一个事实型数据库包含认知技术领域的专用关键词; 第二个事实型数据库包含事实型信息检索所需的专用参数与数据; 第三个事实型数据库以“检索文档模式”(SDP)的形式存储认知技术领域文献的文档描述(DD)。
假定面向认知技术的事实型信息检索特殊要素(SEFIR)由多个不同模块构成,且这些模块结构复杂。SEFIR的架构图(见图1)展示了这些模块及特殊要素,例如:
具备事实型信息检索功能的事实型信息系统设有若干有效性指标(源自分析模型)及可调参数,例如:
4 结果 研究发现,面向认知技术(CT)的事实型信息检索特殊要素(SEFIR)由九个模块构成,例如:三个事实型数据库、模块2(识别模块,采用CNN)、模块3(认知模块,含工具与方法)、模块9(推荐列表处理模块)及其他模块。文中提出了事实型信息检索的重要关键词,并建议将其存储于事实型数据库中。所提出的系统可应用于多个领域,主要应用场景是在大规模文本信息中,基于检索模式进行数据处理与查找;例如,在需要全文检索的各类应用中——如司法鉴定、法学及其他需处理海量文本信息的领域。通过使用不同的检索模式并配置相应算法,用户可显著缩短在特定领域内查找所需事实数据的时间。需指出的是,本文提出的面向认知技术的事实型信息检索特殊要素,对认知技术领域的研究者及事实型信息系统开发者而言具有重要参考价值。
5 结论 本研究在梳理认知技术关键词与事实型检索需求的基础上,设计了面向认知技术的事实型信息检索特殊要素的可视化架构图。所收集的认知技术关键词信息将用于构建面向认知技术的高效事实型信息检索系统。理解这些特殊要素有助于开发高度有效的认知技术事实型信息系统。此外,研究在识别模块中应用卷积神经网络(CNN)的可能性,可进一步提升人工操作者的处理效能;引入神经网络技术还可为检索模块增添后续处理能力——这不仅能使系统向用户提供所需信息块的链接,更能对信息进行加工,并以更便捷或更紧凑的形式呈现给用户。
原文链接:https://link.springer.com/book/10.1007/978-3-031-76516-2