首页
学习
活动
专区
圈层
工具
发布
技术百科首页 >RAG >RAG的工作流程是什么?

RAG的工作流程是什么?

词条归属:RAG

RAG 的工作流程如下:

1. 索引构建阶段(离线预处理)

  • 数据收集与解析:从企业知识库、文档系统、数据库中收集原始数据,或从腾讯云 COS 等云存储服务中批量导入,进行格式解析与内容提取
  • 文本分块处理:将长文档按照语义边界分割为适当大小的文本块(Chunk),通常每个块包含200-500个token,并设置一定的重叠区域以保持上下文连续性
  • 向量化与索引:使用嵌入模型将每个文本块转换为高维向量,并将向量与原始文本、元数据一起存储在向量数据库

2. 检索阶段(查询时执行)

  • 查询编码:将用户的自然语言查询通过相同的嵌入模型转换为向量表示
  • 相似度搜索:在向量数据库中执行近似最近邻搜索(ANN),找出与查询向量最相似的Top-K个文本块
  • 结果重排序:使用交叉编码器(Cross-Encoder)或重排序模型对初步检索结果进行重新打分和排序,提高检索精度

3. 增强与生成阶段

  • 上下文组装:将检索到的相关文本块与原始查询组合成增强后的提示词,为生成模型提供充分的上下文信息
  • 答案生成:大语言模型基于增强后的提示词生成最终响应,回答用户的问题
  • 结果后处理:对生成结果进行格式优化、来源标注、安全检查等后处理操作
相关文章
RAG技术工作流程详细指南
检索增强生成(Retrieval-Augmented Generation,简称RAG)是人工智能领域的一项关键技术。它将信息检索与大型语言模型相结合,大大提升了生成内容的准确性和及时性。
霍格沃兹-测试开发学社
2025-08-28
8170
RAG是什么?
检索增强生成(RAG)是对大型语言模型输出进行优化的方法,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)通过海量数据进行训练,利用数十亿个参数执行诸如回答问题、语言翻译和生成句子等任务。在已经具备强大功能的LLM基础上,RAG通过扩展其能力,使其能够访问特定领域或企业的内部知识库,而无需重新训练模型。这种方法经济高效,能够有效改进LLM输出,在不同情境下保持相关性、准确性和实用性。
灵雀云
2024-02-22
2K0
RAG 系统中的偏差是什么?
检索增强生成 (RAG) 在减少模型幻觉和增强大型语言模型 (LLM)的领域特定知识库方面已获得广泛认可。通过外部数据源佐证大型语言模型生成的信息,有助于保持模型输出的新鲜度和真实性。然而,最近在 RAG系统中的发现,突显了基于 RAG 的大型语言模型的问题,例如 RAG 系统中偏差的引入。
致Great
2025-04-09
2960
【项目管理之RAG流程】
RAG流程,也称为Red, Amber, Green技术,是一种用于项目管理和团队协作的简单而有效的方法。RAG代码代表红色、黄色和绿色标志,用于识别任务或项目的状态。在本文中,我们将讨论如何使用RAG技术,通过代码和案例分析来帮助您了解其实现过程。
贺公子之数据科学与艺术
2025-08-29
3550
大模型RAG:文档分块方案与RAG全流程
在上一篇文章《大模型RAG:基于PgSql的向量检索》中,简单介绍了RAG概念和简要实现。在实际的应用中,技术方案远不会这样简单。
程序员架构进阶
2025-02-28
2.3K0
点击加载更多
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
领券