开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >RAG >RAG的工作流程是什么？

RAG的工作流程是什么？

修改于 2026-06-11 15:36:52

1

词条归属：RAG

RAG 的工作流程如下：

1. 索引构建阶段（离线预处理）

数据收集与解析：从企业知识库、文档系统、数据库中收集原始数据，或从腾讯云 COS 等云存储服务中批量导入，进行格式解析与内容提取
文本分块处理：将长文档按照语义边界分割为适当大小的文本块（Chunk），通常每个块包含200-500个token，并设置一定的重叠区域以保持上下文连续性
向量化与索引：使用嵌入模型将每个文本块转换为高维向量，并将向量与原始文本、元数据一起存储在向量数据库中

2. 检索阶段（查询时执行）

查询编码：将用户的自然语言查询通过相同的嵌入模型转换为向量表示
相似度搜索：在向量数据库中执行近似最近邻搜索（ANN），找出与查询向量最相似的Top-K个文本块
结果重排序：使用交叉编码器（Cross-Encoder）或重排序模型对初步检索结果进行重新打分和排序，提高检索精度

3. 增强与生成阶段

上下文组装：将检索到的相关文本块与原始查询组合成增强后的提示词，为生成模型提供充分的上下文信息
答案生成：大语言模型基于增强后的提示词生成最终响应，回答用户的问题
结果后处理：对生成结果进行格式优化、来源标注、安全检查等后处理操作

相关文章

RAG技术工作流程详细指南

检索增强生成（Retrieval-Augmented Generation，简称RAG）是人工智能领域的一项关键技术。它将信息检索与大型语言模型相结合，大大提升了生成内容的准确性和及时性。

霍格沃兹-测试开发学社

2025-08-28

8170

RAG是什么？

企业模型数据搜索人工智能

检索增强生成（RAG）是对大型语言模型输出进行优化的方法，使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型（LLM）通过海量数据进行训练，利用数十亿个参数执行诸如回答问题、语言翻译和生成句子等任务。在已经具备强大功能的LLM基础上，RAG通过扩展其能力，使其能够访问特定领域或企业的内部知识库，而无需重新训练模型。这种方法经济高效，能够有效改进LLM输出，在不同情境下保持相关性、准确性和实用性。

2024-02-22

2K0

RAG 系统中的偏差是什么？

数据算法系统人工智能模型

检索增强生成 (RAG) 在减少模型幻觉和增强大型语言模型 (LLM)的领域特定知识库方面已获得广泛认可。通过外部数据源佐证大型语言模型生成的信息，有助于保持模型输出的新鲜度和真实性。然而，最近在 RAG系统中的发现，突显了基于 RAG 的大型语言模型的问题，例如 RAG 系统中偏差的引入。

2025-04-09

2960

【项目管理之RAG流程】

软件开发手机工具工作开发

RAG流程，也称为Red, Amber, Green技术，是一种用于项目管理和团队协作的简单而有效的方法。RAG代码代表红色、黄色和绿色标志，用于识别任务或项目的状态。在本文中，我们将讨论如何使用RAG技术，通过代码和案例分析来帮助您了解其实现过程。

贺公子之数据科学与艺术

2025-08-29

3550

大模型RAG：文档分块方案与RAG全流程

大模型部署

在上一篇文章《大模型RAG：基于PgSql的向量检索》中，简单介绍了RAG概念和简要实现。在实际的应用中，技术方案远不会这样简单。

程序员架构进阶

2025-02-28

2.3K0

点击加载更多