开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >RAG >RAG的核心组成部分有哪些？

RAG的核心组成部分有哪些？

修改于 2026-06-11 15:35:21

1

词条归属：RAG

RAG 的核心组成部分如下：

1. 检索模块（Retriever）

查询编码器（Query Encoder）：将用户输入的查询转换为向量表示，使用与文档索引相同的嵌入模型，确保查询与文档在统一的向量空间中可比
向量数据库（Vector Database）：存储预先处理后的文档向量表示，支持高效的语义相似度搜索，常用系统包括腾讯云向量数据库、FAISS、Milvus、Pinecone、Weaviate、Qdrant、Chroma 以及 pgvector 等
检索算法：结合向量搜索（语义相似度）与关键词搜索（如BM25算法），通过混合检索提升召回率；许多RAG系统还引入重排序模型（Reranker）对检索结果进行二次精排

2. 生成模块（Generator）

大语言模型（LLM）：接收用户查询与检索到的相关上下文，生成自然语言响应；常用模型包括 GPT-5.2、Gemini 3 、Claude 4.7、Qwen 、混元等
提示词组装器（Prompt Assembler）：将检索到的相关文本片段与原始查询组织成结构化的提示词，为生成模型提供充分的上下文信息
输出后处理：对生成结果进行过滤、格式化、引用标注等处理，确保输出的可信度和可用性

3. 知识库与数据处理模块

数据摄取（Ingestion）：从多种来源（PDF文档、网页、数据库、API等）收集原始数据，支持结构化与非结构化数据
文本分块（Chunking）：将长文档分割为适当大小的文本片段，常用策略包括固定长度分块、递归字符分块、语义分块等，分块质量直接影响检索效果
嵌入模型（Embedding Model）：将文本转换为高维向量表示，常用模型包括 text-embedding-4-large、text-embedding-3-large、EmbeddingGemma-300M、text-embedding-005、voyage-3.5、embed-v4.0、Qwen3-Embedding、BGE-M3、Nomic Embed Text V2 等
索引构建（Indexing）：将文本块的向量表示存储在向量数据库中，建立高效的检索索引（如HNSW、IVF等算法）

相关文章

Ribbon 的核心组件有哪些

spring cloud ribbon

Spring Cloud Ribbon 是一个客户端负载均衡器，它的核心组件包括负载均衡器、服务列表和负载均衡策略。

2023-04-07

7570

UWB 有哪些核心的服务？

UWB服务将会越来越多，生活中的应用也越来越广泛，所有这些都利用了 UWB 独特的精细范围能力，如果我们停留在用户层面，所有用例本质上都依赖于三个核心服务。

2022-09-10

8150

缓存的实现核心方法有哪些

put()方法 put()方法可以将一个数据放入到缓冲区中。进行该操作后，postition的值会+1，指向下一个可以放入的位置。capacity = limit ，为缓冲区容量的值。 flip()方法 flip()方法会切换对缓冲区的操作模式，由写->读 / 读->写进行该操作后如果是写模式->读模式，position = 0 ， limit 指向最后一个元素的下一个位置，capacity不变如果是读->写，则恢复为put()方法中的值 get()方法 get()方法会读取缓冲区中的一个值进

2021-09-26

7780

Spring Boot 的核心注解有哪些？

spring spring boot

Spring Boot 是一种快速开发应用程序的框架，提供了一系列的注解来简化开发过程。其中，最重要的就是核心注解，它能帮助开发者快速配置应用程序。本文将深入探讨 Spring Boot 的核心注解，介绍它的作用以及常见的组成注解。

网络技术联盟站

2023-09-01

1.2K0

百度网站链接怎么分享_url的组成部分有哪些

php http https 网络安全 javascript

百度分享默认分享的是当前页的url，但也可以在同一个页面中分享多个不同的url，仅需进行如下简单的配置。

全栈程序员站长

2022-11-10

6580

点击加载更多