首页
学习
活动
专区
圈层
工具
发布
技术百科首页 >RAG >RAG的核心组成部分有哪些?

RAG的核心组成部分有哪些?

词条归属:RAG

RAG 的核心组成部分如下:

1. 检索模块(Retriever)

  • 查询编码器(Query Encoder):将用户输入的查询转换为向量表示,使用与文档索引相同的嵌入模型,确保查询与文档在统一的向量空间中可比
  • 向量数据库(Vector Database):存储预先处理后的文档向量表示,支持高效的语义相似度搜索,常用系统包括腾讯云向量数据库、FAISS、Milvus、Pinecone、Weaviate、Qdrant、Chroma 以及 pgvector 等
  • 检索算法:结合向量搜索(语义相似度)与关键词搜索(如BM25算法),通过混合检索提升召回率;许多RAG系统还引入重排序模型(Reranker)对检索结果进行二次精排

2. 生成模块(Generator)

  • 大语言模型(LLM:接收用户查询与检索到的相关上下文,生成自然语言响应;常用模型包括 GPT-5.2、Gemini 3 、Claude 4.7、Qwen 、混元等
  • 提示词组装器(Prompt Assembler):将检索到的相关文本片段与原始查询组织成结构化的提示词,为生成模型提供充分的上下文信息
  • 输出后处理:对生成结果进行过滤、格式化、引用标注等处理,确保输出的可信度和可用性

3. 知识库与数据处理模块

  • 数据摄取(Ingestion):从多种来源(PDF文档、网页、数据库、API等)收集原始数据,支持结构化与非结构化数据
  • 文本分块(Chunking):将长文档分割为适当大小的文本片段,常用策略包括固定长度分块、递归字符分块、语义分块等,分块质量直接影响检索效果
  • 嵌入模型(Embedding Model):将文本转换为高维向量表示,常用模型包括 text-embedding-4-large、text-embedding-3-large、EmbeddingGemma-300M、text-embedding-005、voyage-3.5、embed-v4.0、Qwen3-Embedding、BGE-M3、Nomic Embed Text V2 等
  • 索引构建(Indexing):将文本块的向量表示存储在向量数据库中,建立高效的检索索引(如HNSW、IVF等算法)
相关文章
Ribbon 的核心组件有哪些
Spring Cloud Ribbon 是一个客户端负载均衡器,它的核心组件包括负载均衡器、服务列表和负载均衡策略。
堕落飞鸟
2023-04-07
7570
UWB 有哪些核心的服务?
UWB服务将会越来越多,生活中的应用也越来越广泛,所有这些都利用了 UWB 独特的精细范围能力,如果我们停留在用户层面,所有用例本质上都依赖于三个核心服务。
李肖遥
2022-09-10
8150
缓存的实现核心方法有哪些
put()方法 put()方法可以将一个数据放入到缓冲区中。 进行该操作后,postition的值会+1,指向下一个可以放入的位置。capacity = limit ,为缓冲区容量的值。 flip()方法 flip()方法会切换对缓冲区的操作模式,由写->读 / 读->写 进行该操作后 如果是写模式->读模式,position = 0 , limit 指向最后一个元素的下一个位置,capacity不变 如果是读->写,则恢复为put()方法中的值 get()方法 get()方法会读取缓冲区中的一个值 进
用户7108768
2021-09-26
7780
Spring Boot 的核心注解有哪些?
Spring Boot 是一种快速开发应用程序的框架,提供了一系列的注解来简化开发过程。其中,最重要的就是核心注解,它能帮助开发者快速配置应用程序。本文将深入探讨 Spring Boot 的核心注解,介绍它的作用以及常见的组成注解。
网络技术联盟站
2023-09-01
1.2K0
百度网站链接怎么分享_url的组成部分有哪些
百度分享默认分享的是当前页的url,但也可以在同一个页面中分享多个不同的url,仅需进行如下简单的配置。
全栈程序员站长
2022-11-10
6580
点击加载更多
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
领券