开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >RAG >RAG如何保证检索结果的相关性？

RAG如何保证检索结果的相关性？

修改于 2026-06-11 15:42:36

1

词条归属：RAG

1. 混合检索策略

向量搜索（语义搜索）：基于查询与文档在向量空间中的语义相似度进行检索，能够理解同义词和上下文关系；可使用 Gemini Embedding 2、Amazon Nova Multimodal Embeddings 等先进模型
关键词搜索（BM25）：基于词汇匹配进行检索，确保精确匹配查询中的关键术语
混合检索融合：结合向量搜索与关键词搜索的优点，使用加权融合或排序融合算法（如 RRF：Reciprocal Rank Fusion）生成最终排序；也可使用学习融合模型进行更精确的融合
查询路由（Query Routing）：将不同性质的查询发送到不同的检索管道，提高检索效率，是较新的检索优化技术

2. 查询理解与改写

查询意图识别：分析用户的查询意图，确定所需信息的类型和范围
查询改写与扩展：对原始查询进行改写或扩展，生成多个相关查询，提高检索召回率
查询分解：将复杂查询分解为多个子查询，分别检索后合并结果

3. 结果重排序与过滤

重排序模型（Reranker）：使用交叉编码器或更精细的模型对初步检索结果进行重新打分，将最相关的结果排在前面
上下文感知过滤：基于查询的上下文信息（如对话历史、用户偏好等）对检索结果进行过滤
多样性保证：确保检索结果覆盖查询的多个方面，避免结果过于单一

4. 元数据与过滤条件

元数据过滤：利用文档的元数据（如发布时间、作者、来源、类别等）对检索结果进行过滤
权限与访问控制：确保检索结果符合用户的访问权限，避免泄露敏感信息
时效性过滤：优先返回最新或最相关的文档，特别是对于时效性强的查询

相关文章

RAG系统如何支持多模态检索？图文检索如何实现？

自然语言处理 NLP技术全文检索人工智能大模型部署

🚀 本文收录于Github：AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助，欢迎 ⭐ Star 支持！

2026-03-25

4810

如何合理的展示相关性分析结果？？

数据库 sql 腾讯云开发者社区

如果是做肿瘤研究的，TCGA的数据分析，有很多在线工具是可以直接出图的，比如TIMER和GEPIA。上图的绘制，可以使用ggscatterstats函数，搜狗|微信搜索一下，有很多现成的代码，就不多介绍了。

2021-11-01

2.1K0

你知道RAG？它是如何高效检索向量的？

聚类算法向量数据库腾讯技术创作特训营S12#AI进化论

在历时一个半月的笔试面试后，我又回来分享知识了，后续应该只能一周一更了，要去公司当牛马了，不过好在结果顺利，收获了三个offer，已经打算去鹅厂实习了

2025-03-30

1.2K0

提高检索增强的相关性

模型数据搜索开源递归

次优的嵌入模型、低效的分块以及缺乏元数据过滤可能会影响LLM响应的相关性。以下是应对方法。

2024-03-28

5870

如何将数据库检索的结果导出？

数据库 spring 数据处理

本文介绍了如何将不同数据库的检索结果导出，并提供了具体的数据库名单和导出方法。主要目的是方便用户对检索结果进行进一步处理。

企鹅号小编

2018-01-09

6K0

点击加载更多