搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏【腾讯云开发者】
RAG优化字典：20种RAG优化方法全解析
关注腾讯云开发者，一手技术干货提前解锁本文系统性地梳理了 RAG（Retrieval-Augmented Generation，检索增强生成）系统从基础到高级的 20 种优化方法，涵盖分块策略、检索增强、查询优化、生成质量控制等多个维度。 "clarity": 7, "completeness": 7, "conciseness": 7 } CRAG 系统动态评估并纠正检索质量 20 RL增强RAG 系统强化学习优化全流程优化方法选择指南分块优化：检索不够精准时，优先考虑语义分块（1）、命题分块（13）或切块大小评估（2）检索增强：融合检索（15）性价比高、易落地；图RAG（16）适合概念与关系密集的领域。查询优化：HyDE（18）对短查询、抽象问句效果好；查询转换（6）适合复杂、多子问题查询。
95811编辑于 2026-03-06
来自专栏自然语言处理
【RAG最新研究】优化RAG系统的最佳实践与深度解析
RAG有哪些相关研究？在RAG领域，已经有不少研究为这篇论文奠定了基础。 RAG系统的优化： Wang et al. (2024) 提出了优化检索组件的策略，比如改进文档索引和检索算法，以减少延迟并保持准确性。通过这些步骤，论文系统地研究了RAG系统的架构，并提出了具体的改进措施，为开发和优化RAG系统提供了实证基础和理论支持。论文做了哪些实验？对比了有无RAG模块的模型（w/o_RAG）与包含RAG模块的模型之间的事实性表现。定性分析：提供了在TruthfulQA和MMLU数据集上由模型变体生成的示例。基于74次实验的结果，论文总结了关键发现，并提出了对比上下文学习RAG和焦点模式RAG在性能上的优越性。
1.2K10编辑于 2025-01-16
来自专栏云云众生s
RAG和模型优化：AI实用指南
AI工程实践指南：探索LLM/SLM集成，利用MoE和Co-LLM优化代码生成。RAG提供可扩展替代方案，避免静态微调，提升代码质量。，同时平衡模型选择、性能优化、安全性和成本效益。集成 LLM 和 SLM 通过利用两者的优势，将小型语言模型 (SLM) 和大型语言模型 (LLM) 集成到软件工程任务中，可以优化效率。这种方法通过将较简单的任务分配给较小的模型，将复杂的任务分配给较大的模型来优化效率。在 AI 软件开发平台中部署 LLM 并使用 RAG 对其进行增强可以提高准确性，消除幻觉并优化资源效率。
43200编辑于 2025-03-16
llm与RAG的学习与优化
本文首发个人博客：llm与RAG的学习与优化 - 黑白の世界欢迎点击，评论前言这是一篇拖延了半年的文章。 **Redis**从 2022 年（Redis 7）起，通过模块正式支持向量搜索。**优点**: 可以轻松集成到已有的 Redis 架构中，无需过多调整。预处理：优化数据质量分块 (Chunking)将文档切分成合适的、独立的语义单元是RAG中最关键的第一步。分块的质量直接影响向量的质量和检索的精度。**为什么需要分块？这是提升RAG效果最有效的手段之一。结语以上内容大概就是笔者最近在大模型学习，RAG开发与特定领域向量数据库构建业务中的一些总结与优化心得。同时不禁感叹，大模型从22年到如今的发展迅速。可以看到本文在谈到RAG调优的格式突然有些变化。因为到这里笔者有些懒了，手写了思路与大纲后，直接让AI优化，然后再手改一番。本文还只是单纯的 RAG知识库，或者说向量数据库的相关技术点。
65610编辑于 2025-09-01
来自专栏具身小站
大模型优化技术（RAG 和 LoRA）对比
RAG 和 LoRA 是优化大模型的两种主流且互补的技术， LoRA 是给模型“大脑升级”的技能插件，RAG 是给模型“大脑联网”的外挂知识库，分别从“模型能力”和“知识获取”两个不同维度，来解决让通用大模型变得更专业的问题工作原理 RAG的工作流程分为两步：检索和生成。检索：收到问题时，RAG首先将问题转化为向量，在知识库（如公司内部文档）中搜索最相关的信息片段。 RAG就像是给大脑配一个秒查资料的"超级助理"，遇到问题时，大脑不自己回忆，而是先让助理去查资料，再将查到的信息一起思考后回答。 RAG的核心优势在于处理需要大量、最新、具体事实信息的场景。因此，建议以LoRA为主，RAG为辅。并行组合：设计一个决策器来判断任务类型，对深层任务调用LoRA模块，对知识性任务调用RAG流程。同时，LoRA生成的结果可作为RAG的检索源，形成正向循环。
20910编辑于 2026-05-22
RAG 2.0 的索引与召回机制优化
很多做RAG的朋友可能都有过这样的经历：兴冲冲地把系统搭起来满怀信心地让它回答几个问题，结果它要么答非所问，要么一脸无辜地说"抱歉我不知道"。今天我们就来聊聊RAG 2.0在索引与召回机制上的优化思路，看看怎么才能让RAG真正派上用场。向量召回的困境与破局之道向量召回命中率低这个问题，说起来简单，真正解决起来却让人头疼。未来重排序很可能成为RAG系统的标配组件，就像现在全文索引是必备的一样。值得注意的是，延迟交互这条路还在快速发展。结语 RAG 2.0的索引与召回机制优化，本质上是在效果和效率之间找平衡。多路召回解决了单一检索方式的局限，张量排序在保持效果的同时提升了效率，文档预处理则为整个系统打下了高质量的数据基础。 RAG技术还在快速演进，但无论怎么变，扎实的基础功永远是关键，是吧？
36410编辑于 2026-02-28
来自专栏Linyb极客之路
RAG 的检索模块是怎么优化的？
RAG（Retrieval-Augmented Generation）中的检索模块是整个系统的关键环节，直接影响生成结果的质量。为了提升检索的准确性、相关性和效率，业界采用了多种优化策略。以下是 RAG 检索模块的主要优化方法：一、向量检索优化更优的嵌入模型（Embedding Model）使用领域微调的嵌入模型（如 BGE、E5 等），比通用模型（如 Sentence-BERT）四、索引与架构优化分块策略优化合理的文本分块大小（如 256-512 tokens）。使用滑动窗口重叠分块，避免信息割裂。基于语义边界（如段落、标题）进行智能分块。基于反馈的持续优化利用用户反馈或生成结果质量信号，迭代优化检索模型或策略。，RAG 的检索模块能够更精准地找到与用户问题相关的上下文，为生成模块提供高质量输入，从而显著提升整体系统表现。
34310编辑于 2026-04-14
来自专栏掘金安东尼
再靠近亿点点，RAG 优化策略
本篇来看下 RAG 的架构优化策略利用知识图谱（KG）进行上下文增强在现有的向量数据库中，典型的上下文增强可能面临挑战：难以捕捉长距离的关联知识，信息稀疏性高（尤其是当LLM上下文窗口有限时）。 Self-RAG 的推理过程 Self-RAG 通过运用反思性标记对自己的输出进行自评，这使得它在推理过程中展现出调整与适应能力。模型可根据具体任务进行定制化调整，它通过增加检索的文段数量来优化对事实准确性的重视，或是在开放性任务中突出创新能力。此模型能决定何时进行文段的检索，或者依据预设的阈值来启动该过程。在这其中，数据保密性至关重要，可以使用LLaVA-7b模型来提炼图像摘要，借助Chroma作为向量数据库，Nomic的GPT4All作为源模型，结合多向量索引器，再通过Ollama.ai的LLaMA2- 小结本篇文章介绍了 RAG 的架构优化策略，主要包括利用知识图谱进行上下文增强以及让大模型对召回结果进行筛选的方法。
1.1K10编辑于 2024-04-13
来自专栏Java帮帮-微信公众号-技术文章全总结
Tomcat7优化
用了很久的Tomcat，没怎么看过它的优化，今天抽出时间研究了下，将内容记录下。示的参数来优化tomcat。　　二、优化 1. 禁用AJP协议　　(1)通过禁用AJP协议，达到在集群的时候提高处理请求的时间。将BIO通讯模式修改为NIO通讯模式　　(1)tomcat通讯协议支持http1.0和1.1，tomcat默认走的是BIO通讯模式，tomcat7和tomcat8之所以默认的都是效率低下的BIO通讯模式优化连接器　　最佳实践：　　 5.
2.2K100发布于 2018-03-15
来自专栏AIGC大模型应用
RAG性能优化杀器，引入上下文检索！
开发者通常通过 RAG扩展 AI 模型的知识。RAG 是一种从知识库中检索相关信息并将其附加到用户提示词中的方法，从而显著提升模型的回答能力。但传统的 RAG 解决方案在编码信息时会丢失上下文，导致系统无法从知识库中检索到相关信息。 1 RAG 简介：扩展到更大的知识库对于无法放入上下文窗口的更大知识库，RAG 是典型的解决方案。但传统 RAG 系统有一个显著的局限：它们往往破坏上下文。传统 RAG 中的上下文问题在传统 RAG 中，文档通常被拆分为较小的块，以便于检索。我们的实验表明，跨多个领域，添加重新排序步骤进一步优化了检索。具体而言，我们发现，重新排序后的上下文嵌入和上下文 BM25 将前 20 个块检索未命中率降低了 67%（5.7% → 1.9%）。
1.2K11编辑于 2024-10-02
来自专栏自然语言处理
你的RAG系统真的达标了吗？生产环境RAG成功的7大关键指标
系统性能：整个RAG系统在成本和响应速度上表现如何？ 7个你必须关注的指标根据我的经验，要想打造一个成功的RAG应用，你得盯紧以下7个关键指标： Precision@k（我们拿到的是相关内容吗？）：这个指标估算每个请求的成本，帮我们优化资源使用，避免浪费。还有哪些指标值得关注？虽然前面提到的7个指标是认为必不可少的，但RAG系统的评估远不止这些。系统性能分析：接着检查延迟和令牌消耗，优化系统性能，降低成本。迭代改进：最后根据指标不断调整系统，跟踪超参数的变化，持续评估和优化。 TruLens：专注于特定领域的优化，强调领域内的准确性和精确度。 Galileo：集成先进见解和指标，提升性能和透明度。 Tonic Validate：专门测量RAG LLM系统的性能。总结无论你是刚起步，还是已经深入RAG项目，指标都是你成功的关键。希望这些经验能帮你在RAG系统的开发和优化中少走弯路，早日打造出高效、稳定的智能应用！
1.2K10编辑于 2025-01-13
来自专栏DeepHub IMBA
RAG流程优化（微调）的4个基本策略
在本文中，我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略，可以提升生成任务的质量和准确性。通过使用一些优化策略，可以有效提升检索增强生成系统的性能和输出质量，使其在实际应用中能够更好地满足需求。 RAG简单回顾 RAG主要有两个过程。我们先总结RAG过程中的可以优化的关键点: 1、分块方法:优化块大小确保有意义和上下文相关的数据段。 2、嵌入模型:选择和微调模型以改进语义表示。 3、向量搜索方法:选择有效的相似度量和搜索参数。我们探讨了四种关键优化方向:细化分块方法、选择和微调嵌入模型、选择有效的向量搜索方法以及制作精确的提示。这些组件中的每一个都在提高RAG系统的性能方面起着至关重要的作用。优化RAG的过程是需要持续的测试的，从失败中学习，以及做出明智的调整。需要采用迭代方法，才能定制出适合自己的AI解决方案，更有效地满足特定需求。
2.3K10编辑于 2024-07-01
来自专栏AI智能体从入门到实践
构建AI智能体：优化 RAG 检索精度：深入解析 RAG 中的五种高级切片策略
前面几篇文章已经深入讨论过LangChain、RAG架构的细节，对RAG有了基础的了解，今天重点梳理一下RAG的切片策略；一、什么是RAG切片给定一个场景，我们有一本非常厚的百科全书 RAG 的切片策略，就是帮我们把这本厚厚的书，提前拆分成一页一页、或者一段一段的“小纸片”，并给这些小纸片做好详细的“目录”和“标签”，做成一个高效的“索引”或者“目录”，当AI助手需要回答问题时，它不需要去翻整本书所以，到底什么是RAG切片？ RAG切片就是把一份长长的文档（如PDF、Word），合理地切割成一个个小块（Chunks）的过程。这个过程是整个RAG系统的基石，它直接决定了后续检索和生成答案的质量。运行你的RAG管道，评估答案的质量。评估答案是否准确？检索到的上下文是否真正相关？迭代优化：选择效果最好的那种策略。
1.8K32编辑于 2025-11-11
来自专栏Datawhale专栏
RAG 作者：RAG 已死，RAG 万岁！
一个具有更大上下文窗口的新模型问世，社交媒体上便会充斥着“RAG 已死”的宣言。 RAG 的初衷五年前，我在 Meta 基础人工智能研究中心（FAIR，前身为 Facebook 人工智能研究中心）的团队提出了 RAG（Retrieval-Augmented Generation，检索增强生成底线是：您同时需要长上下文 LLM 和 RAG。但既然“RAG”这个术语似乎如此具有争议性，那我们不妨这样说：我们不必非得称之为 RAG。我们可以就叫它检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢，而且极其低效，并且比使用 RAG 精准定位所需信息要昂贵得多。 RAG、微调和大型上下文窗口在 AI 中也是如此。结论我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。
82610编辑于 2025-04-24
来自专栏自然语言处理
带你了解7种检索增强生成 (RAG) 技术
校正：如果在评分过程中发现任何不准确或不一致之处，模型将使用从查询中提取的关键词进行网络搜索，以生成新的答案或优化之前的答案。 3. 自省RAG（Self RAG）自省RAG通过自我反思或自我批评来提高RAG结果的质量。工作原理：搜索与检索：模型首先检索相关信息并根据输入查询生成答案。代理持续评估模型的进展并实时调整行动，优化策略以获得更好的结果。此步骤涉及评估中间结果并采取纠正措施，例如重新查询或更改检索方法。 7. 图RAG(Graph RAG) GraphRAG 是微软公司内部广受赞誉的一种结合了检索增强生成（RAG）技术和知识图谱的先进框架。 GraphRAG 的成功也催生了一系列轻量级的优化版本，诸如 LightRAG 与 nano-GraphRAG 等。与此同时，还涌现出了一些别具一格的变体，如 KAG 框架。
9.2K31编辑于 2025-01-06
来自专栏全栈开发工程师
【RAG】001-RAG概述
补充1：RAG 基本逻辑补充2：RAG 知识库基本逻辑一、RAG 介绍 1、LLM 的主要局限性大语言模型（LLM）尽管功能强大，但仍存在以下明显的局限性：时效性问题：模型的知识在预训练后就固定了系统时，需要注意以下几点：数据质量控制：确保知识库数据的准确性和时效性定期更新和维护知识库内容建立数据质量审核机制性能优化：选择合适的向量数据库优化检索策略和参数合理设置缓存机制系统监控：跟踪系统响应时间监控检索准确率收集用户反馈并持续优化三、RAG vs Fine-tuning（微调） 1、两种方法的基本概念 RAG：通过实时检索相关信息来增强模型输出：格式化输出添加引用来源质量检查 3、性能优化策略 3.1 检索优化索引优化：选择合适的索引算法定期重建索引优化检索参数缓存策略：热点查询缓存结果集缓存智能预加载资源调优：硬件配置优化负载均衡服务扩缩容 4、图示
86410编辑于 2025-03-25
来自专栏ClearSeve
Windows7 系统优化
Diagostic policy server 检测网络禁用 print Spooler 打印机禁用 Superfetch 加速了固态硬盘的寿命损耗禁用, 机械键盘自动 Windows Defender 禁用 Windows Update 禁用 Windows Search 文件索引
3.4K50编辑于 2022-02-11
来自专栏多模态 / RAG / 知识图谱
RAG 系列 02 — Advanced RAG
配套阅读：《RAG系列01—NaiveRAG》《从NaiveRAG到AgenticRAG》引言：2025年3月，我参加了一家toBSaaS公司的技术评审会。那天的议题是"RAG系统下一阶段升级路线"。 AdvancedRAG的本质，是把RAG从"一锤子买卖"重构为"多阶段管道"。每一阶段：有独立的优化目标有独立的评测指标有独立的失败模式可以独立替换和升级它在NaiveRAG的"线性三段式"基础上，明确划分三个新阶段：Pre-Retrieval（检索前）、Retrieval（检索模型，几乎是ROI最低的优化Hybrid+Reranker组合的收益，远大于单独使用任何一个这就是为什么我说AdvancedRAG是RAG演进光谱上"最值钱的一站"——投入最小，回报最大。在单引擎实现（避免双写一致性）BM25tokenizer适配语言（中文用ik_max_word+ik_smart）Vector和BM25并行执行（不要串行）RRF的k值在GoldenSet上gridsearch优化单路超时降级
28710编辑于 2026-06-09
来自专栏JavaEdge
RAG性能优化杀器，引入上下文检索！
开发者通常通过 RAG扩展 AI 模型的知识。RAG 是一种从知识库中检索相关信息并将其附加到用户提示词中的方法，从而显著提升模型的回答能力。 1 RAG 简介：扩展到更大的知识库对于无法放入上下文窗口的更大知识库，RAG 是典型的解决方案。但传统 RAG 系统有一个显著的局限：它们往往破坏上下文。传统 RAG 中的上下文问题在传统 RAG 中，文档通常被拆分为较小的块，以便于检索。实验表明，跨多个领域，添加重新排序步骤进一步优化了检索。重新排序后的上下文嵌入和上下文 BM25 将前 20 个块检索未命中率降低了 67%（5.7% → 1.9%）。负责：中央/分销预订系统性能优化活动&券等营销中台建设交易平台及数据中台等架构和开发设计车联网核心平台-物联网连接平台、大数据平台架构设计及优化 LLM Agent应用开发区块链应用开发
48610编辑于 2025-06-01
来自专栏机器学习原理
rag
在训练过程中，这两个编码器通过最大化正确文档和查询对的相似度来进行优化。在成功检索到相关文档后，RAG的生成模型接管任务。 RAG工作流程 RAG的工作流程可以分为以下几个步骤：用户查询：用户提出一个查询，系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势，这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势，但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。有效的优化和并行处理技术可以在一定程度上改善这一问题，但仍需进一步的研究和改进。
67911编辑于 2024-06-27

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

RAG优化字典：20种RAG优化方法全解析

【RAG最新研究】优化RAG系统的最佳实践与深度解析

RAG和模型优化：AI实用指南

llm与RAG的学习与优化

大模型优化技术（RAG 和 LoRA）对比

RAG 2.0 的索引与召回机制优化

RAG 的检索模块是怎么优化的？

再靠近亿点点，RAG 优化策略

Tomcat7优化

RAG性能优化杀器，引入上下文检索！

你的RAG系统真的达标了吗？生产环境RAG成功的7大关键指标

RAG流程优化（微调）的4个基本策略

构建AI智能体：优化 RAG 检索精度：深入解析 RAG 中的五种高级切片策略

RAG 作者：RAG 已死，RAG 万岁！

带你了解7种检索增强生成 (RAG) 技术

【RAG】001-RAG概述

Windows7 系统优化

RAG 系列 02 — Advanced RAG

RAG性能优化杀器，引入上下文检索！

rag

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐