搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏【腾讯云开发者】
RAG优化字典：20种RAG优化方法全解析
关注腾讯云开发者，一手技术干货提前解锁本文系统性地梳理了 RAG（Retrieval-Augmented Generation，检索增强生成）系统从基础到高级的 20 种优化方法，涵盖分块策略、检索增强、查询优化、生成质量控制等多个维度。适用场景：上线前调参、不同领域/文档类型单独优化。 17 分层检索检索摘要→详细的两级检索 18 HyDE 查询假设文档嵌入替代查询嵌入 19 CRAG 系统动态评估并纠正检索质量 20 RL增强RAG 系统强化学习优化全流程优化方法选择指南检索增强：融合检索（15）性价比高、易落地；图RAG（16）适合概念与关系密集的领域。查询优化：HyDE（18）对短查询、抽象问句效果好；查询转换（6）适合复杂、多子问题查询。
96211编辑于 2026-03-06
来自专栏悟道
2-5 快速幂模板
这个就是在快速乘的基础上改一下 sum=0--->sum=1 x+=x--->x*=x //快速幂模板 public double quickPow(double x,long y){ double sum=1; while(y>0){ if((y&1)==1){ sum*=x; } x*=x; y=y>>1; }
35520发布于 2021-06-01
来自专栏自然语言处理
【RAG最新研究】优化RAG系统的最佳实践与深度解析
RAG有哪些相关研究？在RAG领域，已经有不少研究为这篇论文奠定了基础。 RAG系统的优化： Wang et al. (2024) 提出了优化检索组件的策略，比如改进文档索引和检索算法，以减少延迟并保持准确性。通过这些步骤，论文系统地研究了RAG系统的架构，并提出了具体的改进措施，为开发和优化RAG系统提供了实证基础和理论支持。论文做了哪些实验？对比了有无RAG模块的模型（w/o_RAG）与包含RAG模块的模型之间的事实性表现。定性分析：提供了在TruthfulQA和MMLU数据集上由模型变体生成的示例。基于74次实验的结果，论文总结了关键发现，并提出了对比上下文学习RAG和焦点模式RAG在性能上的优越性。
1.2K10编辑于 2025-01-16
来自专栏云云众生s
RAG和模型优化：AI实用指南
AI工程实践指南：探索LLM/SLM集成，利用MoE和Co-LLM优化代码生成。RAG提供可扩展替代方案，避免静态微调，提升代码质量。，同时平衡模型选择、性能优化、安全性和成本效益。集成 LLM 和 SLM 通过利用两者的优势，将小型语言模型 (SLM) 和大型语言模型 (LLM) 集成到软件工程任务中，可以优化效率。这种方法通过将较简单的任务分配给较小的模型，将复杂的任务分配给较大的模型来优化效率。在 AI 软件开发平台中部署 LLM 并使用 RAG 对其进行增强可以提高准确性，消除幻觉并优化资源效率。
43200编辑于 2025-03-16
来自专栏AI机器学习与深度学习算法
学习分类 2-5 线性可分
感知机非常简单同时又很容易理解，但是相对应的，缺点也很多。感知机最大的缺点就是它只能解决线性可分的问题。
59310编辑于 2022-11-08
llm与RAG的学习与优化
本文首发个人博客：llm与RAG的学习与优化 - 黑白の世界欢迎点击，评论前言这是一篇拖延了半年的文章。为了从“能用”到“好用”，我们需要一系列的调优手段来优化召回效果。预处理：优化数据质量分块 (Chunking)将文档切分成合适的、独立的语义单元是RAG中最关键的第一步。分块的质量直接影响向量的质量和检索的精度。**为什么需要分块？这是提升RAG效果最有效的手段之一。结语以上内容大概就是笔者最近在大模型学习，RAG开发与特定领域向量数据库构建业务中的一些总结与优化心得。同时不禁感叹，大模型从22年到如今的发展迅速。可以看到本文在谈到RAG调优的格式突然有些变化。因为到这里笔者有些懒了，手写了思路与大纲后，直接让AI优化，然后再手改一番。本文还只是单纯的 RAG知识库，或者说向量数据库的相关技术点。
65610编辑于 2025-09-01
来自专栏具身小站
大模型优化技术（RAG 和 LoRA）对比
RAG 和 LoRA 是优化大模型的两种主流且互补的技术， LoRA 是给模型“大脑升级”的技能插件，RAG 是给模型“大脑联网”的外挂知识库，分别从“模型能力”和“知识获取”两个不同维度，来解决让通用大模型变得更专业的问题工作原理 RAG的工作流程分为两步：检索和生成。检索：收到问题时，RAG首先将问题转化为向量，在知识库（如公司内部文档）中搜索最相关的信息片段。 RAG就像是给大脑配一个秒查资料的"超级助理"，遇到问题时，大脑不自己回忆，而是先让助理去查资料，再将查到的信息一起思考后回答。 RAG的核心优势在于处理需要大量、最新、具体事实信息的场景。因此，建议以LoRA为主，RAG为辅。并行组合：设计一个决策器来判断任务类型，对深层任务调用LoRA模块，对知识性任务调用RAG流程。同时，LoRA生成的结果可作为RAG的检索源，形成正向循环。
21110编辑于 2026-05-22
RAG 2.0 的索引与召回机制优化
很多做RAG的朋友可能都有过这样的经历：兴冲冲地把系统搭起来满怀信心地让它回答几个问题，结果它要么答非所问，要么一脸无辜地说"抱歉我不知道"。今天我们就来聊聊RAG 2.0在索引与召回机制上的优化思路，看看怎么才能让RAG真正派上用场。向量召回的困境与破局之道向量召回命中率低这个问题，说起来简单，真正解决起来却让人头疼。未来重排序很可能成为RAG系统的标配组件，就像现在全文索引是必备的一样。值得注意的是，延迟交互这条路还在快速发展。结语 RAG 2.0的索引与召回机制优化，本质上是在效果和效率之间找平衡。多路召回解决了单一检索方式的局限，张量排序在保持效果的同时提升了效率，文档预处理则为整个系统打下了高质量的数据基础。 RAG技术还在快速演进，但无论怎么变，扎实的基础功永远是关键，是吧？
36510编辑于 2026-02-28
来自专栏Linyb极客之路
RAG 的检索模块是怎么优化的？
RAG（Retrieval-Augmented Generation）中的检索模块是整个系统的关键环节，直接影响生成结果的质量。为了提升检索的准确性、相关性和效率，业界采用了多种优化策略。以下是 RAG 检索模块的主要优化方法：一、向量检索优化更优的嵌入模型（Embedding Model）使用领域微调的嵌入模型（如 BGE、E5 等），比通用模型（如 Sentence-BERT）四、索引与架构优化分块策略优化合理的文本分块大小（如 256-512 tokens）。使用滑动窗口重叠分块，避免信息割裂。基于语义边界（如段落、标题）进行智能分块。基于反馈的持续优化利用用户反馈或生成结果质量信号，迭代优化检索模型或策略。，RAG 的检索模块能够更精准地找到与用户问题相关的上下文，为生成模块提供高质量输入，从而显著提升整体系统表现。
34810编辑于 2026-04-14
来自专栏Hank’s Blog
2-5 R语言基础 factor
#因子：分类数据 #有序和无序 #整数向量+标签label #Male/Female #常用于lm(),glm()
44310发布于 2020-09-16
来自专栏刷题笔记
2-5 修理牧场 (35 分)【优先队列】
2-5 修理牧场 (35 分) 农夫要修理牧场的一段栅栏，他测量了栅栏，发现需要N块木头，每块木头长度为整数Li个长度单位，于是他购买了一条很长的、能锯成N块的木头，即该木头的长度是Li的总和
1.1K10发布于 2020-06-23
来自专栏NetCore 从壹开始
2-5 安装容器Web工具：Docker Portainer
现在已经习惯了容器化了，不仅可以很快的配合CICD来实现部署，同时主要是也能解决一些疑难杂症，比如在Linux中经常会有各种图形图像的依赖包问题。特别是内网环境。
1K20编辑于 2023-01-09
来自专栏Deep learning进阶路
2-5 线性表之循环链表
2-5 线性表之循环链表循环链表就是链表首尾相接连成一个环，可以用单链表和循环链表来实现。
43240发布于 2019-07-02
来自专栏刷题笔记
2-5 Two Stacks In One Array (20 分)
本文链接：https://blog.csdn.net/shiliang97/article/details/101173005 2-5 Two Stacks In One Array (20 分) Write
77230发布于 2019-11-08
来自专栏掘金安东尼
再靠近亿点点，RAG 优化策略
本篇来看下 RAG 的架构优化策略利用知识图谱（KG）进行上下文增强在现有的向量数据库中，典型的上下文增强可能面临挑战：难以捕捉长距离的关联知识，信息稀疏性高（尤其是当LLM上下文窗口有限时）。 Self-RAG 的重要创新 Self-RAG 的 Reflection tokens (反思字符) 通过生成反思字符这一特殊标记来检查输出。 Self-RAG 的推理过程 Self-RAG 通过运用反思性标记对自己的输出进行自评，这使得它在推理过程中展现出调整与适应能力。模型可根据具体任务进行定制化调整，它通过增加检索的文段数量来优化对事实准确性的重视，或是在开放性任务中突出创新能力。此模型能决定何时进行文段的检索，或者依据预设的阈值来启动该过程。小结本篇文章介绍了 RAG 的架构优化策略，主要包括利用知识图谱进行上下文增强以及让大模型对召回结果进行筛选的方法。
1.1K10编辑于 2024-04-13
来自专栏育种数据分析之放飞自我
笔记 | GWAS 操作流程2-5：杂合率检验
一般自然群体，基因型个体的杂合度过高或者过低，都不正常，我们需要根据杂合度进行过滤。偏差可能表明样品受到污染，近亲繁殖。我们建议删除样品杂合率平均值中偏离±3 SD的个体。
2.4K20发布于 2020-04-27
来自专栏DeepHub IMBA
RAG流程优化（微调）的4个基本策略
在本文中，我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略，可以提升生成任务的质量和准确性。通过使用一些优化策略，可以有效提升检索增强生成系统的性能和输出质量，使其在实际应用中能够更好地满足需求。 RAG简单回顾 RAG主要有两个过程。我们先总结RAG过程中的可以优化的关键点: 1、分块方法:优化块大小确保有意义和上下文相关的数据段。 2、嵌入模型:选择和微调模型以改进语义表示。 3、向量搜索方法:选择有效的相似度量和搜索参数。我们探讨了四种关键优化方向:细化分块方法、选择和微调嵌入模型、选择有效的向量搜索方法以及制作精确的提示。这些组件中的每一个都在提高RAG系统的性能方面起着至关重要的作用。优化RAG的过程是需要持续的测试的，从失败中学习，以及做出明智的调整。需要采用迭代方法，才能定制出适合自己的AI解决方案，更有效地满足特定需求。
2.3K10编辑于 2024-07-01
来自专栏AI智能体从入门到实践
构建AI智能体：优化 RAG 检索精度：深入解析 RAG 中的五种高级切片策略
前面几篇文章已经深入讨论过LangChain、RAG架构的细节，对RAG有了基础的了解，今天重点梳理一下RAG的切片策略；一、什么是RAG切片给定一个场景，我们有一本非常厚的百科全书 RAG 的切片策略，就是帮我们把这本厚厚的书，提前拆分成一页一页、或者一段一段的“小纸片”，并给这些小纸片做好详细的“目录”和“标签”，做成一个高效的“索引”或者“目录”，当AI助手需要回答问题时，它不需要去翻整本书所以，到底什么是RAG切片？ RAG切片就是把一份长长的文档（如PDF、Word），合理地切割成一个个小块（Chunks）的过程。这个过程是整个RAG系统的基石，它直接决定了后续检索和生成答案的质量。运行你的RAG管道，评估答案的质量。评估答案是否准确？检索到的上下文是否真正相关？迭代优化：选择效果最好的那种策略。
1.8K32编辑于 2025-11-11
来自专栏Datawhale专栏
RAG 作者：RAG 已死，RAG 万岁！
一个具有更大上下文窗口的新模型问世，社交媒体上便会充斥着“RAG 已死”的宣言。 RAG 的初衷五年前，我在 Meta 基础人工智能研究中心（FAIR，前身为 Facebook 人工智能研究中心）的团队提出了 RAG（Retrieval-Augmented Generation，检索增强生成底线是：您同时需要长上下文 LLM 和 RAG。但既然“RAG”这个术语似乎如此具有争议性，那我们不妨这样说：我们不必非得称之为 RAG。我们可以就叫它检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢，而且极其低效，并且比使用 RAG 精准定位所需信息要昂贵得多。 RAG、微调和大型上下文窗口在 AI 中也是如此。结论我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。
82810编辑于 2025-04-24
来自专栏全栈开发工程师
【RAG】001-RAG概述
补充1：RAG 基本逻辑补充2：RAG 知识库基本逻辑一、RAG 介绍 1、LLM 的主要局限性大语言模型（LLM）尽管功能强大，但仍存在以下明显的局限性：时效性问题：模型的知识在预训练后就固定了系统时，需要注意以下几点：数据质量控制：确保知识库数据的准确性和时效性定期更新和维护知识库内容建立数据质量审核机制性能优化：选择合适的向量数据库优化检索策略和参数合理设置缓存机制系统监控：跟踪系统响应时间监控检索准确率收集用户反馈并持续优化三、RAG vs Fine-tuning（微调） 1、两种方法的基本概念 RAG：通过实时检索相关信息来增强模型输出：格式化输出添加引用来源质量检查 3、性能优化策略 3.1 检索优化索引优化：选择合适的索引算法定期重建索引优化检索参数缓存策略：热点查询缓存结果集缓存智能预加载资源调优：硬件配置优化负载均衡服务扩缩容 4、图示
86510编辑于 2025-03-25

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

RAG优化字典：20种RAG优化方法全解析

2-5 快速幂模板

【RAG最新研究】优化RAG系统的最佳实践与深度解析

RAG和模型优化：AI实用指南

学习分类 2-5 线性可分

llm与RAG的学习与优化

大模型优化技术（RAG 和 LoRA）对比

RAG 2.0 的索引与召回机制优化

RAG 的检索模块是怎么优化的？

2-5 R语言基础 factor

2-5 修理牧场 (35 分)【优先队列】

2-5 安装容器Web工具：Docker Portainer

2-5 线性表之循环链表

2-5 Two Stacks In One Array (20 分)

再靠近亿点点，RAG 优化策略

笔记 | GWAS 操作流程2-5：杂合率检验

RAG流程优化（微调）的4个基本策略

构建AI智能体：优化 RAG 检索精度：深入解析 RAG 中的五种高级切片策略

RAG 作者：RAG 已死，RAG 万岁！

【RAG】001-RAG概述

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐