首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI智能体从入门到实践

    构建AI智能体:优化 RAG 检索精度:深入解析 RAG 中的五种高级切片策略

    前面几篇文章已经深入讨论过LangChain、RAG架构的细节,对RAG有了基础的了解,今天重点梳理一下RAG切片策略;一、什么是RAG切片 给定一个场景,我们有一本非常厚的百科全书 RAG切片策略,就是帮我们把这本厚厚的书,提前拆分成一页一页、或者一段一段的“小纸片”,并给这些小纸片做好详细的“目录”和“标签”,做成一个高效的“索引”或者“目录”,当AI助手需要回答问题时,它不需要去翻整本书 不同的切片策略,就是做“目录”的不同方法。 所以,到底什么是RAG切片RAG切片就是把一份长长的文档(如PDF、Word),合理地切割成一个个小块(Chunks)的过程。 切片后,搜索引擎可以精准地定位到包含“年假”关键词的那些小块。三、几种切片策略1. 用不同的策略和参数(大小、重叠)处理你的文档。 运行你的RAG管道,评估答案的质量。评估答案是否准确?检索到的上下文是否真正相关? 迭代优化:选择效果最好的那种策略

    1.4K32编辑于 2025-11-11
  • 来自专栏NebulaGraph 技术文章

    7 种查询策略教你用好 Graph RAG 探索知识图谱

    知识图谱 RAG 具体实现NebulaGraph 的首席布道师古思为,以及 LlamaIndex 团队精心撰写了一份关于知识图谱 RAG 开发的综合指南。 Graph RAG 查询。 = RetrieverQueryEngine.from_args( graph_rag_retriever, service_context=service_context)好了,现在我们对 7 使用 3 个问题测试 7 种图查询问题 1:告诉我 Bryce Harper 相关信息下图展示了 7 种查询方式对这一问题的回复,我用不同的颜色对查询语言进行了标注:这是我基于结果的一些看法:KG 基于向量的检索 关键收获基于上面 3 个问题在 7 个查询引擎上的实验,比较了 7 个查询引擎的优点和缺点:哪个查询引擎最适合,将取决于你的特定使用情况。

    4.2K11编辑于 2023-12-06
  • 来自专栏#大模型热点基础知识

    什么是RAG文档切分策略

    文档切分策略,就是解决这个平衡问题的关键艺术。在RAG系统中,文档切分不只是简单的"砍一刀",它直接影响检索的准确性和生成答案的质量。 二、什么是RAG文档切分策略RAG文档切分策略是将大型文档分割成适合检索和生成的小块(chunks)的方法论。 三、RAG文档切分策略如何工作文档切分策略主要包含三种核心方法,每种都有其独特的工作机制和适用场景。 流式切分技术能够在文档新增时动态调整chunk边界,避免全量重建索引,这对大规模RAG系统至关重要。多模态文档切分:随着RAG从文本扩展到图片、表格、视频,切分策略也需要演进。 六、总结与思考RAG文档切分策略的本质,是在检索效率与语义完整之间寻找动态平衡的艺术。

    27420编辑于 2026-04-02
  • 来自专栏无题~

    MapReduce之 FileInputFormat的切片策略(默认)

    ①获取当前输入目录中所有的文件 ②以文件为单位切片,如果文件为空文件,默认创建一个空的切片 ③如果文件不为空,尝试判断文件是否可切(不是压缩文件,都可切) ④如果文件不可切,整个文件作为1片 ⑤如果文件可切 ArrayList<InputSplit>(); // 获取当前Job输入目录中所有文件的状态(元数据) List<FileStatus> files = listStatus(job); // 以文件为单位进行切片 blkLocations = fs.getFileBlockLocations(file, 0, length); } // 判断当前文件是否可切,如果可切,切片 } } else { //Create empty hosts array for zero length files // 如果文件是个空文件,创建一个切片对象 ,这个切片从当前文件的0offset起,向后读取0个字节 splits.add(makeSplit(path, 0, length, new String[0])); }

    69140发布于 2020-07-21
  • 来自专栏机器学习/数据可视化

    Golang之旅7-切片slice

    :索引遍历和for range遍历 package main import "fmt" //切片遍历 func main(){ numArray := []int{1,2,3,4,5,6,7,8 每个切片指向一个底层数组,数组能够容纳一个数量的元素。当底层数组不能容纳新增的元素时,切片就会自动按照一定的策略进行“扩容”,此时该切片指向的底层数组就会更换。 cap:8 ptr:0xc00000c280 [0 1 2 3 4 5 6 7] len:8 cap:8 ptr:0xc00000c280 [0 1 2 3 4 5 6 7 8] len:9 cap:16 ptr:0xc00008c000 [0 1 2 3 4 5 6 7 8 9] len:10 cap:16 ptr:0xc00008c000 小结 append函数将元素追加到切片的最后,同时需要原来的切片进行接收 append函数能够同时追加多个元素 切片的扩容策略 newcap := old.cap doublecap := newcap + newcap if cap > doublecap { newcap

    33220发布于 2021-03-02
  • RAG—Chunking策略实战|得物技术

    一、背 景在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问答仍可能出现上下文缺失、事实性错误或拼接不连贯等问题。 某种意义上,分块质量几乎决定了RAG的性能上限——它决定知识是以连贯的上下文呈现,还是退化为无法拼合的碎片。 当分块尊重文档的叙事与结构时,检索的相关性与答案的事实一致性往往显著提升,远胜于一味更换向量模型或调参;换言之,想要真正改善 RAG 的稳健性与上限,首先要把“知识如何被切开并呈现给模型”这件事做好。 四、分块策略详解4.1 基础分块基于固定长度分块分块策略:按预设字符数 chunk_size 直接切分,不考虑文本结构。优点:实现最简单、速度快、对任意文本通用。 目标:为RAG检索创建高内聚、可追溯的块。

    1.1K10编辑于 2025-10-30
  • 来自专栏kwai

    Go切片Silce底层实现和扩容策略(旧版)

    不管是使用 nil 切片还是空切片,对其调用内置函数 append,len 和 cap 的效果都是一样的。 三 切片扩容 当一个切片的容量满了,就需要扩容了。怎么扩,策略是什么? return slice{unsafe.Pointer(&zerobase), old.len, cap} } // 这里就是扩容的策略 newcap := old.cap 主要需要关注的有两点,一个是扩容时候的策略,还有一个就是扩容是生成全新的内存地址还是在原来的地址后追加。 扩容策略 func main() { slice := []int{10, 20, 30, 40} newSlice := append(slice, 50) fmt.Printf Go 中切片扩容的策略是这样的: 如果切片的容量小于 1024 个元素,于是扩容的时候就翻倍增加容量。上面那个例子也验证了这一情况,总容量从原来的4个翻倍到现在的8个。

    1.2K30编辑于 2023-04-12
  • 来自专栏掘金安东尼

    再靠近亿点点,RAG 优化策略

    本篇来看下 RAG 的架构优化策略 利用知识图谱(KG)进行上下文增强 在现有的向量数据库中,典型的上下文增强可能面临挑战:难以捕捉长距离的关联知识,信息稀疏性高(尤其是当LLM上下文窗口有限时)。 Self-RAG 的重要创新 Self-RAG 的 Reflection tokens (反思字符) 通过生成反思字符这一特殊标记来检查输出。 Self-RAG 的推理过程 Self-RAG 通过运用反思性标记对自己的输出进行自评,这使得它在推理过程中展现出调整与适应能力。 在这其中,数据保密性至关重要,可以使用LLaVA-7b模型来提炼图像摘要,借助Chroma作为向量数据库,Nomic的GPT4All作为源模型,结合多向量索引器,再通过Ollama.ai的LLaMA2- 小结 本篇文章介绍了 RAG 的架构优化策略,主要包括利用知识图谱进行上下文增强以及让大模型对召回结果进行筛选的方法。

    1K10编辑于 2024-04-13
  • 来自专栏DeepHub IMBA

    RAG流程优化(微调)的4个基本策略

    在本文中,我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略,可以提升生成任务的质量和准确性。 通过使用一些优化策略,可以有效提升检索增强生成系统的性能和输出质量,使其在实际应用中能够更好地满足需求。 RAG简单回顾 RAG主要有两个过程。 为了评估这些策略的有效性,我根据ColdF的数据准备了一套10个带有实际答案的问题。 真实性和答案相关性是生成器度量标准,分别衡量幻觉和答案对问题的直接程度。 = pd.DataFrame(rag_dataset) rag_eval_datset = Dataset.from_pandas(rag_df) # Return the 还有最重要的一点成功的关键在于理解现有的数据,尝试不同的策略,并不断改进的流程。

    2.2K10编辑于 2024-07-01
  • 来自专栏AgenticAI

    OpenAI主管Lilian Weng分享RAG对抗LLM幻觉策略

    2024年77号,OpenAI安全团队负责人,Lilian Weng分享了一篇博客介绍了LLM中幻觉的由来、检测和对抗策略,分享给大家,以下为翻译全文。 注:本文共分为三节:LLM幻觉由来、检测和对抗,其中对抗方法包括RAG相关的策略,感兴趣的同学可以直达。 1. 什么导致幻觉? 3.1 RAG → 编辑和归属 RAG(检索增强生成)[20]是一种非常常见的提供基础信息的方法,即检索相关文档,然后使用相关文档作为额外上下文进行生成。 Self-RAG 每次生成一个片段。 有证据表明,微调新知识可能会导致幻觉,而 RAG 的监督包含 LLM 未知的信息。 (1)以RAG数据样本作为正样本,以原始模型生成为RM数据作为负样本。

    70410编辑于 2025-03-18
  • 来自专栏程序员

    C++对象切片:机制、应用场景与规避策略

    对象切片的核心机制1.1 切片的发生条件对象切片(Object Slicing)发生在派生类对象向基类对象赋值或传值时,编译器仅复制基类子对象部分,派生类特有成员被丢弃。 对象切片的潜在风险3.1 多态性破坏std::vector<Base> objects;objects.push_back(Derived()); // 切片发生objects[0].func(); 专业规避策略4.1 基于智能指针的多态容器std::vector<std::unique_ptr<Base>> polymorphic_objects;polymorphic_objects.push_back 工程实践建议明确设计意图:如果确实需要切片,使用显式接口如getBaseCopy()代码审查重点:将对象切片作为代码审查的重点检查项静态分析配置:启用编译器警告(-Wslicing)和静态分析工具检测文档化约定 :在团队编码规范中明确切片的使用条件和限制6.

    34010编辑于 2025-09-09
  • 来自专栏AI研思录

    RAT:融合RAG和CoT的高效多步推理任务策略

    因此这篇论文考虑在COT的基础上加上了RAG,即 RAT,通过利用检索到的外部信息为大模型提供推理依据。 使用RAG来修复大模型生成思维步骤:假设已经修复了之前的思考步骤,现在要修复第 个思维步骤 ,将现在和过去的思维步骤 转化为将可以被LLM检索系统处理的查询,得到 检索文档:使用RAG检索 相关的文档 、GPT-4和CodeLLaMA-7b,所有实验均在零样本(zero-shot)设置下进行。 论文总结 这篇文章提出的RAT结合了RAG和CTO思想,使用RAG检索的文档动态优化COT中的每一个步骤,确保每一个推理步骤都是有依据的,避免大模型的幻觉。 实验结果表明,RAT在这些任务上相比传统的CoT提示和RAG方法都有显著的性能提升。

    71910编辑于 2025-02-20
  • 来自专栏拾光学迹

    RAG 中数据处理的关键:数据切片的挑战与解决方案

    字数: 900+ | 阅读时间: 3-4分钟 热点解读:在AI快速发展的今天,RAG技术正成为各行各业的"必备神器"。但要真正驾驭这头"AI猛兽",你必须先搞定数据切片这个"拦路虎"! 一、数据切片RAG技术的"阿喀琉斯之踵" 朋友们,想象一下:你辛辛苦苦收集了海量数据,却因为切片不当,让你的AI变成了"结巴"或"健忘症患者"。 1. AI:基于长切片中的丰富信息,我可以从AI、量子计算、生物科技等多个角度为您分析... 四、解决方案三:先粗切片 + 再细切片 小贴士:这就像给AI装备了"望远镜+显微镜",既能看大局又能观细节! 优点: 效率和准确性的完美平衡 适应复杂文档的处理需求 示例: 粗切片:硬件部分、软件部分 细切片:处理器、内存、硬盘... 用户:处理器的性能如何? AI:通过粗切片定位到硬件部分,再通过细切片找到处理器相关信息,为您详细分析... 五、总结 朋友们,在这个AI浪潮中,掌握RAG技术就像学会了"驯服AI猛兽"的秘诀。

    45000编辑于 2025-02-26
  • 来自专栏DeepHub IMBA

    RAG系统嵌入模型怎么选?选型策略和踩坑指南

    检索增强生成(RAG)已成为构建生成式 AI 应用的主流架构,企业选择它主要原本是可以用自有数据约束模型输出,使答案更准确、可更新且更贴合业务场景。 RAG 的效果在很大程度上取决于检索到的上下文质量——提升效果的常用手段包括合理切分文本块(chunking)、选用合适的嵌入模型与采用稳健的检索策略。 嵌入在 RAG 中为何重要? 语义理解:嵌入将词、句子或文档转成向量(数字列表),让相近语义彼此靠近。这帮助系统理解语境与含义,而非仅做字面匹配。 高效检索:RAG 需要快速找到最相关的段落或文档。 选择嵌入时的关键考量 设计 RAG 时我首先会问:"系统要处理什么数据?" RAG 系统的优化是个迭代过程,嵌入模型只是其中一环。有了数据、有了用户反馈,你自然知道该朝哪个方向调整。

    46610编辑于 2025-11-15
  • 来自专栏DeepHub IMBA

    RAG 中分块重叠的 8 个隐性开销与权衡策略

    RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。 本文将总结的八项 RAG 分块重叠隐藏的成本,以及如何判断什么时候重叠真正有用,什么时候只是花钱买心安。 7、评估漂移:基准悄悄变了 这个问题比较隐蔽。改了 overlap 之后,分块集合变了,检索结果变了,模型看到的上下文也变了。你的评估套件衡量的已经不是同一个系统。 正确做法是对所有环节做版本管理:语料库快照、分块参数(S,O)、Embedding 模型、索引构建配置、检索和重排序策略,一个都不能少。 如果你正在调优 RAG,建议做一个实验:在增大 overlap 的同时,强制启用去重和每文档上限。如果这套组合能以更少的冗余拿到大部分质量收益。 by Velorum

    12410编辑于 2026-02-27
  • 来自专栏自然语言处理

    你的RAG系统真的达标了吗?生产环境RAG成功的7大关键指标

    RAG系统的两大核心组件 一个典型的RAG系统主要由两部分组成: 检索器:这家伙负责响应用户的查询,从知识库(通常是矢量数据库)里找出相关信息。 评估RAG系统,就得从这两个部分入手,同时还要关注系统整体的表现。 RAG评估的三大维度 评估RAG系统,通常得从以下几个关键领域入手: 检索质量:检索器能不能准确找到并抓取相关文档? 系统性能:整个RAG系统在成本和响应速度上表现如何? 7个你必须关注的指标 根据我的经验,要想打造一个成功的RAG应用,你得盯紧以下7个关键指标: Precision@k(我们拿到的是相关内容吗?) 虽然前面提到的7个指标是认为必不可少的,但RAG系统的评估远不止这些。根据你的具体需求,还有很多其他指标可能会派上用场。 RAG评估的核心要素 在评估RAG系统时,有几个关键要素你得时刻关注: 已检索到的块 (RC):这是检索器从知识库里抓出来的内容块。

    1K10编辑于 2025-01-13
  • 来自专栏蛋先生说识

    RAG 切片利器 LumberChunker 是如何智能地把文档切割成 LLM 爱吃的块

    RAG 里的文档应该怎么切割比较好呢?按固定的字符数或词数?按句?按段落?加个重叠窗口?感觉这些都太简单粗暴,容易把相关的内容给拆散了蛋先生:恩,你说得对。 我们在上面的流程处理后,拿到了新的起点段落,然后重复以上流程,直到所有段落都被处理完毕丹尼尔:哎呦不错哦,又简单又有效,这样看上去每个相关的块基本都可以在一起,不会被硬拆开蛋先生:没错,有了高质量的分块,RAG

    43810编辑于 2025-10-27
  • 来自专栏DeepHub IMBA

    深入RAG架构:分块策略、混合检索与重排序的工程实现

    从分块方式到搜索策略,从排序逻辑到异常兜底,每一层都藏着独立的故障模式。 Level 1:Naive RAG 文档做 embedding,存向量,按相似度取 top-k,丢给模型生成。 教程教的就是这套,大多数RAG系统也停在了这一步。 Level 5:生产级RAG 前面几个级别都在提升检索质量。生产级RAG要处理的是另一件事:检索已经尽力了,但还是失败了,怎么办? 因为它一定会失败,用户会问文档里根本没覆盖的问题。 分块策略会漏掉某个关键段落。或者问题本身就很模糊,召回的几个 chunk 互相矛盾。 真正该问的不是"怎么杜绝检索失败",而是"检索失败的时候,系统该怎么表现"。 , "must_retrieve": ["data-retention-policy-2024.md"], "answer_must_contain": ["7

    25010编辑于 2026-02-27
  • RAG新范式】超越向量搜索:企业级知识库构建必知的3大RAG高级策略

    #【RAG新范式】超越向量搜索:企业级知识库构建必知的3大RAG高级策略摘要:本文深度剖析企业级知识库构建中RAG(检索增强生成)技术的进阶实践。 阅读后您将掌握:如何将RAG召回率提升37%,推理成本降低52%,并构建支持千亿级文档的工业级知识引擎。一、从客服危机看RAG升级的紧迫性上周三凌晨2点,我们电商平台的智能客服突然崩溃。 二、RAG技术演进:从基础架构到工业级实践2.1RAG核心机制解析检索增强生成(Retrieval-AugmentedGeneration)通过动态检索外部知识库来增强大语言模型的生成能力。 架构必须升级三、核心策略一:查询改写增强技术3.1多提示改写引擎我们在项目中采用HyDE(假设文档嵌入)+查询扩展双引擎策略:展开代码语言:PythonAI代码解释fromllama_index.coreimportHyDEQueryTransformfromlangchain.retrieversimportContextualCompressionRetriever =analyze_complexity(query)ifcomplexity<0.3:returnlora_finetuned_llm#7B微调模型elifcomplexity<0.7:returnqwen1.5

    33710编辑于 2026-02-06
  • 来自专栏CloudBest

    7策略解除云风险警报

    03 使用零信任模型来降低风险 零信任是一种IT安全策略,企业要求防护周界内部和外部的每一名用户、系统或者设备在连接到其系统之前都要进行验证和认证。怎样使用零信任模型来降低云风险呢? 05 重新考虑使用手动和自动云混合管理策略 ? 自动化、虚拟助理和数据处理不仅能够帮助企业销售更多的产品,而且还能够管理他们的云服务。 07 反思避险作为一种风险缓解策略 攻击和安全并不是唯一要考虑的风险,落后也是需要考虑的风险之一。 在此,诚挚建议企业根据自身需要制定正确的策略,大幅降低云风险。(来源:SCDN云计算) 边缘计算与模块化数据中心:天作之合 云计算和边缘计算,谁更依赖数据引力?

    1.3K10发布于 2019-11-08
领券