首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏自然语言处理

    RAG与CAG的较量与融合

    架构:RAG 和 CAG 的背景 检索增强生成 (RAG) RAG 将大型语言模型 (LLM) 与外部检索机制集成在一起,以动态整合来自广泛数据存储库的上下文相关信息。 基本概要 ⚖️ RAG 与 CAG 的比较分析 数据来源 RAG:外部数据库、API 和实时存储库确保广泛的数据覆盖。 CAG:结构化的内部缓存提供快速访问,但受到预定义范围的限制。 延迟 ⏳ RAG:由于依赖外部检索,因此延迟更高。 ⏩ CAG:通过利用预缓存数据实现更低的延迟。 系统复杂性 RAG:需要复杂的检索机制,增加了整个系统的复杂性。 选择的因素 是否实施 RAG 或 CAG 取决于预期应用的具体要求: RAG:尽管在延迟和成本方面存在权衡,但对于适应不断发展的信息至关重要的场景而言,它是首选。 ️‍ ⚛ 混合架构 人工智能系统的未来可能在于综合 RAG 和 CAG 优势的混合架构。此类系统可以采用 RAG 的动态检索功能来处理实时场景,同时利用 CAG 的缓存数据集来获取可预测且经常访问的信息。

    36510编辑于 2025-02-03
  • 来自专栏明明如月的技术专栏

    深入理解RAG:检索与生成的融合

    -1l4b 深入理解RAG:检索与生成的融合 检索增强生成(RAG)模型代表了检索系统和生成模型两大不同但互补组件完美结合的杰作。 通过无缝集成相关信息检索和生成背景相关响应,RAG模型达到了人工智能领域前所未有的复杂程度。 RAG是如何工作的? 想象一下,你正计划去国外旅行,想了解当地的文化、历史和景点。 最后的行程安排巧妙地将代理提供的信息与导游的专业知识融合在一起,形成一份全面且生动的旅游计划。 RAG模型的架构 让我们分解一下RAG模型的架构: 查询处理: 这是旅程的开始。 正如生成模型创作出连贯的故事情节,旅行社代理也会巧妙地将航班、酒店和活动融合在一起,为客人打造无缝而愉快的旅游体验。 集成一切 让RAG模型如此非凡的,正是其检索和生成组件之间的协同作用。 构建RAG的平台选择 在构建检索增强生成(RAG)模型时,开发人员可以利用各种平台和工具,这些工具能够简化开发流程,提供集成的实验和部署环境。

    56500编辑于 2024-05-24
  • 来自专栏DeepHub IMBA

    BookRAG:面向层级文档的树-图融合RAG框架

    现有的RAG系统,无论是基于文本的图方法还是基于版面分割的方法,在面对这类文档时往往失效。根源在于两点:结构与语义的脱节以及工作流程的僵化。 本文介绍的BookRAG或许能提供一个有用的视角。 第一种是文本优先方法,将所有内容扁平化为纯文本,主要依赖OCR,再用BM25、经典分块RAG或GraphRAG、RAPTOR等图方法完成检索。 大多数RAG管道依赖固定的查询处理流程,简单问题处理起来效率低,复杂问题又应对不了。 所以多数现有的文档级RAG系统要么忽略文档的层级结构,要么缺乏查询感知的检索流程。 BookRAG是一个专为层级结构文档设计的RAG框架。 问答之外,它还能支撑一致性检查、结构化摘要乃至交叉引用修复——树-图结构由此成为文档生命周期的一部分,而非仅仅服务于RAG的后端工程。 再往前看,Agent的算子规划是否能演化为一个可学习的策略层?

    14510编辑于 2026-03-31
  • 来自专栏AI研思录

    RAT:融合RAG和CoT的高效多步推理任务策略

    因此这篇论文考虑在COT的基础上加上了RAG,即 RAT,通过利用检索到的外部信息为大模型提供推理依据。 论文核心 RAT 的核心是将 RAG 用于修正由 CoT 提示生成的每一个思维步骤中,通过查找不同参考文档来不断修正每一个思维步骤,确保推理的每一步都有准确且可靠的信息支持。 使用RAG来修复大模型生成思维步骤:假设已经修复了之前的思考步骤,现在要修复第 个思维步骤 ,将现在和过去的思维步骤 转化为将可以被LLM检索系统处理的查询,得到 检索文档:使用RAG检索 相关的文档 论文总结 这篇文章提出的RAT结合了RAG和CTO思想,使用RAG检索的文档动态优化COT中的每一个步骤,确保每一个推理步骤都是有依据的,避免大模型的幻觉。 实验结果表明,RAT在这些任务上相比传统的CoT提示和RAG方法都有显著的性能提升。

    71710编辑于 2025-02-20
  • 来自专栏掘金安东尼

    👾打开 RAG 对接大模型的黑盒 —— 9 大隐藏问题

    构建 RAG 本篇不是想讲 RAG 概念,而是想再深入探索一下:RAG 的构建; 通常来说,构建 RAG 的过程有: 将文档分割成均匀的块,每个块都是一段原始文本; 为每个块生成嵌入(例如 OpenAl 库创建 RAG 管道。 对接大模型的黑盒 —— 9 大问题 来源:Seven Failure Points When Engineering a Retrieval Augmented Generation System 1 greater than 1 invokes parallel execution. nodes = pipeline.run(documents=documents, num_workers=4) 9. 总结 本篇提供了开发 RAG 通道 9 个痛点,并针对每个痛点都给了相应的解决思路。 RAG 是非常重要的专用检索+通用大模型的技术手段,在赋能模型、满足特定化场景中非常重要!

    77810编辑于 2024-04-04
  • 大模型 RAG 中 RRF(Reciprocal Rank Fusion倒数排序融合)是什么

    (对大模型处理的好处)在RAG系统中,如果你只给大模型看前3条资料,这3条资料的质量决定了回答的上限。 适用场景:标准的RAG场景,用户提问通常就是一句话。展开代码语言:PythonAI代码解释//示例:全文检索一句话{"query":{"match":{"content":"如何办理入职手续?"}}} -通过RRF(倒数排名融合)合并结果,给模型最精准的那几段话。 代码实现在代码层面实现ES检索并对接大模型,通常有两种主流方式:一种是使用Elasticsearch官方PythonSDK(适合底层控制),另一种是使用LangChain/LlamaIndex(适合快速搭建RAG user_vector,"k":3,"num_candidates":100}}res=es.search(index=index_name,knn=query)3.对接大模型(LLM)的完整闭环这是RAG

    38700编辑于 2026-03-15
  • 来自专栏Datawhale专栏

    RAG 作者:RAG 已死,RAG 万岁!

    一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。 RAG 的初衷 五年前,我在 Meta 基础人工智能研究中心(FAIR,前身为 Facebook 人工智能研究中心)的团队提出了 RAG(Retrieval-Augmented Generation,检索增强生成 底线是:您同时需要长上下文 LLM 和 RAG。 但既然“RAG”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为 RAG。 我们可以就叫它 检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用 RAG 精准定位所需信息要昂贵得多。 RAG、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。

    70710编辑于 2025-04-24
  • 来自专栏全栈开发工程师

    RAG】001-RAG概述

    RAG】001-RAG概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:RAG 基本逻辑 补充2:RAG 知识库基本逻辑 一、RAG 介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、RAG 的概念 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、RAG 的工作原理 RAG 的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用

    75010编辑于 2025-03-25
  • 来自专栏ceshiren0001

    用LightRAG打造智能问答系统:知识图谱与RAG融合应用实践

    当知识图谱与RAG技术相遇,会碰撞出怎样的火花?在AI迅猛发展的当下,检索增强生成(RAG:Retrieval-Augmented Generation)技术正成为解决大模型幻觉问题的有效方案。 然而,传统RAG系统仍普遍存在检索不够精准、上下文理解能力有限等痛点。知识图谱的引入,为这些瓶颈提供了全新的突破思路。而LightRAG,正是这样一个将知识图谱与RAG轻量融合的创新框架。 本文将以LightRAG为例,带你轻松入门,探索如何借助知识图谱的力量,提升RAG系统的准确性与整体性能。 model_name="sentence-transformers/all-MiniLM-L6-v2",    device="cpu"  # 使用"cuda"加速GPU)三、快速构建你的第一个知识图谱RAG (custom_retriever)4.2 可视化检索过程# 启用检索过程可视化result = rag.query(    "解释LightRAG的架构优势",    visualize=True  

    1.1K00编辑于 2025-08-27
  • 来自专栏机器学习原理

    rag

    RAG技术全面解析:原理、应用与优势 引言 在当今快速发展的人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为一个备受关注的话题。 RAG工作流程 RAG的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息,RAG系统可以识别出新的实体和关系。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。

    60511编辑于 2024-06-27
  • 来自专栏自然语言处理

    RAG Logger:RAG日志记录工具

    您听说过 RAG Logger 吗? 它是一款专为检索增强生成 (RAG) 应用程序设计的开源日志记录工具! 据说它可以作为 LangSmith 的轻量级替代方案,满足 RAG 特定的日志记录需求。 查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。 特点 通过查询跟踪详细了解用户问题! RAG Logger 为 RAG 应用程序的性能监控和调试提供了强大的支持,对吗? 特别推荐给那些想要提高应用程序开发效率的人。 请参阅此处的详细信息: RAG Logger GitHub 仓库

    31110编辑于 2025-01-07
  • 来自专栏数据派THU

    独家 | 进阶RAG-提升RAG效果

    在我的上一篇博客中,我深入地介绍了RAG以及它是如何用LlamaIndex实现的。然而,RAG在回答问题时经常遇到许多挑战。 RAG工作流程分解 首先,为了增强对RAG的理解,我们将RAG工作流程分解为三个部分,并对每个部分进行优化以提高整体表现。 9. 模块化RAG 模块化RAG集成了多种方法来增强RAG的不同组成部分,如在检索器中加入相似度检索的搜索模块和应用微调方法 RAG融合RAG Fusion) RA融合技术结合了两种方法: 多查询检索 利用 总结 本文讨论了优化RAG管道各部分和增强整体RAG流水线的各种技术。您可以在您的RAG流水线中使用这些技术中的一种或多种,从而使其更加准确和高效。

    1.5K20编辑于 2024-06-28
  • 来自专栏Reinvent Data Science

    RAG 修炼手册|如何评估 RAG 应用?

    当以黑盒方式来评估 RAG 应用时,我们看不到 RAG 应用的内部,只能从输入给 RAG 应用的信息和它返回的信息来评估 RAG 的效果。 对于一般的 RAG 系统,我们只能访问这三个信息:用户提问(User's query)、RAG 系统召回的引用上下文(retrieved contexts)、RAG 系统的回答(RAG's response 我们使用这三个信息来评估 RAG 应用的效果,黑盒方式是一种端到端的评估方式,也比较适用于评估闭源的 RAG 应用。 当以白盒方式来评估 RAG 应用时,我们能看到 RAG 应用的内部所有流程。 白盒方式可以用来评估开源 RAG 应用,或者提升自研 RAG 应用。 02. )、RAG 系统的回答(RAG's response)。

    1.5K12编辑于 2024-04-25
  • 来自专栏coder

    什么是 RAG,为什么要用 RAG

    为什么要用 RAGRAG 引用信息来源是用户可以核实答案,因此其透明透非常高,这增强了人们对模型输出结果的信任。 透过获取与特定领域数据,RAG能够为不同领域提供专业的知识支持,定制能力非常高。 由于 RAG 不需更新模型参数,因此在处理大规模数据集时,经济效率方面更具优势。 不过虽然RAG有许多优势在,但这3种方法并不是互斥的,反而是相辅相成的。 什么是 RAG ? 这篇章旨在介绍 RAG 的过程与其使用的相关技术。 RAG 生态系 RAG 的生态系蓬勃发展,在水平领域,从最初的文本问答领域以外,RAG 的应用逐渐拓展到更多模态数据,包括图像、代码、结构化知识、影音等。 在这些领域,已经涌现许多相关研究成果。

    71510编辑于 2024-09-06
  • 来自专栏周末程序猿

    RAG实战|8种RAG架构浅析

    生成多个embedding,每个头捕获不同的语义特征 多向量索引构建:为每个注意力头构建独立的向量索引,存储不同维度的语义信息 并行检索:针对查询,在多个索引上并行检索,每个头返回最相关的文档片段 结果融合 :将多个头的检索结果进行去重和融合,综合考虑不同语义维度的相关性 上下文生成:将融合后的文档片段组装成上下文,输入LLM生成答案 相关参考如下: 论文:https://arxiv.org/pdf/2406.05085 (vectorstore) def search(self, query: str, top_k: int = 3) -> List[str]: """多头并行检索并融合结果 Agentic RAG 简介: Agentic RAG(智能体RAG)将 AI Agent 的规划和推理能力与 RAG 相结合。 SFR RAG 简介: SFR RAG(Salesforce Research RAG)是工业级高质量 RAG 的最佳实践。

    1K10编辑于 2025-12-30
  • RAG 2.0,让RAG 终成正果

    然而,像Contextual.ai提出的基于情境语言模型(CLMs)的“RAG 2.0”这样的案例却很少见,它试图让目前最流行(如果不是最受欢迎的话)的生成式AI模型实现方式之一——标准检索增强生成(RAG 提出这种主张的,恰恰是RAG的创造者。 虽然这是对生产级生成式AI现状的一次重大改进,但整个子领域仍存在一个疑问:RAG是否正在走向末路,这些创新是否只是在对一个已经死去的马施加无效的鞭打? 这就是RAG发挥作用的地方。 更好的商业案例,或者死亡 今天,由于Transformer无法压缩上下文,更长的序列不仅意味着成本呈二次方增长(序列增加2倍意味着计算量增加4倍,或者序列增加3倍意味着计算成本增加9倍),而且还意味着由于 总的来说,我们很快就能看到处理极长序列的成本仅为现在的一小部分,这应该会增加对RAG架构需求的怀疑。 当那个时刻到来时,我们可以几乎肯定它会发生,我们还会依赖RAG吗?

    1.7K51编辑于 2024-04-24
  • 来自专栏全栈开发工程师

    RAG】001.1-RAG相关核心概念

    RAG】001.1-RAG相关核心概念 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与生成模型的混合架构,旨在提升生成的准确性和可信度。 典型模型:GPT、T5、Llama等预训练语言模型(LLM),负责融合检索结果与用户输入生成最终响应。 的优势也是挑战: 理想状态: 检索模块提供精准、紧凑的上下文,生成模块聚焦语义融合与逻辑表达,形成“1+1>2”的协同效应。 上下文融合(Context Fusion) 上下文融合是指将检索到的知识与用户输入有效整合的过程,这是RAG系统中至关重要的环节。 系统通常将上述三种技术有机结合: 通过精心设计的上下文融合策略将检索内容与用户查询整合 使用可控生成技术确保输出严格基于检索内容 实现完善的溯源机制使用户能够验证生成内容的来源 这种综合应用不仅提高了RAG

    94210编辑于 2025-03-26
  • 来自专栏DeepHub IMBA

    RAG系统文本分块优化指南:9种实用策略让检索精度翻倍

    RAG系统的性能很大程度上依赖于文本分块策略的选择和实施。 文本分块是RAG系统中的关键预处理环节,文本块定义为从大型文档或数据集中按照特定规则和策略分割而成的文本片段,这些片段将被嵌入并索引到RAG知识库中以支持检索操作。 该过程的目标是将文档重新组织为多个部分,使RAG系统能够根据输入查询高效检索最相关的内容片段。 RAG系统的工作机制是在推理阶段对查询进行嵌入编码,然后从向量数据库中检索前k个最相关的文本块。 {"text_chunks": text_chunks, "tables": tables, "images": images} result = modality_chunk(pdf_file) 9、 开发者可以根据具体需求选择单一策略或组合多种策略,以实现最优的RAG系统性能。通过深入理解这些分块策略的原理和实现方法,我们能够构建更加高效和准确的RAG系统,为用户提供更好的信息检索和生成体验。

    1.5K11编辑于 2025-08-20
  • 来自专栏AgenticAI

    Agentic RAG:超越传统RAG与案例分享

    RAG 框架不断推陈出新、日新月异,从 Navie RAG、高级 RAG、模块化 RAG,发展到现在的 Graph based RAG,甚至混合高级 RAG 与 GraphRAG 的 HybridRAG 本文先讨论 Agentic RAG 常见范式,然后推荐一些流行的 Agentic RAG 开发示例:Nvidia 的 Agentic RAG 案例和基于 LlamaIndex 的 Agentic RAG Nvidia Agentic RAG Nvidia 展示的 Agentic RAG 只是一个示例,参考了如下 3 篇论文实现。 路由 (Adaptive-RAG[1]). agentic-rag-llama 比如你可能会问:“比较一下 adapt rag 和 self-rag,首先分析各个论文中的方法”,查询重写模块可能会将用户提问分解为: adapt rag 中的方法 self rag 中的方法 对比 self rag 和 adapt rag 然后 Router 会分别调用 self rag 的 summary tool 和 adapt rag 的 summary tool

    3.2K31编辑于 2025-03-18
  • 来自专栏有文化的技术人

    静态 RAG 与动态 RAG 技术全解析

    ❝本文系统介绍静态 RAG 与动态 RAG 的核心原理、技术对比、主流实现方案及代码实践,适合技术选型和深入学习参考。 ❞ 目录 一、RAG 技术概述 二、静态 RAG 2.1 核心原理 2.2 优化技术 2.3 主流实践方案 2.4 代码示例 三、动态 RAG 3.1 核心原理 3.2 主流实现方案 四、Self-RAG 7.2 Self-RAG vs CRAG 7.3 选型建议 八、参考资源 一、RAG 技术概述 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与文本生成的技术架构 为什么需要 RAG? 」 多路检索结果融合(RRF 算法) 多维度召回 「Hybrid Search」 向量检索 + BM25 关键词检索混合 兼顾语义和关键词 2.3 主流实践方案 开源框架 「LangChain」:最流行的

    15710编辑于 2026-04-09
领券