首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI应用开发实践

    检索增强生成

    一 什么是RAG RAG,英文全称是 Retrieval-Augmented Generation,中文我们一般叫做检索增强生成,这是一种结合信息检索技术与生成式大语言模型(LLM)的框架。 这个“先查资料再回答”的过程,就是 RAG(检索增强生成)的核心! 具体来说,RAG 就是让 AI 学会“先查资料再说话”。 数据安全与隐私:企业敏感数据无需上传至公有模型,仅通过本地知识库增强回答(如客服系统引用内部退货政策)。 降低微调成本:无需频繁重新训练模型,仅更新外部知识库即可适应新需求。 三 如何实现 RAG 我们来看下这张经典的 RAG 流程图: 这张图清晰展示了检索增强生成(RAG)的核心流程,分为数据准备和问答生成两大阶段。 我们分别来看。 优化方向: 混合检索:结合关键词、向量、图谱等多模态检索提升查全率。 动态评估与迭代:通过用户反馈和 A/B 测试持续优化检索策略。

    25210编辑于 2026-03-26
  • 来自专栏xiaosen

    检索增强生成(RAG)

    检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了检索机制和生成模型的先进技术,旨在提高自然语言处理系统的准确性和上下文相关性。 本文将详细介绍如何从零开始构建一个RAG系统,包括数据处理、检索、生成以及部署等各个环节。 检索管道:根据用户的查询从已索引的数据库中检索最相关的信息,使用检索策略和重排序方法来优化结果。 生成管道:将检索到的数据与用户的查询结合,生成准确、相关且连贯的响应。 构建RAG系统的步骤  1. 检索过程 在用户提交查询后,RAG系统会执行以下步骤: 查询预处理:对用户输入进行清洗和标准化,例如去除停用词、词形还原等,以提高检索效果。 执行检索:利用向量数据库执行相似性搜索,从中获取与用户查询最相关的文档片段。 4.

    1.2K10编辑于 2025-01-03
  • 来自专栏大数据杂货铺

    使用检索增强生成 (RAG) 增强 SQL 代理

    在本文中,我们将探讨如何通过合并高级分析功能来增强 SQL 代理的功能。想象一下,代理不仅能够提供基本的统计数字,例如客户支付的平均金额,而且还能够提供更高级和更有趣的见解。 检索增强生成 (RAG) 为了便于您的代理了解如何使用这些功能,我建议采用一种称为检索增强生成 (RAG) 的技术。 此方法有助于根据查询查找相关说明。 此外,我们还讨论了创建一个 RAG 来检索相关的语法指令信息。现在,让我们探讨如何无缝集成这两个组件。 RAG 作为工具 在这篇博客中,我详细介绍了 如何利用SQL 代理与数据库交互等工具。

    1.1K10编辑于 2024-04-02
  • 来自专栏自然语言处理

    检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?

    检索增强思维 (RAT) 是一种创新性的方法,它结合了两种关键技术:检索增强生成 (RAG) 和思维链 (CoT) 提示。大型语言模型 (LLM) 因其模仿人类写作和流畅回答问题的能力而变得流行。 RAT:知识与思维链的结合 检索增强思维 (RAT) 是一种简单但有效的提示方法,它将思路链 (CoT) 提示与检索增强生成 (RAG) 相结合,以处理长窗口推理和生成问题。 我们提出的方法称为检索增强思维 (RAT),它涉及使用从相关来源检索到的信息逐一修改每个思维步骤。这包括任务查询,以及生成初始零样本 CoT 后的当前和过去思维步骤。 知识库:这象征着 LLM 可以通过检索增强生成 (RAG) 访问的外部知识库。 增强修订:这指的是 LLM 如何根据检索到的信息和先前的解释来完善其思维链 (Ti)。 检索增强思考 RAT(RAG+COT):提升 AI 推理能力的强大组合 原创 【LLM-RAG】RAT:检索增强思维提示实现上下文感知推理 将RAG与CoT结合起来的技术,RAT减轻长文本生成出现的幻觉问题

    77710编辑于 2025-01-05
  • 来自专栏机器学习

    介绍 RAG(检索增强生成)

    它结合了检索系统和生成模型的优势,通过从大型数据库中检索相关信息并使用生成模型对其进行处理,生成更准确和上下文相关的答案或内容。 RAG 的基本原理RAG 模型的工作流程可以分为以下几个步骤:检索:从一个大型知识库或文档集合中检索与输入查询相关的文档或段落。 文档摘要:从多个文档中检索相关段落,生成一个综合性的摘要。信息检索增强:在需要综合多个信息源的任务中,RAG 可以提供更全面的回答或内容。 print(response)总结RAG(检索增强生成)通过将检索和生成相结合,能够在需要丰富背景信息的任务中表现出色。 它不仅在开放域问答和对话系统中具有很大的应用潜力,还可以用于文档摘要和信息检索增强等任务。通过适当的数据准备、检索模型训练、生成模型训练和模型融合,可以构建出一个强大的 RAG 系统。

    2.3K00编辑于 2024-07-29
  • 来自专栏人工智能

    检索增强生成(RAG)技术详解

    检索增强生成(Retrieval-Augmented Generation,RAG)通过将外部知识检索与生成相结合,有效解决了这些问题。 RAG技术概述 什么是RAG RAG是一种结合信息检索和文本生成的AI架构,工作流程如下: 用户查询 → 检索相关文档 → 生成增强回答 → 返回结果 ↓ # RAG检索增强生成实践代码 import torch import numpy as np from typing import List, Dict, Optional, Tuple import summary # ==================== 主程序 ==================== def main(): print("="*70) print("RAG检索增强生成系统演示 print(f"\n生成的增强提示:") print(result['prompt'][:300] + "...

    93310编辑于 2026-01-21
  • 来自专栏AIGC

    【AIGC】检索增强技术深度剖析(RAG)

    在这种情况下,检索增强生成 (RAG) 开辟了新的视角。RAG 允许将 AI 模型与公司的特定内部数据集成,不仅可以进行处理,还可以对这些知识进行智能解释和利用。在本文中,我们将探讨如何实现这一点。 一、检索增强定义RAG 是一种技术,它允许通过从大型文档数据库中实时检索信息来扩展预训练语言模型的知识。 二、深度使用检索增强想更深入地了解这个简单的例子吗? 这是它的样子:在这种情况下,检索增强生成 (RAG) 就派上用场了。我们可以通过向提示添加上下文信息来简单地扩展机器学习模型的知识。从理论上讲,它如下所示:从理论上讲,它会起作用。 小节本节我们学习了检索增强,我们知道了什么是检索增强,我们为什么需要检索增强以及检索增强构建思路,后面章节我们会专门整理出来检索增强服务的构建过程,大家敬请期待吧。

    1K10编辑于 2024-05-11
  • 来自专栏人工智能

    LLM的检索增强--SELF-RAG

    通常人们会使用RAG来解决大模型的幻觉问题,检索增强生成(RAG)是一种通过检索相关知识来增强 LLMs 输入的方法,可以减少这类问题。 然而,无论检索是否必要或检索到的段落是否相关,RAG 方法都会不加选择地检索和整合固定数量的检索段落,这可能会降低 LLMs 的多功能性或导致生成无用的响应。 LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION》的论文提出了一个创新解决方案——SELF-RAG框架,旨在通过自我反思和检索增强来提高语言模型的生成质量和事实准确性 如果模型确定需要检索,它会输出一个检索标记(retrieval token),触发检索模型(retriever model)按需检索相关文档。 **增强多功能性**:SELF-RAG不会损害语言模型的多功能性,它能够根据任务需求灵活地调整检索和生成策略。

    51110编辑于 2024-11-25
  • 来自专栏云云众生s

    提高检索增强的相关性

    构建采用检索增强生成(RAG)的生成式AI应用程序可能面临各种挑战。让我们来看看依靠向量数据库检索相关上下文,然后将其融入提示送入大语言模型(LLM),以提供更相关结果的RAG实现的故障排除。 本文重点关注检索用例,但嵌入当然可以用于许多其他应用,包括分类、聚类和总结。该排行榜可以帮助您确定对特定用例表现最佳的模型。 他们经常发现使用Word2Vec、sBERT和RoBERTa等嵌入模型的样本代码,而这些模型对于检索用例来说是糟糕的选择。 因此,不仅在基准用例的检索性能方面略胜一筹,而且还以较低的存储和计算需求从向量数据库角度获得了这些改进的结果。 相反,更大的上下文窗口允许更大的灵活性,即使并非所有内容都严格必要,也可以包含可能增强模型输出的额外上下文。 通过实验这些分块策略并考虑这些因素,您可以评估它们对生成输出相关性的影响。

    46310编辑于 2024-03-28
  • 来自专栏云云众生s

    评估检索增强生成(RAG):TruLens + Milvus

    越来越多地,向量搜索已成为生成式 AI 在问答应用中的关键企业用例,即所谓的“检索增强生成(retrieval augmented generation)”或RAG。 如果数据不够准确,检索过程就可能返回无关的结果。 选择好数据之后,要考虑使用的嵌入模型,因为它对检索质量有很大影响。 检索 检索到的上下文数量(前 k 个) 分块大小 当进行检索时,前 k 个是经常讨论的一个参数,它控制检索到的上下文分块数量。 我们观察到一种失败模式是检索到错误城市信息。您可以从下面的思维链反馈原因中看到,其中检索到了 Tucson 而不是 Houston 的上下文。 相似度前 k 个 增加 top k 略微提高最大检索质量(通过上下文相关度测量)。检索更多块,检索器有更多机会获取高质量上下文。

    90210编辑于 2024-03-28
  • 检索增强生成(Retrieval-Augmented Generation)

    定义 RAG,全称Retrieval-Augmented Generation,中文翻译为“检索增强生成”。 原理 RAG的原理主要包括两个阶段: 检索阶段:模型首先从外部知识库中检索与输入文本相关的信息。这个知识库可以是对大规模文本数据集进行索引处理后形成的数据库。 检索模型训练/选择:训练一个高效的检索模型,如使用向量空间模型、TF-IDF或基于BERT的语义检索模型。 联合训练(可选):在某些情况下,为了更好地融合检索和生成两个阶段,可以进行联合训练。 检索和生成两个阶段可能存在信息损失。 对计算资源有一定要求。 应用场景 RAG在多个领域都有广泛的应用,包括: 问答系统:通过检索相关知识库,为用户提供准确、详细的答案。 知识图谱构建:通过检索和生成技术,构建丰富、准确的知识图谱。

    1.1K10编辑于 2025-04-05
  • 来自专栏秋枫学习笔记

    RAT:检索增强的Transformer用于CTR估计

    目前的方法主要集中于对单个样本内的特征交互进行建模,而忽略了潜在的跨样本间的关系,这些关系可以作为增强预测的参考上下文信息。 为本文提出了一种检索增强的Transformer(RAT),获取样本内部和样本之间的细粒度特征交互。 通过检索相似的样本,为每个目标样本构建增强输入。 2.方法 alt text 2.1 检索相似样本作为上下文 样本 x_i 有F个field的特征 x_i=[x^1_i,... ,x^F_i] ,为当前样本从剩下的样本池 \mathcal{P} 中检索相似相似样本,作者此处采用BM25进行检索。 2.2 构建增强输入 通过emb层将离散的特征转化为D维的emb,并且对于检索得到的样本,标签也作为特征进行编码得到emb。

    46210编辑于 2024-04-11
  • 【RAG】检索增强生成的评估·综述

    相关工作的文章和代码汇总在:Awesome RAG Evaluation 摘要 RAG(Retrieval-Augmented Generation,检索增强生成)由于其复杂的结构性和对检索知识库的依赖 其中RAG主要由检索和生成两阶段组成。检索涉及两个部分,建立文档索引和执行文档检索,通常还会结合精拍/重排来进一步微调检索到的文档排序。 准确率、召回率和F1分数是主要评价指标,但这些传统的评价指标无法反映检索结果的有效性和多样性,无法有效适配后续生成阶段所需的准确性和全面性的需求。复杂的信息来源和多样的检索策略也是另一大挑战。 ,后者确保检索到的文档在文档候选集中的排名合理。 检索指标 在检索评估中,关键在于选用能准确反映相关性、准确性和多样性的指标。这些指标不仅体现系统在获取相关信息方面的精确度,还需展示其在动态知识源中的鲁棒性。

    1.9K51编辑于 2024-07-19
  • 来自专栏muller的测试分享

    人工智能|RAG 检索增强生成

    它能够通过检索大规模文档集合来提供准确的答案,无需针对每个问题进行特定训练。 信息检索(Information Retrieval):RAG 可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。 RAG 检索增强的原理从上图可能很多同学非常好奇,大模型是如何与“外挂”数据库进行交互的。不是说大模型不能联网吗?其实大模型和数据库的交互,也是通过提示词完成的。 让其变的易检索。这个预处理的过程,就使用了向量数据库以及embedding。 相关资料RAG 官方文档说明总结理解什么是 RAG 检索增强。理解 RAG 检索增强应用场景。了解 RAG 检索增强有哪些相关的使用方法。

    66310编辑于 2024-07-24
  • 选择性检索增强代码补全技术解析

    通过选择性检索增强仓库级代码补全大型代码语言模型在补全任意程序函数代码方面表现出色,但面对大型软件开发项目时,正确的代码补全可能依赖于代码仓库中其他地方定义的API调用或函数。 检索增强生成通过从仓库中获取相关上下文来解决此问题,从而丰富模型的理解并改善其输出。但执行检索需要时间并会减慢生成速度:它总是最佳选择吗? 更有趣的是,Repoformer能够作为一个即插即用的策略模型,减少作为检索增强生成中生成模型的各种强大代码大型语言模型的推理延迟。 凭借超过85%的检索决策准确率,Repoformer确保仅在检索增加价值时才使用上下文检索。 进一步的分析表明,所提出的策略提高了Repoformer对检索的鲁棒性,减少了有害检索,并增加了通过检索改进的实例数量。FINISHED

    9310编辑于 2026-02-06
  • 从 0 到 1 构建 RAG 检索增强系统

    检索增强生成(RAG,Retrieval-AugmentedGeneration)成为连接大模型与外部知识的重要方式。 本文从0到1系统讲解RAG的核心原理、系统结构及落地步骤,帮助读者构建一个可用、可扩展的RAG检索增强系统,为智能体和企业级AI应用提供可靠基础。 目录一、什么是RAG二、为什么需要RAG三、RAG系统核心架构四、从0到1搭建RAG系统五、一个典型RAG流程示例六、常见问题与优化经验七、总结一、什么是RAGRAG(检索增强生成)是一种将信息检索与文本生成结合的技术框架 RAG可以:接入内部知识库保障数据安全提供定制化答案3.降低幻觉风险当模型基于真实检索内容回答时:胡编概率显著下降可追溯性增强结果更可信4.成本可控相比微调大模型:RAG成本更低维护更简单迭代更灵活因此 第五步:构建检索逻辑关键参数包括:Top-K数量相似度阈值混合检索策略需要通过测试不断调整。

    59810编辑于 2026-02-02
  • 检索增强生成(RAG)的版权新关注

    二、“检索增强生成”为何会崛起?“检索增强生成”最早由Facebook AI Research团队在2020年发表的《用于知识密集型自然语言处理任务的检索增强生成》一文中提出。 检索增强生成的整个过程可分为“数据检索收集”和“内容整合展示”两个阶段。 三、“检索增强生成”的现实版权纠纷早在2024年10月21日,美国便出现了首例针对“检索增强生成”的版权侵权诉讼——“道琼斯公司和纽约邮报控股公司诉Perplexity AI”案。 六、“检索增强生成”涉及作品利用问题在“内容整合展示”阶段,需要评估检索增强生成对作品的利用,是否落入版权法规制的“直接侵权”和“间接侵权”的范畴。 如果检索增强生成的回答超出了合理限度,依旧可能构成侵权。

    45700编辑于 2025-08-14
  • 来自专栏机器学习与推荐算法

    用户检索增强的大模型跨域推荐

    针对这一问题,该文提出了URLLM框架,通过同时探索基于大模型的用户检索方法和领域基础来提高跨域序列推荐的性能。 然后,采用用户检索生成模型将结构信息无缝地集成到大模型中,充分利用大模型的推理能力。此外,提出了一种特定于域的策略和一个精化模块来防止域外生成。

    47510编辑于 2024-07-05
  • 来自专栏DeepHub IMBA

    TabR:检索增强能否让深度学习在表格数据上超过梯度增强模型?

    这是一篇7月新发布的论文,他提出了使用自然语言处理的检索增强Retrieval Augmented技术,目的是让深度学习在表格数据上超过梯度增强模型。 检索增强一直是NLP中研究的一个方向,但是引入了检索增强的表格深度学习模型在当前实现与非基于检索的模型相比几乎没有改进。 TabR的检索组件虽然比以前的工作更有效,但会产生明显的开销。所以它可能无法有效地扩展以处理真正的大型数据集。 实验结果 作者将TabR与现有的检索增强解决方案和最先进的参数模型进行比较。 它的基于检索的方法具有良好的潜力,并且在某些数据集上可以明显优于梯度增强的决策树。 3、使用检索组件增强XGBoost 作者试图通过结合类似于TabR中的检索组件来提高XGBoost的性能。

    36220编辑于 2023-08-30
  • 检索增强生成机理探寻:为什么要RAG?

    检索增强生成机理探寻:为什么要RAG?本文是关于RAG的第三篇文章,前两篇可从作者主页进去。 RAG系列文章的核心观点来自于“灯塔书”《知识增强大模型》第4章《检索增强生成》的内容,这些内容是对书中内容进行补充和概览。 关于为什么要使用RAG,在“灯塔书”《知识增强大模型》详细比较了RAG、SFT、LoRA和长上下文的各自优劣,并以“锂电池供应链管理”的案例作为例子来说明。本文是对其的一点总结和补充。 此外,来源标注或引用功能增强了AI输出的透明度(见下一节),允许用户追溯信息的来源并验证其准确性,这对于在各个领域建立和维持对AI系统的信任至关重要。 RAG通过使用户能够将用于生成响应的信息追溯到其原始来源来增强信任。这种透明度不仅允许验证准确性,而且还帮助用户了解信息的上下文和可靠性,从而增强了对AI系统的信心。

    86210编辑于 2025-04-27
领券