首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏xiaosen

    检索增强生成(RAG

    检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了检索机制和生成模型的先进技术,旨在提高自然语言处理系统的准确性和上下文相关性。 本文将详细介绍如何从零开始构建一个RAG系统,包括数据处理、检索、生成以及部署等各个环节。 检索管道:根据用户的查询从已索引的数据库中检索最相关的信息,使用检索策略和重排序方法来优化结果。 生成管道:将检索到的数据与用户的查询结合,生成准确、相关且连贯的响应。 构建RAG系统的步骤  1. 文本分块:将长文本分割成较小的块,以便于后续的嵌入和检索。 2. 向量嵌入生成 向量嵌入是RAG系统的基础,它将文本数据转换为数值表示,使得计算机能够理解其语义。 检索过程 在用户提交查询后,RAG系统会执行以下步骤: 查询预处理:对用户输入进行清洗和标准化,例如去除停用词、词形还原等,以提高检索效果。

    1.2K10编辑于 2025-01-03
  • 来自专栏架构进阶

    RAG检索实践:多路检索(PostgreSQL环境准备)

    一 前言 大模型的RAG架构,不论是入门还是某个环节的深入,已经有不少文章都做了介绍。我在大模型 RAG:文档分块方案与 RAG 全流程中也做了阐述。 本篇在 大模型 RAG:基于 PgSql 的向量检索的基础上,介绍基于postgresql的向量检索和全文检索基础环境搭建及检索示例,为后续的多路检索召回、重排序做好准备。 本篇基于mac操作系统和PostgreSQL13.2.1版本,安装pgvector、pg_trgm扩展,并演示向量化检索和全文检索实现过程。 在RAG或NLP领域中,代表着一段/文本的“特征”,通过对文本向量化(embedding),把每段文本转化成一个向量。 下一篇将进一步介绍向量检索与全文检索结果聚合与重排序(rerank),欢迎随时留言探讨。

    88510编辑于 2025-05-04
  • 来自专栏机器学习

    介绍 RAG检索增强生成)

    什么是 RAGRAG(Retrieval-Augmented Generation)是一种将检索和生成结合在一起的模型架构,特别适用于回答开放域问答、生成相关文本以及需要丰富背景信息的任务。 RAG 的基本原理RAG 模型的工作流程可以分为以下几个步骤:检索:从一个大型知识库或文档集合中检索与输入查询相关的文档或段落。 RAG 的应用场景RAG 模型在多个领域有广泛的应用,包括但不限于:开放域问答:在回答开放性问题时,RAG 可以从大量文档中检索相关信息,生成更准确和详尽的回答。 信息检索增强:在需要综合多个信息源的任务中,RAG 可以提供更全面的回答或内容。RAG 的优势上下文丰富:通过检索相关信息,RAG 可以生成更符合上下文的回答或内容。 print(response)总结RAG检索增强生成)通过将检索和生成相结合,能够在需要丰富背景信息的任务中表现出色。

    2.3K00编辑于 2024-07-29
  • 来自专栏NLP/KG

    探索检索增强生成(RAG)技术的无限可能:Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成

    探索检索增强生成(RAG)技术的无限可能:Vector+KG RAG、Self-RAG、多向量检索器多模态RAG集成 由于 RAG 的整体思路是首先将文本切分成不同的组块,然后存储到向量数据库中。 详细过程可参考我对 Self-RAG 的总结 [6]。 如图 4 所示,右侧就是 Self-RAG 的工作流程。首先,根据 query判断是否需要检索。 2.3 多向量检索器多模态 RAG 本小节涉及三种工作模式 [7],具体为: 半结构化 RAG(文本 + 表格) 多模态 RAG(文本 + 表格 + 图片) 私有化多模态 RAG(文本 + 表格 + 图片 如图 1 左侧例子,检索上下文有可能引入有冲突的观点。 而图 1 右侧的 Self-RAG 可有效解决 RAG 中存在的无差别检索上下文的问题。 3.2.1 自适应检索 Self-RAG 预测 retrieve token 来动态决定是否需要检索上下文。

    5.1K45编辑于 2024-01-10
  • 来自专栏#大模型热点基础知识

    RAG系统如何支持多模态检索?图文检索如何实现?

    RAG系统如何支持多模态检索?图文检索如何实现?by@Laizhuocheng一、简介想象这样一个场景:你打开电商App,看到一件很眼熟的衣服,但不知道叫什么名字。 这就是多模态检索的魅力——让图像和文本能够真正"对话"。传统文本RAG有一个致命局限:只能处理文字。如果你的知识库里有成千上万张产品图片、医学影像、设计图纸,传统的RAG系统对它们束手无策。 但这样做有两个问题:丢失了图像本身的视觉信息:一张商品图包含的颜色、款式、质感等视觉特征,很难用文字完全描述清楚无法支持图查文:用户上传一张图片,系统无法理解图片内容去做检索多模态RAG的诞生就是为了解决这个核心问题 未来展望:多模态大模型与RAG深度结合:现在的CLIP主要做语义对齐,但推理能力有限。像GPT-4V这种视觉语言模型出现后,我们可以把检索和生成更紧密地结合,从单纯的检索走向理解+生成的完整链路。 实时多模态学习:未来可能会出现能够实时学习新模态的RAG系统。用户上传一张新类型的图片,系统能够在线学习这种新模态的特征,下次遇到类似图片时能够准确检索

    14410编辑于 2026-03-25
  • 来自专栏人工智能

    检索增强生成(RAG)技术详解

    检索增强生成(Retrieval-Augmented Generation,RAG)通过将外部知识检索与生成相结合,有效解决了这些问题。 RAG技术概述 什么是RAG RAG是一种结合信息检索和文本生成的AI架构,工作流程如下: 用户查询 → 检索相关文档 → 生成增强回答 → 返回结果 ↓ RAG | 一次检索直接生成 | 简单快速 | 上下文可能不足 | 简单问答 | | Recursive RAG | 迭代检索细化 | 提高检索质量 | 计算开销大 | 复杂查询 | **: 查询重写、重排序、混合检索 - **GraphRAG**: 结合知识图谱的RAG - **Self-RAG**: 自我反思的RAG系统 - **RAGAS**: RAG系统评估框架 """ if RAG + 微调 最佳效果 总结 RAG通过将检索与生成结合,为大语言模型提供了访问外部知识的能力,有效解决了知识截止和幻觉问题。

    87010编辑于 2026-01-21
  • 来自专栏AIGC

    【AIGC】检索增强技术深度剖析(RAG

    在这种情况下,检索增强生成 (RAG) 开辟了新的视角。RAG 允许将 AI 模型与公司的特定内部数据集成,不仅可以进行处理,还可以对这些知识进行智能解释和利用。在本文中,我们将探讨如何实现这一点。 一、检索增强定义RAG 是一种技术,它允许通过从大型文档数据库中实时检索信息来扩展预训练语言模型的知识。 二、深度使用检索增强想更深入地了解这个简单的例子吗? 这是它的样子:在这种情况下,检索增强生成 (RAG) 就派上用场了。我们可以通过向提示添加上下文信息来简单地扩展机器学习模型的知识。从理论上讲,它如下所示:从理论上讲,它会起作用。 小节本节我们学习了检索增强,我们知道了什么是检索增强,我们为什么需要检索增强以及检索增强构建思路,后面章节我们会专门整理出来检索增强服务的构建过程,大家敬请期待吧。

    1K10编辑于 2024-05-11
  • 来自专栏人工智能

    LLM的检索增强--SELF-RAG

    通常人们会使用RAG来解决大模型的幻觉问题,检索增强生成(RAG)是一种通过检索相关知识来增强 LLMs 输入的方法,可以减少这类问题。 然而,无论检索是否必要或检索到的段落是否相关,RAG 方法都会不加选择地检索和整合固定数量的检索段落,这可能会降低 LLMs 的多功能性或导致生成无用的响应。 SELF-RAG框架包括以下几个关键步骤:按需检索(On-demand Retrieval):SELF-RAG训练一个语言模型(LM),使其能够根据任务输入自适应地决定是否需要检索额外的信息。 并行处理检索到的文档:SELF-RAG能够同时处理多个检索到的文档,并评估它们的相关性。模型会评估每个检索到的段落与任务输入的相关性,并基于这些段落生成任务输出。 SELF-RAG的优势与传统的语言模型相比,SELF-RAG框架有以下几个显著优势:**提高事实准确性**:通过检索和自我反思,SELF-RAG能够减少生成响应中的事实错误,提供更准确的信息。

    49910编辑于 2024-11-25
  • 来自专栏DeepHub IMBA

    使用LOTR合并检索提高RAG性能

    RAG结合了两个关键元素:检索和生成。它首先使用语义搜索等高级技术来浏览大量数据,包括文本、图像、音频和视频。RAG的本质在于它能够检索相关信息,然后作为下一阶段的基础。 与传统的生成模型相比,这个过程确保RAG系统可以提供更细致和准确的输出。 “Lost in the Middle” 在RAG中“LIM”问题相当具有挑战性。 通过使用上面这些技术,可以确保数据的所有部分(包括中间部分)都得到了适当的检索并用于生成响应。这些步骤有助于改进RAG系统的性能,使它们更有效地处理和解释大量不同的信息源。 并且可以对不同检索器的结果进行排序,这有助于确保首先返回最相关的文档。 我们将以医疗/医疗保健相关的RAG为例构建回答一些保健被问题的聊天机器人。 通过这种方法可以使RAG获得更好的性能 总结 为了解决LIM问题并提高检索性能,对RAG系统进行增强是非常重要的。

    65810编辑于 2024-01-04
  • 大模型RAG向量检索原理深度解析

    常规的知识库检索通常使用的是关键字与词条匹配,随着AGI的爆发,越来越多的知识库检索开始使用向量检索技术,特别是在RAG领域,增强型的生成式问答检索正在大面积应用和推广。 从上面对比分析来看,传统检索方法更适合准确匹配的场景,向量检索适合复杂语义匹配检索需求,可以理解更复杂的语义关系,提供更为准确和全面的检索结果。 RAG应用。 具体应用如:车辆检索和商品图片检索等; 自然语言处理:基于语义的文本检索和推荐,通过文本检索近似文本; 声纹匹配,音频检索; 文件去重:通过文件指纹去除重复文件; 新药搜索; 然而针对不同数据类型和匹配逻辑 ,不同的检索数据和检索场景应用的检索算法也不一样,以下是几种基础的检索算法和应用场景简单介绍: 局部敏感哈希(LSH) LSH(Locality Sensitive Hashing),中文叫做“局部敏感哈希

    3.1K00编辑于 2024-04-19
  • 来自专栏云云众生s

    评估检索增强生成(RAG):TruLens + Milvus

    越来越多地,向量搜索已成为生成式 AI 在问答应用中的关键企业用例,即所谓的“检索增强生成(retrieval augmented generation)”或RAG。 构建 RAG 在构建高效的 RAG 式 LLM 应用程序时,有许多配置选择可供优化,这些选择可以显着影响检索质量。 TruLens 用于语言模型应用跟踪和评估 TruLens是一个开源库,用于评估和跟踪语言模型应用(如RAG)的性能。通过TruLens,我们还可以利用语言模型本身来评估输出、检索质量等。 RAG 在很大程度上通过为语言模型提供检索上下文来确保准确信息,但无法百分百保证。因此评估对验证应用中不存在幻想至关重要。TruLens 提供了三项测试:上下文相关度、准确性和答案相关度。 上下文相关度 任何 RAG 应用第一步是检索;为验证检索质量,我们要确保每个上下文块与输入查询相关。这非常关键,因为语言模型将使用该上下文生成答案,所以上下文中的任何不相关信息都可能被编织成幻想。

    89010编辑于 2024-03-28
  • 来自专栏DeepHub IMBA

    Agentic RAG:用LangGraph打造会自动修正检索错误的 RAG 系统

    标准 RAG 流水线有个根本性的毛病:检索到的文档一旦与用户意图对不上号,模型照样能面不改色地输出一堆看似合理的胡话,既没有反馈机制也谈不上什么纠错能力。 而Agentic RAG 的思路截然不同,它不急着从检索结果里硬挤答案,而是先判断一下拿回来的东西到底有没有用,如果没用则会重写查询再来一轮。 检索器拉回来的可能是模型架构相关的内容虽然沾边但答非所问,LLM 本身没法意识到上下文是错的,照样能生成一段貌似专业实则离题万里的回答。 传统 RAG 对这种失败模式完全没有办法。 Agentic RAG 的解法是在流程中插入检查点:智能体先判断要不要检索检索完了有评分环节确认相关性;不相关就重写查询再试;如此循环直到拿到合格的上下文,或者把重试次数耗尽为止。 改检索模块。想把 OpenAI 换成 Anthropic?改配置层。其他部分不受影响。 总结 标准 RAG检索当黑盒,查询丢进去、文档出来,至于相不相关全凭运气。

    61710编辑于 2026-01-12
  • RAG检索增强生成的评估·综述

    相关工作的文章和代码汇总在:Awesome RAG Evaluation 摘要 RAG(Retrieval-Augmented Generation,检索增强生成)由于其复杂的结构性和对检索知识库的依赖 引言 RAG通过整合检索到的信息提升了生成大语言模型(Large Language Model,LLM)的能力,并缓解了大语言模型面临“幻觉”和输出事实错误的回答,从而提升了内容的可靠性和丰富性。 其中RAG主要由检索和生成两阶段组成。检索涉及两个部分,建立文档索引和执行文档检索,通常还会结合精拍/重排来进一步微调检索到的文档排序。 Auepora (A Unified Evaluation Process of RAG) 为了应对这些挑战,系统性的比较RAG系统的检索和生成质量,本文提出A Unified Evaluation Process ,后者确保检索到的文档在文档候选集中的排名合理。

    1.9K51编辑于 2024-07-19
  • 来自专栏架构进阶

    大模型RAG:基于PgSql的向量检索

    RAG与向量检索1.1 RAG概念 检索增强生成(Retrieval-augmented Generation),简称RAGRAG通常包括两个阶段:1、检索上下文相关信息;2、使用检索到的知识指导生成过程。简单来说,就像开卷考试,我们可以携带参考材料用来查找相关信息来回答问题。 1.3 RAG应用框架 RAG应用框架如下图所示,包含文本向量化、检索向量数据库、获取上下文(相关知识/文档)、prompt构造、调用大模型执行文本生成等主要环节。 二 向量数据库 由于介绍RAG的文章已经很多,本篇主要打算介绍向量数据库部分,所以不再对RAG进行赘述。 四 小结 本篇介绍了RAG的一些基础知识,以及向量库在其中的作用及选型。并基于PgSQL给出了一个向量库的使用示例。接下来的文章中,我们将深入探索如何实现可用的RAG应用。欢迎留言一起探讨。

    1.1K00编辑于 2025-02-28
  • 来自专栏DeepHub IMBA

    RAG中的3个高级检索技巧

    RAG系统检索的文档可能并不总是与用户的查询保持一致,这是一个常见的现象。 本文将探讨三种有效的技术来增强基于rag的应用程序中的文档检索,通过结合这些技术,可以检索与用户查询密切匹配的更相关的文档,从而生成更好的答案。 查询扩展 查询扩展指的是一组重新表述原始查询的技术。 给定一个查询,用所有检索到的文档对其进行编码。然后按降序排序。得分高的认为是最相关的文件。 一盘情况下适配器会插入到预训练模型层之间的小型前馈神经网络中,所以训练适配器的目标是更改嵌入查询,以便为特定任务生成更好的检索结果。 嵌入适配器是一个可以在嵌入阶段之后和检索之前插入的阶段。 我们需要做的就是将原始的嵌入输出与适配器矩阵相乘,然后再将其输入到检索系统。

    1.2K10编辑于 2024-01-23
  • 来自专栏muller的测试分享

    人工智能|RAG 检索增强生成

    RAG(Retrieval-Augmented Generation),通过将检索模型和生成模型(LLM)结合在一起,即可提高了生成内容的相关性和质量。 RAG 的优点外部知识的利用。 信息检索(Information Retrieval):RAG 可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。 知识图谱填充(Knowledge Graph Population):RAG 可以用于填充知识图谱中的实体关系,通过检索文档来识别和添加新的知识点。 RAG 检索增强的原理从上图可能很多同学非常好奇,大模型是如何与“外挂”数据库进行交互的。不是说大模型不能联网吗?其实大模型和数据库的交互,也是通过提示词完成的。 相关资料RAG 官方文档说明总结理解什么是 RAG 检索增强。理解 RAG 检索增强应用场景。了解 RAG 检索增强有哪些相关的使用方法。

    66210编辑于 2024-07-24
  • LLM 系列(十):RAG 番外篇-向量检索

    引言 在之前的系列文章中,我介绍了 RAG 和 Embedding,本篇文章将侧重在梳理整个向量检索技术体系。 无论是刚接触 RAG 的开发者,还是寻求深度优化的资深工程师,希望在阅读完本篇之后能够对向量检索整个技术领域有个完整的理解。 无内置机制,通常需要外部归一化 内置归一化,通过参数 b 调节 核心参数 无 k1 (饱和度), b (长度归一化) 计算成本 较低 略高 典型用例 基础的关键词权重计算、文本分析入门 现代搜索引擎、RAGRAG 系统而言,外在评估最有实际意义。 表5:检索任务核心评估指标 指标 定义 解读 适用场景 Recall@k 在返回的前k个结果中,包含了多少比例的“所有”相关文档。 负反馈 传统的 RAG 系统是静态的,通过引入用户反馈循环,特别是负反馈,我们可以将 RAG 系统从一个静态的信息处理器转变为一个能够持续学习和自我改进的动态系统。

    98011编辑于 2025-09-02
  • 来自专栏AIGC

    RAG】六步学习检索增强(RAG),打造你的私域助理

    到目前为止,大多数技术人员都听说过 RAG - Retrieval Augmented Generation。简单来说,RAG 只是一种将文档或某些知识源链接到 AI 模型的方法。 即使您对成为 AI 专家不感兴趣,了解 RAG 的所有部分的工作原理也肯定会为您提供良好的服务,因为许多公司将整合这些工作流程。 第四步:RAG with text query(通过检索增强查询文本)我们需要在带有嵌入的库中获取某种形式的知识,并将这些碎片与模型组合在一起。 了解如何将正确的 RAG 策略与深思熟虑的检索和查询策略结合使用正确的模型来完成工作。第五步:RAG with Semantic Query(通过检索增强进行语义查询)现在,您可以开始语义搜索了。 第六步:RAG with Multi-Step, Hybrid Query(通过检索增强进行多步混合查询)并学习如何在笔记本电脑上使用 Hugging Face 中的量化 DRAGON-YI-6b-GGUF

    52410编辑于 2024-05-01
  • 来自专栏AI技术探索和应用

    向量检索RAG)之向量数据库研究

    研究内容主要包括:是否开源,支持的功能有哪些(是否支持暴力检索,支持哪些索引),是否有可视化界面,是否支持标量过滤。 功能:将文档生成向量,存储向量及其元数据,检索向量。即将推出:多种数据类型,包括图像、音频、视频等。 功能:将文档生成向量,存储向量及其元数据,检索向量。即将推出:多种数据类型,包括图像、音频、视频等。 然后将查询图像转换为向量,并检索出相似的图像。 产品推荐:基于代表用户的向量,为电子商务生成产品推荐。 如果设置为 true,搜索可能会运行很长时间,因为它会执行完整扫描以检索准确的结果。(暴力检索) ), limit=3 ) Qdrant 目前仅使用 HNSW 作为矢量索引。

    3.1K42编辑于 2025-03-05
  • 来自专栏coder

    RAG 使用Rerank和两阶段检索来提升你的检索质量

    RAG 使用Rerank和两阶段检索来提升你的检索质量 检索增强生成 (RAG)是一个含义丰富的术语。 它向世界许诺,但在开发出 RAG 管道后,我们中的许多人仍然在疑惑,为什么它的效果不如我们预期的那样好。 与大多数工具一样,RAG 易于使用但难以掌握。 事实是,RAG 不仅仅是将文档放入矢量数据库并在上面添加 LLM。 这可以奏效,但并不总是如此。 本文中将介绍通常最简单、最快速地实施次优 RAG 管道的解决方案 — 我们将学习重新排序器。 使用 RAG,我们可以对许多文本文档执行语义搜索— 这些文档可能有数万个,甚至数百亿个。 这自然会显著提高 RAG 的性能。这意味着我们可以最大化相关信息,同时最大限度地减少 LLM 中的噪音输入。 参考:RAG 使用Rerank和两阶段检索来提升你的检索质量

    1.3K10编辑于 2024-09-06
领券