首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI应用开发实践

    检索增强生成

    一 什么是RAG RAG,英文全称是 Retrieval-Augmented Generation,中文我们一般叫做检索增强生成,这是一种结合信息检索技术与生成式大语言模型(LLM)的框架。 他可能会瞎编:“《星际穿越2》上周刚上映,评分 9.8!”(其实根本没这部电影) 这时候你会说:“等等,你先去豆瓣查一下再回答!” 这个“先查资料再回答”的过程,就是 RAG(检索增强生成)的核心! 数据安全与隐私:企业敏感数据无需上传至公有模型,仅通过本地知识库增强回答(如客服系统引用内部退货政策)。 降低微调成本:无需频繁重新训练模型,仅更新外部知识库即可适应新需求。 三 如何实现 RAG 我们来看下这张经典的 RAG 流程图: 这张图清晰展示了检索增强生成(RAG)的核心流程,分为数据准备和问答生成两大阶段。 我们分别来看。 嵌入模型(如 Word2Vec、BERT)通过大量数据自动学习,无需人工标记。例如,它发现“苹果”和“香蕉”常出现在相似语境中(比如水果沙拉),于是将它们分配到相近的向量位置。

    28610编辑于 2026-03-26
  • 来自专栏xiaosen

    检索增强生成(RAG)

    检索增强生成(Retrieval-Augmented Generation, RAG)是一种结合了检索机制和生成模型的先进技术,旨在提高自然语言处理系统的准确性和上下文相关性。 本文将详细介绍如何从零开始构建一个RAG系统,包括数据处理、检索、生成以及部署等各个环节。 检索管道:根据用户的查询从已索引的数据库中检索最相关的信息,使用检索策略和重排序方法来优化结果。 生成管道:将检索到的数据与用户的查询结合,生成准确、相关且连贯的响应。 构建RAG系统的步骤  1. 文本分块:将长文本分割成较小的块,以便于后续的嵌入和检索2. 向量嵌入生成 向量嵌入是RAG系统的基础,它将文本数据转换为数值表示,使得计算机能够理解其语义。 检索过程 在用户提交查询后,RAG系统会执行以下步骤: 查询预处理:对用户输入进行清洗和标准化,例如去除停用词、词形还原等,以提高检索效果。

    1.3K10编辑于 2025-01-03
  • 来自专栏大数据杂货铺

    使用检索增强生成 (RAG) 增强 SQL 代理

    在本文中,我们将探讨如何通过合并高级分析功能来增强 SQL 代理的功能。想象一下,代理不仅能够提供基本的统计数字,例如客户支付的平均金额,而且还能够提供更高级和更有趣的见解。 CallDuration','DataCounter','SMS') DistanceMeasure('cosine') TopK(2) ) AS dt ORDER BY 3,1,2,4; 以下是来自 DB 的结果: Target_ID Reference_ID DistanceType Distance 检索增强生成 (RAG) 为了便于您的代理了解如何使用这些功能,我建议采用一种称为检索增强生成 (RAG) 的技术。 此方法有助于根据查询查找相关说明。 此外,我们还讨论了创建一个 RAG 来检索相关的语法指令信息。现在,让我们探讨如何无缝集成这两个组件。 RAG 作为工具 在这篇博客中,我详细介绍了 如何利用SQL 代理与数据库交互等工具。

    1.1K10编辑于 2024-04-02
  • 来自专栏自然语言处理

    检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?

    检索增强思维 (RAT) 是一种创新性的方法,它结合了两种关键技术:检索增强生成 (RAG) 和思维链 (CoT) 提示。大型语言模型 (LLM) 因其模仿人类写作和流畅回答问题的能力而变得流行。 RAT:知识与思维链的结合 检索增强思维 (RAT) 是一种简单但有效的提示方法,它将思路链 (CoT) 提示与检索增强生成 (RAG) 相结合,以处理长窗口推理和生成问题。 检索增强思维 (RAT) 的管道。给定一个任务提示(在图中表示为 I),RAT 从 LLM 在零样本(“让我们一步一步思考”)中产生的初始分步思维(1、2、· · ·、)开始。 知识库:这象征着 LLM 可以通过检索增强生成 (RAG) 访问的外部知识库。 增强修订:这指的是 LLM 如何根据检索到的信息和先前的解释来完善其思维链 (Ti)。 段落2:爱因斯坦的科学成就。 段落3:爱因斯坦的晚年生活。 逐段修正: 对每个段落生成检索查询,例如: 查询1:“爱因斯坦的早期生活”。 查询2:“爱因斯坦的科学成就”。

    79910编辑于 2025-01-05
  • 来自专栏机器学习

    介绍 RAG(检索增强生成)

    它结合了检索系统和生成模型的优势,通过从大型数据库中检索相关信息并使用生成模型对其进行处理,生成更准确和上下文相关的答案或内容。 RAG 的基本原理RAG 模型的工作流程可以分为以下几个步骤:检索:从一个大型知识库或文档集合中检索与输入查询相关的文档或段落。 文档摘要:从多个文档中检索相关段落,生成一个综合性的摘要。信息检索增强:在需要综合多个信息源的任务中,RAG 可以提供更全面的回答或内容。 print(response)总结RAG(检索增强生成)通过将检索和生成相结合,能够在需要丰富背景信息的任务中表现出色。 它不仅在开放域问答和对话系统中具有很大的应用潜力,还可以用于文档摘要和信息检索增强等任务。通过适当的数据准备、检索模型训练、生成模型训练和模型融合,可以构建出一个强大的 RAG 系统。

    2.4K00编辑于 2024-07-29
  • 来自专栏AIGC

    【AIGC】检索增强技术深度剖析(RAG)

    在这种情况下,检索增强生成 (RAG) 开辟了新的视角。RAG 允许将 AI 模型与公司的特定内部数据集成,不仅可以进行处理,还可以对这些知识进行智能解释和利用。在本文中,我们将探讨如何实现这一点。 一、检索增强定义RAG 是一种技术,它允许通过从大型文档数据库中实时检索信息来扩展预训练语言模型的知识。 二、深度使用检索增强想更深入地了解这个简单的例子吗? 这是它的样子:在这种情况下,检索增强生成 (RAG) 就派上用场了。我们可以通过向提示添加上下文信息来简单地扩展机器学习模型的知识。从理论上讲,它如下所示:从理论上讲,它会起作用。 小节本节我们学习了检索增强,我们知道了什么是检索增强,我们为什么需要检索增强以及检索增强构建思路,后面章节我们会专门整理出来检索增强服务的构建过程,大家敬请期待吧。

    1.1K10编辑于 2024-05-11
  • 来自专栏人工智能

    检索增强生成(RAG)技术详解

    检索增强生成(Retrieval-Augmented Generation,RAG)通过将外部知识检索与生成相结合,有效解决了这些问题。 RAG技术概述 什么是RAG RAG是一种结合信息检索和文本生成的AI架构,工作流程如下: 用户查询 → 检索相关文档 → 生成增强回答 → 返回结果 ↓ # RAG检索增强生成实践代码 import torch import numpy as np from typing import List, Dict, Optional, Tuple import * 2) # 关键词检索 keyword_doc_ids = self.keyword_search(question, top_k=top_k * 2) :检索更多文档 actual_top_k = top_k * 2 else: actual_top_k = top_k

    1.1K10编辑于 2026-01-21
  • 来自专栏人工智能

    LLM的检索增强--SELF-RAG

    通常人们会使用RAG来解决大模型的幻觉问题,检索增强生成(RAG)是一种通过检索相关知识来增强 LLMs 输入的方法,可以减少这类问题。 然而,无论检索是否必要或检索到的段落是否相关,RAG 方法都会不加选择地检索和整合固定数量的检索段落,这可能会降低 LLMs 的多功能性或导致生成无用的响应。 LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION》的论文提出了一个创新解决方案——SELF-RAG框架,旨在通过自我反思和检索增强来提高语言模型的生成质量和事实准确性 如果模型确定需要检索,它会输出一个检索标记(retrieval token),触发检索模型(retriever model)按需检索相关文档。 **增强多功能性**:SELF-RAG不会损害语言模型的多功能性,它能够根据任务需求灵活地调整检索和生成策略。

    52910编辑于 2024-11-25
  • 来自专栏云云众生s

    提高检索增强的相关性

    构建采用检索增强生成(RAG)的生成式AI应用程序可能面临各种挑战。让我们来看看依靠向量数据库检索相关上下文,然后将其融入提示送入大语言模型(LLM),以提供更相关结果的RAG实现的故障排除。 他们经常发现使用Word2Vec、sBERT和RoBERTa等嵌入模型的样本代码,而这些模型对于检索用例来说是糟糕的选择。 Ada v2检索用例中表现突出,它是为处理不同类型的内容(包括文本和代码)而构建的。它支持长达8192个标记的最大输入序列长度,也允许您为比替代模型更长的文本创建嵌入。这既是优势也是劣势。 jina嵌入式v2(Jina v2) Jina v2是一个新的开源嵌入模型,它为您提供与Ada v2相同的8000输入序列支持,实际上在检索用例中得分略高。 它还产生一个具有Ada v2一半维数的嵌入向量。因此,不仅在基准用例的检索性能方面略胜一筹,而且还以较低的存储和计算需求从向量数据库角度获得了这些改进的结果。

    47710编辑于 2024-03-28
  • 【RAG】检索增强生成的评估·综述

    相关工作的文章和代码汇总在:Awesome RAG Evaluation 摘要 RAG(Retrieval-Augmented Generation,检索增强生成)由于其复杂的结构性和对检索知识库的依赖 其中RAG主要由检索和生成两阶段组成。检索涉及两个部分,建立文档索引和执行文档检索,通常还会结合精拍/重排来进一步微调检索到的文档排序。 (2)全面分析了现有的RAG基准测试,总结了它们的优势和局限性,并为RAG系统评估的未来发展提出了建议。 评估目标(What to Evaluate?) ,后者确保检索到的文档在文档候选集中的排名合理。 在表2中的评估框架主要采取两种策略来构建评测数据集,一种利用现有数据集,剩下的则会为特定评估目标生成新的数据集。

    2K51编辑于 2024-07-19
  • 来自专栏秋枫学习笔记

    RAT:检索增强的Transformer用于CTR估计

    目前的方法主要集中于对单个样本内的特征交互进行建模,而忽略了潜在的跨样本间的关系,这些关系可以作为增强预测的参考上下文信息。 为本文提出了一种检索增强的Transformer(RAT),获取样本内部和样本之间的细粒度特征交互。 通过检索相似的样本,为每个目标样本构建增强输入。 2.方法 alt text 2.1 检索相似样本作为上下文 样本 x_i 有F个field的特征 x_i=[x^1_i,... 2.2 构建增强输入 通过emb层将离散的特征转化为D维的emb,并且对于检索得到的样本,标签也作为特征进行编码得到emb。 2.3 样本内和样本间的特征交互 作者发现直接把检索的样本和目标样本的emb拼接(长度变成(K+1)*(F+1)),采用自注意力进行特征交互是低效的,复杂度 O((K+1)^2\cdot (F+1)^2

    46510编辑于 2024-04-11
  • 来自专栏云云众生s

    评估检索增强生成(RAG):TruLens + Milvus

    越来越多地,向量搜索已成为生成式 AI 在问答应用中的关键企业用例,即所谓的“检索增强生成(retrieval augmented generation)”或RAG。 检索 检索到的上下文数量(前 k 个) 分块大小 当进行检索时,前 k 个是经常讨论的一个参数,它控制检索到的上下文分块数量。 vector_store = MilvusVectorStore(index_params={ "index_type": index_param, "metric_type": "L2" }, 这里是更新后的表格: 索引类型 嵌入模型 相似度前 k 个 块大小 IVF Flat Multilingual MiniLM L12 v2 1 500 识别出哪些失败模式? 相似度前 k 个 增加 top k 略微提高最大检索质量(通过上下文相关度测量)。检索更多块,检索器有更多机会获取高质量上下文。

    91310编辑于 2024-03-28
  • SpringAI 全栈开发 + RAG 检索增强实战

    1.2 RAG检索增强生成底层逻辑 RAG(Retrieval Augmented Generation,检索增强生成)是解决大模型幻觉、知识滞后、私有数据安全接入三大核心痛点的最优方案,其核心逻辑是在大模型生成回答前 RAG全流程分为两大核心阶段,对应的流程图如下: 这里必须明确区分RAG与大模型微调(Fine-tuning)的核心差异,避免开发者选型错误: 特性 RAG检索增强生成 大模型微调 核心能力 实时接入私有数据 /groupId> <artifactId>fastjson2</artifactId> <version>${fastjson2.version}</version .title("SpringAI RAG实战项目接口文档") .description("企业级AI应用开发与RAG检索增强系统接口文档 如果参考上下文中包含用户问题的答案,必须基于上下文内容进行回答,回答要准确、完整、逻辑清晰 2.

    15510编辑于 2026-04-14
  • 检索增强生成(Retrieval-Augmented Generation)

    定义 RAG,全称Retrieval-Augmented Generation,中文翻译为“检索增强生成”。 原理 RAG的原理主要包括两个阶段: 检索阶段:模型首先从外部知识库中检索与输入文本相关的信息。这个知识库可以是对大规模文本数据集进行索引处理后形成的数据库。 检索模型训练/选择:训练一个高效的检索模型,如使用向量空间模型、TF-IDF或基于BERT的语义检索模型。 联合训练(可选):在某些情况下,为了更好地融合检索和生成两个阶段,可以进行联合训练。 检索和生成两个阶段可能存在信息损失。 对计算资源有一定要求。 应用场景 RAG在多个领域都有广泛的应用,包括: 问答系统:通过检索相关知识库,为用户提供准确、详细的答案。 知识图谱构建:通过检索和生成技术,构建丰富、准确的知识图谱。

    1.2K10编辑于 2025-04-05
  • 来自专栏muller的测试分享

    人工智能|RAG 检索增强生成

    它能够通过检索大规模文档集合来提供准确的答案,无需针对每个问题进行特定训练。 信息检索(Information Retrieval):RAG 可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。 RAG 检索增强的原理从上图可能很多同学非常好奇,大模型是如何与“外挂”数据库进行交互的。不是说大模型不能联网吗?其实大模型和数据库的交互,也是通过提示词完成的。 让其变的易检索。这个预处理的过程,就使用了向量数据库以及embedding。 相关资料RAG 官方文档说明总结理解什么是 RAG 检索增强。理解 RAG 检索增强应用场景。了解 RAG 检索增强有哪些相关的使用方法。

    67110编辑于 2024-07-24
  • 选择性检索增强代码补全技术解析

    通过选择性检索增强仓库级代码补全大型代码语言模型在补全任意程序函数代码方面表现出色,但面对大型软件开发项目时,正确的代码补全可能依赖于代码仓库中其他地方定义的API调用或函数。 检索增强生成通过从仓库中获取相关上下文来解决此问题,从而丰富模型的理解并改善其输出。但执行检索需要时间并会减慢生成速度:它总是最佳选择吗? 更有趣的是,Repoformer能够作为一个即插即用的策略模型,减少作为检索增强生成中生成模型的各种强大代码大型语言模型的推理延迟。 凭借超过85%的检索决策准确率,Repoformer确保仅在检索增加价值时才使用上下文检索。 进一步的分析表明,所提出的策略提高了Repoformer对检索的鲁棒性,减少了有害检索,并增加了通过检索改进的实例数量。FINISHED

    9710编辑于 2026-02-06
  • 来自专栏大猪的笔记

    信息检索:布尔检索-建立倒排索引(2)

    假定我们有3个文档: doc1 = ["1", "hello", "word", "i", "love", "dazhu"] doc2 = ["2", "hi", "i", "can", "speak" 合并单词表并排序(代码 give_index) 同理,处理doc2和doc3,合并所有结果并排序,可得一个如下的列表: ['can', '2'] ['can', '3'] ['dazhu', '1'] 最终得到结果如下: ['can', ['2', '3']] ['dazhu', ['1', '3']] ['hello', ['1', '3']] ['hi', ['2', '3']] ['i', [' 1', '2', '3']] ...... 取出 i 的倒排记录表:['1', '2', '3'] 2. 取出 can 的倒排记录表:['2', '3'] 3. 对这两个集合求交集 4.

    1.6K20发布于 2019-11-21
  • 从 0 到 1 构建 RAG 检索增强系统

    检索增强生成(RAG,Retrieval-AugmentedGeneration)成为连接大模型与外部知识的重要方式。 本文从0到1系统讲解RAG的核心原理、系统结构及落地步骤,帮助读者构建一个可用、可扩展的RAG检索增强系统,为智能体和企业级AI应用提供可靠基础。 目录一、什么是RAG二、为什么需要RAG三、RAG系统核心架构四、从0到1搭建RAG系统五、一个典型RAG流程示例六、常见问题与优化经验七、总结一、什么是RAGRAG(检索增强生成)是一种将信息检索与文本生成结合的技术框架 RAG的基本流程通常包括三步:1️⃣从知识库中检索相关内容2️⃣将检索结果作为上下文输入模型3️⃣大模型基于上下文生成回答这使得模型回答更可信、更可控。 2.向量化模块将文本转换为向量表示:使用Embedding模型保留语义信息支持语义检索这一步决定检索质量上限。

    61810编辑于 2026-02-02
  • 检索增强生成(RAG)的版权新关注

    二、“检索增强生成”为何会崛起?“检索增强生成”最早由Facebook AI Research团队在2020年发表的《用于知识密集型自然语言处理任务的检索增强生成》一文中提出。 检索增强生成的整个过程可分为“数据检索收集”和“内容整合展示”两个阶段。 62025年2月13日,《大西洋月刊》《卫报》等十四家全球头部新闻出版商于纽约南区联邦法院起诉加拿大AI公司Cohere,指控其依赖“检索增强生成”技术,通过“网络搜索连接器”(Web Search Connector 六、“检索增强生成”涉及作品利用问题在“内容整合展示”阶段,需要评估检索增强生成对作品的利用,是否落入版权法规制的“直接侵权”和“间接侵权”的范畴。 参见《数字单一市场版权指令》第15条第1款:成员国应当规定,在一个成员国成立的新闻出版物的出版者,对于信息社会服务提供者在线使用其新闻出版物,享有2001/29/EC指令第2条和第3条第2款规定的权利。

    47800编辑于 2025-08-14
  • 来自专栏机器学习与推荐算法

    用户检索增强的大模型跨域推荐

    针对这一问题,该文提出了URLLM框架,通过同时探索基于大模型的用户检索方法和领域基础来提高跨域序列推荐的性能。 然后,采用用户检索生成模型将结构信息无缝地集成到大模型中,充分利用大模型的推理能力。此外,提出了一种特定于域的策略和一个精化模块来防止域外生成。

    48610编辑于 2024-07-05
领券