首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏周末程序猿

    RAG实战|8RAG架构浅析

    因为项目的需要,之前研究了一段时间的RAG,于是本文总结 8RAG 架构,对每种架构进行简要介绍,并用 langchain 实现其参考代码。 1. Corrective RAG 简介: Corrective RAG 在传统 RAG 基础上引入了文档质量评估和自我修正机制。 Agentic RAG 简介: Agentic RAG(智能体RAG)将 AI Agent 的规划和推理能力与 RAG 相结合。 ", "行业趋势..."]) answer = arag.query("分析公司未来的发展前景") # 会被识别为OPEN_ENDED print(answer) 8. SFR RAG 简介: SFR RAG(Salesforce Research RAG)是工业级高质量 RAG 的最佳实践。

    1.1K10编辑于 2025-12-30
  • 来自专栏自然语言处理

    5个开源RAG框架对比

    还在为RAG应用开发头疼吗?别急,今天给大家推荐五款完全开源免费的RAG框架,覆盖自动优化、多模态处理、本地部署、生产环境支持等多种场景,助你轻松搞定RAG开发! 1. AutoRAG:自动优化,省心省力 核心优势:自动寻找最优RAG流程,告别手动调参! ✨ 特色功能:支持用你的评估数据测试不同RAG模块,找到最适合的方案。 https://github.com/SciPhi-AI/R2R 3. n8n AI 工具包:本地部署,隐私无忧 核心优势:完全本地化部署,数据安全有保障! https://github.com/n8n-io/self-hosted-ai-starter-kit 4. Cognita:生产环境,稳定可靠 核心优势:专为生产环境设计,企业级应用的首选! 适用场景:适合企业级应用部署,需要稳定可靠的RAG框架。 https://github.com/truefoundry/cognita 5.

    3.9K11编辑于 2024-12-31
  • 来自专栏AgenticAI

    RAG新SOTA!港中深发布Graph-based RAG统一框架,深度评估现有Graph-based RAG框架

    然而,目前各种基于图的 RAG 方法缺乏统一框架,难以在相同实验环境下系统比较和深入分析。 研究贡献 1、创新统一框架:首次提出涵盖所有现有 Graph-based RAG 方法的统一框架,从高层次明确定义图构建、索引构建、操作符配置及检索生成四个关键步骤。 2、深入方法比较:在统一框架下,系统地评估和对比 12 种主流 Graph-based RAG 算法,详细分析每种方法的优势与局限性。 6、前瞻性研究方向:基于详细的实验结果与分析,提出了多种前瞻性研究机会与实践方案,有望推动 RAG 领域未来研究。 研究与实验方法 本文提出一个全新的统一框架,将基于图的 RAG 方法划分为图构建、索引构建、操作符配置及检索与生成四个核心阶段,以实现对现有方法的系统比较与深入分析。

    42400编辑于 2025-03-18
  • 来自专栏JadePeng的技术博客

    知识图谱增强的KG-RAG框架

    /KG_RAG),该框架利用生物医学知识图谱SPOKE与大型语言模型相结合,有效的提升了LLM在医疗领域的问答效果。 KG-RAG框架介绍 KG-RAG框架,较好的结合了生物医学知识图谱SPOKE和LLM的优势。 研究人员对KG-RAG框架进行了广泛的测试,包括单跳和双跳提示、药物再利用查询、生物医学真假问题和多项选择题。 通过这种方法,KG-RAG框架能够有效地从专业文本中提取和识别疾病实体,并将其与丰富的生物医学知识库相连接,从而生成准确、可靠的生物医学相关信息。 在其他领域如何去应用KG做RAG,一方面可以扩展该框架,另外一方面,也要结合自己的实际场景去定制具体的策略。

    2.5K10编辑于 2024-04-12
  • 来自专栏自然语言处理

    RAG入门教程03】Langchian框架-文档加载

    这个也是在后续开发框架的过程中,我们可以选取langchian的document作为处理对象,但是文件解析需要自己去写和实现。 DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-<em>8</em>" /> <meta name="viewport" content loader.load() data """ [Document(page_content='3 2 0 2\n\nb e F 7\n\n]\n\nG A . h t a m\n\n[\n\n1 v 3 0 <em>8</em>

    97910编辑于 2024-06-10
  • 来自专栏自然语言处理

    RAG入门教程05】Langchian框架-Vector Stores

    向量存储旨在高效处理大量向量,提供根据特定标准添加、查询和检索向量的功能。它可用于支持语义搜索等应用程序,在这些应用程序中,您可以查找与给定查询在语义上相似的文本段落或文档。

    1K10编辑于 2024-06-10
  • 来自专栏DeepHub IMBA

    UniMS-RAG:用于个性化对话的统一多源RAG框架

    RAG领域已经取得了相当大的发展,这篇论文的是如何分解RAG过程,加入多文件检索、记忆和个人信息等定制化的元素。 使用RAG的一个优点是其实现的简单。但是在agenic RAG、多文档搜索和添加会话历史等方面,还需要很多的手动工作。代理RAG是将代理层次结构与RAG实现相结合的地方,这会带来很大的复杂性。 UniMS-RAG会对这些元素进行优先排序。 3、持续改进 论文的方法还包括一种自我细化推理算法,通过结合RAG会带来很大程度的可检查性和可观察性。 UniMS-RAG框架 UniMS-RAG统一了计划、检索和阅读任务的训练过程,并将它们集成到一个综合框架中。 提出的统一多源检索-增强对话系统(UniMS-RAG)使用大型语言模型(llm)同时作为计划者、检索者和读者。 这个框架在推理过程中还引入了自改进,使用一致性和相似性分数来改进响应。

    57610编辑于 2024-02-01
  • 来自专栏DeepHub IMBA

    BookRAG:面向层级文档的树-图融合RAG框架

    第一种是文本优先方法,将所有内容扁平化为纯文本,主要依赖OCR,再用BM25、经典分块RAG或GraphRAG、RAPTOR等图方法完成检索。 大多数RAG管道依赖固定的查询处理流程,简单问题处理起来效率低,复杂问题又应对不了。 所以多数现有的文档级RAG系统要么忽略文档的层级结构,要么缺乏查询感知的检索流程。 BookRAG是一个专为层级结构文档设计的RAG框架。 整个框架由三个关键组件构成。 构建BookIndex BookIndex在一个统一索引中同时容纳结构和语义。 Select_by_Entity 过滤树,将推理范围从134个节点压缩到24个,之后运行 Graph_Reasoning 和 Text_Reasoning 分配重要性分数,最终由 Skyline_Ranker 选出8个高置信度节点生成答案

    21910编辑于 2026-03-31
  • 来自专栏自然语言处理

    RAG入门必备技能】Faiss框架使用与FaissRetriever实现

    提供了高效且可靠的相似性聚类和检索方法,可支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库 官方资源地址https://github.com/facebookresearch/faiss Faiss基础依赖 1)矩阵计算框架 :Faiss与计算资源之间需要一个外部依赖框架,这个框架是一个矩阵计算框架,官方默认配置安装的是OpenBlas,另外也可以用Intel的MKL,相比于OpenBlas使用MKL作为框架进行编译可以提高一定的稳定性 使用方法 Faiss是为稠密向量提供高效相似度搜索的框架(Facebook AI Research),选择索引方式是faiss的核心内容,faiss 三个最常用的索引是:IndexFlatL2, IndexIVFFlat retriever_config) documents=[] with open('/home/test/codes/GoMate/data/zh_refine.json','r',encoding="utf-8" 200]) contexts=faiss_retriever.retrieve("2022年冬奥会开幕式总导演是谁") print(contexts) 参考资料 Faiss应用 - 召回框架

    5K20编辑于 2024-06-06
  • 来自专栏Datawhale专栏

    RAG 作者:RAG 已死,RAG 万岁!

    一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。 底线是:您同时需要长上下文 LLM 和 RAG。 但既然“RAG”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为 RAG。 我们可以就叫它 检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用 RAG 精准定位所需信息要昂贵得多。 警惕错误的二分法 在谷歌搜索“RAG vs”,你会看到一长串建议的查询补全——“长上下文”、“微调”、“MCP”。这种框架设定制造了一种人为的选择,并没有反映这些技术实际上如何协同工作的最佳方式。 RAG、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。

    75510编辑于 2025-04-24
  • 来自专栏全栈开发工程师

    RAG】001-RAG概述

    RAG】001-RAG概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:RAG 基本逻辑 补充2:RAG 知识库基本逻辑 一、RAG 介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、RAG 的概念 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、RAG 的工作原理 RAG 的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用

    79710编辑于 2025-03-25
  • 来自专栏DeepHub IMBA

    FaaF:为RAG系统量身定制的事实召回评估框架

    RAG系统中实际的事实召回评估可能存在以下问题: 在低质量生成的文本中自动验证真实的、独立的陈述和模拟低质量的检索增强生成(RAG)场景并没有得到太多的关注。 RAG系统涉及许多组件,例如知识库、检索、提示公式和语言模型,这些都需要大量的调优。因此效率对实际执行至关重要。 Facts As A Function faaf是一个为RAG系统量身定制的事实召回评估框架,它可以用来创建一个测试数据集,并执行自动的事实召回评估。 评估数据是通过真实事实和人工注释来增强的。 WikiEval的特点是问题和答案对,答案具有可变的事实质量,可以模拟有缺陷的RAG反应。 然后测试RAG的假设反应(在这种情况下,无根据的答案和糟糕的答案)对提取的事实的召回。 依靠提示来验证事实往往会高估陈述的真实性,尤其是在文本缺乏重要信息的情况下。

    39210编辑于 2024-04-15
  • 来自专栏AgenticAI

    深度测评 RAG 应用评估框架:指标最全面的 RAGas

    大家常说 RAG 应用是:一周出 demo,半年用不好。那么怎么评估 RAG 应用是否能够上生产了呢?如果公司人手足够,当然可以人工测试评估准确性,但指标未免单一。 本文介绍一个全自动化的 rag 应用评估框架 ragas。 RAGas(RAG Assessment)[1]RAG 评估的缩写,是一个专门的解决方案用于评估、监控和提升生产环境中大语言模型(LLM)和检索增强生成(RAG)应用的性能,包括用于生产质量监控的定制模型 然后就是使用 ragas 框架的 API 来生成测试集了,首先初始化测试集生成器。 如果你想深入RAG也可以考虑购买这本《大模型RAG实战》,更为系统地学习。

    5.6K12编辑于 2025-03-18
  • 来自专栏AgenticAI

    蚂蚁开源新RAG框架KAG,可达91%准确率

    看这篇就够了》,本文探一探蚂蚁开源的另外一套知识增强生成框架 KAG(Knowledge Augmented Generation),专门用于构建垂直领域知识库的逻辑推理问答框架,论文中提到在电子政务达到了 KAG 简介 KAG 可以有效克服传统 RAG 向量相似度计算的歧义性和 OpenIE 引入的 GraphRAG 的噪声问题,支持逻辑推理、多跳事实问答等。 核心功能 2.1 LLM 友好的语义化知识管理 私域知识库场景,非结构化数据、结构化信息、业务专家经验 往往三者共存,KAG 提出了一种对大型语言模型(LLM)友好的知识表示框架,基于 DIKW(数据 3.2 开发者模式 即使是开发者模型,也仍然需要安装刚才的 Docker Compose,其中启动了一些依赖服务,KAG 框架并不包含前端或者服务端的代码。

    3.4K00编辑于 2025-03-18
  • 来自专栏狗哥的专栏

    【ZStack】8.级联框架

    ZStack提供一个级联框架,用以散布本来只对一个资源的操作到所有相关的资源。资源可以通过实现一个简单的扩展点以加入级联框架,使得资源的业务逻辑与框架解耦。 级联框架 ZStack通过一个级联框架解决这一问题;顾名思义,级联框架允许一个操作能从一个资源级联到其他资源。为了解耦整个架构,这个级联框架被作为一个单独的组件创造出来,资源可以按意愿加入框架。 由于资源的关系是一个可能有环路的有向图,级联框架将把图压扁成一棵树,并把环路变为分支。 当级联一个操作时,该框架从该操作被应用的root issuer开始;在上述删除区域的示例中,zone是根发起者;那么框架将从根发起者遍历树,并调用扩展的createActionForChildResource 总结 在这篇文章中,我们演示了ZStack的级联框架,这是一个强大的工具,用于扩散操作而不需要硬编码。

    35510编辑于 2024-01-09
  • 来自专栏学习笔记ol

    框架分析(8)-React Native

    框架分析(8)-React Native 主要对目前市面上常见的框架进行分析和总结,希望有兴趣的小伙伴们可以看一下,会持续更新的。希望各位可以监督我,我们一起学习进步。 React Native React Native是Facebook开源的一款用于构建跨平台移动应用的框架。 第三方库兼容性 由于React Native是一个相对较新的框架,某些第三方库可能不完全兼容。这可能导致在使用这些库时遇到一些问题,需要额外的努力来解决。 总结 React Native是一款强大的跨平台移动应用开发框架,具有许多优点和特点。它可以帮助开发人员快速构建高性能的移动应用,并提供了丰富的生态系统和社区支持。

    62820编辑于 2023-10-11
  • 来自专栏唐国梁Tommy

    Self-RAG 框架:更精准的信息检索与生成

    1.4 Self-RAG实施步骤 根据对上图(Figure-1)的理解,可以分为两部分:RAG 和 Self-RAG,我们分别来看一下: 1.4.1 常规方法 RAG Retrieval-Augmented Self-RAG 核心算法 SELF-RAG是一个增强语言模型质量和事实性的框架,通过检索和自我反思实现,而不损失原始创造性和多功能性。 该框架使模型可以根据检索到的段落生成文本,并使用“反思tokens”自我评估输出的相关性和完整性。 与普通的RAG方法不同,SELF-RAG更加选择性地进行检索,确保从引用源获得完整支持。 此外,框架还允许设定一个阈值。 (2)如果生成的token是 Retrieve=Yes, 且在所有输出tokens中的标准化值超过了指定的阈值,则触发检索。 2.3.2 基于评判tokens的树解码(Tree-decoding with critique tokens) (1)基本框架 第1步:当每一步进行到t时,依据是否需要检索,可以基于硬或软条件进行。

    4.5K40编辑于 2023-11-09
  • 来自专栏技术翻译

    8个深度学习框架

    今天,我们拥有无数的框架,使我们能够开发出可以提供更好抽象级别的工具,同时简化困难的编程挑战。 每个框架都以不同的方式构建,以用于不同的目的。 在这里,我们将介绍八大深度学习框架,以便您更好地了解哪个框架最适合您,或者在解决您的业务挑战时更方便。 1. 8. Deeplearning4j 通过迭代减少,微服务架构适配以及分布式CPU和GPU的并行训练是Deeplearning4j深度学习框架的一些显着特征 。 上面列表中哪个深度学习框架最适合您的业务需求?答案就在于许多因素,但是,如果您只是想要开始,那么像TensorFlow或Chainer这样的基于Python的深度学习框架是理想的。 原文标题《Top 8 Deep Learning Frameworks》 作者:Mitul Makadia 译者:February 不代表云加社区观点,更多详情请查看原文链接

    1.6K30发布于 2018-12-04
  • 来自专栏指点的专栏

    Java 集合框架8)---- 总结

    在此之前我们来看看整个 Java 集合框架的类图: ? 当出现 hash 值冲突的时候,先采用链地址法处理(使用单链表将冲突的元素连接),当某个冲突链表的长度不小于 8 时,将其树化(转换为红黑树,加快查找速度)。 HashMap 是非线程安全的类。 这里用一篇文章总结了一下 Set 接口下的具体类:Java 集合框架(7). HashSet 内部通过 HashMap 实现,效率较高。 不同的是 Arrays 更多的是针对数组和线性集合,而 Collestions 针对的更多是集合框架中的类。 好了,关于 Java 中的集合框架到这里就告一段落了。

    75310发布于 2019-01-18
  • 来自专栏机器学习原理

    rag

    RAG技术全面解析:原理、应用与优势 引言 在当今快速发展的人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为一个备受关注的话题。 RAG工作流程 RAG的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息,RAG系统可以识别出新的实体和关系。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。

    63111编辑于 2024-06-27
领券