首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏自然语言处理

    5个开源RAG框架对比

    还在为RAG应用开发头疼吗?别急,今天给大家推荐五款完全开源免费的RAG框架,覆盖自动优化、多模态处理、本地部署、生产环境支持等多种场景,助你轻松搞定RAG开发! 1. AutoRAG:自动优化,省心省力 核心优势:自动寻找最优RAG流程,告别手动调参! ✨ 特色功能:支持用你的评估数据测试不同RAG模块,找到最适合的方案。 适用场景:适合需要优化RAG系统性能的开发者。 https://github.com/Marker-Inc-Korea/AutoRAG 2. 适用场景:适合企业级应用部署,需要稳定可靠的RAG框架。 https://github.com/truefoundry/cognita 5. ✨ 特色功能: 提供50+针对企业任务优化的小型模型 支持完整的RAG生命周期 适用场景:适合企业环境中需要专业化、轻量级解决方案的场景。

    3.9K11编辑于 2024-12-31
  • 来自专栏AgenticAI

    RAG新SOTA!港中深发布Graph-based RAG统一框架,深度评估现有Graph-based RAG框架

    然而,目前各种基于图的 RAG 方法缺乏统一框架,难以在相同实验环境下系统比较和深入分析。 研究贡献 1、创新统一框架:首次提出涵盖所有现有 Graph-based RAG 方法的统一框架,从高层次明确定义图构建、索引构建、操作符配置及检索生成四个关键步骤。 2、深入方法比较:在统一框架下,系统地评估和对比 12 种主流 Graph-based RAG 算法,详细分析每种方法的优势与局限性。 6、前瞻性研究方向:基于详细的实验结果与分析,提出了多种前瞻性研究机会与实践方案,有望推动 RAG 领域未来研究。 研究与实验方法 本文提出一个全新的统一框架,将基于图的 RAG 方法划分为图构建、索引构建、操作符配置及检索与生成四个核心阶段,以实现对现有方法的系统比较与深入分析。

    42400编辑于 2025-03-18
  • 来自专栏学习笔记ol

    框架分析(9)-Hibernate

    框架分析(9)-Hibernate 主要对目前市面上常见的框架进行分析和总结,希望有兴趣的小伙伴们可以看一下,会持续更新的。希望各位可以监督我,我们一起学习进步。 Hibernate Hibernate是一个开源的Java持久化框架,它提供了一种将Java对象映射到数据库表的方法,使得开发人员可以使用面向对象的方式来操作数据库。 性能问题 Hibernate框架在某些情况下可能会引起性能问题。由于Hibernate需要进行对象的映射和关联查询,可能会导致一些额外的开销。 总结 Hibernate框架具有简化数据库操作、跨数据库平台、高度可定制性、缓存机制、查询语言等优点。然而,它也存在学习曲线较陡、性能问题、复杂性和难以调试等缺点。 强调 Hibernate是一个强大的Java持久化框架,它简化了开发人员对数据库的操作,提高了系统的性能和可维护性。

    48520编辑于 2023-10-11
  • 来自专栏掘金安东尼

    👾打开 RAG 对接大模型的黑盒 —— 9 大隐藏问题

    构建 RAG 本篇不是想讲 RAG 概念,而是想再深入探索一下:RAG 的构建; 通常来说,构建 RAG 的过程有: 将文档分割成均匀的块,每个块都是一段原始文本; 为每个块生成嵌入(例如 OpenAl 对接大模型的黑盒 —— 9 大问题 来源:Seven Failure Points When Engineering a Retrieval Augmented Generation System 1 输出格式错误 RAG 通道需要输出 JSON 答案,我们也要保证输出格式: 使用OpenAI函数调用+ JSON模式 使用令牌级提示(LMQL,Guidance) LlamaIndex支持与其他框架提供的输出解析模块集成 greater than 1 invokes parallel execution. nodes = pipeline.run(documents=documents, num_workers=4) 9. 总结 本篇提供了开发 RAG 通道 9 个痛点,并针对每个痛点都给了相应的解决思路。 RAG 是非常重要的专用检索+通用大模型的技术手段,在赋能模型、满足特定化场景中非常重要!

    80710编辑于 2024-04-04
  • 来自专栏JadePeng的技术博客

    知识图谱增强的KG-RAG框架

    /KG_RAG),该框架利用生物医学知识图谱SPOKE与大型语言模型相结合,有效的提升了LLM在医疗领域的问答效果。 KG-RAG框架介绍 KG-RAG框架,较好的结合了生物医学知识图谱SPOKE和LLM的优势。 研究人员对KG-RAG框架进行了广泛的测试,包括单跳和双跳提示、药物再利用查询、生物医学真假问题和多项选择题。 通过这种方法,KG-RAG框架能够有效地从专业文本中提取和识别疾病实体,并将其与丰富的生物医学知识库相连接,从而生成准确、可靠的生物医学相关信息。 在其他领域如何去应用KG做RAG,一方面可以扩展该框架,另外一方面,也要结合自己的实际场景去定制具体的策略。

    2.5K10编辑于 2024-04-12
  • 来自专栏自然语言处理

    RAG入门教程03】Langchian框架-文档加载

    这个也是在后续开发框架的过程中,我们可以选取langchian的document作为处理对象,但是文件解析需要自己去写和实现。

    97910编辑于 2024-06-10
  • 来自专栏自然语言处理

    RAG入门教程05】Langchian框架-Vector Stores

    向量存储旨在高效处理大量向量,提供根据特定标准添加、查询和检索向量的功能。它可用于支持语义搜索等应用程序,在这些应用程序中,您可以查找与给定查询在语义上相似的文本段落或文档。

    1K10编辑于 2024-06-10
  • 来自专栏爱游博客

    安卓9安装Xposed框架

    前两天把自己手机升级到了Android P也就是安卓9.0升级后才发现无法安装Xposed框架,Xposed框架真的是个神器,模块各种各样的都有,搞机必备,所以有了这篇文章,纯记录下 Android P 框架(Xposed Framework)是一套开源的、在Android高权限模式下运行的框架服务,可以在不修改APK文件的情况下影响程序运行(修改系统)的框架服务,基于它可以制作出许多功能强大的模块,且在功能不冲突的情况下同时运作 对于作者上次更新Xposed框架已经1年多了,版本仍然停留在v90-beta3的版本,对于Android 8.0(N)版本的都还没有一个正式的版本,国内的MIUI版本在另外一个开发者放弃适配之后就更是连 Edxposed及太极得安装使用方法,前提是你有安装Magisk框架。 Edxposed及太极都需要Magisk框架支持的。 Edxposed安装 先下载Magisk框架模块,在Magisk框架里面刷入即可。

    18.8K20发布于 2019-08-07
  • 来自专栏DeepHub IMBA

    UniMS-RAG:用于个性化对话的统一多源RAG框架

    RAG领域已经取得了相当大的发展,这篇论文的是如何分解RAG过程,加入多文件检索、记忆和个人信息等定制化的元素。 使用RAG的一个优点是其实现的简单。但是在agenic RAG、多文档搜索和添加会话历史等方面,还需要很多的手动工作。代理RAG是将代理层次结构与RAG实现相结合的地方,这会带来很大的复杂性。 UniMS-RAG会对这些元素进行优先排序。 3、持续改进 论文的方法还包括一种自我细化推理算法,通过结合RAG会带来很大程度的可检查性和可观察性。 UniMS-RAG框架 UniMS-RAG统一了计划、检索和阅读任务的训练过程,并将它们集成到一个综合框架中。 提出的统一多源检索-增强对话系统(UniMS-RAG)使用大型语言模型(llm)同时作为计划者、检索者和读者。 这个框架在推理过程中还引入了自改进,使用一致性和相似性分数来改进响应。

    57610编辑于 2024-02-01
  • 来自专栏TeamsSix的网络空间安全专栏

    CS学习笔记 | 9、Metasploit框架

    如果想使用MSF对目标进行漏洞利用,再通过这个漏洞来传输Beacon的话,也是可以的。

    96320发布于 2020-06-23
  • 来自专栏DeepHub IMBA

    BookRAG:面向层级文档的树-图融合RAG框架

    现有的RAG系统,无论是基于文本的图方法还是基于版面分割的方法,在面对这类文档时往往失效。根源在于两点:结构与语义的脱节以及工作流程的僵化。 本文介绍的BookRAG或许能提供一个有用的视角。 第一种是文本优先方法,将所有内容扁平化为纯文本,主要依赖OCR,再用BM25、经典分块RAG或GraphRAG、RAPTOR等图方法完成检索。 大多数RAG管道依赖固定的查询处理流程,简单问题处理起来效率低,复杂问题又应对不了。 所以多数现有的文档级RAG系统要么忽略文档的层级结构,要么缺乏查询感知的检索流程。 BookRAG是一个专为层级结构文档设计的RAG框架。 整个框架由三个关键组件构成。 构建BookIndex BookIndex在一个统一索引中同时容纳结构和语义。

    22010编辑于 2026-03-31
  • 来自专栏自然语言处理

    RAG入门必备技能】Faiss框架使用与FaissRetriever实现

    提供了高效且可靠的相似性聚类和检索方法,可支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库 官方资源地址https://github.com/facebookresearch/faiss Faiss基础依赖 1)矩阵计算框架 :Faiss与计算资源之间需要一个外部依赖框架,这个框架是一个矩阵计算框架,官方默认配置安装的是OpenBlas,另外也可以用Intel的MKL,相比于OpenBlas使用MKL作为框架进行编译可以提高一定的稳定性 使用方法 Faiss是为稠密向量提供高效相似度搜索的框架(Facebook AI Research),选择索引方式是faiss的核心内容,faiss 三个最常用的索引是:IndexFlatL2, IndexIVFFlat torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9) 200]) contexts=faiss_retriever.retrieve("2022年冬奥会开幕式总导演是谁") print(contexts) 参考资料 Faiss应用 - 召回框架

    5K20编辑于 2024-06-06
  • 来自专栏Datawhale专栏

    RAG 作者:RAG 已死,RAG 万岁!

    一个具有更大上下文窗口的新模型问世,社交媒体上便会充斥着“RAG 已死”的宣言。 底线是:您同时需要长上下文 LLM 和 RAG。 但既然“RAG”这个术语似乎如此具有争议性,那我们不妨这样说: 我们不必非得称之为 RAG。 我们可以就叫它 检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢,而且极其低效,并且比使用 RAG 精准定位所需信息要昂贵得多。 警惕错误的二分法 在谷歌搜索“RAG vs”,你会看到一长串建议的查询补全——“长上下文”、“微调”、“MCP”。这种框架设定制造了一种人为的选择,并没有反映这些技术实际上如何协同工作的最佳方式。 RAG、微调和大型上下文窗口在 AI 中也是如此。 结论 我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。

    75510编辑于 2025-04-24
  • 来自专栏全栈开发工程师

    RAG】001-RAG概述

    RAG】001-RAG概述 0、整体思维导图 下面的知识是基于一个视频教程结合 AI 生成的笔记,我也看了一遍,有了一些印象,但这种印象很快就会消失,知识也就消失了,为了使得知识在我的大脑中停留更长的时间 补充1:RAG 基本逻辑 补充2:RAG 知识库基本逻辑 一、RAG 介绍 1、LLM 的主要局限性 大语言模型(LLM)尽管功能强大,但仍存在以下明显的局限性: 时效性问题:模型的知识在预训练后就固定了 概述 1、RAG 的概念 RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索和生成技术的文本处理方法,主要用于提高语言模型的输出质量。 2、RAG 的工作原理 RAG 的核心工作流程包含以下步骤: 知识库构建: 收集和处理文档资料 将文档切分为适当大小的文本块 使用向量化模型将文本转换为向量并存储 检索过程: 接收用户查询并向量化 在向量数据库中搜索相似内容 获取最相关的文本片段 生成过程: 将检索到的相关内容与用户问题组合 构建合适的提示词(Prompt) 通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用

    79710编辑于 2025-03-25
  • 来自专栏java工会

    9张图带你认识SpringCloud框架

    9、分布式事物,我认为这是分布式最困难的,因为不同的业务集群都对应自己的数据库,互相数据库不是互通的,互相服务调用只能是相互接口,有些甚至是异地的,这样造成的结果就是网络延迟造成的请求等待,网络抖动造成的数据丢失

    1.2K10发布于 2019-10-15
  • 来自专栏何白白开发记录

    手写一个orm框架-9

    手写一个orm框架-9 生成sql:update 最后一部分了,马上就写完了。

    47520发布于 2019-06-28
  • 来自专栏并发笔记

    手写dubbo框架9-SPI实现

    博客中代码地址:https://github.com/farliu/farpc.git

    80061发布于 2020-10-23
  • 来自专栏DeepHub IMBA

    FaaF:为RAG系统量身定制的事实召回评估框架

    RAG系统中实际的事实召回评估可能存在以下问题: 在低质量生成的文本中自动验证真实的、独立的陈述和模拟低质量的检索增强生成(RAG)场景并没有得到太多的关注。 RAG系统涉及许多组件,例如知识库、检索、提示公式和语言模型,这些都需要大量的调优。因此效率对实际执行至关重要。 Facts As A Function faaf是一个为RAG系统量身定制的事实召回评估框架,它可以用来创建一个测试数据集,并执行自动的事实召回评估。 评估数据是通过真实事实和人工注释来增强的。 WikiEval的特点是问题和答案对,答案具有可变的事实质量,可以模拟有缺陷的RAG反应。 然后测试RAG的假设反应(在这种情况下,无根据的答案和糟糕的答案)对提取的事实的召回。 依靠提示来验证事实往往会高估陈述的真实性,尤其是在文本缺乏重要信息的情况下。

    39210编辑于 2024-04-15
  • 来自专栏加米谷大数据

    2020年9大热门Java框架

    Java 编程语言的最新版本 Java 13 于 2019 年 9 月发布。根据 TOIBE 排行榜(根据排名最高的 25 个搜索引擎计算),Java 排在第一位。 框架 3:Struts 该框架帮助自定义软件开发人员创建易于维护的企业级应用程序。这个框架的 USP 是它的插件。它们是 JAR 包,这意味着它们是可移植的。 框架 5:Google Web Toolkit 这个框架用于客户端开发,类似 JavaScript。它是一个开源的 Java 框架,这意味着它是免费的。 框架 7:Blade 以简单和轻量级著称。这个框架最大的亮点是它快速创建 Web 应用程序的能力。它是一个全栈 Web 开发框架,提供了一个简单而简洁的编码结构。 框架 9:Vaadin 用于精简 Java 开发的优秀平台,一大优点是服务器和浏览器之间的通信顺畅,提供了从 Java 虚拟机直接访问 DOM 的功能。

    97940发布于 2020-01-03
  • 来自专栏AgenticAI

    深度测评 RAG 应用评估框架:指标最全面的 RAGas

    大家常说 RAG 应用是:一周出 demo,半年用不好。那么怎么评估 RAG 应用是否能够上生产了呢?如果公司人手足够,当然可以人工测试评估准确性,但指标未免单一。 本文介绍一个全自动化的 rag 应用评估框架 ragas。 RAGas(RAG Assessment)[1]RAG 评估的缩写,是一个专门的解决方案用于评估、监控和提升生产环境中大语言模型(LLM)和检索增强生成(RAG)应用的性能,包括用于生产质量监控的定制模型 然后就是使用 ragas 框架的 API 来生成测试集了,首先初始化测试集生成器。 如果你想深入RAG也可以考虑购买这本《大模型RAG实战》,更为系统地学习。

    5.6K12编辑于 2025-03-18
领券