搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏自然语言处理
5个开源RAG框架对比
还在为RAG应用开发头疼吗？别急，今天给大家推荐五款完全开源免费的RAG框架，覆盖自动优化、多模态处理、本地部署、生产环境支持等多种场景，助你轻松搞定RAG开发！ 1. AutoRAG：自动优化，省心省力核心优势：自动寻找最优RAG流程，告别手动调参！ ✨ 特色功能：支持用你的评估数据测试不同RAG模块，找到最适合的方案。适用场景：适合需要优化RAG系统性能的开发者。 https://github.com/Marker-Inc-Korea/AutoRAG 2. https://github.com/SciPhi-AI/R2R 3. n8n AI 工具包：本地部署，隐私无忧核心优势：完全本地化部署，数据安全有保障！适用场景：适合企业级应用部署，需要稳定可靠的RAG框架。 https://github.com/truefoundry/cognita 5.
3.9K11编辑于 2024-12-31
来自专栏AgenticAI
RAG新SOTA！港中深发布Graph-based RAG统一框架，深度评估现有Graph-based RAG框架！
然而，目前各种基于图的 RAG 方法缺乏统一框架，难以在相同实验环境下系统比较和深入分析。研究贡献 1、创新统一框架：首次提出涵盖所有现有 Graph-based RAG 方法的统一框架，从高层次明确定义图构建、索引构建、操作符配置及检索生成四个关键步骤。 2、深入方法比较：在统一框架下，系统地评估和对比 12 种主流 Graph-based RAG 算法，详细分析每种方法的优势与局限性。研究与实验方法本文提出一个全新的统一框架，将基于图的 RAG 方法划分为图构建、索引构建、操作符配置及检索与生成四个核心阶段，以实现对现有方法的系统比较与深入分析。所有节点和关系索引均利用先进文本编码模型 BGE-M3 生成嵌入向量，社区索引则通过聚类算法生成社区报告。
42400编辑于 2025-03-18
来自专栏JadePeng的技术博客
知识图谱增强的KG-RAG框架
/KG_RAG），该框架利用生物医学知识图谱SPOKE与大型语言模型相结合，有效的提升了LLM在医疗领域的问答效果。 KG-RAG框架介绍 KG-RAG框架，较好的结合了生物医学知识图谱SPOKE和LLM的优势。研究人员对KG-RAG框架进行了广泛的测试，包括单跳和双跳提示、药物再利用查询、生物医学真假问题和多项选择题。通常情况下，可以查询1~3跳内的三元组信息，这里借助图数据库可以比较容易的实现。在其他领域如何去应用KG做RAG，一方面可以扩展该框架，另外一方面，也要结合自己的实际场景去定制具体的策略。
2.5K10编辑于 2024-04-12
来自专栏自然语言处理
【RAG入门教程03】Langchian框架-文档加载
这个也是在后续开发框架的过程中，我们可以选取langchian的document作为处理对象，但是文件解析需要自己去写和实现。 page_content='Name: Charlie\nAge: 35\nCity: Chicago', metadata={'source': 'sample_data.csv', 'row': 3} jane.smith@example.com", "age": 25, "city": "Los Angeles" }, { "id": 3, ', metadata={'source': '/Users/okanyenigun/Desktop/codes/python__general/example.jsonl', 'seq_num': 3} 2 0 2\n\nb e F 7\n\n]\n\nG A . h t a m\n\n[\n\n1 v 3 0 8 3 0 . 2 0 3 2 : v i X r a\n\nA WEAK (k, k)-LEFSCHETZ
97910编辑于 2024-06-10
来自专栏自然语言处理
【RAG入门教程05】Langchian框架-Vector Stores
docs_resp = vectorstore.similarity_search(query=query, k=3) print(len(docs_resp)) print(docs_resp[0] 在本例中，k=3表示将返回前 3 个最相似的文档。结果，docs_resp是与查询最相似的文档列表。
1K10编辑于 2024-06-10
来自专栏DeepHub IMBA
UniMS-RAG:用于个性化对话的统一多源RAG框架
RAG领域已经取得了相当大的发展，这篇论文的是如何分解RAG过程，加入多文件检索、记忆和个人信息等定制化的元素。使用RAG的一个优点是其实现的简单。但是在agenic RAG、多文档搜索和添加会话历史等方面，还需要很多的手动工作。代理RAG是将代理层次结构与RAG实现相结合的地方，这会带来很大的复杂性。 UniMS-RAG会对这些元素进行优先排序。 3、持续改进论文的方法还包括一种自我细化推理算法，通过结合RAG会带来很大程度的可检查性和可观察性。 UniMS-RAG框架 UniMS-RAG统一了计划、检索和阅读任务的训练过程，并将它们集成到一个综合框架中。提出的统一多源检索-增强对话系统(UniMS-RAG)使用大型语言模型(llm)同时作为计划者、检索者和读者。这个框架在推理过程中还引入了自改进，使用一致性和相似性分数来改进响应。
57610编辑于 2024-02-01
来自专栏DeepHub IMBA
RAG中的3个高级检索技巧
RAG系统检索的文档可能并不总是与用户的查询保持一致，这是一个常见的现象。本文将探讨三种有效的技术来增强基于rag的应用程序中的文档检索，通过结合这些技术，可以检索与用户查询密切匹配的更相关的文档，从而生成更好的答案。查询扩展查询扩展指的是一组重新表述原始查询的技术。 # 3. How much debt does the company have? Is it increasing or decreasing? # 4. query_embedding) return torch.cosine_similarity(updated_query_embedding, document_embedding, dim=0) 3、
1.3K10编辑于 2024-01-23
来自专栏DeepHub IMBA
BookRAG：面向层级文档的树-图融合RAG框架
第一种是文本优先方法，将所有内容扁平化为纯文本，主要依赖OCR，再用BM25、经典分块RAG或GraphRAG、RAPTOR等图方法完成检索。大多数RAG管道依赖固定的查询处理流程，简单问题处理起来效率低，复杂问题又应对不了。所以多数现有的文档级RAG系统要么忽略文档的层级结构，要么缺乏查询感知的检索流程。 BookRAG是一个专为层级结构文档设计的RAG框架。整个框架由三个关键组件构成。构建BookIndex BookIndex在一个统一索引中同时容纳结构和语义。 Figure 3: The BookIndex Construction process.
22010编辑于 2026-03-31
来自专栏自然语言处理
【RAG入门必备技能】Faiss框架使用与FaissRetriever实现
提供了高效且可靠的相似性聚类和检索方法，可支持十亿级别向量的搜索，是目前最为成熟的近似近邻搜索库官方资源地址https://github.com/facebookresearch/faiss Faiss基础依赖 1）矩阵计算框架：Faiss与计算资源之间需要一个外部依赖框架，这个框架是一个矩阵计算框架，官方默认配置安装的是OpenBlas，另外也可以用Intel的MKL，相比于OpenBlas使用MKL作为框架进行编译可以提高一定的稳定性 2）查找向量对应的中心点 3）向量减去对应的中心点生成残差向量 4）针对残差向量生成二级量化器。使用方法 Faiss是为稠密向量提供高效相似度搜索的框架(Facebook AI Research），选择索引方式是faiss的核心内容，faiss 三个最常用的索引是：IndexFlatL2, IndexIVFFlat document_text # store the original document text self.ctr += 1 def search_doc(self, query, k=3)
5K20编辑于 2024-06-06
来自专栏Datawhale专栏
RAG 作者：RAG 已死，RAG 万岁！
的 Gemini 1.5，上下文窗口达 100 万 token 2025 年 3 月：模型上下文协议（Model Context Protocol）让你能直接与你的数据对话 (注：原文日期可能是笔误) 底线是：您同时需要长上下文 LLM 和 RAG。但既然“RAG”这个术语似乎如此具有争议性，那我们不妨这样说：我们不必非得称之为 RAG。我们可以就叫它检索 (retrieval)。 RAG 提供了相当于直接翻到相关页面的能力。处理更多 token 不仅更慢，而且极其低效，并且比使用 RAG 精准定位所需信息要昂贵得多。警惕错误的二分法在谷歌搜索“RAG vs”，你会看到一长串建议的查询补全——“长上下文”、“微调”、“MCP”。这种框架设定制造了一种人为的选择，并没有反映这些技术实际上如何协同工作的最佳方式。 RAG、微调和大型上下文窗口在 AI 中也是如此。结论我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。
75510编辑于 2025-04-24
来自专栏全栈开发工程师
【RAG】001-RAG概述
【RAG】001-RAG概述 0、整体思维导图下面的知识是基于一个视频教程结合 AI 生成的笔记，我也看了一遍，有了一些印象，但这种印象很快就会消失，知识也就消失了，为了使得知识在我的大脑中停留更长的时间补充1：RAG 基本逻辑补充2：RAG 知识库基本逻辑一、RAG 介绍 1、LLM 的主要局限性大语言模型（LLM）尽管功能强大，但仍存在以下明显的局限性：时效性问题：模型的知识在预训练后就固定了在向量数据库中搜索相似内容获取最相关的文本片段生成过程：将检索到的相关内容与用户问题组合构建合适的提示词（Prompt）通过 LLM 生成最终答案 3、RAG 的应用场景 RAG 技术在多个领域都有广泛应用 3、选择建议 3.1 适合使用 RAG 的场景需要频繁更新知识的应用对答案准确性要求高的场景预算有限但需求明确的项目需要透明解释的业务场景 3.2 适合使用 Fine-tuning 的场景任务明确且相对固定的应用 Prompt 构建：设计提示模板整合检索内容添加约束条件 LLM 调用：发送完整 Prompt 控制生成参数处理模型输出后处理优化：格式化输出添加引用来源质量检查 3、
79710编辑于 2025-03-25
来自专栏IT大咖说
使用 Llama3 和 Ollama 改进了 RAG
◆介绍：在本文中，我们将创建一个高级 RAG，它将根据作为管道输入给出的研究论文来回答用户查询。用于构建该管道的技术堆栈如下。 Ollama 嵌入模型 mxbai-embed-large Ollama 量化Llama-3 8b 模型本地托管的 Qdrant 向量数据库。在初始步骤（称为“步骤 1”）中，语言模型（具体以 GPT-3 为例）通过指令提示引导，根据原始查询生成假设文档。这一过程是针对论文中提出的问题精心定制的，尽管文件具有假设性，但仍确保了相关性。输出： ◆结论：总之，通过利用 Meta 的大型语言模型等尖端技术的力量Llama-3，以及等复杂的方法HyDE，并利用的功能Ollama，我们准备构建无与伦比的 RAG 管道。 log_from=adb4c5d3cf43a_1713747619961
1.6K10编辑于 2024-04-24
来自专栏DeepHub IMBA
FaaF:为RAG系统量身定制的事实召回评估框架
在RAG系统中实际的事实召回评估可能存在以下问题: 在低质量生成的文本中自动验证真实的、独立的陈述和模拟低质量的检索增强生成(RAG)场景并没有得到太多的关注。 RAG系统涉及许多组件，例如知识库、检索、提示公式和语言模型，这些都需要大量的调优。因此效率对实际执行至关重要。 Facts As A Function faaf是一个为RAG系统量身定制的事实召回评估框架，它可以用来创建一个测试数据集，并执行自动的事实召回评估。评估数据是通过真实事实和人工注释来增强的。 WikiEval的特点是问题和答案对，答案具有可变的事实质量，可以模拟有缺陷的RAG反应。然后测试RAG的假设反应(在这种情况下，无根据的答案和糟糕的答案)对提取的事实的召回。依靠提示来验证事实往往会高估陈述的真实性，尤其是在文本缺乏重要信息的情况下。
39210编辑于 2024-04-15
来自专栏AgenticAI
深度测评 RAG 应用评估框架：指标最全面的 RAGas
本文介绍一个全自动化的 rag 应用评估框架 ragas。然后就是使用 ragas 框架的 API 来生成测试集了，首先初始化测试集生成器。比如将答案拆分为 3 个 claims，然后从 context 中判断有几个可以推断出来，假设为 2，那么忠实性就是 2/3。它需要回答和上下文。 3. 总结本文介绍了如何使用 ragas 生成测试集，介绍了多个常用的 RAG 评估指标。如果你想深入RAG也可以考虑购买这本《大模型RAG实战》，更为系统地学习。
5.6K12编辑于 2025-03-18
来自专栏AgenticAI
蚂蚁开源新RAG框架KAG，可达91%准确率
看这篇就够了》，本文探一探蚂蚁开源的另外一套知识增强生成框架 KAG（Knowledge Augmented Generation），专门用于构建垂直领域知识库的逻辑推理问答框架，论文中提到在电子政务达到了 KAG 简介 KAG 可以有效克服传统 RAG 向量相似度计算的歧义性和 OpenIE 引入的 GraphRAG 的噪声问题，支持逻辑推理、多跳事实问答等。 3. 3.2 开发者模式即使是开发者模型，也仍然需要安装刚才的 Docker Compose，其中启动了一些依赖服务，KAG 框架并不包含前端或者服务端的代码。 //openspg.yuque.com/ndx6g9/0.5/nbb1bn3wegwue6yo#r95Sg [3] Efficient Tool Use with Chain-of-Abstraction
3.4K00编辑于 2025-03-18
来自专栏唐国梁Tommy
Self-RAG 框架：更精准的信息检索与生成
of Washington 3.论文链接: https://arxiv.org/abs/2310.11511 4.github: https://github.com/AkariAsai/self-rag.git Self-RAG 核心算法 SELF-RAG是一个增强语言模型质量和事实性的框架，通过检索和自我反思实现，而不损失原始创造性和多功能性。该框架使模型可以根据检索到的段落生成文本，并使用“反思tokens”自我评估输出的相关性和完整性。与普通的RAG方法不同，SELF-RAG更加选择性地进行检索，确保从引用源获得完整支持。此外，框架还允许设定一个阈值。（2）如果生成的token是 Retrieve=Yes，且在所有输出tokens中的标准化值超过了指定的阈值，则触发检索。 2.3.2 基于评判tokens的树解码（Tree-decoding with critique tokens）（1）基本框架第1步：当每一步进行到t时，依据是否需要检索，可以基于硬或软条件进行。
4.5K40编辑于 2023-11-09
来自专栏机器学习原理
rag
引言传统的生成模型，例如GPT-3，尽管在生成流畅自然的文本方面表现出色，但在应对特定领域的深度问答时常常显得力不从心。 RAG工作流程 RAG的工作流程可以分为以下几个步骤：用户查询：用户提出一个查询，系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势，这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势，但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。 RAG技术 VS 纯生成模型（如GPT-3）纯生成模型，如GPT-3，通常依赖于大量的数据和参数来生成文本。
63111编辑于 2024-06-27
来自专栏自然语言处理
RAG Logger：RAG日志记录工具
您听说过 RAG Logger 吗？它是一款专为检索增强生成 (RAG) 应用程序设计的开源日志记录工具！据说它可以作为 LangSmith 的轻量级替代方案，满足 RAG 特定的日志记录需求。查询、搜索结果、LLM 交互和性能指标可以以 JSON 格式记录。特点通过查询跟踪详细了解用户问题！ RAG Logger 为 RAG 应用程序的性能监控和调试提供了强大的支持，对吗？特别推荐给那些想要提高应用程序开发效率的人。请参阅此处的详细信息： RAG Logger GitHub 仓库
32910编辑于 2025-01-07
来自专栏数据派THU
独家 | 进阶RAG-提升RAG效果
RAG工作流程分解首先，为了增强对RAG的理解，我们将RAG工作流程分解为三个部分，并对每个部分进行优化以提高整体表现。数据清洗在RAG框架中起着至关重要的作用。RAG的效果取决于数据清洗和组织的好坏。删除不必要的信息，如特殊字符、不需要的元数据或文本。删除不相关的文本/文档：删除所有不需要LLM来回答的不相关文档。 3. 分块优化选择正确的chunk_size是一个关键的决定，它可以在几个方面影响RAG系统的效率和准确性: 相关性和粒度较小的chunk_size，如128，产生更细粒度的块。它帮助框架识别包含与用户查询相关信息的最相关子文档。 3. 一旦建立了与子文档的对齐，它就会检索与该子文档相关联的整个父文档。在所示的图片中，最终获得了父块。 4. 框架现在可以访问整个父文档，而不是仅仅依赖于子文档的内容。 5. 句子窗口检索这种分块技术与上面的非常相似。
1.6K20编辑于 2024-06-28
来自专栏思考是一种快乐
Symfony 3 框架＋Elasticsearch
下载symfony 略创建一个symfony 3 项目 cd /var/www symfony new search-www 修改composer.json，增加 "require": { ...
1.1K31发布于 2019-09-23

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

5个开源RAG框架对比

RAG新SOTA！港中深发布Graph-based RAG统一框架，深度评估现有Graph-based RAG框架！

知识图谱增强的KG-RAG框架

【RAG入门教程03】Langchian框架-文档加载

【RAG入门教程05】Langchian框架-Vector Stores

UniMS-RAG:用于个性化对话的统一多源RAG框架

RAG中的3个高级检索技巧

BookRAG：面向层级文档的树-图融合RAG框架

【RAG入门必备技能】Faiss框架使用与FaissRetriever实现

RAG 作者：RAG 已死，RAG 万岁！

【RAG】001-RAG概述

使用 Llama3 和 Ollama 改进了 RAG

FaaF:为RAG系统量身定制的事实召回评估框架

深度测评 RAG 应用评估框架：指标最全面的 RAGas

蚂蚁开源新RAG框架KAG，可达91%准确率

Self-RAG 框架：更精准的信息检索与生成

rag

RAG Logger：RAG日志记录工具

独家 | 进阶RAG-提升RAG效果

Symfony 3 框架＋Elasticsearch

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐