首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI进修生

    HybridRAG:混合 RAG 引擎 - 知识图谱 + 向量检索!比 GraphRAG 更好!

    例如 GraphRAG 使用知识图谱来表示实体和关系,提供了一种结构化的信息检索方法,但它缺乏全面的召回能力。 接着,我们还有另一个示意图,描述了知识图谱的创建过程,这是 GraphRAG 的过程,涉及构建实体的结构化表示。 这一过程包括信息提取,如识别实体和关系,并通过填补知识图谱中的空白和解决冗余来改进它。这样它可以适应知识,并由表示实体的各种节点和表示关系的边组成。 GraphRAG 阶段:接着使用 GraphRAG 利用知识图谱来补充和优化之前获取的上下文。这一步能够通过知识图谱提供更丰富的语义信息,从而生成更准确的答案。 为了解决这个问题,我们看到了混合 RAG,它结合了知识图谱和传统 RAG 技术来更好地进行信息提取。

    3.7K02编辑于 2024-12-02
  • 腾讯云大模型知识引擎:以DeepSeek+RAG技术攻克企业知识管理难题

    腾讯云大模型知识引擎基于OCR大模型打造解析引擎,支持超过26类文档类型,成为业界首个支持200MB以上超大文档的系统。 构建三重应用模式适配多元业务场景 标准模式集成RAG能力,通过DeepSeek模型实现知识问答精准匹配。 车企客服独立解决率实现127%跨越式增长 某头部车企集成大模型知识引擎后,智能客服机器人独立解决率从37%提升至84%。 电商企业行政问答准确率达89% 某头部电商将大模型知识引擎集成到内部IM系统,员工通过对话形式高效检索IT/HR等企业知识。 数据来源:腾讯云大模型知识引擎产品文档及客户案例实测数据

    11510编辑于 2026-05-30
  • 来自专栏AI相关

    再谈RAG与向量存储引擎

    上一篇文章我们讲述了向量和向量数据库的基本概念,并且尝试使用Milvus向量数据库实现RAG,向量数据库是AI大模型不可或缺的“长期记忆体”和“事实校验器”,通过RAG等技术,将大模型的强大生成能力与精准的外部知识结合 在传统程序架构中,为了实现存储和检索除了常用的DBMS以外还可以使用缓存和搜索引擎等技术,那么在AI Agent中想要实现RAG除了向量数据库以外还有没有其他方式?答案的有的。 不仅如此,其实向量这一概念在计算机人工智能技术中也早就出现了,这篇文章我们就来探究一下向量的发展史,以及使用传统向量存储引擎Elasticsearch实现RAG,讨论它与Milvus向量数据库有哪些不同 Elasticsearch 与 Milvus 实现RAG对比对比维度ElasticSearchMilvus核心定位通用搜索引擎专用向量数据库向量支持插件式,7.x后支持原生核心功能最大维度1024/2048 无论采用哪种技术方案,RAG的根本目标始终一致:通过外部知识检索来增强大语言模型,缓解其知识陈旧与幻觉问题,从而提供更准确、可信的答案。

    35210编辑于 2026-02-07
  • TextIn文档树引擎,助力RAG知识库问答检索召回能力提升

    TextIn团队研发了文档树引擎这一关键技术,针对性提升标题检测能力。物理版面分析技术支持对目标区块的检测与元素识别,并利用标题区块的高度(即字号)判断一级、二级、三级、......N级标题。 在此基础上,文档树引擎从语义出发,增强了标题识别率与召回率。 TextIn文档树引擎遵循以下路径工作:一、输入 整份文档的段落内容,以序列化形式传入模型 二、预测 提取当前段落的embedding值 预测每个段落和上一个段落的关系,分为子标题、子段落、合并、 RAG在进行信息检索的时候需要将检索出来的有价值的文本段送给模型,模型才能生成可靠有用的内容。 目前,TextIn文档解析工具已在RAG知识库问答中发挥重要功能,文档树引擎在年报、财报、行研报告等金融文件领域展现了较为明显的优势。

    78610编辑于 2024-08-13
  • 来自专栏AI大模型应用开发炼丹房

    破解大语言模型三大死穴:RAG如何成为AI的实时知识引擎

    RAG的检索增强生成(Retrieval-Augmented Generation, RAG)技术,一直是不少人研究和优化的方向,RAG通过整合外部知识库来增强模型能力,特别适用于实时性、准确性和专业深度要求高的企业场景 重新训练模型以更新知识成本高昂(数百万至数亿美元),且可能引发灾难性遗忘问题。RAG通过外接动态知识库(如公司文档系统或新闻API)来解决这一矛盾。 相似性搜索​​:在向量数据库中查找Top-K相似块(例如Top-5),如查询“iPhone发布时间”时匹配到“苹果发布会新闻”块。​​ ps:关于RAG检索增强生成的技术优化,其实之前我也写过很多,这里就不再过多展示,我这里把之前的一些技术文档整理给粉丝朋友,点个小红心自行领取:《检索增强生成(RAG)》总结RAG并非替代LLM,而是通过动态知识库 未来,随着向量数据库和嵌入模型的优化,RAG将继续成为企业级AI的核心支柱,其核心逻辑——以检索事实约束生成——将确保AI从演示工具进化为生产力引擎

    85810编辑于 2025-09-05
  • 来自专栏RAG

    RAG系列:#5 RAG中的11种分块策略

    7个指标让你的准确率大幅提升RAG评测完整指南:指标、测试和最佳实践收藏! RAG核心工具大全:7大解析工具+向量模型+数据库+检索排序GraphRAG开源生态全景:6大主流开源项目,微软/蚂蚁/港大项目同台PK检索增强生成(RAG)将LLM与信息检索系统相结合,以生成更准确、 知识固化与过时:无法知晓训练截止日期之后发生的事,比如,你问「2026年世界杯决赛结果如何?」,模型只能回答「我的知识截止到某年某月,无法提供最新信息」或者胡编一个结果。 分块是海量知识“索引化”的关键注意力稀释效应:输入整本书时,模型注意力被分散。 给出少量精准、高相关度的“知识卡片”,能让注意力集中,提升回答质量③直接影响生成答案的连贯性与完整性合理分块能提供信息丰富、边界清晰的完整文本,便于模型提炼答案。

    14710编辑于 2026-05-27
  • 来自专栏深度学习与python

    谷歌Vertex AI推出新的RAG引擎

    ;基于用户提示词从知识库中检索相关信息;最后是生成内容,将原始用户查询与检索到的信息结合,生成最终输出。 在设置 Google Cloud 项目并初始化 Vertex AI 引擎后,你可以使用 upload_file 或 import_file 方法快速从本地文件、Google Cloud Storage (publisher_model=EMBEDDING_MODEL) rag_corpus = rag.create_corpus( display_name="my-rag-corpus", embedding_model_config=embedding_model_config ) rag_file = rag.upload_file( corpus_name=rag_corpus.name ("What is RAG?")

    69600编辑于 2025-02-06
  • 来自专栏山行AI

    RAGFlow-一款开源的RAG引擎

    RAGFlow[1] 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。 RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。 全程无忧、自动化的 RAG 工作流 •全面优化的 RAG 工作流可以支持从个人应用乃至超大型企业的各类生态系统。•大语言模型 LLM 以及向量模型均支持配置。•基于多路召回、融合重排序。 •2024-04-11 支持用 Xinference[5] 本地化部署大模型。•2024-04-10 为‘Laws’版面分析增加了底层模型。 : https://github.com/netease-youdao/BCEmbedding [4] FastEmbed: https://github.com/qdrant/fastembed [5]

    13.4K21编辑于 2024-04-18
  • 来自专栏自然语言处理

    5个开源RAG框架对比

    还在为RAG应用开发头疼吗?别急,今天给大家推荐五款完全开源免费的RAG框架,覆盖自动优化、多模态处理、本地部署、生产环境支持等多种场景,助你轻松搞定RAG开发! 1. AutoRAG:自动优化,省心省力 核心优势:自动寻找最优RAG流程,告别手动调参! ✨ 特色功能:支持用你的评估数据测试不同RAG模块,找到最适合的方案。 适用场景:适合需要优化RAG系统性能的开发者。 https://github.com/Marker-Inc-Korea/AutoRAG 2. ✨ 特色功能: 支持文本、PDF、JSON、图片等多种文件格式 结合语义搜索 + 关键词搜索 自动构建知识图谱,提取实体关系 适用场景:适合需要处理多类型数据源的综合性RAG应用。 适用场景:适合企业级应用部署,需要稳定可靠的RAG框架。 https://github.com/truefoundry/cognita 5.

    4K11编辑于 2024-12-31
  • 来自专栏自然语言处理

    RAG5个常见错误

    向量数据库并非硬性规定 几乎互联网上所有关于RAG的教程都使用向量存储。如果你一直在搜索RAG相关内容,你就会明白我们在说什么。 基于向量的检索无疑是RAG成功的重要因素。 RAG可以从互联网、关系型数据集、Neo4J中的知识图谱,或者这三者的组合中检索信息。 在许多情况下,我们注意到混合方法往往能带来更好的性能。 对于客户聊天机器人,你可能需要授予RAG访问部分客户数据库的权限,这可能是一个关系型数据库。 公司的知识管理系统可能会创建知识图谱并从中检索信息,而不是使用向量存储。 要让模型具备领域知识这一缺失能力,你可以对其进行微调。 这两个提示可以修复高效检索的索引部分。但是,检索过程本身也可以优化。 检索过程可以更先进 最直接的检索过程是直接查询。 分块是RAG中最具挑战性和最重要的部分 当上下文中包含不相关信息时,LLM往往会失控。 防止RAG中出现幻觉的最佳方法是分块。 现代LLM可能支持更长的上下文长度。

    30810编辑于 2025-04-26
  • 来自专栏大数据杂货铺

    使用知识图谱实现 RAG 应用

    构建出色的 RAG 应用程序或聊天机器人时面临的挑战是处理结构化文本和非结构化文本。 接下来,我们将演练一个场景,展示如何使用 LangChain 实现基于知识图谱的 RAG 应用程序来支持您的 DevOps 团队。该代码可在 GitHub 上获取。 开发 DevOps RAG 应用程序时,您可以从云服务、任务管理工具等获取信息。 将多个数据源组合成知识图谱 由于此类微服务和任务信息不公开,因此我们创建了一个综合数据集。 RAG 应用程序中的矢量相似性搜索 从向量索引中检索到的信息可以用作大语言模型的上下文,以便它可以生成准确且最新的答案。 这些任务已经在我们的知识图谱中了。但是,我们必须计算嵌入值并创建向量索引。 MATCH (t:Task {status:'Open'}) RETURN count(*)" ) # [{'count(*)': 5}

    3K10编辑于 2024-04-03
  • RAG到Agent:腾讯乐享“知识虾”重塑企业级智能知识库与生产力引擎

    数据与观点来源: 腾讯全球数字生态大会·城市峰会 主讲人: 杨志强(腾讯乐享商业化负责人) 一、 突破传统知识管理瓶颈:消除数据孤岛与AI“幻觉”陷阱 企业落地AI的核心在于“知识库+大模型+Agent 内容陈旧与运维成本高: 存量文档数量庞大(如动辄数万条的工业设备知识),人工排查与审核成本极高,导致知识库充斥错误参数与过时数据,可信度极低。 二、 构建“知识库+大模型+Agent”三位一体架构:重塑工作流 为解决上述痛点,腾讯乐享推出“知识虾”,通过全景能力将AI从单纯的“问答助手”升级为深度参与业务的“工作伙伴”。 通过智能查重、AI评审、冲突检测等机制完成知识的深度加工。 : 客户问题检索命中率从原先的平均需检索5次,大幅优化至问1次即得答案。

    73910编辑于 2026-04-01
  • 来自专栏AI进修生

    Verba:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等!

    Aitrainee | 公众号:AI进修生 在本文中,我们将深入探讨 Verba,这是一款革命性的开源 rag 引擎。 解决文档中的问题,交叉引用多个数据点,或从现有知识库中获取见解。Verba 结合了最先进的 RAG 技术与 Weaviate 的上下文感知数据库。 (如文档、文档类型等) 高级查询 计划中 ⏱️ 基于 LLM 评估的任务委派 重新排名 计划中 ⏱️ 基于上下文重新排名结果以改进结果 RAG 评估 计划中 ⏱️ 用于评估 RAG 管道的界面 可自定义元数据 描述 Haystack 计划中 ⏱️ 实现 Haystack RAG 管道 LlamaIndex 计划中 ⏱️ 实现 LlamaIndex RAG 管道 LangChain 计划中 ⏱️ 实现 LangChain RAG 管道 缺少什么内容?

    95700编辑于 2024-12-02
  • 来自专栏AI进修生

    GraphRAG:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等等!

    Aitrainee | 公众号:AI进修生 解锁 GraphRAG 的力量:用于高级语义搜索、嵌入、矢量搜索等的终极 RAG 引擎RAG(Retrieval-Augmented Generation)是一种自然语言处理方法,通过外部知识增强现有的大型语言模型,以便在回答需要特定知识的问题时,提供更相关的答案。 与简单的文本搜索方法不同,GraphRAG使用知识图谱来提取和组织信息,从而提高响应的准确性和相关性,尤其是在处理复杂或私密的数据集时。 接着输入cd graph rag进入目录,并输入export graph rag_API_key填入你的API密钥。 你需要创建一个输入文件夹以存放所有文件或文档。 代码库指南 此代码库展示了如何利用知识图谱记忆结构来增强 LLM 输出。请注意,提供的代码仅作为示范用途,不是微软官方支持的产品。

    2.8K10编辑于 2024-12-02
  • 大模型+知识rag项目架构

    而“知识库”则是指存储大量结构化或半结构化数据的系统,这些数据可以用于支持决策、提供信息查询等服务。 将大模型与知识库结合的项目架构(RAG项目架构)可能指的是一种结合了检索(Retrieval)和生成(Generation)的架构,即RAG(Retrieval-Augmented Generation RAG架构的一般流程如下:检索阶段(Retrieval):首先,系统会从知识库中检索出与输入查询相关的信息。这可以通过关键词匹配、语义搜索或其他相关性度量来实现。 在实际应用中,RAG项目架构可以根据不同的应用场景和需求进行定制和优化。例如,检索系统可以使用不同的搜索引擎或推荐系统,而生成模型可以是传统的语言模型,也可以是专门为特定任务训练的模型。 如果你有关于RAG项目架构的具体问题,或者需要了解如何在特定的应用场景中实现这种架构,请提供更多的上下文信息,我会尽力提供帮助。

    1.1K10编辑于 2024-04-19
  • 来自专栏程序员

    揭秘RAG的核心引擎:Document、Embedding与Retriever详解

    在人工智能的浪潮中,检索增强生成(RAG)技术以其卓越的能力,成为了处理知识密集型任务的关键。 一、Document(文档):知识的基石1.是什么?Document是RAG系统中的基本知识单元,是信息的载体。 简单来说,Document就是RAG系统的“藏书”,而切分(Chunking)就是将厚厚的书籍整理成一张张便于查阅的“知识卡片”。 Retriever是搜索引擎和调度中心,它利用Embedding提供的“语义地图”,高效地完成知识的定位与召回。这三者环环相扣,缺一不可。 正是它们精妙的配合,使得RAG系统能够突破LLM自身知识的局限,成为一个动态、可靠且可追溯的智能问答系统,为企业级AI应用打开了无限可能的大门。理解它们,是理解和优化任何RAG系统的第一步。

    47610编辑于 2025-09-28
  • 来自专栏CSDN小华

    Unity引擎基础知识

    Unity基础知识概要 1. 创建工程 在Unity中,首先需要通过Unity Hub创建一个新的项目。点击“New Project”按钮,然后为项目命名并选择保存路径即可完成创建。 2. 5. 场景和层管理 一个游戏由多个场景构成,每个场景可以包含不同的层(Layer),用于组织和隔离不同的游戏元素。场景分为2D界面和3D场景,分别适用于二维和三维的游戏开发。 6. 实践项目:通过实际操作和完成项目来巩固所学知识,例如在Unity官方开发者社区中找到相关案例和示例项目。 社区交流:加入Unity开发者社区,与其他开发者交流心得和经验。 在Unity中实现高级UI设计和交互,需要掌握多个方面的知识和技能。 可以通过官方手册或相关教程来学习这些基础知识。 参考和应用实际的示例和源代码可以加深理解。

    1.7K10编辑于 2024-10-16
  • 来自专栏JadePeng的技术博客

    知识图谱增强的KG-RAG框架

    /KG_RAG),该框架利用生物医学知识图谱SPOKE与大型语言模型相结合,有效的提升了LLM在医疗领域的问答效果。 KG-RAG框架介绍 KG-RAG框架,较好的结合了生物医学知识图谱SPOKE和LLM的优势。 相关测试结果: 工作原理 KG-RAG框架的工作原理包括以下步骤: 实体识别:从用户输入的query中识别出疾病实体,然后在SPOKE知识图谱中找到相应的节点。 语义搜索匹配:将LLM提取的疾病实体与向量数据库中的疾病实体进行比较,选择最相似的 当然,如果零样本方法未能识别出疾病实体,采取的办法是直接拿原始query去匹配,取top 5。 通过这种方法,KG-RAG框架能够有效地从专业文本中提取和识别疾病实体,并将其与丰富的生物医学知识库相连接,从而生成准确、可靠的生物医学相关信息。

    2.5K10编辑于 2024-04-12
  • 来自专栏JadePeng的技术博客

    知识图谱在RAG中的应用探讨

    在这篇文章中,我们来详细探讨知识图谱(KG)在RAG流程中的具体应用场景。 缘起 关于知识图谱在现在的RAG中能发挥出什么样的作用,之前看了360 刘焕勇的一个分享,简单的提了使用知识图谱增强大模型的问答效果的几个方面: 在知识整理阶段,用知识图谱将文档内容进行语义化组织; 在意图识别阶段 阶段2/D:chunk提取 阶段3-5:后处理,用检索到的信息生成答案 查询增强(Query Augmentation)** 预处理 阶段 ,这里主要 在执行检索之前,向查询添加上下文。 关于“胆碱酯酶抑制剂”的相关信息块提取规则有助于指导查询引擎提取最有用的chunks。 文档层次结构帮助查询引擎快速识别与副作用相关的文档,并开始提取文档内的chunk。 总结 知识图谱KG如何更好的利用在RAG里,是一个值得深入探讨的好话题,本文探讨了知识图谱在RAG不同阶段能产生的作用,不妨去试一试,后续我们会基于一些案例来实际探讨。

    1.4K10编辑于 2024-04-11
  • 来自专栏XINDOO的专栏

    Agent设计模式——第 14 章:知识检索(RAG

    知识检索(RAG)模式概述 知识检索(RAG)模式通过在生成响应之前授予 LLM 访问外部知识库的权限,显著增强了它们的能力。 总之,检索增强生成(RAG)模式代表了使 AI 更加知识渊博和可靠的重大飞跃。通过将外部知识检索步骤无缝集成到生成过程中,RAG 解决了独立 LLM 的一些核心局限。 当被提示关于时事时,RAG 系统检索最近的文章,使 LLM 能够生成最新的摘要。 通过整合外部知识RAG 将 LLM 的能力从简单通信扩展到作为知识处理系统发挥作用。 ## 这控制 RAG 服务将返回多少相关文档块。 SIMILARITY_TOP_K = 5 ## 为向量距离阈值定义一个可选参数。 -4e9bd5f6a4f2 Google Cloud Vertex AI RAG Corpus https://cloud.google.com/vertex-ai/generative-ai/docs

    1.5K10编辑于 2025-10-27
领券