首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI进修生

    HybridRAG:混合 RAG 引擎 - 知识图谱 + 向量检索!比 GraphRAG 更好!

    例如 GraphRAG 使用知识图谱来表示实体和关系,提供了一种结构化的信息检索方法,但它缺乏全面的召回能力。 >/ 下面这篇文章文末有手动混合两种方法的代码实践_ 使用GraphRAG+LangChain+Ollama:LLaMa 3.1跑通知识图谱与向量数据库集成(Neo4j) 这是一个新颖的 AI 系统, 这一过程包括信息提取,如识别实体和关系,并通过填补知识图谱中的空白和解决冗余来改进它。这样它可以适应知识,并由表示实体的各种节点和表示关系的边组成。 GraphRAG 阶段:接着使用 GraphRAG 利用知识图谱来补充和优化之前获取的上下文。这一步能够通过知识图谱提供更丰富的语义信息,从而生成更准确的答案。 为了解决这个问题,我们看到了混合 RAG,它结合了知识图谱和传统 RAG 技术来更好地进行信息提取。

    3.7K02编辑于 2024-12-02
  • 腾讯云大模型知识引擎:以DeepSeek+RAG技术攻克企业知识管理难题

    腾讯云大模型知识引擎基于OCR大模型打造解析引擎,支持超过26类文档类型,成为业界首个支持200MB以上超大文档的系统。 构建三重应用模式适配多元业务场景 标准模式集成RAG能力,通过DeepSeek模型实现知识问答精准匹配。 电商企业行政问答准确率达89% 某头部电商将大模型知识引擎集成到内部IM系统,员工通过对话形式高效检索IT/HR等企业知识。 医疗行业大幅减轻医生文书负担 针对医生文书工作沉重问题(50%以上住院医生每天花4小时以上撰写病历),大模型知识引擎打通医院信息系统,智能生成出院小结、首次病程记录等多类病历文书,帮助医生显著提效。 数据来源:腾讯云大模型知识引擎产品文档及客户案例实测数据

    11510编辑于 2026-05-30
  • 来自专栏AI相关

    再谈RAG与向量存储引擎

    上一篇文章我们讲述了向量和向量数据库的基本概念,并且尝试使用Milvus向量数据库实现RAG,向量数据库是AI大模型不可或缺的“长期记忆体”和“事实校验器”,通过RAG等技术,将大模型的强大生成能力与精准的外部知识结合 在传统程序架构中,为了实现存储和检索除了常用的DBMS以外还可以使用缓存和搜索引擎等技术,那么在AI Agent中想要实现RAG除了向量数据库以外还有没有其他方式?答案的有的。 不仅如此,其实向量这一概念在计算机人工智能技术中也早就出现了,这篇文章我们就来探究一下向量的发展史,以及使用传统向量存储引擎Elasticsearch实现RAG,讨论它与Milvus向量数据库有哪些不同 Elasticsearch 与 Milvus 实现RAG对比对比维度ElasticSearchMilvus核心定位通用搜索引擎专用向量数据库向量支持插件式,7.x后支持原生核心功能最大维度1024/2048 无论采用哪种技术方案,RAG的根本目标始终一致:通过外部知识检索来增强大语言模型,缓解其知识陈旧与幻觉问题,从而提供更准确、可信的答案。

    35210编辑于 2026-02-07
  • TextIn文档树引擎,助力RAG知识库问答检索召回能力提升

    TextIn团队研发了文档树引擎这一关键技术,针对性提升标题检测能力。物理版面分析技术支持对目标区块的检测与元素识别,并利用标题区块的高度(即字号)判断一级、二级、三级、......N级标题。 在此基础上,文档树引擎从语义出发,增强了标题识别率与召回率。 TextIn文档树引擎遵循以下路径工作:一、输入 整份文档的段落内容,以序列化形式传入模型 二、预测 提取当前段落的embedding值 预测每个段落和上一个段落的关系,分为子标题、子段落、合并、 RAG在进行信息检索的时候需要将检索出来的有价值的文本段送给模型,模型才能生成可靠有用的内容。 目前,TextIn文档解析工具已在RAG知识库问答中发挥重要功能,文档树引擎在年报、财报、行研报告等金融文件领域展现了较为明显的优势。

    78610编辑于 2024-08-13
  • 来自专栏AI大模型应用开发炼丹房

    破解大语言模型三大死穴:RAG如何成为AI的实时知识引擎

    RAG的检索增强生成(Retrieval-Augmented Generation, RAG)技术,一直是不少人研究和优化的方向,RAG通过整合外部知识库来增强模型能力,特别适用于实时性、准确性和专业深度要求高的企业场景 (例如GPT-4数据截止于2023年10月),无法获取后续信息(如2024年新品发布)。 重新训练模型以更新知识成本高昂(数百万至数亿美元),且可能引发灾难性遗忘问题。RAG通过外接动态知识库(如公司文档系统或新闻API)来解决这一矛盾。 分割分块​​:将长文档切成100-500字的语义块,以适配LLM的上下文窗口限制(例如GPT-4的8,192 token限制)。分割需按自然语义边界进行(如章节或段落),保持块内完整性。​​ 未来,随着向量数据库和嵌入模型的优化,RAG将继续成为企业级AI的核心支柱,其核心逻辑——以检索事实约束生成——将确保AI从演示工具进化为生产力引擎

    85810编辑于 2025-09-05
  • 来自专栏深度学习与python

    谷歌Vertex AI推出新的RAG引擎

    ;基于用户提示词从知识库中检索相关信息;最后是生成内容,将原始用户查询与检索到的信息结合,生成最终输出。 在设置 Google Cloud 项目并初始化 Vertex AI 引擎后,你可以使用 upload_file 或 import_file 方法快速从本地文件、Google Cloud Storage (publisher_model=EMBEDDING_MODEL) rag_corpus = rag.create_corpus( display_name="my-rag-corpus", embedding_model_config=embedding_model_config ) rag_file = rag.upload_file( corpus_name=rag_corpus.name ("What is RAG?")

    69600编辑于 2025-02-06
  • 来自专栏全栈程序员必看

    流程引擎概念_虚幻引擎4

    目录 一、流程定义 二、查询流程定义 三、ID与版本 四、挂起流程定义 五、流程实例 六、执行 七、活动实例 八、任务与任务定义 ---- 本部分说明了流程引擎的概念 一、流程定义 流程定义定义了流程的结构 Camunda BPM使用BPMN2.0作为主要的建模语言,可以将BPMN 2.0XML格式部署到流程引擎中。 流程引擎负责创建流程实例并管理状态。 六、执行 流程引擎在流程实例内部创建两个并发执行。 部署流程后,流程引擎会为流程中的每个活动创建任务定义,这将在运行时创建任务。

    1.2K10编辑于 2022-11-01
  • 来自专栏山行AI

    RAGFlow-一款开源的RAG引擎

    RAGFlow[1] 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。 RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。 全程无忧、自动化的 RAG 工作流 •全面优化的 RAG 工作流可以支持从个人应用乃至超大型企业的各类生态系统。•大语言模型 LLM 以及向量模型均支持配置。•基于多路召回、融合重排序。 •2024-04-16 添加 FastEmbed[4] 专为轻型和高速嵌入而设计。•2024-04-11 支持用 Xinference[5] 本地化部署大模型。 ragflow/blob/main/deepdoc/README.md [3] BCEmbedding: https://github.com/netease-youdao/BCEmbedding [4]

    13.4K21编辑于 2024-04-18
  • 来自专栏大数据杂货铺

    使用知识图谱实现 RAG 应用

    构建出色的 RAG 应用程序或聊天机器人时面临的挑战是处理结构化文本和非结构化文本。 接下来,我们将演练一个场景,展示如何使用 LangChain 实现基于知识图谱的 RAG 应用程序来支持您的 DevOps 团队。该代码可在 GitHub 上获取。 开发 DevOps RAG 应用程序时,您可以从云服务、任务管理工具等获取信息。 将多个数据源组合成知识图谱 由于此类微服务和任务信息不公开,因此我们创建了一个综合数据集。 RAG 应用程序中的矢量相似性搜索 从向量索引中检索到的信息可以用作大语言模型的上下文,以便它可以生成准确且最新的答案。 这些任务已经在我们的知识图谱中了。但是,我们必须计算嵌入值并创建向量索引。 原文链接:https://neo4j.com/developer-blog/knowledge-graph-rag-application/ 原文作者:Tomaz Bratanic

    3K10编辑于 2024-04-03
  • RAG到Agent:腾讯乐享“知识虾”重塑企业级智能知识库与生产力引擎

    数据与观点来源: 腾讯全球数字生态大会·城市峰会 主讲人: 杨志强(腾讯乐享商业化负责人) 一、 突破传统知识管理瓶颈:消除数据孤岛与AI“幻觉”陷阱 企业落地AI的核心在于“知识库+大模型+Agent 内容陈旧与运维成本高: 存量文档数量庞大(如动辄数万条的工业设备知识),人工排查与审核成本极高,导致知识库充斥错误参数与过时数据,可信度极低。 二、 构建“知识库+大模型+Agent”三位一体架构:重塑工作流 为解决上述痛点,腾讯乐享推出“知识虾”,通过全景能力将AI从单纯的“问答助手”升级为深度参与业务的“工作伙伴”。 通过智能查重、AI评审、冲突检测等机制完成知识的深度加工。 降低运营总成本 (Ops Cost): 依托独立中英文知识库与打通的4套客服系统,人工成本量化降低 40%。 优化终端用户体验: 知识库的精准溯源与权限隔离机制,直接推动客服满意度提升 90+%。

    73910编辑于 2026-04-01
  • LangChain4j 标准 RAG 实战

    LangChain4j - LangChain4j快速入门实战 2. LangChain4j - 多模态开发踩坑实录 3. LangChain4j - 系统提示词稳住AI 4. LangChain4j - 注解式AI服务实战 5. LangChain4j - 让AI不再失忆 6. LangChain4j - LangChain4j 结构化输出实战 7. LangChain4j - RAG落地实战 经过上一篇 LangChain4j - RAG落地实战, 已经了解了极简版 RAG,那么本篇呢,继续延续上篇内容开展。 api-key: <You API Key here> 新建 rag.RagConfig,编写 RAG 相关的代码,执行 RAG 的初始流程并返回一个定制的内容检索器 Bean: /** 查看详情 5 NotebookLM:靠谱知识库 查看详情 6 Spring AI 玩转多轮对话 查看详情 7 Cursor生成UI,加一步封神 查看详情 8 神器!

    20810编辑于 2026-04-29
  • 来自专栏AI应用开发实践

    langchain4j 之 Advanced RAG

    langchain4j 中的 Advanced RAG 涉及到诸多策略,今天和大家聊一聊这里涉及到的一些策略。 Retrieval Augmentor 就像 RAG 系统的“中央处理器”,专门负责给用户的问题“加料”——通过调用各种检索渠道(比如数据库、文档库、网络资源),把找到的相关知识片段“贴”到原始问题里, 四 Content Retriever 4.1 Content 就像快递包裹里的物品,Content 是 RAG 系统中承载知识的最小单元: 当前形态:主要是文本(比如文档片段、问答对) 未来扩展:可能支持图片 userId); }) .build(); 4.2.2 WebSearchContentRetriever WebSearchContentRetriever 可以调用 Google 等搜索引擎实时抓取网页内容 5.3 方案对比 六 Content Injector 6.1 简介 这就像 RAG 系统的"信息打包员",负责把检索到的知识片段(Content)整合到用户的问题中,让大模型回答时有参考资料。

    32310编辑于 2026-03-26
  • 来自专栏码匠的流水账

    聊聊langchain4j的RAG

    序本文主要研究一下langchain4j的RAG概述RAG(Retrieval-Augmented Generation)即检索增强生成,它通过检索来获取相关信息,注入到prompt,然后用增强的prompt 实现LangChain4j 提供了三种RAG(Retrieval-Augmented Generation,检索增强生成)的实现方式:Easy RAG:这是最简单的方式,适合初学者快速上手。 Easy RAGpom.xml<dependency> <groupId>dev.langchain4j</groupId> <artifactId>langchain4j-easy-rag RAG Flavors**LangChain4j offers three RAG flavors:* **Easy RAG:** The simplest, quickest way to get LangChain4j 提供了三种RAG(Retrieval-Augmented Generation,检索增强生成)的实现方式:Easy RAG、Naive RAG、Advanced RAG

    92110编辑于 2025-03-17
  • 来自专栏AI进修生

    Verba:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等!

    Aitrainee | 公众号:AI进修生 在本文中,我们将深入探讨 Verba,这是一款革命性的开源 rag 引擎。 解决文档中的问题,交叉引用多个数据点,或从现有知识库中获取见解。Verba 结合了最先进的 RAG 技术与 Weaviate 的上下文感知数据库。 提供的本地嵌入模型 Cohere(如Command R+) ✅ 由 Cohere 提供的嵌入和生成模型 Google(如Gemini) ✅ 由 Google 提供的嵌入和生成模型 OpenAI(如GPT4) (如文档、文档类型等) 高级查询 计划中 ⏱️ 基于 LLM 评估的任务委派 重新排名 计划中 ⏱️ 基于上下文重新排名结果以改进结果 RAG 评估 计划中 ⏱️ 用于评估 RAG 管道的界面 可自定义元数据 RAG 管道 缺少什么内容?

    95700编辑于 2024-12-02
  • 来自专栏AI进修生

    GraphRAG:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等等!

    Aitrainee | 公众号:AI进修生 解锁 GraphRAG 的力量:用于高级语义搜索、嵌入、矢量搜索等的终极 RAG 引擎RAG(Retrieval-Augmented Generation)是一种自然语言处理方法,通过外部知识增强现有的大型语言模型,以便在回答需要特定知识的问题时,提供更相关的答案。 与简单的文本搜索方法不同,GraphRAG使用知识图谱来提取和组织信息,从而提高响应的准确性和相关性,尤其是在处理复杂或私密的数据集时。 接着输入cd graph rag进入目录,并输入export graph rag_API_key填入你的API密钥。 你需要创建一个输入文件夹以存放所有文件或文档。 代码库指南 此代码库展示了如何利用知识图谱记忆结构来增强 LLM 输出。请注意,提供的代码仅作为示范用途,不是微软官方支持的产品。

    2.8K10编辑于 2024-12-02
  • 大模型+知识rag项目架构

    而“知识库”则是指存储大量结构化或半结构化数据的系统,这些数据可以用于支持决策、提供信息查询等服务。 将大模型与知识库结合的项目架构(RAG项目架构)可能指的是一种结合了检索(Retrieval)和生成(Generation)的架构,即RAG(Retrieval-Augmented Generation RAG架构的一般流程如下:检索阶段(Retrieval):首先,系统会从知识库中检索出与输入查询相关的信息。这可以通过关键词匹配、语义搜索或其他相关性度量来实现。 在实际应用中,RAG项目架构可以根据不同的应用场景和需求进行定制和优化。例如,检索系统可以使用不同的搜索引擎或推荐系统,而生成模型可以是传统的语言模型,也可以是专门为特定任务训练的模型。 如果你有关于RAG项目架构的具体问题,或者需要了解如何在特定的应用场景中实现这种架构,请提供更多的上下文信息,我会尽力提供帮助。

    1.1K10编辑于 2024-04-19
  • 来自专栏程序员

    揭秘RAG的核心引擎:Document、Embedding与Retriever详解

    在人工智能的浪潮中,检索增强生成(RAG)技术以其卓越的能力,成为了处理知识密集型任务的关键。 一、Document(文档):知识的基石1.是什么?Document是RAG系统中的基本知识单元,是信息的载体。 简单来说,Document就是RAG系统的“藏书”,而切分(Chunking)就是将厚厚的书籍整理成一张张便于查阅的“知识卡片”。 Retriever是搜索引擎和调度中心,它利用Embedding提供的“语义地图”,高效地完成知识的定位与召回。这三者环环相扣,缺一不可。 正是它们精妙的配合,使得RAG系统能够突破LLM自身知识的局限,成为一个动态、可靠且可追溯的智能问答系统,为企业级AI应用打开了无限可能的大门。理解它们,是理解和优化任何RAG系统的第一步。

    47610编辑于 2025-09-28
  • 来自专栏CSDN小华

    Unity引擎基础知识

    Unity基础知识概要 1. 创建工程 在Unity中,首先需要通过Unity Hub创建一个新的项目。点击“New Project”按钮,然后为项目命名并选择保存路径即可完成创建。 2. 4. 游戏物体创建与操作 在Unity中,游戏物体是构建游戏的基本单位。可以通过拖拽的方式将预制体(Prefab)放置到Scene视图中,并对其进行缩放、旋转和移动等操作。 实践项目:通过实际操作和完成项目来巩固所学知识,例如在Unity官方开发者社区中找到相关案例和示例项目。 社区交流:加入Unity开发者社区,与其他开发者交流心得和经验。 在Unity中实现高级UI设计和交互,需要掌握多个方面的知识和技能。 可以通过官方手册或相关教程来学习这些基础知识。 参考和应用实际的示例和源代码可以加深理解。

    1.7K10编辑于 2024-10-16
  • 来自专栏码匠的流水账

    聊聊langchain4j的Naive RAG

    序本文主要研究一下langchain4j的Naive RAG示例public class Naive_RAG_Example { /** * This example demonstrates EmbeddingStoreContentRetriever),全文检索数据源(AzureAiSearchContentRetriever),混合搜索数据源(AzureAiSearchContentRetriever),搜索引擎数据源 (ebSearchContentRetriever),知识图谱数据源(Neo4jContentRetriever),关系数据库数据源(SqlDatabaseContentRetriever)。 EmbeddingStoreContentRetrieverdev/langchain4j/rag/content/retriever/EmbeddingStoreContentRetriever.javapublic 小结langchain4j提供了EmbeddingStoreContentRetriever来开启Naive RAG的功能,EmbeddingStoreContentRetriever.builder(

    43900编辑于 2025-03-19
  • 来自专栏码匠的流水账

    聊聊langchain4j的Advanced RAG

    序本文主要研究一下langchain4j的Advanced RAG核心流程将UserMessage转换为一个原始的QueryQueryTransformer将原始的Query转换为多个Query每个Query *

    * Advanced RAG in LangChain4j is described here: https://github.com/langchain4j/langchain4j DefaultQueryTransformerdev/langchain4j/rag/query/transformer/DefaultQueryTransformer.javapublic class ReRankingContentAggregatordev/langchain4j/rag/content/aggregator/ReRankingContentAggregator.javapublic ContentInjectordev/langchain4j/rag/content/injector/ContentInjector.java@Experimentalpublic interface

    70410编辑于 2025-03-21
领券