首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏服务器运维日常

    私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek

    本文将介绍如何通过Page Assist、Cherry Studio、AnythingLLM对私有化部署的DeepSeek进行设置,搭建本地知识库、联网搜索、RAG(检索增强生成),以实现私人专属AI大模型 4.6、RAG设置RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索技术和生成模型的方法,可以提升自然语言处理系统的性能。 简单的说,RAG可以将后续介绍的本地知识库中的内容进行处理,便于大语言模型使用。这里需要安装合适的嵌入模型,推荐以下两种模型。 4.8、管理知识对于私有化的知识,可以添加上传至大模型,由嵌入模型分析处理后,对DeepSeek模型提问,大模型就可以优先检索知识库中数据,回答的更加准确。 4.11、Page Assist使用总结通过合理的RAG设置、知识库设置、提示词设置,可以将大模型AI训练成更符合自身需要、更加智能化的产品。相比于通用大模型更能满足私有、定制的需求。

    5.1K22编辑于 2025-02-15
  • 大模型+知识库rag项目架构

    而“知识库”则是指存储大量结构化或半结构化数据的系统,这些数据可以用于支持决策、提供信息查询等服务。 将大模型与知识库结合的项目架构(RAG项目架构)可能指的是一种结合了检索(Retrieval)和生成(Generation)的架构,即RAG(Retrieval-Augmented Generation RAG架构的一般流程如下:检索阶段(Retrieval):首先,系统会从知识库中检索出与输入查询相关的信息。这可以通过关键词匹配、语义搜索或其他相关性度量来实现。 在实际应用中,RAG项目架构可以根据不同的应用场景和需求进行定制和优化。例如,检索系统可以使用不同的搜索引擎或推荐系统,而生成模型可以是传统的语言模型,也可以是专门为特定任务训练的模型。 如果你有关于RAG项目架构的具体问题,或者需要了解如何在特定的应用场景中实现这种架构,请提供更多的上下文信息,我会尽力提供帮助。

    1K10编辑于 2024-04-19
  • 2025主流AI智能客服系统技术对比分析:RAG知识库私有化部署能力全解读

    本文从技术实现角度出发,分析国内数个典型AI客服系统解决方案,重点关注其知识库结构、问答能力、国产化兼容情况、私有化部署模式及场景落地效果,供开发者、集成商与技术选型人员参考。 核心能力横向对比表(2025年版)公司产品名称知识库模型问答能力私有化部署国产化兼容典型场景动易 PowerEasyAI智能客服助手结构化/非结构化统一管理 + RAG支持多轮对话、语义检索与生成✅ 全支持 近年来,RAG(Retrieval-Augmented Generation)成为主流解决方案,即:先通过向量检索获取候选知识,再用语言模型生成最终回答。 以动易AI智能客服助手为例,其在政务与医疗门户中的部署采用“文档+结构化知识库+RAG生成”组合结构,支持: 企业知识全文索引(支持PDF/Word/HTML) 知识片段切分与向量化存储(faiss/ 在选型阶段,建议技术人员重点关注:关键能力维度建议关注点知识处理能力是否支持结构化+非结构化混合、支持RAG模型灵活性是否支持自定义Prompt模板与多轮对话逻辑安全与部署是否支持私有化部署、信创适配、

    1.9K10编辑于 2025-06-18
  • 来自专栏嵌入式音视频

    RAG】内部外挂知识库搭建-本地GPT

    大半年的项目告一段落了,现在自己找找感兴趣的东西学习下,看看可不可以搞出个效果不错的local GPT,自研下大模型吧 RAG是什么? 检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库

    1.2K10编辑于 2024-04-04
  • RAG 知识库的四个段位

    这让我想起了最近在技术圈热议的话题:RAG技术到底该怎么选? 说白了,RAG就是让AI从"闭卷考试"变成"开卷考试"。但这个"开卷考试"可不简单,里面的门道多着呢。 RAG不是万能药,但没它万万不能 很多人以为RAG就是简单的检索增强,错了。 真正的RAG是在解决两个根本问题:时效性和专业性。 比如电商客服,顾客问"你们的产品怎么样",通过RAG调取最新的用户评价和品牌资料,AI就能给出靠谱的建议,而不是瞎编乱造。 但RAG也不是万能的。 技术路线的段位选择 RAG技术有四个段位,选错了就是花钱买罪受。 入门级:Naive RAG 这是最简单的做法,把文档切块存起来,问题来了就搜索相关段落。听起来很美好,但问题不少。 企业选型的现实考量 很多人问过我:到底该选哪种RAG技术? 我的建议是:别被技术名词忽悠了,先想想你的实际需求。 如果你的业务场景很简单,比如FAQ问答,用Naive RAG就够了。

    13510编辑于 2026-02-02
  • 来自专栏人工智能

    使用DeepSeek+RAG实现私人知识库

    当用户对一个通过 RAG 增强的大语言模型提问时,系统首先通过检索模块(Retriever)从外部知识库中查找相关文档(下图图例2),然后将检索结果与原始问题共同输入生成模块(Generator)进行答案合成 本文我们用DeepSeek、Ollama 和 AnythingLLM 这三个工具,然后手动上传 SAP 文档,来演示如何基于 RAG 架构,打造自己的个人 SAP 知识库。 2)上传 SAP 文档作为知识库素材 既然是打造私人的 SAP 知识库, 我们就需要给 DeepSeek 喂一些外部文档作为知识库的文档素材。 在 RAG 架构中,向量数据库的作用类似于一个知识库,它存储了大量文本片段的嵌入(Embeddings),当用户输入查询时,模型会将查询转换为向量,并在数据库中检索最相关的向量,进而找到对应的文本内容。 图片 后记:模型部署 对于企业级用户而言,大模型的私有部署,在数据安全性、响应速度、可定制化、长期成本以及可靠性等多个方面都有着显著优势。

    30.4K1252编辑于 2025-02-07
  • 来自专栏Edward的专栏

    Deepseek本地部署 + 个性化 Rag 知识库

    什么是 RAG ? Retrieval-Augmented Generation (RAG) 是一种结合了信息检索与文本生成的先进模型架构,旨在提高自然语言处理任务中的准确性和相关性。 不同于传统的端到端生成模型,RAG 通过整合外部知识库来增强其输出内容的质量。 具体来说,RAG 首先利用一个检索组件从大规模语料库中动态查找与输入查询最相关的文档或段落,然后将这些检索到的信息作为额外上下文传递给生成组件。 RAG 特别适用于需要实时更新和专业领域知识的应用场景,如智能问答系统、个性化推荐和对话机器人等。 通过这种方式,RAG 克服了传统生成模型仅依赖于固定时间点上训练数据的局限,实现了更灵活、更强大的自然语言理解和生成能力。

    1.1K12编辑于 2025-04-15
  • 来自专栏CoderJia的工作笔记

    一百行代码实现自己的RAG知识库

    RAG模型通过将外部知识库中的信息与生成模型结合在一起,可以提供更准确和上下文相关的答案。具体来说,RAG由两个部分组成: 检索模块:负责从预先建立的知识库中检索与输入问题最相关的文档或信息片段。 这在动态性强、知识库更新频繁的场景中尤为重要。 2. RAG搭建常见流程 在实际应用中,搭建一个基于 RAG知识库通常包括以下几个步骤: 文档加载,并按一定条件切割成片段; 将切割的文本片段灌入向量数据库; 封装检索接口; 构建调用流程:Query - 编码实现 下面用极少的代码快速搭建一个RAG系统,包括服务端和web界面,仅用于demo展示,生成级的 RAG 系统要复杂的多的多。 总结与优化点 以上只是搭建搭建基于RAG知识库最基本的步骤,实际应用时,有几点优化建议: 知识库的动态更新:随着时间的推移,知识库中的信息可能会过时或无效,因此需要设计自动化的知识更新机制,以保证系统回答的准确性和时效性

    1K10编辑于 2024-10-18
  • 个人电脑本地私有知识库:访答知识库深度解析

    个人电脑本地私有知识库:访答知识库深度解析什么是本地私有知识库?本地私有知识库是一种将知识数据存储在个人电脑本地的管理工具,与云端存储不同,它提供了更高的数据安全性和隐私保护。 访答知识库的核心优势知识库作为本地私有知识库的杰出代表,具备以下核心优势:数据完全私有:所有数据存储在本地,无需担心数据泄露风险离线访问能力:无需网络连接即可访问知识库内容高效知识管理:支持多种格式文档 ,提供强大的检索和分类功能轻量级部署:无需复杂配置,即可在个人电脑上快速部署使用如何选择适合的本地知识库在选择本地私有知识库时,应考虑以下因素:数据安全级别、易用性、功能完整性、技术支持等。 知识库在这些方面表现出色,是个人知识管理的理想选择。结语在数据安全日益重要的今天,选择一款可靠的本地私有知识库至关重要。 访答知识库以其出色的安全性能和便捷的使用体验,为用户提供了完美的个人知识管理解决方案。

    29710编辑于 2025-12-08
  • 来自专栏学习成长指南

    AI超级智能体教程(七)---RAG实战本地知识库和云端知识库

    1.RAG实战–本地知识库的应用 1.1编写代码 我们的文档添加到这个向量数据库里面去: 基于我们的知识库进行问答:我们的prompt+拦截器从向量数据库里面找到的上下文,两个组合在一起,发给我们的AI ,而且这个分数越高,表示我们的本地知识库里面搜索出来的这个内容和我们的用户输入的这个提示词的吻合度是更高的; 1.3输出结果 实际上仔细观察这个输出的结果,我们的这个回答就是从我们的本地的知识库里面去找到的 ,也就是我们的那三个md文档 2.RAG实战–云端知识库的应用 2.1新建云端知识库 这个主要是使用的阿里云百炼的云端知识库的平台,下面的这个步骤是我们后续进行这个云端的知识库开发的这个基础,大家实际需要重视一下的 2.3断点调试 这个时候我们会发现这个request打断点的位置内容和刚才的本地的知识库的差别还是很大的,大家可以去回顾一下本地的知识库的,这个云端知识库应该是直接加进来了,内容还是很多的; 这个时候云端知识库检索的结果是 5个,可以喝上面的本地的知识库进行对比一下,就可以发现两个的差别;大家进行学习的时候,也可以使用这个方式,对比一下两个方式的异同点; 2.4输出结果 这个测试的结果就是从我们的知识库里面搞得,我觉得这个也是很不错的

    96910编辑于 2025-05-05
  • 来自专栏XINDOO的专栏

    一文了解知识库背后的技术RAG

    为了让大家对知识库有更深入的理解,今天我们就来探讨下知识库背后的技术——RAG,它是什么又它为什么会诞生?它的能力和局限是什么?以及如何正确地评估和使用RAG技术! 然而在实际应用中,我们常常需要模型能够获取最新数据,以及一些私有或特定领域的专业知识。这些信息有个共同特点:它们都不在模型的预训练数据中——简单来说,模型并不知道这些信息,所以也就无法回答相关的问题。 答案是将这些私有信息作为参考资料(知识库)提供给大模型,让模型能够借助这些资料来回答问题,这就是RAG技术诞生的背景。   让我们用一个形象的例子来说明下这个问题。 这就像在RAG中提问的质量直接影响检索效果。 其次是参考资料的质量,它需要包含完整准确的知识点,并且内容组织合理,方便快速查找。这就像RAG系统中的知识库质量,直接决定了最终的表现。 具体来说,我们主要需要准备知识库并完成知识库的向量化。从知识库构建开始分析,RAG实现过程中最关键的环节就是对现有文档进行科学合理的处理。

    2.1K10编辑于 2025-10-27
  • 来自专栏Java后端项目

    派聪明RAG知识库项目实战--初次尝试总结

    1.前言 昨天是7月的最后一天,二哥上架了自己的这个RAG知识库的项目,取名叫做派聪明,实际上就是一个企业端的知识库的项目,覆盖了这个企业场景下面的这个知识库的大部分的内容,也就是说这个项目还是和AI 相关的一个项目,因为这个知识库目前也是我们的这个企业的主流技术了,尤其是这个RAG之类的,因为现在的这个企业为了自己本地的这个数据的安全性,以及这个隐私性,要么就是本地化 部署,或者就是这个本地知识库, 很少去使用这个现成的,这个是我自己的一个理解吧,其实我是对于这个知识库很感兴趣的; 熟悉我的这个朋友应该清楚,之前我写了一个腾讯云的云原生的CNB知识库的项目,当时写了一个文章,我确实对于这个知识库很感兴趣 ,但是自己的这个实操的能力上面确实非常的一般,这不,我再次去尝试这个二哥的RAG项目,简单的聊聊自己的经验吧; 其实这个项目里面的这个很多的技术栈我自己都是没有使用过的,比如这个redis我知道是缓存, ; 教程里面的很多内容都是在这个linux系统下面的,而且二哥的笔记本是mac的,我是用的都是windows下面进行这个相关的操作,因此这个很多内容还需要自己不断的进行摸索; 2.操作流程 首先是这个RAG

    72310编辑于 2025-08-01
  • RAG详解:让大模型看见你的私有知识

    用户提问时,系统从私有知识库中检索相关片段,把这些片段和问题一起发给大模型。模型结合真实信息来回答,而不是靠"记忆"里不知道哪来的东西生成。 RAG 的破局思路 RAG 提供了第三条路:不把数据交给模型,而是让模型"看到"它需要的那部分数据。 用户提问时,系统从私有知识库中检索相关片段,把这些片段作为上下文提供给大模型。 数据始终留在本地,模型获得了"感知"私有知识的能力。 RAG 的技术架构 RAG 的完整工作流程分为两个阶段:数据准备阶段(离线索引) 和 应用阶段(在线推理)。 RAG技术架构双阶段工作原理 数据准备阶段:构建知识的向量化索引 数据准备是离线过程,目标是将私有数据转化为可高效检索的向量形式。流程包含四个环节: 数据提取。 结语 RAG 技术通过将检索能力与大语言模型的生成能力相结合,为 LLM 的实际应用提供了一条切实可行的路。它解决了知识时效性、私有数据访问和幻觉抑制等核心问题。 当然,RAG 不是万能药。

    26410编辑于 2026-04-14
  • 检索增强生成(RAG):大模型的‘外挂知识库

    什么是RAG RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索技术与生成式大模型(LLM)的AI框架。 准确性高 检索增强:通过从外部知识库中检索相关文档,生成模型能够基于真实、可靠的信息生成回答,显著提高准确性。 减少幻觉:相比纯生成模型(如GPT),RAG减少了生成虚假或无关内容的可能性。 2. 灵活性高 多任务适用:RAG可以用于多种任务,如问答、对话生成、文档摘要、内容创作等。 动态知识更新:通过更新知识库RAG可以快速适应新领域或新知识,而无需重新训练生成模型。 4. 知识覆盖广 外部知识库RAG可以利用大规模知识库(如维基百科、专业数据库),覆盖广泛的主题和领域。 弥补模型知识局限:生成模型本身的知识受限于训练数据,而RAG通过检索弥补了这一不足。 5. 复杂性问题 系统复杂性高:RAG需要同时维护检索模型、生成模型和知识库,系统架构和调试复杂度较高。 调试难度大:检索和生成两个模块的协同工作可能导致问题定位和优化更加困难。 5.

    1.7K10编辑于 2025-05-31
  • AI智能知识库-传统RAG的末日-从RAG到Agentic Full-text Retrieval模式

    今天接着聊AI方面的话题,即AI智能知识库的发展演进方向究竟是如何的?传统模式的RAG增强检索还是否是最佳的一个选择? 大家都知道,我实际在前面专门发表过通过Cursor+Claude进行AI辅助写作的文章,包括我一直在思考一个关键问题,就是为何这种方式输出的文章质量明显好于基于RAG搭建的个人智能知识库。 原来我也一直没太深究这个问题,只是比较确认的就是将知识库进行Markdown格式化,并通过AI开发工具进行的辅助写作不是走的RAG检索增强和向量匹配这条路,但是核心实现思路究竟是如何的? 做法1:将历史文章构建一个RAG知识库,然后基于上面的提示语进行知识库问答,底层大模型采用Claude Sonect 4.0 做法2:将我输出的文章构建一个源代码项目,然后启动Claude Code CLI 如果你实际的文档很难想我个人知识库一样进行Markdown方式的结构化,而且文件大小特别大,同时你对检索的速度要求也高,那么你还是可以使用传统RAG的方式来获取知识答案。

    50011编辑于 2025-11-17
  • Ragas库实现RAG知识库自动化评估系统

    RAG知识库测试架构方案系统概述现有系统生产环境:SpringAI+Elasticsearch(向量检索+BM25)测试环境:Python+Ragas(测试集生成+指标评估)测试目标评估检索质量(召回率 ─────────────────────────────────┘Phase1:测试数据准备(Python)┌──────────────────────────────────────┐│1.加载知识库文档 自动生成问题││-生成参考答案││-生成ground_truth上下文││3.保存为标准格式(JSON)│└──────────────────────────────────────┘↓Phase2:RAG AnswerRelevancy││7.生成评估报告││8.可视化分析结果│└──────────────────────────────────────┘详细实施方案Step1:测试数据生成(Python)输入:知识库原始文档 评估集成测试执行器开发结果记录和存储Week3:分析和优化报告生成可视化开发持续监控系统最佳实践测试集多样性:包含不同难度、不同类型的问题版本控制:测试集和结果都要版本管理隔离测试环境:避免影响生产数据定期更新:随着知识库更新

    50100编辑于 2025-11-03
  • 来自专栏AI研习日志

    DeepSeek + Ollama + Cherry Studio搭建本地私有知识库

    如果想要搭建知识库,这里我们又不得不提到另外一个词——RAG.三、什么是RAG? 简单来说,它通过给模型提供一个外部的“知识库”,让模型在回答问题时可以“查资料”,从而给出更准确、更相关的答案。举个栗子: 想象一下,大模型就像一个学生,而RAG系统就是一本字典。 那么,当大模型遇到不懂的问题时,他也可以查字典,也就是RAG系统。 四、有了大模型,为什么还需要RAG? 这里,我先贴出一个 RAG 的运作流程图。好了,废话不多说,接下来就带大家具体实操了,如何用DeepSeek + Ollama + Cherry Studio在本地搭建私有知识库。五、搭建实操1. 因为我自己搭建的知识库会用到很多内部资料,出于安全性考虑今天我们重点介绍的是第一种方式———使用Ollama工具本地运行 DeepSeek R1 ,借助Cherry Studio嵌入本地资料,搭建本地私有知识库

    7.5K52编辑于 2025-02-26
  • 来自专栏YashanDB知识库

    【YashanDB知识库私有maven使用崖山JDBC驱动

    mvn install:install-file -Dfile=F:\developRE\yashan\dbeaver-for-yashandb-23.1-win32\win32\x86_64\dbeaver\configuration\org.eclipse.osgi\258\0\.cp\driver\yashandb-jdbc-1.5.1.jar -DgroupId=com.yashandb -DartifactId=jdbc -Dversion=1.5.1 -Dpackaging=jar

    22800编辑于 2025-03-03
  • 来自专栏Go语言学习专栏

    3 - RAG 知识库基础 - AI 超级智能体项目教程

    本节重点 通过为 AI 面试助手应用添加知识问答功能,入门并实战企业主流的 AI 开发⁠场景 —— RAG 知识库,掌握基于 Spring AI 框架实现 RAG 的两种方式。 具体内容包括: AI 面试助手问答需求分析 RAG 概念(重点理解核心步骤) RAG 实战:Spring AI + 本地知识库 RAG 实战:Spring AI + 云知识库服务 友情提示:由于 AI 其中⁠,知识的来源可能来源于网络,也可能是自己公司私有的数据,从而让 AI 提供更精准的服务。 AI 面试助手应用的潜在需求 对于我们的AI 面试助手,同样可以利用 AI 知识问答满足很多⁠需求。 想要在程序中让 AI 使用知识库,首先建议利用一个 AI 开发⁠框架,比如 Spring AI;然后可以通过 2 种模式进行开发 —— 基于本地知识库或云知识库服务实现 RAG。 由于是第一个 RAG 程序,我们参考标准的 RAG 开发⁠步骤并进行一定的简化,来实现基于本地知识库的 AI 知识问答应用。

    30510编辑于 2026-03-17
  • 来自专栏Spring AI 进阶之路

    Spring AI 进阶之路03:集成RAG构建高效知识库

    本文将手把手带你走完整个流程:从搭建向量数据库,到将私有文档“喂”给AI,最终实现一个可以随时在“通用模式”和“知识库模式”间切换的智能聊天机器人。 1.前端改造:提供上传入口和模式开关首先,我们需要改造前端页面,增加两个核心功能:一个文件上传按钮,用于提交我们的知识库文档;一个“知识库”开关,用于在普通对话和RAG对话之间自由切换。 至此,我们的知识库已经成功“喂”给了AI的大脑!实现RAG增强对话知识入库后,最关键的一步就是如何在对话中“用”上它。 这种精细的指令是保证RAG效果的关键。测试完成了编码后,让我们进行测试,看看AI开启“知识库”前后有什么不同。1.测试一:关闭知识库开关我们问一个关于产品的问题:“AuraHub是什么?” 通过整合Redis向量数据库和SpringAI,我们成功地为AI应用构建了一个外部知识库,实现了完整的RAG流程。

    1.4K00编辑于 2025-12-07
领券