搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏《三桥君 | AI产品方法论》
掌握这5个要点，选对Embedding模型助力RAG系统
在RAG系统中，Embedding模型的质量直接决定了系统在理解用户查询、检索相关文档以及生成高质量回答方面的能力。 2. E5 - mistral - 7B 适合动态调整语义密度的复杂系统，能够根据任务需求灵活调整语义表示。 4. E5 - mistral - 7B 适合企业级部署和智能客服系统，能够在高并发环境下稳定运行。四、如何选择合适的Embedding模型 1. 明确任务需求首先，你需要明确你的RAG系统的任务需求。比如，如果你的系统需要处理多语言长文档检索，那么BGE - M3可能是一个不错的选择。比如，如果你的系统需要支持本地部署，那么你需要选择支持本地部署的模型。如果你的系统需要支持云端部署，那么你需要选择支持云端部署的模型。 5. 考虑语言支持最后，你还需要考虑模型的语言支持。
40610编辑于 2025-08-28
来自专栏《三桥君 | AI产品方法论》
掌握这5个要点，选对Embedding模型助力RAG系统
然而，许多开发者在构建RAG系统时，往往将注意力集中在生成模型上，而忽视了Embedding模型的选择。这种忽视可能导致系统在语义理解、检索精度和生成质量上大打折扣。通过重新审视和优化Embedding模型，你将能够为你的RAG系统找到真正的“完美搭档”，从而显著提升系统性能和用户体验。二、Embedding模型的重要性1. E5 - mistral - 7B适合动态调整语义密度的复杂系统，能够根据任务需求灵活调整语义表示。4. E5 - mistral - 7B适合企业级部署和智能客服系统，能够在高并发环境下稳定运行。四、如何选择合适的Embedding模型1. 明确任务需求首先，你需要明确你的RAG系统的任务需求。比如，如果你的系统需要支持本地部署，那么你需要选择支持本地部署的模型。如果你的系统需要支持云端部署，那么你需要选择支持云端部署的模型。5. 考虑语言支持最后，你还需要考虑模型的语言支持。
41510编辑于 2025-07-15
来自专栏自然语言处理
RAG5个常见错误
向量数据库并非硬性规定几乎互联网上所有关于RAG的教程都使用向量存储。如果你一直在搜索RAG相关内容，你就会明白我们在说什么。基于向量的检索无疑是RAG成功的重要因素。 RAG可以从互联网、关系型数据集、Neo4J中的知识图谱，或者这三者的组合中检索信息。在许多情况下，我们注意到混合方法往往能带来更好的性能。对于客户聊天机器人，你可能需要授予RAG访问部分客户数据库的权限，这可能是一个关系型数据库。公司的知识管理系统可能会创建知识图谱并从中检索信息，而不是使用向量存储。从定义上讲，所有这些都是RAG。然而，确定使用哪些数据源的过程并不是很直接。你需要尝试各种选项，了解每种方法的优缺点。接受或拒绝某个想法的原因可能受到技术和业务考虑的双重影响。分块是RAG中最具挑战性和最重要的部分当上下文中包含不相关信息时，LLM往往会失控。防止RAG中出现幻觉的最佳方法是分块。现代LLM可能支持更长的上下文长度。
27110编辑于 2025-04-26
来自专栏自然语言处理
5个开源RAG框架对比
还在为RAG应用开发头疼吗？别急，今天给大家推荐五款完全开源免费的RAG框架，覆盖自动优化、多模态处理、本地部署、生产环境支持等多种场景，助你轻松搞定RAG开发！ 1. AutoRAG：自动优化，省心省力核心优势：自动寻找最优RAG流程，告别手动调参！ ✨ 特色功能：支持用你的评估数据测试不同RAG模块，找到最适合的方案。适用场景：适合需要优化RAG系统性能的开发者。 https://github.com/Marker-Inc-Korea/AutoRAG 2. 适用场景：适合企业级应用部署，需要稳定可靠的RAG框架。 https://github.com/truefoundry/cognita 5. ✨ 特色功能：提供50+针对企业任务优化的小型模型支持完整的RAG生命周期适用场景：适合企业环境中需要专业化、轻量级解决方案的场景。
3.7K11编辑于 2024-12-31
来自专栏自然语言处理
【RAG最新研究】优化RAG系统的最佳实践与深度解析
简单来说，RAG系统通过结合语言模型和外部知识库来生成更准确的回答，但之前的研究并没有深入探讨哪些因素（比如模型大小、提示设计、知识库大小等）对系统性能的影响最大。 RAG系统的评估： Semnani et al. (2023) 和 Chang et al. (2024) 研究了大型语言模型（LLMs）生成不准确信息的问题，并探讨了RAG系统如何解决这一问题。设计RAG系统变体：基于这些研究问题，论文设计了多种RAG系统的变体，包括查询扩展模块、检索模块和文本生成模块。通过这些步骤，论文系统地研究了RAG系统的架构，并提出了具体的改进措施，为开发和优化RAG系统提供了实证基础和理论支持。论文做了哪些实验？ RAG方法的具体实现：包括使用T5模型进行查询扩展、FAISS用于向量索引和相似性搜索、Sentence Transformer作为文本编码器等。
1K10编辑于 2025-01-16
来自专栏菩提树下的杨过
langchain4j 学习系列(5)-RAG
继续我们的langchain4j之旅，今天来看看RAG如何实现，“RAG萌宠新手盆友们”建议先看看B站大佬的视频RAG 工作机制详解—哔哩哔哩_bilibili，核心步骤就是下面这3张图：最简单的RAG prompt_eval_count":11} 3、重排/生成 private interface Assistant { String chat(String userMessage); } /** * 基于RAG "done_reason":"stop","total_duration":1059949995,"prompt_eval_count":21,"eval_count":22} 从日志上看，先做了1次RAG
27610编辑于 2025-12-24
来自专栏啄木鸟软件测试
RAG系统测试团队如何成功转型？
但一个严峻现实正浮出水面：某头部银行上线的RAG客服系统在灰度阶段遭遇37%的‘幻觉响应率’（即答案看似合理却与检索源矛盾），而其测试团队仍沿用传统API+UI自动化脚本覆盖逻辑，漏测率达68%。 RAG系统本质是‘检索+生成’双引擎耦合体，其质量风险分布远超传统软件： - 检索层失效：向量数据库召回不相关文档（如语义漂移、分块粒度失当）、元数据过滤逻辑错误、多跳检索链断裂； - 生成层失准：LLM 模型微调任务； - 第5-6月：输出RAG质量门禁标准（如Faithfulness<0.85禁止上线），并接入CI/CD流水线，使RAG版本发布周期从2周压缩至72小时。结语：测试的终极价值不是‘发现多少Bug’，而是‘守护多少信任’ RAG不是另一个待测系统，它是人机协作的新契约界面。当用户向AI提问时，他交付的不仅是query，更是对专业性的托付。测试团队的转型，表面是技能升级，内核是角色进化——从保障功能正确，到捍卫事实可信；从验证系统行为，到审计认知过程。
24810编辑于 2026-03-09
来自专栏DeepHub IMBA
Agentic RAG：用LangGraph打造会自动修正检索错误的 RAG 系统
本文要做的就是用 LangGraph 做流程编排、Redis 做向量存储，搭一个生产可用的 Agentic RAG 系统。涉及整体架构设计、决策逻辑实现，以及状态机的具体接线方式。系统架构拆解整个系统拆成六个模块：配置层负责环境变量和 API 客户端的初始化工作。Redis 连接串、OpenAI 密钥、模型名称全部归拢到这里统一管理。系统不会因为一次检索失败就直接给出一个牵强附会的答案，它会调整策略重新尝试。这个环节的价值在于拦截那些本会导致标准 RAG 胡说八道的情况，与其硬着头皮从不靠谱的上下文里编答案，不如给系统一次修正查询的机会。总结标准 RAG 把检索当黑盒，查询丢进去、文档出来，至于相不相关全凭运气。Agentic RAG 打开这个黑盒在关键位置加了质量控制。
67710编辑于 2026-01-12
来自专栏啄木鸟软件测试
RAG系统测试实战：未来已来
在啄木鸟软件测试团队服务的17家金融与政务客户中，超63%的RAG项目因缺乏系统化测试方案，在上线后3个月内遭遇知识召回率骤降、政策问答误答率超标或审计合规风险暴露。一、RAG系统测试的三大认知跃迁 1. 从「功能正确」到「事实可信」 RAG的本质是“检索+生成”双阶段协同，测试必须解耦验证：检索模块是否召回了最相关文档片段？生成模块是否忠于检索证据、未引入虚构？ Step 2：自动化「双轨验证流水线」开发Pytest插件rag-testkit，支持并行执行： - 检索轨：调用向量库API获取top-5 chunk，验证其与query的余弦相似度>0.65、覆盖全部标注关键词 5），任一维度<3即告警。 Step 3：混沌工程注入「现实噪声」 RAG系统最脆弱点常在边缘场景：PDF解析错位导致表格文字断裂、OCR识别将“2023年”误为“2028年”、向量库冷热数据混布引发召回漂移。
15710编辑于 2026-03-31
来自专栏喔家ArchiSelf
你的RAG系统安全么？
因此，在享受 RAG 带来的便利的同时，也需要采取相应的措施来防范潜在的安全问题。 2. RAG 的安全威胁基于 RAG 的系统面临三大主要威胁： 2.1. 系统瘫痪风险（DDoS） RAG 对大规模知识库的检索需要大量计算资源。如果系统设计存在漏洞，攻击者可能通过发送海量请求耗尽服务器资源，导致服务变慢甚至完全停摆。对AI Agent的影响：如果 RAG 系统为其他 AI 提供决策依据，攻击者可能通过篡改数据误导 AI 执行危险操作，比如调用错误的工具。这些因素相互关联，共同决定了 RAG 系统的安全水平。这些措施共同构建起多层防御体系，从数据源头控制到系统运行监控，形成闭环保护。通过技术手段与人工策略的有机结合，我们才能在享受 RAG 技术便利的同时，有效应对潜在安全威胁。 5. （文本过滤/嵌入校正）信息敏感 5.RAG存储了哪些信息类型？（共有/私有/敏感/PII）6.如何保护敏感信息的非授权访问？7.是否执行了渗透测试？8.是否执行了去标识化？
69610编辑于 2025-06-30
来自专栏自然语言处理
RAG 系统中的偏差是什么？
然而，最近在 RAG系统中的发现，突显了基于 RAG 的大型语言模型的问题，例如 RAG 系统中偏差的引入。 RAG 系统中偏差的概述 RAG是一种人工智能技术，通过整合外部来源来增强大型语言模型。它允许模型对其产生的信息进行事实核查或校对。如果 RAG 系统引用的外部数据集未经开发者消除偏差和刻板印象，则可能会嵌入偏差。这些嵌入捕获了文本的语义含义，RAG 系统使用它们从知识库中获取相关信息，然后再生成响应。考虑到这种关系，研究表明，反向偏置嵌入器可以消除整个 RAG 系统的偏差。最后，研究人员得出结论，大多数消除偏差的努力都集中在 RAG 系统的检索过程上，正如之前讨论的那样，这是不够的。
25910编辑于 2025-04-09
来自专栏HuggingFists
如何使用ElasticSearch搭建LLM-RAG系统
在之前的案例视频中我们演示了使用Milvus向量数据库和腾讯向量数据库实现RAG的场景应用。今天我们演示下利用ES的向量数据存储能力来实现RAG，包括三个部分：连接ES数据库并建表；数据写入ES向量数据库流程；问答对话流程。整个流程的其他创建过程可参考如下视频：《轻松玩儿转数据分析系列-低代码玩转LLM-RAG》上图是用Milvus数据库实现的，现在将其替换为ES算子，如下选择ES写出算子替换掉Milvus写出算子后 windows版】Github: https://github.com/Datayoo/HuggingFists4Win/tree/main百度网盘：https://pan.baidu.com/s/1JXgd5bEfSX8RsDb0WTocdw
87010编辑于 2024-05-06
来自专栏Datawhale专栏
RAG 作者：RAG 已死，RAG 万岁！
该 LinkedIn 帖子：一些值得注意的 RAG“死亡宣告”包括： 2023 年 5 月：Anthropic 的 Claude，上下文窗口达 10 万 token 2024 年 2 月：Google MCP 简化了 Agent 与 RAG 系统（及其他工具）的集成我们在生产环境中看到的最复杂的 AI 系统结合了这些方法，根据各自的优势来使用每种工具，而不是宣布某一个获胜并将其他工具抛弃。它们服务于不同的目的，并作为一个系统协同工作。RAG、微调和大型上下文窗口在 AI 中也是如此。结论我们不需要在 RAG 与长上下文窗口、微调或 MCP 之间做出选择。这个网站将作为一个活生生的证明，展现检索在 AI 系统中持久的重要性，并且每当下一波“RAG 已死”的帖子不可避免地出现时，它都会更新。如果你的系统无法利用你的专有数据，持续提供过时信息，或者缺乏你所需的专业知识，那么让我们谈谈。我们构建了一个将智能检索与前沿 LLM 相结合的系统，来解决这些长期存在的难题。
70710编辑于 2025-04-24
来自专栏云云众生s
影响生产RAG流水线5大瓶颈
这些是可能阻碍RAG流水线在生产LLM环境中性能的主要潜在瓶颈。译自 5 Bottlenecks Impacting RAG Pipeline Efficiency in Production，作者 Janakiram MSV。其主要目标是通过将通用语言模型与外部信息检索系统集成，增强通用语言模型的能力。这种混合方法旨在解决传统语言模型在处理复杂、知识密集型任务方面的局限性。通过这样做，RAG显著提高了生成响应的事实准确性和可靠性，尤其是在需要精确或最新信息的情况下。 RAG以其增强语言模型知识的能力脱颖而出，使其能够产生更准确、上下文感知和可靠的输出。即使一些 LLMs 具有较大的上下文窗口，这并不意味着我们可以跳过 RAG 流水线的某些阶段，一次性传递整个上下文。
56410编辑于 2024-03-28
来自专栏全栈开发工程师
【RAG】001-RAG概述
【RAG】001-RAG概述 0、整体思维导图下面的知识是基于一个视频教程结合 AI 生成的笔记，我也看了一遍，有了一些印象，但这种印象很快就会消失，知识也就消失了，为了使得知识在我的大脑中停留更长的时间补充1：RAG 基本逻辑补充2：RAG 知识库基本逻辑一、RAG 介绍 1、LLM 的主要局限性大语言模型（LLM）尽管功能强大，但仍存在以下明显的局限性：时效性问题：模型的知识在预训练后就固定了概述 1、RAG 的概念 RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合了检索和生成技术的文本处理方法，主要用于提高语言模型的输出质量。系统时，需要注意以下几点：数据质量控制：确保知识库数据的准确性和时效性定期更新和维护知识库内容建立数据质量审核机制性能优化：选择合适的向量数据库优化检索策略和参数合理设置缓存机制系统监控：跟踪系统响应时间监控检索准确率收集用户反馈并持续优化三、RAG vs Fine-tuning（微调） 1、两种方法的基本概念 RAG：通过实时检索相关信息来增强模型输出
75010编辑于 2025-03-25
来自专栏DeepHub IMBA
使用CLIP和LLM构建多模态RAG系统
在本文中我们将探讨使用开源大型语言多模态模型(Large Language Multi-Modal)构建检索增强生成(RAG)系统。什么是RAG 在人工智能领域，检索增强生成(retrieve - augmented Generation, RAG)作为一种变革性技术改进了大型语言模型(Large Language Models)的能力 RAG通过确保响应以权威来源为基础，减少关键部门误导性建议的风险。 4、具有成本效益的适应性: RAG提供了一种经济有效的方法来提高AI输出，而不需要广泛的再训练/微调。 annual, biennial and perennial plants, and vary in habit from dwarf arctic and alpine species under 5 query_image = '/kaggle/input/flowers/flowers/rose/00f6e89a2f949f8165d5222955a5a37d.jpg' raw_image =
2.4K11编辑于 2024-01-17
从 0 到 1 构建 RAG 检索增强系统
本文从0到1系统讲解RAG的核心原理、系统结构及落地步骤，帮助读者构建一个可用、可扩展的RAG检索增强系统，为智能体和企业级AI应用提供可靠基础。目录一、什么是RAG二、为什么需要RAG三、RAG系统核心架构四、从0到1搭建RAG系统五、一个典型RAG流程示例六、常见问题与优化经验七、总结一、什么是RAGRAG（检索增强生成）是一种将信息检索与文本生成结合的技术框架三、RAG系统核心架构一个标准RAG系统通常包含以下模块。1.文档处理模块负责数据准备：文档清洗分段切分去噪处理高质量数据是RAG效果的基础。 5.生成模块将检索结果与问题一起输入大模型：构建Prompt引导模型基于资料回答控制生成范围生成阶段决定最终体验。四、从0到1搭建RAG系统下面给出一个通用落地路线。从0到1构建RAG系统，核心在于：1️⃣高质量数据2️⃣合理检索策略3️⃣清晰Prompt约束当这三点做到位，RAG系统即可在真实业务中发挥稳定价值。
61710编辑于 2026-02-02
来自专栏机器学习原理
rag
RAG技术结合了检索系统和生成模型的优势，旨在提高回答问题和生成自然语言文本的准确性和一致性。 RAG工作流程 RAG的工作流程可以分为以下几个步骤：用户查询：用户提出一个查询，系统首先会将这个查询传递给检索模型。信息检索与问答系统在信息检索和问答系统中，RAG技术可以显著提高系统的准确性和用户满意度。传统的问答系统通常依赖于检索模型找到相关文档，然后从这些文档中抽取答案。 RAG技术可以在知识图谱构建过程中发挥重要作用。通过利用检索模型从大规模文档库中找到最新的相关信息，RAG系统可以识别出新的实体和关系。实时性和响应速度：尽管RAG技术在生成准确答案方面有显著优势，但其双阶段流程可能会影响系统的实时性和响应速度。这对于需要即时回答的应用场景（如在线客服、实时问答系统）提出了更高的要求。
60511编辑于 2024-06-27
来自专栏产品笔记
如何引入重排序提升RAG系统的效果？
之前介绍了在RAG系统中使用混合检索，而混合检索将不同的检索技术的优势，如向量检索适合语义模型匹配，而关键词检索适合精准匹配。将不同的优势结合互补单一检索的劣势，获得更好的召回结果。引入重排序是对现有RAG系统的一种增强，无需进行重大改造，以一种简单且低复杂度的方式改善RAG系统的回答效果。
1.4K10编辑于 2024-03-18
来自专栏啄木鸟软件测试
2026年RAG系统测试工具深度对比
引言：RAG已进入‘可信性临界点’ 2026年，检索增强生成（RAG）系统正从PoC走向规模化落地——金融风控文档问答、政务知识中枢、医疗辅助诊断等场景中，RAG不再是‘锦上添花’，而是业务连续性的关键链路例如某省级医保政策问答系统中，用户问‘门诊慢特病报销比例’，系统检索出2023年试点文件（已废止），召回率100%，但语义相关性熵值高达0.89（理想≤0.2）。在某银行信贷FAQ系统测试中，它成功捕获一条高置信度幻觉回答——‘LPR加点可协商’，实际政策明确禁止加点浮动，该结论未在任一检索文档中出现，且TruEra自动回溯至原始PDF第17页脚注，实现根因可追溯典型案例如：用户查询‘暴雨红色预警响应流程’返回超时，Trace Graph直接定位到‘重排序模块因GPU显存溢出触发降级，启用线性搜索导致Top-5召回质量下降39%’，而非笼统归因为‘LLM响应慢’ 四、安全与合规：内置监管沙盒，不止于红队测试 2026年，国内《生成式AI服务安全评估要求》（GB/T 44512-2026）正式实施，明确要求RAG系统需通过‘敏感信息泄露路径审计’和‘知识边界越界检测
48910编辑于 2026-03-04

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

掌握这5个要点，选对Embedding模型助力RAG系统

掌握这5个要点，选对Embedding模型助力RAG系统

RAG5个常见错误

5个开源RAG框架对比

【RAG最新研究】优化RAG系统的最佳实践与深度解析

langchain4j 学习系列(5)-RAG

RAG系统测试团队如何成功转型？

Agentic RAG：用LangGraph打造会自动修正检索错误的 RAG 系统

RAG系统测试实战：未来已来

你的RAG系统安全么？

RAG 系统中的偏差是什么？

如何使用ElasticSearch搭建LLM-RAG系统

RAG 作者：RAG 已死，RAG 万岁！

影响生产RAG流水线5大瓶颈

【RAG】001-RAG概述

使用CLIP和LLM构建多模态RAG系统

从 0 到 1 构建 RAG 检索增强系统

rag

如何引入重排序提升RAG系统的效果？

2026年RAG系统测试工具深度对比

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐