首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI应用开发实践

    langchain4j 之 Advanced RAG

    langchain4j 中的 Advanced RAG 涉及到诸多策略,今天和大家聊一聊这里涉及到的一些策略。 二 Query 2.1 Query 包含的内容 在 RAG 流程中,Query 就是用户提出的问题。比如你问"糖醋排骨怎么做?"这就是一个 Query。 4.2.4 其他 其他的还有像 AzureAiSearchContentRetriever 主要负责和 Azure AI 进行交互,Neo4jContentRetriever 则主要负责和 Neo4j with LangChain4j?") with LangChain4j?")

    36310编辑于 2026-03-26
  • LangChain4j 标准 RAG 实战

    LangChain4j - LangChain4j快速入门实战 2. LangChain4j - 多模态开发踩坑实录 3. LangChain4j - 系统提示词稳住AI 4. LangChain4j - 注解式AI服务实战 5. LangChain4j - 让AI不再失忆 6. LangChain4j - LangChain4j 结构化输出实战 7. LangChain4j - RAG落地实战 经过上一篇 LangChain4j - RAG落地实战, 已经了解了极简版 RAG,那么本篇呢,继续延续上篇内容开展。 标准版 RAG 下面来试试标准版 RAG 实现,为了更好的效果,我们需要: • 加载 Markdown 文档并按需切割 • Markdown 文档补充文件名信息 • 自定义 Embedding 模型 • api-key: <You API Key here> 新建 rag.RagConfig,编写 RAG 相关的代码,执行 RAG 的初始流程并返回一个定制的内容检索器 Bean: /**

    25210编辑于 2026-04-29
  • 来自专栏AgenticAI

    实战微软新一代RAG:GraphRAG强大的全局理解能力,碾压朴素RAG

    微软近日开源了新一代RAG框架GraphRAG[1],以解决当前RAG在大型语料库上全局理解问题。 当前RAG主要聚焦于局部检索能力,即根据查询语句在向量库中匹配部分知识,然后通过大型语言模型合成这些检索到的信息,生成一个自然流畅的回答。 下一篇,我们将使用LlamaIndex测试同样问题进行对比全局理解能力。 1. **这类问题需要查询聚焦摘要(Query focused summary)而不是像我们上述RAG系统那样显式检索,现有的QFS方法无法扩展到RAG系统索引的文本量。 王林对“仙人”的概念着迷,反映了他对于超自然能力和永生的渴望。他的故事中还包含了与Heng Yue Faction青年的互动,这些交流影响了社区的动态和选拔过程。

    1.5K10编辑于 2025-03-18
  • 来自专栏码匠的流水账

    聊聊langchain4j的RAG

    序本文主要研究一下langchain4j的RAG概述RAG(Retrieval-Augmented Generation)即检索增强生成,它通过检索来获取相关信息,注入到prompt,然后用增强的prompt 实现LangChain4j 提供了三种RAG(Retrieval-Augmented Generation,检索增强生成)的实现方式:Easy RAG:这是最简单的方式,适合初学者快速上手。 Easy RAGpom.xml<dependency> <groupId>dev.langchain4j</groupId> <artifactId>langchain4j-easy-rag RAG Flavors**LangChain4j offers three RAG flavors:* **Easy RAG:** The simplest, quickest way to get LangChain4j 提供了三种RAG(Retrieval-Augmented Generation,检索增强生成)的实现方式:Easy RAG、Naive RAG、Advanced RAG

    95310编辑于 2025-03-17
  • 来自专栏AI 大数据

    RAG技术:通过向量检索增强模型理解与生成能力

    摘要本文介绍了RAG(检索增强生成)技术的原理与应用,特别是如何通过向量检索系统增强生成模型对外部知识的理解和生成能力RAG技术通过结合向量检索与生成模型,有效解决了这些问题,提高了模型对外部知识的理解和生成能力RAG技术原理RAG技术主要通过“检索+生成”两个阶段结合来处理复杂的问题。 技术系统架构图优化与改进为了提升RAG技术的效果,可以持续优化生成模型的训练数据和参数配置,以提高其对自然语言的理解能力和语义分析准确性。 Q2:如何评估RAG技术的效果?A2:可以通过对比实验来评估RAG技术的效果。例如,将RAG技术与传统的基于关键词检索的方法进行比较,观察在相同查询条件下,RAG技术是否能够生成更准确、更相关的回答。 总结本文介绍了RAG技术的原理与应用,特别是如何通过向量检索系统增强生成模型对外部知识的理解和生成能力

    64510编辑于 2025-01-28
  • 来自专栏码匠的流水账

    聊聊langchain4j的Naive RAG

    序本文主要研究一下langchain4j的Naive RAG示例public class Naive_RAG_Example { /** * This example demonstrates 技术,Easy RAG使用了EmbeddingStoreIngestor来隐藏了文档解析、分割、嵌入、嵌入存储,Naive RAG亦可使用。 EmbeddingStoreContentRetrieverdev/langchain4j/rag/content/retriever/EmbeddingStoreContentRetriever.javapublic 小结langchain4j提供了EmbeddingStoreContentRetriever来开启Naive RAG的功能,EmbeddingStoreContentRetriever.builder( docNaive RAG

    46300编辑于 2025-03-19
  • 来自专栏PHP在线

    编程能力4 种境界

    人们把一个人能够到达的能力描述成四个阶段。 这篇文章里,我将试图把这种分类应用的我们每天都会应用的技能上,它就是编程。 阶段一:无意识,无能力 约 翰是一个年轻的网站开发者。 而且更悲哀的是,他在论坛里的能力值比你我加起来都高。 约翰是无意识的无能力。 阶段二:有意识的无能力 马 克是个数学老师。 马克是有意识的无能力 阶段三:有意识的有能力 自 从阿德拿起他的第一本HTML书至今已经有两年了。 很显然这是一条不归路,对于阿德来说,每天思考的问题都是如何去提高自己喜爱的这个专业。 阿德是有意识的有能力。 阶段四:无意识的有能力 这是编程水平的终极阶段。 它不仅仅是知识积累的结果,更是一系列的逻辑规则在数年里慢慢的刻印到一个人的脑海里的结果。 值得一提的是,一些作者提出第五中阶段:成熟的有能力,定义为有能力去教育和传承他所学的、甚至是还未意识到的知识。

    78460发布于 2018-03-08
  • 来自专栏码匠的流水账

    聊聊langchain4j的Advanced RAG

    序本文主要研究一下langchain4j的Advanced RAG核心流程将UserMessage转换为一个原始的QueryQueryTransformer将原始的Query转换为多个Query每个Query *

    * Advanced RAG in LangChain4j is described here: https://github.com/langchain4j/langchain4j DefaultQueryTransformerdev/langchain4j/rag/query/transformer/DefaultQueryTransformer.javapublic class ReRankingContentAggregatordev/langchain4j/rag/content/aggregator/ReRankingContentAggregator.javapublic ContentInjectordev/langchain4j/rag/content/injector/ContentInjector.java@Experimentalpublic interface

    73710编辑于 2025-03-21
  • 来自专栏菩提树下的杨过

    langchain4j 学习系列(5)-RAG

    继续我们的langchain4j之旅,今天来看看RAG如何实现,“RAG萌宠新手盆友们”建议先看看B站大佬的视频RAG 工作机制详解—哔哩哔哩_bilibili,核心步骤就是下面这3张图: 最简单的RAG error: " + e.getMessage() + "\"}"); } } 略做解释: 为了简单起见, 这里分片我们略过,直接手动用二个句子,当成2个分片 使用langchang4j prompt_eval_count":11} 3、重排/生成 private interface Assistant { String chat(String userMessage); } /** * 基于RAG "" + e.getMessage() + "\"}"); } } 日志输出: 2025-12-03T21:06:00.218+08:00 INFO 16956 --- [langchain4j-study "done_reason":"stop","total_duration":1059949995,"prompt_eval_count":21,"eval_count":22} 从日志上看,先做了1次RAG

    37510编辑于 2025-12-24
  • 来自专栏码匠的流水账

    聊聊langchain4j的核心RAG APIs

    序本文主要研究一下langchain4j的核心RAG APIs核心RAG APIslangchain4j提供了一套丰富的API来构建自定义的RAG(检索增强生成)pipelines,从简单的到高级的都有涵盖 (langchain4j-document-loader-amazon-s3)、AzureBlobStorageDocumentLoader(langchain4j-document-loader-azure-storage-blob (langchain4j-document-parser-apache-pdfbox)、ApachePoiDocumentParser(langchain4j-document-parser-apache-poi 提供了一套丰富的API来构建自定义的RAG(检索增强生成)pipelines,包括DocumentLoader、DocumentParser、DocumentTransformer、DocumentSplitter doccore-rag-apis

    1.3K10编辑于 2025-03-18
  • 来自专栏DeepHub IMBA

    使用知识图谱提高RAG能力,减少大模型幻觉

    4、向用户显示检索到的客户配置文件或相关信息,例如显示他们的姓名、人口统计数据或购买历史记录。 知识图谱 知识图谱是表示实体或概念及其关系(如事实、属性或类别)的节点和边的集合。 2、使用图查询语言,例如Cypher(在Neo4j中使用)或Gremlin,从参考用户节点遍历图。指定要探索的模式或关系。 所以下面我们使用一个简单的例子来介绍如何使用知识图谱构建RAG。 LLM HF_TOKEN = "api key DEEPHUB 123456" llm = HuggingFaceInferenceAPI( model_name="HuggingFaceH4/ 对于RAG,知识图谱是一个非常好的应用方向。 作者:Plaban Nayak 喜欢就关注一下吧: 点个 在看 你最好看!

    1.9K11编辑于 2024-01-08
  • 来自专栏DeepHub IMBA

    RAG流程优化(微调)的4个基本策略

    RAG简单回顾 RAG主要有两个过程。第一个是“数据收集过程”,它收集来自不同来源的数据,将其转换为文本,将其分割成较小的、连贯的和语义相关的部分,并将结果存储在矢量数据库中。 4、提供模型的最后提示:制作有效提示以提高输出质量。 RAG的A/B测试 A/B测试可以比较每个组件具有不同配置的两个版本,确定哪个版本的性能更好。 上下文相关性和上下文召回是检索度量,分别度量从向量数据库检索正确数据块和获得所有必要信息的能力。 = pd.DataFrame(rag_dataset) rag_eval_datset = Dataset.from_pandas(rag_df) # Return the lragas dataset return rag_eval_datset def get_metrics(rag_dataset): """ For a RAG Dataset

    2.3K10编辑于 2024-07-01
  • 来自专栏自然语言处理

    GraphRAG vs 传统 RAG:如何通过知识图谱提升 AI 检索能力

    相比传统 RAG 仅能独立检索文本片段的局限性,GraphRAG通过构建实体关系图谱实现了信息间的连接,让 AI 能更完整地理解和检索复杂的关联信息,从而生成更准确和连贯的回答 问题背景: 想象有一本详细记录某人 现在我们想要总结这个人的所有成就 传统 RAG 的局限性: 只能获取有限数量(top-k)的相关文本片段 各个文本片段是独立检索的 LLM 需要自行推断这些片段之间的联系 可能会遗漏重要信息 GraphRAG

    91110编辑于 2025-01-05
  • 来自专栏新智元

    闲来无事,我测了测国产大模型的RAG能力

    问题四:我的奖学金有2万块,可以同时买iPhone16pro max1tb和AirPods4吗? 模型A在一番检索之后发现AirPods 4有两个版本,于是分别计算出了对应的总价。 此外,第4点面对外界质疑的内容,也不属于融资的关键过程。 问题七:微软和亚马逊的大模型研发在2023年哪个对生态系统影响更大? 对于这个问题,模型A直接把结论前置,观点鲜明,态度明确。 上面这些场景所考验的,就是模型在RAG(Retrieval-Augmented Generation)检索增强生成方面的能力RAG这个概念,最早在2020年的一篇划时代论文中首次提出,它巧妙地融合了LLM和信息检索的能力。 百度搜索增强技术深度融合大模型能力和搜索系统,构建了「理解-检索-生成」的协同优化技术。

    43900编辑于 2025-02-04
  • TextIn文档树引擎,助力RAG知识库问答检索召回能力提升

    今天,我们将介绍另一项重要指标,也是业内面对的一项普遍性难点:标题识别,以及它如何影响数据清洗与RAG系统开发。 TextIn团队研发了文档树引擎这一关键技术,针对性提升标题检测能力。物理版面分析技术支持对目标区块的检测与元素识别,并利用标题区块的高度(即字号)判断一级、二级、三级、......N级标题。 以RAG(Retrieval-Augmented Generation)这一主要场景为例,在系统开发过程中,Chunking(分块)对整体性能有着显著的影响。 RAG在进行信息检索的时候需要将检索出来的有价值的文本段送给模型,模型才能生成可靠有用的内容。 目前,TextIn文档解析工具已在RAG知识库问答中发挥重要功能,文档树引擎在年报、财报、行研报告等金融文件领域展现了较为明显的优势。

    85310编辑于 2024-08-13
  • 来自专栏开源心路

    GLM-4 能力接近ChatGPT4和Claude 2.1

    逻辑推理 GLM-4 ChatGPT Claude-2 小结 ** 逻辑推理能力GLM-4、ChatGPT、Claude-2不分伯仲!** 工具调用 GLM-4 ChatGPT 小结 不相伯仲! GLM-4 新一代基座大模型GLM-4,整体性能相比GLM3全面提升60%,逼近GPT-4;支持更长上下文;更强的多模态;支持更快推理速度,更多并发,大大降低推理成本;同时GLM-4增强了智能体能力。 基础能力(英文):GLM-4 在 MMLU、GSM8K、MATH、BBH、HellaSwag、HumanEval等数据集上,分别达到GPT-4 94%、95%、91%、99%、90%、100%的水平。 指令跟随能力:GLM-4在IFEval的prompt级别上中、英分别达到GPT-4的88%、85%的水平,在Instruction级别上中、英分别达到GPT-4的90%、89%的水平。 对齐能力:GLM-4在中文对齐能力上整体超过GPT-4

    1.1K10编辑于 2024-01-19
  • 来自专栏多模态 / RAG / 知识图谱

    RAG 系列 02 — Advanced RAG

    配套阅读:《RAG系列01—NaiveRAG》《从NaiveRAG到AgenticRAG》引言:2025年3月,我参加了一家toBSaaS公司的技术评审会。那天的议题是"RAG系统下一阶段升级路线"。 一边写成功一边写失败→数据不一致增量同步延迟不一致→同一文档两边状态不同删除传播不同步→一边能搜到,一边搜不到没法做原子重建解法(按推荐度排序):方案适合坑Elasticsearch8.x/OpenSearch单引擎双能力新项目首选 理由:单引擎一致性问题消失BM25是ES的看家本领向量能力虽然不顶尖,但够用运维生态成熟,招人容易坑2:中文BM25的tokenizer默认是错的ES默认tokenizer对中文是单字切分,召回质量极差 六、三层评测:AdvancedRAG必须有的"质量护栏"NaiveRAG阶段只看4个指标(hit@k、fact_recall、forbidden_rate)。 工程师真正稀缺的能力,不是用最新模型,是知道什么时候该克制。

    28410编辑于 2026-06-09
  • 来自专栏我的安全视界观

    【应急能力提升4】实战应急响应经验

    然而在本专题中,考量或锻炼的就是这些自动化的能力变为手工化,应急同学不能使用现成的自动化工具,只能自己写或使用功能单一的开源工具; 从业务异常现象反向分析法:业务系统所在服务器的CPU使用率非常高,

    2.9K20编辑于 2022-08-31
  • 来自专栏用户3246163的专栏

    解构 TOGAF-4-如何建设架构能力

    需要让企业的关键组织意识到企业架构的价值,确定组织期望获得的架构能力,然后开始在企业建立架构能力。 那么什么才是架构能力呢?或者说架构能力应该包含什么? 先说说“能力”的定义吧,这是一个经常挂在嘴边的词,有时候我们会说一个人能力很强,有时候也会说一个公司不具备什么能力,那么究竟什么才是能力呢? 所以所谓架构能力就是组织或人基于流程和技术完成架构设计,实施,治理以及架构变更的东西。 弄清楚了架构能力的定义,下面看看 TOGAF 是怎么一步步识别架构能力,建设架构能力的。 ,可能是增加了新能力,可能是简化了某个旧能力的流程。 3 预备阶段的架构交付物 介绍完了预备阶段的实施步骤,最后总结一下预备阶段的架构交付物都有什么: [架构原则],在步骤 4 产出 [架构库],在步骤 1 产出初始化的架构库 [业务原则,业务目标和业务驱动因素

    1K30发布于 2021-12-01
  • 来自专栏机器学习原理

    rag

    这是因为这些模型在生成答案时完全依赖训练数据和参数,并没有利用外部知识库的能力。与此相对,检索模型可以访问大规模的文档库,找到与查询相关的信息,但在生成流畅的语言响应方面则表现欠佳。 RAG技术的原理 RAG(检索增强生成)技术是一种将信息检索和自然语言生成结合起来的创新方法。其核心思想是通过利用大规模的外部知识库来增强生成模型的回答能力,从而提高生成文本的准确性和相关性。 RAG工作流程 RAG的工作流程可以分为以下几个步骤: 用户查询:用户提出一个查询,系统首先会将这个查询传递给检索模型。 RAG技术的应用场景 RAG技术在众多实际应用场景中显示出其独特的优势,这是其他单一技术难以比拟的。下面我们详细探讨RAG技术的几个主要应用场景。 RAG技术的优势与挑战 RAG技术在很多方面展示了其显著的优势,但它也面临着一些挑战。以下我们将详细探讨RAG技术的优势和挑战。

    67811编辑于 2024-06-27
领券