首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏DeepHub IMBA

    DecEx-RAG:过程监督+智能剪枝,让大模型检索推理快6

    与传统 RAG 不同它让模型在推理过程中自主决定要不要检索、什么时候检索。这样就相当于给模型一套工具让它自己判断该用哪个。 如果继续的话用内部知识还是去检索外部信息?每一步模型都要做出终止决策 σₜ 和检索决策 δₜ。 执行阶段关注的是生成质量。不管是子问题还是最终答案,都要求高质量输出。这个阶段用过程级奖励来优化。 实测效果也是相当不错的,平均扩展时间从 743.2 秒压缩到 134.9 秒,快了将近 6 倍性能却几乎没有损失。 MDP 建模的技术细节 状态 S 是增量构建的,每一步都在历史中累积原始问题、子问题和对应的答案或检索文档。 在实际测试中单问题扩展时间从 743.2 秒降到 134.9 秒,6 倍提速而且可以保证性能不降。 训练流程 第一步是监督微调(SFT):从搜索树中抽取根到叶的最优推理链用来做标准监督学习。

    19810编辑于 2026-01-12
  • 批量关键词检索:使用腾讯云ADP搭建智能信息检索智能

    腾讯云智能体开发平台(TencentCloudADP)构建的批量关键词检索智能体是新一代智能信息检索解决方案。 同时调用多个数据源API进行并行检索智能负载均衡:动态分配检索任务,避免API限流●实时结果汇总:实时收集和初步整理各源检索结果第三层:智能分析输出层●相关性智能评估:基于AI算法评估结果与关键词的相关性 source_distribution}-质量评分:{quality_score}/10优质结果示例:1.标题:{title}来源:{source}相关性:{relevance}/10质量评分:{quality}/10第6步 :智能评估与输出功能说明:对检索结果进行多维度智能评估,生成结构化报告和可视化图表。 ●PDF报告:可视化分析报告●JSON数据:结构化数据接口●图表可视化:趋势图、分布图、对比图结论基于腾讯云智能体开发平台(TencentCloudADP)构建的批量关键词检索作为新一代智能信息检索解决方案

    23710编辑于 2026-03-24
  • 来自专栏muller的测试分享

    人工智能|RAG 检索增强生成

    它能够通过检索大规模文档集合来提供准确的答案,无需针对每个问题进行特定训练。 智能助手和虚拟代理(Intelligent Assistants and Virtual Agents):RAG 可以用于构建智能助手或虚拟代理,结合聊天记录回答用户的问题、提供信息和执行任务,无需进行特定任务微调 信息检索(Information Retrieval):RAG 可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。 让其变的易检索。这个预处理的过程,就使用了向量数据库以及embedding。 相关资料RAG 官方文档说明总结理解什么是 RAG 检索增强。理解 RAG 检索增强应用场景。了解 RAG 检索增强有哪些相关的使用方法。

    70310编辑于 2024-07-24
  • 来自专栏大数据学习笔记

    ElasticSearch 6.x 学习笔记:15.检索入门

    53946664"} { "index":{ "_index": "website", "_type": "blog", "_id": "5" }} { "title": "libstdc++.so.6" ,"author":"程裕强","postdate":"2016-12-30","abstract":"libstdc++.so.6问题解决","url":"http://url.cn/53946911 "} { "index":{ "_index": "website", "_type": "blog", "_id": "6" }} { "title": "CentOS更换国内yum源","author }, { "index" : { "_index" : "website", "_type" : "blog", "_id" : "6" blog", "_id": "5", "_score": 1, "_source": { "title": "libstdc++.so.6"

    35210编辑于 2022-05-06
  • 来自专栏大数据学习笔记

    ElasticSearch 6.x 学习笔记:16.全文检索

    ElasticSearch 6.x 全文检索相关内容官方文档: https://www.elastic.co/guide/en/elasticsearch/reference/6.1/full-text-queries.html 高级别全文检索通常用于在全文本字段(如电子邮件正文)上运行全文检索。 他们了解如何分析被查询的字段,并在执行之前将每个字段的分析器(或search_analyzer)应用于查询字符串。 0.9227539, "hits": [ { "_index": "website", "_type": "blog", "_id": "6" multi_match查询是match查询的升级版,用于多字段检索。 在检索的时候,用户的查询中如果含有停用词,检索系统也会将其过滤掉(因为用户输入的查询字符串也要进行分词处理)。排除停用词可以加快建立索引的速度,减小索引库文件的大小。

    55210编辑于 2022-05-06
  • 来自专栏别先生

    Elasticsearch 6.x版本全文检索学习之Search API

    6)、Group分组设定,使用括号指定匹配的规则。括号的概念,是将值做一个分组,OR和AND是布尔操作符。括号制定了匹配的优先级。   (quick OR brown) AND fox。 6、Request Body Search,将查询语句通过http request body发送到es,主要包含如下参数。query符合Query DSL语法的查询语句。 a、字段类查询,如term(针对词的查询)、match(针对全文检索的查询)、range(针对范围的查询)等等,只针对某一个字段进行查询。    a、全文匹配,针对text类型的字段进行全文检索,会对查询语句先进行分词处理,然后拿着分词结果去es中存倒排索引的term匹配,如match、match_phrase(词语查询)等等query类型。    需要做相关性算分、需要做全文检索的的可以放到query里面。 filter下的filter上下文,不会影响算分,只会过滤符合条件的文档。不需要做相关性算分的可以放到filter里面, ?

    1.6K30发布于 2019-11-03
  • 来自专栏别先生

    Elasticsearch 6.x版本全文检索学习之数据建模

    第二步、是否需要检索字段。需要检索index设置true,否则设置为false。     第三步、是否需要排序和聚合分析。 6、Mapping字段属性的设定流程,是何种类型的。   答:a、字符串类型,需要分词则设定为text类型的,否则设置为keyword类型的。      7、Mapping字段属性的设定流程,是否需要检索。   答:a、完全不需要检索,排序,聚合分析的字段。enabled设置为false。      b、不需要检索的字段,index设置为false。     c、需要检索的字段,可以通过如下配置设定需要的存储粒度。index_options结合需要设定,norms不需要归一化数据时关闭即可。

    1.2K20发布于 2019-11-14
  • 来自专栏数据挖掘

    向量相似度检索智能驾驶领域的应用

    行业内智能驾驶技术发展到一定阶段既会存在数据挖掘的挖掘的需求,尤其针对边缘case的挖掘,如何利用互联网技术实现智能驾驶场景的挖掘是我刚入智能驾驶行业遇见的首要问题。 背景智能驾驶领域的数据挖掘大致可分为两种:面向感知领域的静态场景挖掘,例如:路面反光场景、眩光场景、镜头脏污场景、异型车、隧道场景、树荫遮挡场景、带草砖路面场景、高架场景等。 本文借用基于向量相似度检索技术实现以图搜图、以文搜图等技术,并赋能智能驾驶场景挖掘,这对静态稀有场景的挖掘至关重要。 实践证明以图搜图技术较适合图片中大粒度特征的数据挖掘,例如‘带草砖的车位’、‘树荫挖掘’等,针对地锁、锥桶等小目标采用相似度检索技术仍是业界难题,针对小目标的挖掘较适合用YOLO系列的模型,或者使用clip

    30910编辑于 2025-06-06
  • 腾讯云数据万象智能检索服务概要

    一、 产品定位与核心亮点 数据万象-多模态智能检索 是腾讯云提供的一项基于人工智能的数据处理与检索服务。其核心技术属性为结合对象存储(COS)的一站式数据处理智能平台。 核心商业差异化卖点在于其自研的特征提取服务及检索引擎,专门针对中文电商场景优化,实现跨模态的智能检索。 二、产品应用场景 受众:互联网行业客户,特别是电商平台、视频平台。 产品优势 特征提取精准:采用智能抠图技术,先抠取有效图像主体再提取特征,提升特征库准确性。 检索方式灵活多样: 支持文本搜索和以图搜图。 提供搜前分类提示功能,提升文本搜索效率。 解决方案:使用数据万象的智能检索服务,包括特征库构建和跨模态检索。 成效: 海量数据高效分析:能快速、精准地从数十亿文件中查询指定条件的文件。 智能相册:可根据媒体文件的拍摄时间、地点、人物等信息构建智能相册。 文件管理:提升数据管理和分析效率,挖掘数据价值。

    6300编辑于 2026-05-31
  • 来自专栏自然语言处理

    Chinese-LangChain:基于ChatGLM-6b+langchain实现本地化知识库检索智能答案生成

    Chinese-LangChain Chinese-LangChain:中文langchain项目,基于ChatGLM-6b+langchain实现本地化知识库检索智能答案生成 https://github.com pwd=ujjv 提取码:ujjv TODO 支持上下文 支持知识增量更新 支持加载不同知识库 支持检索结果与LLM生成结果对比 支持检索生成结果与原始LLM生成结果对比 检索结果过滤与排序 互联网检索结果接入 模型初始化有问题 增加非LangChain策略 ❤️引用 webui参考:https://github.com/thomas-yanxin/LangChain-ChatGLM-Webui knowledge问答参考:https://github.com/imClumsyPanda/langchain-ChatGLM LLM模型:https://github.com/THUDM/ChatGLM-6B

    1.2K20编辑于 2023-08-25
  • 来自专栏信数据得永生

    Python 智能项目:6~10

    -1681654125431)(https://gitcode.net/apachecn/apachecn-dl-zh/-/raw/master/docs/intel-proj-py/img/f17a6b6e-bf3f 可以通过将next方法应用于迭代器对象来检索批量。 我们将在每个周期开始时调用生成器函数,以便在每个周期中批量都是随机的。 基于检索的模型和生成模型都具有各自的优缺点。 由于基于检索的模型从一组固定的答案中进行回答,因此它们无法处理看不见的问题或没有适当预定义响应的请求。 生成模型要复杂得多。 在这里,S表示智能体可能会暴露的所有状态,而A则表示智能体可以参与的可能动作。 您现在可能想知道智能体如何采取行动。 应该是随机的还是基于启发式的? 好吧,这取决于智能体与相关环境的交互程度。 状态和奖励将由环境呈现给智能体,而智能体将通过采取适当的行动对智能体采取行动。 这些状态采用从汽车前面的摄像头拍摄的图像的形式。

    94720编辑于 2023-04-23
  • 来自专栏产品笔记

    RAG智能问答系统为什么要使用混合检索

    检索增强生成简称RAG(Retrieval-augmented Generation),RAG为大语言模型安装了知识外挂,基础大语言模型不用训练,通过RAG技术与大语言模型结合在回答问题的时候,可以通过企业内部的知识库检索相关和最新的信息来生成内容 01 — 为什么要用混合检索? 在RAG智能问答系统中,RAG检索环节中的检索的方式采用向量检索,即通过语义相关度匹配的方式进行检索。 在文本搜索场景,首先需要确保最相关的结果能够出现在检索的结果中。向量检索和关键词检索各有优势,而引入混合检索结合了两种搜索技术的优点,并且弥补了各自的缺点。 02 — 什么是混合检索? 混合检索是结合了两种或者多种搜索算法提高搜索结果相关性的搜索技术。而在RAG系统中,混合搜索最常见指向量检索和关键词检索的组合。 不同的检索系统在寻找文本中各自擅长之间存在不同的联系,没有任何一种检索模式能够适用全部的情景,混合检索通过多个不同的检索系统组合,结合不同检索系统的优势,实现多个检索技术直接的互补。

    84510编辑于 2024-03-06
  • 来自专栏别先生

    Elasticsearch 6.x版本全文检索学习之聚合分析入门

    6、bucket和metric聚合分析结合使用。bucket和metric聚合分析整合,Bucket聚合分析允许通过添加子分析来进一步进行分析,该子分析可以是Bucket也可以是Metric。

    1.5K20发布于 2019-11-12
  • 来自专栏啦啦啦啦前端

    信息检索格式 布尔检索

    信息检索格式 布尔检索式 名称 符号 表达式 功能 逻辑与 * 或and AB 同时含 有提问词A和B的文献,为命中文献 逻辑或 + 或or A+B 凡是含有提问词A或B的文献,为命中文献 逻辑非

    1.6K40编辑于 2023-02-11
  • 来自专栏大数据杂货铺

    全文检索、向量检索和混合检索的比较分析

    全文检索 全文搜索是指将部分或全部文本查询与数据库中存储的文档进行匹配。与传统的数据库查询相比,全文搜索即使在部分匹配的情况下也能提供结果。 矢量搜索 矢量搜索是人工智能驱动的搜索方法。它不是查找与文本查询匹配的文档,而是允许查找具有相似语义的文档。这是通过建立大型语言模型(LLM) 提供的文本语义理解来实现的。 它建立在全文搜索的可访问性、即输入即搜索体验的基础上,并集成了人工智能搜索支持的增强发现功能。 Elasticsearch 用户越来越多地使用不同类型信息的搜索检索 — BM25 用于文本,向量搜索用于密集向量。 混合搜索将全文搜索的可访问性与人工智能实现的改进发现相结合。 混合搜索是现代搜索方法,将最先进的搜索功能统一到单个 API 后面。

    6.5K10编辑于 2024-04-24
  • 来自专栏AI研思录

    颠覆传统检索:RAPTOR检索树提升检索准确率20%!

    然而,现有的检索增强方只能检索几个简短的、连续的文本块,这对于需要整合文本多个部分的知识的问题是不够的,限制了它们表示和利用大规模语义结构的能力。 这篇文章提出了一种新颖的方法——检索树,即考虑了广泛的主题理解,也考虑了细粒度的细节信息。 在推理时,使用RAPTOR模型从这棵树中进行检索,在不同抽象层次上整合信息,以跨越较长文档进行理解。 采用递归聚类和汇总技术,RAPTOR创建了一个分层树结构,能够跨检索语料库的各个部分综合信息。在查询阶段,RAPTOR 利用此树结构进行更有效的检索。 实验表明,使用递归总结的检索方法在多个任务上相较于传统的检索增强语言模型提供了显著的改进。在涉及复杂、多步骤推理的问题解答任务中,展示了最优的结果。

    90310编辑于 2025-02-20
  • 来自专栏ATYUN订阅号

    人工智能平台Jane为企业提供高效信息检索

    这就是前Answers.com首席执行官David Karandish创立了Jane.ai的原因,这是一个可以从云存储提供商,团队等索引数据的人工智能平台。 Jane是一个直观,智能的AI,可以让员工即时访问他们需要的信息,以便完成他们的工作。“ Jane.ai服务分为两部分。

    93020发布于 2018-07-27
  • 来自专栏TechLead

    深入探索智能问答:从检索到生成的技术之旅

    在本文中,我们深入探讨了自然语言处理中的智能问答系统,从其发展历程、主要类型到不同的技术实现。文章详细解析了从基于检索、对话到基于生成的问答系统,展示了其工作原理和具体实现。 一、智能问答概述 智能问答 (Intelligent Question Answering, IQA) 是自然语言处理(NLP)中的一个核心子领域,旨在设计和开发可以解析、理解并回答用户提出的自然语言问题的系统 ---- 三、智能问答系统的主要类型 智能问答系统因应用场景、数据源和技术手段的不同而存在多种类型。以下是其中的一些主要类型及其特点: 基于知识库的问答系统: 依赖预定义的知识库来检索答案。 基于检索的问答系统: 从大量文本数据中检索与问题相关的片段。 依赖高效的信息检索技术。 能够处理开放领域的问题,但答案的准确性可能受限于数据源的质量。 ---- 五、基于检索的问答系统 基于检索的问答系统是指根据用户问题的语义信息,从一个预先存在的大型文档或FAQ集中检索并返回最相关的答案。

    2.5K30编辑于 2023-10-21
  • 来自专栏别先生

    Elasticsearch 6.x版本全文检索学习之集群调优建议

    configuration, make sure you 5 # understand what are you trying to accomplish and the consequences. 6 Network ----------------------------------- 52 # 53 # Set the bind address to a specific IP (IPv4 or IPv6) 2 PUT /_cluster/settings 3 { 4 "persistent": { 5 "discovery.zen.minimum_master_nodes": 2 6 6、读性能主要受以下几个方面的影响。 a、数据模型是否符合业务模型。数据建模。高质量的数据建模是优化的基础,将需要通过script脚本动态计算的值提前算好作为字段存到文档中。

    74630发布于 2019-11-14
  • 来自专栏信数据得永生

    Python 人工智能6~10

    6 集成学习的预测分析 在本章中,我们将学习集成学习以及如何将其用于预测分析。 精度是指分类的准确率,召回率是指检索到的项目数占应检索的项目总数的百分比。 好的分类器将具有较高的精度和较高的查全率,但是通常在这两者之间需要权衡。 因此,我们有f1-score来表征。 而不是随机选择它们,我们使用k-means++以更智能的方式选择这些中心。 这样可以确保算法快速收敛。 n_clusters参数是指群集数。 GMM inc 的一些流行应用包括图像数据库检索,股票市场波动建模,生物特征验证等。 现在我们已经描述了什么是 GMM,让我们看看如何应用它们。 在我们讨论它的构成及其在人工智能(AI)中的相关性之前,让我们先讨论一下编程范例。 编程范例的概念源于对编程语言进行分类的需求。 它是指计算机程序通过代码解决问题的方式。

    1.8K30编辑于 2023-04-23
领券