首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏IT云清

    5.Elasticsearch检索文档

    我们会发现,我们存储的文档,在_source中,其他的类似_index,_type等都是元数据,元数据在后面会做详细解释。

    63720发布于 2019-01-22
  • 批量关键词检索:使用腾讯云ADP搭建智能信息检索智能

    腾讯云智能体开发平台(TencentCloudADP)构建的批量关键词检索智能体是新一代智能信息检索解决方案。 同时调用多个数据源API进行并行检索智能负载均衡:动态分配检索任务,避免API限流●实时结果汇总:实时收集和初步整理各源检索结果第三层:智能分析输出层●相关性智能评估:基于AI算法评估结果与关键词的相关性 ,为精准检索提供智能支撑。 }策略制定要求:1.为每个关键词选择最适合的3-5个数据源2.确定检索深度(检索结果数量:10-100条)3.设置时间范围(实时/近期/历史)4.制定质量筛选标准5.预估检索时间和资源消耗输出格式:关键词 -结果质量实时监控第5步:结果汇总与去重功能说明:智能汇总各数据源的检索结果,去除重复内容,提高结果质量。

    23710编辑于 2026-03-24
  • 来自专栏muller的测试分享

    人工智能|RAG 检索增强生成

    它能够通过检索大规模文档集合来提供准确的答案,无需针对每个问题进行特定训练。 智能助手和虚拟代理(Intelligent Assistants and Virtual Agents):RAG 可以用于构建智能助手或虚拟代理,结合聊天记录回答用户的问题、提供信息和执行任务,无需进行特定任务微调 信息检索(Information Retrieval):RAG 可以改进信息检索系统,使其更准确深刻。用户可以提出更具体的查询,不再局限于关键词匹配。 让其变的易检索。这个预处理的过程,就使用了向量数据库以及embedding。 相关资料RAG 官方文档说明总结理解什么是 RAG 检索增强。理解 RAG 检索增强应用场景。了解 RAG 检索增强有哪些相关的使用方法。

    70310编辑于 2024-07-24
  • 来自专栏我的小碗汤

    5 款强大的 Kubernetes Events 收集与检索工具

    以下是我将要解释的内容的概述: 事件机制 Kubernetes API 中的事件结构 需要关注的事件类型 检索事件的可用解决方案 在本文的最后,会链接到 YouTube 和 Github 上的相关教程, 这样你就可以直接学习如何收集和检索 Kubernetes 事件。 Rebooted HostPort 冲突 检索 Kubernetes 事件的解决方案 有多种解决方案可用于检索 Kubernetes 事件。让我们看看现成可用的项目。 详细信息请看 kspan[5] GitHub Kubernetes 事件教程 现在我们已经大致了解了 Kubernetes 事件是什么以及如何利用它们,您可以在 YouTube 和 GitHub 上找到更详细教程 salesforce/sloop [4] kubernetes-event-exporter: https://github.com/opsgenie/kubernetes-event-exporter [5]

    2.1K21编辑于 2023-03-19
  • 腾讯云数据万象智能检索服务概要

    一、 产品定位与核心亮点 数据万象-多模态智能检索 是腾讯云提供的一项基于人工智能的数据处理与检索服务。其核心技术属性为结合对象存储(COS)的一站式数据处理智能平台。 核心商业差异化卖点在于其自研的特征提取服务及检索引擎,专门针对中文电商场景优化,实现跨模态的智能检索。 二、产品应用场景 受众:互联网行业客户,特别是电商平台、视频平台。 产品优势 特征提取精准:采用智能抠图技术,先抠取有效图像主体再提取特征,提升特征库准确性。 检索方式灵活多样: 支持文本搜索和以图搜图。 提供搜前分类提示功能,提升文本搜索效率。 解决方案:使用数据万象的智能检索服务,包括特征库构建和跨模态检索。 成效: 海量数据高效分析:能快速、精准地从数十亿文件中查询指定条件的文件。 智能相册:可根据媒体文件的拍摄时间、地点、人物等信息构建智能相册。 文件管理:提升数据管理和分析效率,挖掘数据价值。

    6300编辑于 2026-05-31
  • 来自专栏数据挖掘

    向量相似度检索智能驾驶领域的应用

    行业内智能驾驶技术发展到一定阶段既会存在数据挖掘的挖掘的需求,尤其针对边缘case的挖掘,如何利用互联网技术实现智能驾驶场景的挖掘是我刚入智能驾驶行业遇见的首要问题。 背景智能驾驶领域的数据挖掘大致可分为两种:面向感知领域的静态场景挖掘,例如:路面反光场景、眩光场景、镜头脏污场景、异型车、隧道场景、树荫遮挡场景、带草砖路面场景、高架场景等。 本文借用基于向量相似度检索技术实现以图搜图、以文搜图等技术,并赋能智能驾驶场景挖掘,这对静态稀有场景的挖掘至关重要。 实践证明以图搜图技术较适合图片中大粒度特征的数据挖掘,例如‘带草砖的车位’、‘树荫挖掘’等,针对地锁、锥桶等小目标采用相似度检索技术仍是业界难题,针对小目标的挖掘较适合用YOLO系列的模型,或者使用clip

    30910编辑于 2025-06-06
  • 来自专栏产品笔记

    RAG智能问答系统为什么要使用混合检索

    检索增强生成简称RAG(Retrieval-augmented Generation),RAG为大语言模型安装了知识外挂,基础大语言模型不用训练,通过RAG技术与大语言模型结合在回答问题的时候,可以通过企业内部的知识库检索相关和最新的信息来生成内容 01 — 为什么要用混合检索? 在RAG智能问答系统中,RAG检索环节中的检索的方式采用向量检索,即通过语义相关度匹配的方式进行检索。 在文本搜索场景,首先需要确保最相关的结果能够出现在检索的结果中。向量检索和关键词检索各有优势,而引入混合检索结合了两种搜索技术的优点,并且弥补了各自的缺点。 02 — 什么是混合检索? 混合检索是结合了两种或者多种搜索算法提高搜索结果相关性的搜索技术。而在RAG系统中,混合搜索最常见指向量检索和关键词检索的组合。 不同的检索系统在寻找文本中各自擅长之间存在不同的联系,没有任何一种检索模式能够适用全部的情景,混合检索通过多个不同的检索系统组合,结合不同检索系统的优势,实现多个检索技术直接的互补。

    84510编辑于 2024-03-06
  • 来自专栏啦啦啦啦前端

    信息检索格式 布尔检索

    信息检索格式 布尔检索式 名称 符号 表达式 功能 逻辑与 * 或and AB 同时含 有提问词A和B的文献,为命中文献 逻辑或 + 或or A+B 凡是含有提问词A或B的文献,为命中文献 逻辑非

    1.6K40编辑于 2023-02-11
  • 来自专栏大数据杂货铺

    全文检索、向量检索和混合检索的比较分析

    全文检索 全文搜索是指将部分或全部文本查询与数据库中存储的文档进行匹配。与传统的数据库查询相比,全文搜索即使在部分匹配的情况下也能提供结果。 矢量搜索 矢量搜索是人工智能驱动的搜索方法。它不是查找与文本查询匹配的文档,而是允许查找具有相似语义的文档。这是通过建立大型语言模型(LLM) 提供的文本语义理解来实现的。 它建立在全文搜索的可访问性、即输入即搜索体验的基础上,并集成了人工智能搜索支持的增强发现功能。 Elasticsearch 用户越来越多地使用不同类型信息的搜索检索 — BM25 用于文本,向量搜索用于密集向量。 混合搜索将全文搜索的可访问性与人工智能实现的改进发现相结合。 混合搜索是现代搜索方法,将最先进的搜索功能统一到单个 API 后面。

    6.5K10编辑于 2024-04-24
  • 来自专栏Reinvent Data Science

    5 分钟实现「视频检索」:基于内容理解,无需任何标签

    随着各类视频平台的兴起和火爆,网络上视频的数量呈现井喷式增长,「视频检索」成为人们高效查找视频的一项新需求。 传统的视频检索通常要求视频带有额外的文字标签,通过匹配查询语句的关键词与视频标签实现检索。 「视频检索」服务 demo 在这篇文章中,我们将会使用 Milvus[5] 和 Towhee[6] 搭建一个基于内容理解的「视频检索」服务! 比如,共有 5 个目标结果,Recall@top10 为 40% 则表示前十个结果中找到了 2(5*40%)个目标结果。 ](func=lambda res: [x.id for i, x in enumerate(res "'top10_raw_res', 'top5'") if i < 5]) .runas_op ](name='recall_at_5' "'ground_truth', 'top5'") \ .evaluate['ground_truth', 'top10'](name='recall_at

    6.4K20编辑于 2023-01-10
  • 来自专栏AI研思录

    颠覆传统检索:RAPTOR检索树提升检索准确率20%!

    然而,现有的检索增强方只能检索几个简短的、连续的文本块,这对于需要整合文本多个部分的知识的问题是不够的,限制了它们表示和利用大规模语义结构的能力。 这篇文章提出了一种新颖的方法——检索树,即考虑了广泛的主题理解,也考虑了细粒度的细节信息。 在推理时,使用RAPTOR模型从这棵树中进行检索,在不同抽象层次上整合信息,以跨越较长文档进行理解。 采用递归聚类和汇总技术,RAPTOR创建了一个分层树结构,能够跨检索语料库的各个部分综合信息。在查询阶段,RAPTOR 利用此树结构进行更有效的检索。 实验表明,使用递归总结的检索方法在多个任务上相较于传统的检索增强语言模型提供了显著的改进。在涉及复杂、多步骤推理的问题解答任务中,展示了最优的结果。

    89710编辑于 2025-02-20
  • 来自专栏ATYUN订阅号

    人工智能平台Jane为企业提供高效信息检索

    这就是前Answers.com首席执行官David Karandish创立了Jane.ai的原因,这是一个可以从云存储提供商,团队等索引数据的人工智能平台。 Jane是一个直观,智能的AI,可以让员工即时访问他们需要的信息,以便完成他们的工作。“ Jane.ai服务分为两部分。

    92920发布于 2018-07-27
  • 来自专栏TechLead

    深入探索智能问答:从检索到生成的技术之旅

    在本文中,我们深入探讨了自然语言处理中的智能问答系统,从其发展历程、主要类型到不同的技术实现。文章详细解析了从基于检索、对话到基于生成的问答系统,展示了其工作原理和具体实现。 预训练模型 近年来,预训练模型如GPT-4、GPT-3.5、T5和XLNet等,已经在各种NLP任务上取得了前所未有的成果。 ---- 三、智能问答系统的主要类型 智能问答系统因应用场景、数据源和技术手段的不同而存在多种类型。以下是其中的一些主要类型及其特点: 基于知识库的问答系统: 依赖预定义的知识库来检索答案。 ---- 五、基于检索的问答系统 基于检索的问答系统是指根据用户问题的语义信息,从一个预先存在的大型文档或FAQ集中检索并返回最相关的答案。 使用如BERT、GPT-2或T5等预训练模型可以进一步提高生成问答系统的性能。 八、总结 经过深入的探索和技术解析,我们对自然语言处理中的智能问答系统有了更加深入的了解。

    2.5K30编辑于 2023-10-21
  • 来自专栏自然语言处理

    检索增强生成 (RAG) 的 5 大 提示词,非常实用!

    接下来,我们就看看 5 种超实用的提示词模板,帮你让 RAG 生成的答案又稳又准! 适用场景: 智能客服:避免 RAG 胡乱回答,而是礼貌地承认“没有完整信息”。 研究分析:确保 RAG 只在有足够依据的情况下给出答案,不随意推测。 想要高质量内容,就别怕“多走一步” 提示词 #5:用“对比查询”让 RAG 更聪明! 想让 RAG 更精准地回答问题?试试“对比查询”法! 5. 如果问题涉及数字、日期或具体数据,务必在回答中准确包含这些信息。 6. 对于表格中的数据或需要综合多个段落的问题,请确保回答全面且准确。 7. 问题: {question} 参考上下文: ··· {context} ··· 请提供准确、相关且简洁的回答:""" 结论:优化提示词,让 RAG 更智能 优化提示词的方式

    2.3K11编辑于 2025-03-15
  • 网页|高级检索与专业检索

    1、高级检索 高级检索也称命令检索,是相对于基本检索而言,高级检索可以让你使用多于基本检索的标准来精炼检索,使检索信息更加详细,搜索出的结果可用性也更大。 ? 图1.1 百度高级检索示例图 ? 示例:知网上检索关键词包括“人工智能”,但不包括“大数据”,作者单位为“清华大学”,发表时间从2019年到2020年。 ? ,; 示例1:知网检索主题包含”人工智能“及”大数据“并且全文不包括”科学“的文献专业检索式 专业检索式:SU=('人工智能'*'大数据')-'研究'。 检索结果: ? 图2.3 示例1检索结果 示例2:百度检索在网址www.baidu.com内搜索标题包括人工智能、大数据但不包括发展,搜索格式为.doc的内容。 专业检索式:filetype:doc site:(baidu.com) title:(人工智能 "大数据" -(发展)) ?

    4.4K20发布于 2020-07-16
  • 来自专栏木头编程 - moTzxx

    ThinkPHP5 使用迅搜 (XunSearch) 实现全文检索实例指导

    是一个高性能、全功能的全文检索解决方案】 场景描述 此处作为对 xunsearch 的初次使用, 以一个简单的商品 SKU 信息搜索场景进行描述 我已有一张 tp5_xsku表,用来存储商品 ---- ☞ ThinkPHP5 应用框架的配置 此处,注意,应用框架跟前面的 "XunSearch" 服务端不在一个 ip 地址 1). composer 安装 sdk 官方指导文档 —— 【通过 $xsService::save($xs_data,'goods_sku'); 提示 如果操作成功,你会在 xunsearch服务端的 "data"目录下发现一个 "goods_sku" 的文件夹 5) 全文检索应用场景 首先,再次明确一下 “全文检索” 概念 创建索引, 然后查询索引的过程我们称之为全文检索, 索引一次创建可以多次使用,这样就不用了每一次都进行文件数据查分,比较快 其次便是 “全文检索” 的应用场景 1.

    1.7K20编辑于 2022-01-06
  • 来自专栏信数据得永生

    Python 智能项目:1~5

    一、人工智能系统的基础 人工智能(AI)在过去几年中一直处于技术的最前沿,并已进入主流应用,例如专家系统,移动设备上的个性化应用, 自然语言处理中的机器翻译,聊天机器人,自动驾驶汽车等。 根据一位著名的计算机科学家的说法: 智能是机器尚未完成的一切。 近来,人工智能已经能够解决复杂的数学问题,创作音乐和创作抽象绘画,并且人工智能的这些功能正在不断增加。 科学家将 AI 系统在未来等同于人类智能水平的点称为 AI 奇点。 机器是否会真正达到人类的智能水平这个问题非常令人着迷。 许多人会认为机器永远无法达到人类的智能水平,因为用来学习或执行智能任务的 AI 逻辑是由人类编程的,并且它们缺乏人类所拥有的意识和自我意识。 在第 5 章,“视频字幕应用”中,我们将研究视频到文本翻译应用,它们属于人工智能领域的专家系统。 五、视频字幕应用 随着视频制作速度成倍增长,视频已成为一种重要的沟通媒介。

    1.4K20编辑于 2023-04-23
  • 数据万象(CI)多模态智能检索服务技术概要

    一、 产品定位与核心亮点 数据万象(Cloud Infinite, CI)多模态智能检索是腾讯云推出的基于 COS(对象存储) 的一站式智能数据处理服务。 场景:基于视频帧特征进行内容检索,或根据人物、地点、表情等信息构建智能相册。 数据治理与监管: 痛点:在上亿级别的海量文件中查找特定合规文件效率极低。 产品优势 精准度提升:通过智能抠图技术先处理图像再提取特征,使得特征库更准确,被搜图像特征计算更精准。 检索灵活性:支持文本、图片多种检索形式,满足不同交互习惯。 检索阶段:用户上传图片或输入文本(如“计算机”),系统调用 智能检索接口 进行特征比对,精准搜索对应特征库。 成效: 提升搜索效率和准确率(通过分类库和预处理)。 实现秒级返回百万级库下的检索结果。 支持输入检索文本/图片/视频,进行 Embedding 相似度对比。 成效: 实现跨模态检索(以文搜视频、以图搜视频)。 支持从数十亿文件中快速查询,辅助构建智能相册或内容审核。

    4600编辑于 2026-05-31
  • 来自专栏desperate633

    第2-3课 检索数据检索检索排序数据

    这两课主要介绍sql中利用select语句对数据的简单检索。 下面分别讨论不同类型的检索 检索列 单个列 select prod_id from Products; 多个列 select prod_id, prod_name, prod_price from Products ; 所有列 select * from Products; 检索不同值 的列 select distinct vend_id from products; 检索前几列或者后几列 select prod_name from products limit 5; select prod_name from products limit 5 offset 5; 检索排序数据 单个列排序 select prod_name

    1.2K20发布于 2018-08-22
  • 智能体记忆系统检索优化:告别“答非所问”的实战指南

    本文从技术原理出发,深度解析智能体记忆检索优化的关键策略,并重点介绍腾讯云智能体开发平台如何通过创新技术帮助企业破解这一难题。 正文 一、记忆检索的三大核心挑战 智能体记忆系统检索不相关主要源于三大挑战。 动态分层索引机制 根据不同场景特点采用差异化索引策略,如下表所示: 索引类型 适用场景 优势特点 实时索引 新闻/价格变动 数据变更后5秒内可检索 领域分层索引 医疗/法律专业领域 精准匹配专业术语 版本控制索引 三、腾讯云智能体开发平台:智能检索优化的实战利器 腾讯云智能体开发平台(Tencent Cloud ADP)作为企业级智能体构建平台,在记忆检索优化方面展现出三大核心优势: 领先的混合检索架构是ADP的突出特点 结语 在AI智能体应用爆发式增长的今天,智能体记忆系统检索优化已成为提升用户体验的关键。

    41410编辑于 2025-10-29
领券