首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏AI科技时讯

    图像搜索|高维空间最近邻逼近搜索算法

    业务场景 上一次介绍图像搜索的基本原理,现在记录下使用的数据包的问题。 NMSLIB 项目地址:https://github.com/nmslib/nmslib 非度量空间库(NMSLIB)是一种高效的跨平台相似性搜索库和用于评估相似性搜索方法的工具包。 NMSLIB是一个可扩展的库,这意味着可以添加新的搜索方法和距离函数。NMSLIB可以直接在C ++和Python中使用。 详细参数 关于参数的设置可以见 https://github.com/nmslib/nmslib/blob/master/python_bindings/parameters.md 参考 高维空间最近邻逼近搜索算法评测 spm=a2c4e.11153940.blogcont697621.16.3ef936ddMFh7on); 图像检索:再叙ANN Search(https://yongyuan.name/blog/ann-search.html

    1.7K20发布于 2019-08-15
  • 来自专栏啄木鸟软件测试

    谈谈基于深度学习的图像搜索

    这些应用在人工智能深度学习中都属于向量搜索的技术范畴,现在给大家简单介绍一下向量搜索。 2.人脸识别的案例 一般而言基础信息中的图像、音频、视频信息通过向量化存储在数据库中。 比如一张面部照片存储在数据库中是一个经过向量化处理过的数据,而且这个向量化数据高达上千维,比如A=[1.34,5.43,9.12,2.11,323.80,…,43.01,711.20];在使用这个软件的时候,获取的实时脸部图像信息也通过相同的向量化算法转为一个向量数据 3.向量化 向量化是把图像、音频、视频信息转换为向量的方法。向量化的方法主要分为基于特征的向量化方法和基于卷积神经网络的向量化两种方法。 基于特征的向量化方法主要是通过提取图像的色彩、纹理、形状等特征,然后将这些特征转化为向量。由于基于特征的向量化方法在处理复杂、模糊的图像时效果不太理想,所以一般不使用。 这些特征向量不仅包含了图像的底层信息,还包含了高级的语义信息,因此可以更好地表示图像的内容。

    43910编辑于 2024-09-10
  • 来自专栏AI科技时讯

    从头开始构建图像搜索服务

    此外,提前计算出数据库中所有图像的矢量,这种方法既快速(一次正向传递就是一种有效的相似性搜索),又可以进行扩展。最后,如果我们设法为图像和单词找到常见的嵌入,就可以使用它们来进行文本到图像搜索! 那么,如何实际使用深度学习表示来创建搜索引擎呢?我们的最终目标是拥有一个搜索引擎,可以接收图像并输出相似的图像或标签,还能接收文本并输出类似的单词或图像。 为了实现这一目标,将经历三个连续的步骤: 根据输入图像搜索类似图像图像图像) 根据输入词搜索类似的单词(文本→文本) 为图像生成标签,并使用文本搜索图像图像↔文本) 为此,将使用嵌入 结果出人意料的好,搜索得到很多猫的图像,而不是瓶子的图像,这看起来很合理! 使用文本搜索图像 最重要的是,可以使用联合嵌入,输入任何单词都可以搜索图像数据库。只需要从GloVe获取预先训练好的单词嵌入,并找到具有最相似嵌入的图像即可。

    1K30发布于 2019-08-16
  • 来自专栏大大的小数据

    pyautogui图像识别的模糊搜索2022.3.24

    pyautogui太好用了,就是有时候不明原因的识别不到图片,可能是电脑重启后屏幕像素变化了,也可能是网页自动缩放适用改变了屏幕的截图像素。 需要引入图像的模糊搜索了 pyautogui.click('2.png') 改为 pyautogui.click(pyautogui.locateOnScreen('2.png',confidence

    2.2K30编辑于 2022-09-22
  • 来自专栏罗超频道

    2014年百度瞄准图像搜索

    百度一图一世界图像搜索技术开放日 百度瞄准图像搜索开始规模应用 图像搜索,可以简单地认为是“以图搜图”,但并非图像识别这么简单。 移动设备摄像头的分辨率不断提升,Intel等公司已经推出具有“深度识别”的摄像头可以识别立体化的图像意味着摄像头技术本身在升级。这些则为图像搜索创造了物理条件。 图像搜索时代已经来临。 深度学习破解图像搜索待解技术难题 Google在2009年分别推出网页版Google相似图片搜索和Google Goggles,10年百度则推出识图搜索(shitu.baidu.com)涉水图像搜索,12 对应到我们自身的“看图过程”不难理解为何深度学习可以让机器识别和理解图像:摄像头是图像搜索的眼睛,基于云的深度学习神经网络就是图像搜索的大脑。 未来的图像搜索会怎样? 这隐含了两个改变:一是图像搜索从被动到主动;二是图像搜索可以做到自动理解它看到的一切并适时启动搜索,让搜索过程更加自然。 还有第三个重点是动态图像搜索。当前图像搜索都是静态图像,而不是动态视频。

    96950发布于 2018-04-28
  • 来自专栏绿盟科技研究通讯

    图像搜索加密(三):逼近明文检索

    引言 在之前的文章[1]中,我们深入探讨了图像领域内可搜索加密技术的主流方法,并重点介绍了一系列以高效性著称的方案。然而,由于加密技术本身的固有限制,这些方法通常只能提取出图像的基本统计特征。 这为图像加密搜索提供了新的解决方案:某些深度卷积神经网络在结构上异常简单,仅涉及基本的加减乘运算和比较操作,且其结构信息在初始阶段即可确定。 一个典型的方案流程如图2所示,具体来说,该过程分为两个阶段: 图2:基于双服务器的图像搜索加密方案 云服务器储备密文图像库:图像的拥有者首先在本地使用加法秘密共享方法将图像分割成两部分,即每个云服务器拥有一份图像的两个 因此,在那些对时间敏感性较低、而对精度要求较高的实际应用场景中,基于双服务器模型的图像搜索加密方案展现出了显著的实用价值。 四. 总结 在本篇文章中,我们深入探讨了图像搜索加密领域的一种重要方案。这种方法借鉴了明文内容基于图像检索(CBIR)的策略,从而在加密环境下显著提高了检索精度。

    85710编辑于 2024-04-24
  • 来自专栏绿盟科技研究通讯

    图像搜索加密(一):问题与方案概览

    引言 在之前的文章中,我们对文本数据的可搜索加密方案[1]进行过简单介绍。如今,除了文本搜索之外,图像搜索也日益成为一项不可或缺的技术。 因此,如何在不泄露敏感信息的前提下,实现高效和准确的图像搜索,即所谓的“图像搜索加密”,成了一个极具研究价值的课题。 本系列文章旨在对图像搜索加密的各种主流方案进行全面而详细的解析,首篇文章我们将着重介绍图像搜索加密的问题定义以及常见的解决方案模型。 ,那么通过明文特征去搜索明文图像库,就会很容易暴露出图像的大致信息。 综上所述,现有主流的图像搜索加密方案可总结如下图所示: 图4. 图像搜索加密方案概览 四. 总结 在本篇文章中,我们对现有图像搜索加密文献做了一个简单的梳理与分析。

    1K20编辑于 2023-09-13
  • 来自专栏绿盟科技研究通讯

    图像搜索加密(四):基于TEE的方案

    引言 在之前的文章[1]中,我们对图像搜索加密的经典系统模型进行了介绍,并从效率主导与精度主导两个方面对现有研究方案进行了分析。 本文将介绍一种基于可信硬件的图像搜索加密新方案。 二. 基于TEE的图像搜索方案 图像搜索加密本质上是为了在提供图像检索服务的同时,让服务提供方无法获知图像的内容。 准备阶段:云服务商基于可信硬件部署图像搜索加密服务:在普通环境中部署服务平台,如前后端等;通过合适的配置,确保机密环境中可调度实际图像检索算法。 图1:基于TEE的图像搜索加密方案 在整个过程中,敏感的图像数据始终是加密的,云服务商无法获知其内容。同时,敏感的图像检索计算也始终在可信环境中进行,云服务商无法窥探或篡改计算过程及结果。 可信硬件作为计算的基础设施,很好的满足了图像搜索加密在实践中的需求。

    66110编辑于 2024-07-02
  • 来自专栏磐创AI技术团队的专栏

    使用Keras构建深度图像搜索引擎

    我们如何建立一个系统,能够找到这些图像的子集来更好地回答用户的搜索查询? 我们基本上需要的是一个搜索引擎,它能够根据图像搜索查询的对应程度对图像结果进行排序,可以用一种自然语言表示,,也可以用其他查询图像表示。 文字图片搜索: 在这里,我们使用几个文本查询示例来在一组70,000张图像搜索最佳匹配。我们计算查询的文本嵌入,然后计算集合中每个图像的嵌入。我们最终在嵌入空间中选择最接近查询的前9张图像。 ? 这些例子表明,嵌入模型能够学习图像的有用表示形式和简单单词组成的嵌入。 图像搜索: 在这里,我们将使用图像作为查询,然后在包含70,000张图像的数据库中搜索与之最相似的示例。 结论: 在这个项目中,我们研究了机器学习模块,它允许我们构建一个基于关键字和图像搜索引擎,应用于图像集合。

    75810发布于 2019-12-12
  • 来自专栏博文视点Broadview

    偷窥了阿里的图像搜索架构,干货分享给你!

    小编从《深度学习图像搜索与识别(全彩)》一书中“偷窥”到它的架构设计,分享给你! 以下内容节选自《深度学习图像搜索与识别(全彩)》一书! 随着业务的发展,也逐步建立了稳定的、可扩展的视觉搜索架构。 下图展示了拍立淘的整个图像搜索架构,分为离线和在线处理流程。 (图1  图像搜索架构) 离线处理主要是指每天生成图像引擎索引的整个过程。 ▼ 至此,拍立淘的整个图像搜索架构的大概设计就基本介绍完了,如果你想了解更多细节,可阅读《深度学习图像搜索与识别(全彩)》一书。 ▊《深度学习图像搜索与识别(全彩)》 潘攀 著 首度剖析基于深度学习的亿级图像检索技术平台 深度分析计算机视觉重要算法原理与应用场景 阐述构建大规划图像搜索平台思路、技巧与落地经验 图像搜索和识别是计算机视觉领域一个非常重要且基础的题目 互动赠书 在本文下方留言区留下你与图像搜索的故事,我们将随机选取1位小伙伴,赠送《深度学习图像搜索与识别(全彩)》一书。

    98220编辑于 2023-05-19
  • 来自专栏yl 成长笔记

    相似图像搜索从训练到服务全过程

    最近完成了一个以图搜图的项目,项目总共用时三个多月。记录一下项目中用到机器学习的地方,以及各种踩过的坑。

    1.3K30发布于 2018-09-12
  • 来自专栏音视频技术

    双编码器的自然语言图像搜索

    1 介绍 该示例演示了如何构建一个双编码器(也称为双塔)神经网络模型,以使用自然语言搜索图像。 该数据集通常用image captioning任务,但我们可以重新利用图像标题对来训练双编码器模型进行图像搜索。 下载提取数据 首先,下载数据集,它由两个压缩文件夹组成:一个是图像,另一个是相关的图像标题。值得注意的是压缩后的图像文件夹大小为13GB。 "Loss") plt.xlabel("Epoch") plt.legend(["train", "valid"], loc="upper right") plt.show() 9 使用自然语言查询搜索图像 return [[image_paths[idx] for idx in indices] for indices in results] 将查询变量设置为你要搜索的图片类型。

    1.6K40发布于 2021-09-01
  • 来自专栏全栈程序员必看

    AI图像识别_头像搜索图片识别在线

    使用百度AI图像识别提供的API接口来搭建识图工具,首先要注册百度开发者账号,然后找到图像识别页面,创建应用,申请成功后会给两个重要的数据API Key ,Secret Key,这是实现识图的重要参数, ') response = urllib2.urlopen(request) content = response.read() if (content): print(content) 识别图像接口 Form): _translate = QtCore.QCoreApplication.translate # 设置窗体内容 Form.setWindowTitle(_translate("Form", "图像识别工具

    4.6K10编辑于 2022-09-20
  • 来自专栏数据派THU

    构建可以查找相似图像图像搜索引擎的深度学习技术详解

    阅读本文后你将有能够从头开始创建类似图像搜索引擎的能力。 图像检索(又名基于内容的图像检索Content-Based Image Retrieval 或 CBIR)是任何涉及图像搜索的基础。 索引图像。索引是在所有图像上运行经过训练的模型,并将获得的嵌入写入特殊索引以进行快速搜索的过程。 步骤 3. 搜索。 使用用户上传的图像,通过模型获得嵌入,并将该嵌入与数据库(索引)中的其他图像的嵌入进行比较,并且搜索结果可以按照相关性排序。 通过增加lambda,使网络聚焦于图像的重要部分,这在某些任务中是很有效的。 距离的测量 1、索引 高质量搜索相似图像的另一个关键点是排名,即显示给定查询的最相关结果。 完整的样例介绍 这里以搜索相似商标logo为例介绍图像搜索引擎是如何工作的。 图像索引数据库的大小:数百万个商标。

    1.5K20编辑于 2022-03-04
  • 来自专栏绿盟科技研究通讯

    图像搜索加密(二):定制化方案及其优化

    引言 在之前的文章[1]中,我们对图像领域的可搜索加密的主流方案进行了梳理。 本文进一步深入,探讨了设计符合这些要求的图像加密方法,以及在基础工作上的几类优化策略。 二. 基础方案 在图像搜索加密问题下,主要涉及三类实体:图像拥有者,授权用户以及云服务器。 如图1所示: 图1:图像搜索加密常见系统模型 图像拥有者:图像拥有者拥有一个较大的图像库,其负责上传加密的图像以及其余辅助的信息;同时,一般来说图像所有这还需要承担对授权用户进行授权的任务。 多值替换:本质上,检索是在比较两张图像特征之间距离的远近;因而,一个有效的可搜索加密方案并不需要维持距离的一致性,而只需要维持距离间大小的一致性。 总结 在本篇文章中,我们对基于统计特征的图像搜索加密领域中的一些重要方法及其动机进行了梳理。本类方案对图像拥有者的负担最低且精度效率均在可接受范围,因而可落地性与实用价值最强。

    55810编辑于 2024-04-24
  • 来自专栏ATYUN订阅号

    谷歌将基于AI的谷歌镜头引入谷歌图像搜索

    谷歌宣布将其基于AI的Lens技术引入谷歌图像搜索。该公司解释说,这个想法是允许网络搜索者更多地了解照片中的内容,特别是他们可能想要购买和购买的商品。 你可以点击照片中显示的“点”,指定谷歌镜头识别的项目,或者可以用手指“画”照片中的对象以触发Google图片搜索相关信息。 然后,Google会在网络上进行搜索,包括其他图片,网页甚至可能出现此对象的视频。 ? 当然,这不仅仅是为了购物。谷歌镜头还可用于了解有关地标,动物,你想要去的地方等更多信息。 谷歌表示,Lens in Images目前正在移动网络上直播,供美国人用英语搜索,并将很快推广到其他国家,其他语言和谷歌图像位置。

    1.2K30发布于 2018-12-04
  • 来自专栏AI科技时讯

    Magiclens:新一代图像搜索技术及产品形态

    摘要 图像检索,即给定参考图像寻找所需图像,本质上包含了丰富的、多方面的搜索意图,这些意图仅通过基于图像的度量难以捕获。最近的工作利用文本指令让用户更自由地表达他们的搜索意图。 此外,对一个未见过的140万图像数据集进行的实验进一步证明了MagicLens支持的搜索意图的多样性。 在图像搜索场景中,用户经常为单个查询图像呈现多个搜索意图,表明仅凭图像相关性不足以获得精确的搜索结果。 在140万检索图像库的人类评估显示,MagicLens能够很好地满足由开放式指令表达的多样化搜索意图,尤其是复杂和非视觉意图,这表明MagicLens在实际搜索场景中具有强大的能力和潜力。 通过这样的查询,用户可以利用源图像的信息,同时通过文本指令指导搜索,找到与源图像相似但内容不同的图像。 Table 10.

    69000编辑于 2024-05-27
  • 来自专栏数说工作室

    懂点硬件 | AlphaGo、图像搜索、街景......背后都有它的影子:TPU

    处理图像时,图像上的每一个像素点都需要被处理,这种处理任务的特点是,量很大,但是单个任务又很小,这时用CPU这样的战车就不合适了,而GPU——我把它比作步兵,一拥而上同时作战。 目前谷歌图像搜索(Google Image Search)、谷歌照片(Google Photo)、谷歌云视觉 API(Google Cloud Vision API)、以及AlphaGo中都能看到TPU

    91050发布于 2018-04-04
  • 来自专栏我爱计算机视觉

    CV+NLP,使用tf.Keras构建图像搜索引擎

    今天跟大家推荐一个刚刚开源的使用tf.Keras深度学习技术构建图像搜索引擎的开源项目,对于了解基于文本查询和基于图像查询的图像搜索都很有价值。 基于文本查询和基于图像实例进行图像搜索图像检索的两种主要方式,面对仅有描述文本的弱监督信息的海量互联网图像,如何建立两者之间的关系,同时实现上述两种图像检索方法,是很具有实用价值的技术。 使用文本查询时,使用NLP模型将文本映射到编码空间,寻找与其距离接近的图像编码,进而索引出近似图像; 2. 使用图像查询时,使用CV模型将图像映射到图像编码空间,直接比较图像间的编码信息欧式距离,进而索引出近似图像。 作者使用了50万幅电子商务场景下的服饰图像和对应描述进行实验。 蓝色代表图像编码信息,红色代表文本编码信息,绿色连线代表他们是一对一的关系。连线方向很一致,表明作者设计的模型很好的实现了相似图像的聚拢、图像和文本关系的关联。 下图为使用文本查询的结果: ? ?

    63310发布于 2019-12-29
  • 来自专栏机器之心

    李飞飞等人提出Auto-DeepLab:自动搜索图像语义分割架构

    然而,图像分类不应该是 NAS 的终点,现下的成功表明它可以扩展至要求更高的领域。在本文中,作者研究了用于语义图像分割的神经架构搜索。 目前关于 NAS 的绝大多数研究都遵循这个两级分层设计,但只自动化搜索内层网络,而手动设计外层网络。这种有限的搜索空间对密集图像预测来说是一个问题,密集图像预测对空间分辨率变化很敏感。 当搜索终止时,最好的单元架构会被贪婪解码,而最好的网络架构会通过维特比算法得到有效解码。作者在从 Cityscapes 数据集中裁剪的 321×321 图像上直接搜索架构。 本论文将研究用于语义图像分割的 NAS,语义图像分割是将语义标签分配给图像中每个像素的重要计算机视觉任务。现有的研究通常关注搜索可重复的单元结构,对控制空间分辨率变化的外部网络结构进行人工设计。 这种做法简化了搜索空间,但对于具备大量网络级架构变体的密集图像预测而言,该方法带来的问题很多。因此,该研究提出在搜索单元结构之外还要搜索网络级架构,从而形成一个分层架构搜索空间。

    1.3K20发布于 2019-04-30
领券