首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏谭广健的专栏

    AI识别之旅三

    前两篇说了AI识别的准备和录入到腾讯云里,接下来我们就来编写一个从人脸库进行识别的功能,老样子那第一篇摄像头那里拉图片。因为有第二篇拉依赖库,这里就不在叙述了。直接来代码了。。 至此,我们就完成简单的AI识别功能人员。最后放出解释多层JSON的代码吧。。。

    73741发布于 2020-02-27
  • 来自专栏谭广健的专栏

    AI识别之旅一

    说到AI识别,很多人会觉得很神秘很高大尚。但随着科技的发展AI已经逐步成熟和简单,这几天我们就围绕如何打造一个AI识别系统进行宣讲吧。 首先AI识别系统,肯定是通过类似视觉识别这样,有图才能有结果,当然你说语音识别就要语音才有结果。不过语音不是咱们这次的重点。我们以视觉识别为主。 视觉识别肯定要通过摄像头获取外界或对应事物的情况,接下来,就是我们这篇文章的重点,如何在安卓上构建摄像头,也希望能使大家减少一些弯路。 这样我们的AI识别之旅就算踏出了第一~

    1K51发布于 2020-02-21
  • 来自专栏小鹏的专栏

    10 端到端语音识别

    端到端语音识别 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? • Espnet: https://github.com/espnet/espnet • 实现了主流的端到端语音识别方法 • Speech-Transformer、LAS、CTC、RNN-T • 一个小缺点

    1.9K20发布于 2020-03-25
  • 来自专栏谭广健的专栏

    AI识别之旅二

    上次说到AI识别第一步就是获取图片并保存下来,相信很多小童鞋应该尝试了。接下来我们就开始对AI识别进行第二步,建立一个AI匹配库。 这个AI匹配库的作用就是把我们第一步获取的图片跟这个识别库进行匹配判断,看看匹配库有没有该图片。这次我们就上腾讯云进行部署。 1、首先登录腾讯云,找到“人脸识别”,点开“人员库管理”中的人员管理,选择“新建人员库”,填入相关的资料。当然这个有API的,不过我们直接手动建省很多事。

    77111发布于 2020-02-22
  • 来自专栏PDF 开发

    AI文档识别技术之表格识别(一)

    ,主要包括(行数,列数,合并单元格数)目前DocumentAI表格识别已实现V2版本,大幅提升标准表格的识别准确率,具体信息会在下一篇blog中再具体说明1. 扫描的手写文档,它们的文档样式、所处光照环境以及纹理等都有比较大的差异,表格识别一直是文档识别领域的研究难点。 表格线条不清晰,需要人为添加表格线条分割表格内容,例如下面的表格就缺少很多的横线与竖线图片1.2 识别原理DocumentAI通过结合AI与传统算法实现表格识别,主要用到的AI能力与算法有:AI:版面分析能力 (通过AI版面分析检测表格在图片内所处的区域)AI:OCR能力(通过OCR实现识别表格内容)算法:图像处理算法(通过结合图像处理算法辅助获取表格结构信息)通过以上的AI与算法再结合一些表格识别算法即可实现通用表格识别 ,同时支持识别标准表格与非标准表格2.

    3.2K40编辑于 2023-08-09
  • 来自专栏python爬虫实战之路

    10行代码实现python人脸识别

    什么是人脸识别 人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。 用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。 目前的人脸识别技术已经非常成熟了,还发展成3D人脸识别。而且现在各大厂商也都提供了人脸识别的API接口供我们调用,可以说几行代码就可以完成人脸识别。但是人脸识别的根本还是基于图像处理。 所有的人脸识别算法在他们的train()函数中都有两个参数:图像数组和标签数组。这些标签标示进行识别时候的人脸ID,根据ID可以知道被识别的人是谁。 现在机器学习是非常火爆的,基于OpenCV的机器学习人脸识别也精确度也很高,下次我们在来对比几种机器学习人脸识别的库。

    5.4K32发布于 2020-05-22
  • 来自专栏燧机科技-视频AI智能分析

    AI人员打架识别算法

    AI打架识别算法基于Detection网络模型算法框架,AI打架识别算法识别校园打架斗殴行为,发现立即打架斗殴行为算法会立即抓拍告警推送打架事件信息。 ,而AI人员打架识别算法直接从图片生成位置和类别。 研究现状 目前AI人员打架识别算法,主要有3种主流的方法,分别是:(1)基于Detection的打架检测。其主要思想是: 将打架作为一种类别,通过分类的方式,将打架行为检测出来。 2.选取的方案 我这里选择方案1,AI人员打架识别算法基于目标检测做打架识别。前文也提到了,目前数据集十分匮乏。笔者也是反复查找,终于拿到了国外的一份很好的数据集。 基本流程是:Labelme标注 -> 标注数据整理与格式转换 -> AI人员打架识别算法模型训练 -> 部署2.2 AI人员打架识别算法标注数据整理与格式转换        Labelme标注的数据,无法直接用在训练中

    1.4K20编辑于 2023-09-22
  • 来自专栏燧机科技-视频AI智能分析

    ai行为识别技术监控

    ai行为识别技术监控系统软件是一种以行为识别技术为关键技术的深度学习算法,根据人工智能化神经元网络,构造大家的主要模块架构,ai行为识别技术监控 依据我们的轨迹测算各种各样健身运动行为,根据视频转码技术 、流媒体播放技术、数字矩阵技术、云技术等,ai行为识别技术监控拍照的各类现场作业人员的异常行为,帮助监控工作人员提高解决各类出现异常紧急事件的效率。 ai行为识别技术监控具备普遍的应用领域,可以用在智能交通、智能化施工工地、智能制造系统、智慧校园、智能化生态公园等。只需有视频监控的地区,就可以完成覆盖识别分析。 ai行为识别技术监控是一种极致的视觉检测系统,应用人工智能视频分析优化算法对视频图象开展即时解析和识别,将监测到的信息与管理者给予的监控规则相对比,并即时消息推送信息和预警信息。 ai行为识别技术监控剖析,可以在紧急状况下开展预警信息,该技术关键完成了对视频监控具体内容数据的分析和获取主要信息内容,并在标识后产生警示。

    70520编辑于 2022-09-12
  • 来自专栏机器之心

    MIT发明10美元AI触觉手套:既能识别物体,又能称重,论文已上Nature

    最近,MIT 的研究人员就发明了一种新的手套,戴上它不仅能掂出手边的小东西有多重,还能仅通过触觉识别出是什么物体。重点是,这么神奇的手套成本只有 10 美元。 ? MIT 研究人员开发了一种低成本的针织手套(仅需 10 美元)——「可伸缩触觉手套」(STAG,scalable tactile glove)。该手套配有 548 个微小的传感器,几乎遍布整个手掌。 但 MIT 研究人员设计的这款 STAG 手套,能够生成高分辨率的数据,且成本仅为 10 美元!是的,你没看错,10 美元。 根据触觉信息识别物体类别并估计重量。 a) 利用触觉信息来识别物体的 CNN 架构;b) 与使用随机输入相比,使用来自 N 个不同簇的不同触觉地图作为输入时,物体识别准确率有所提升;c) 单手操纵物体时的一组代表性示例;d) 模型扩展版学到的卷积滤波器

    1.4K30发布于 2019-06-03
  • 来自专栏c++ 学习分享

    【65001在win7不识别,在win10系统识别

    65001在win7不识别,在win10系统识别 #pragma code_page(65001) 是一个指示编译器使用特定代码页来编译资源文件的预处理器指令。 操作系统更新和补丁:Windows 10 相比 Windows 7,包含了许多系统更新和补丁,这些更新可能改善了对 UTF-8 编码的支持。 Windows 10 的某些更新显著改善了对 UTF-8 的支持,包括命令行和其他系统工具。 大多数Windows应用程序都可以识别BOM,但某些程序和系统可能需要特定的顺序(Little Endian或Big Endian)。 在这种情况下,保存为UTF-16 LE格式通常是Windows平台上识别的默认方式。

    1.6K10编辑于 2023-12-28
  • 来自专栏全栈程序员必看

    AI图像识别_头像搜索图片识别在线

    使用百度AI图像识别提供的API接口来搭建识图工具,首先要注册百度开发者账号,然后找到图像识别页面,创建应用,申请成功后会给两个重要的数据API Key ,Secret Key,这是实现识图的重要参数, QFileDialog import json import base64 import urllib import urllib.request """ 你的 APPID AK SK """ # http://ai.baidu.com translate("Form", "地标")) self.comboBox.setItemText(9, _translate("Form", "车型")) self.comboBox.setItemText(10 ()) pass # 货币识别 elif self.comboBox.currentIndex() == 5: self.get_currency(self.get_token()) pass # 花卉识别 pass # Logo识别 elif self.comboBox.currentIndex() == 10: self.get_logo(self.get_token()) pass pass # 百度提供方法

    4.6K10编辑于 2022-09-20
  • 来自专栏Python编程 pyqt matplotlib

    CIFAR-10数据集 图像识别

    本篇我们还是用序列化的(串行的)卷积神经网络,基于CIFAR-10数据集创建图像识别模型。 # -*- coding: utf-8 -*- """ Created on Tue Dec 10 20:04:58 2019 @author: wsp Tensorflow version:2.0 Python train_dataset, train_labels, valid_dataset, valid_labels from matplotlib import pyplot as plt cifar10 = tf.keras.datasets.cifar10 #(x_train, y_train), (x_test, y_test) = cifar10.load_data() #从网络下载数据集 x_train tf.keras.layers.Dense(500, activation='relu'), tf.keras.layers.Dropout(0.25), tf.keras.layers.Dense(10

    1.6K10发布于 2019-12-25
  • 来自专栏程序你好

    Azure AI 服务之语音识别

    笔者在前文《Azure AI 服务之文本翻译》中简单介绍了 Azure 认知服务中的文本翻译 API,通过这些简单的 REST API 调用就可以轻松地进行机器翻译。 该程序会以不同的模式识别我们 hardcode 的两段音频数据,然后输出识别的结果。其中上面的文本框会输出大量的中间识别结果,而下面的文本框则输出最终的识别结果。 我们在程序中通过定义的常量来保存它们: const string SUBSCRIPTIONKEY = "your bing speech API key"; 由于 demo 的代码比较长,为了能集中精力介绍 Azure AI 代码中我们要通过它们来告诉语音识别 API 执行识别的类型。 AI 的兴起让我们看到了一线希望,在介绍了 Azure AI 的语音识别服务后,让我们接着探索如何通过 AI 让程序理解文本的内容。

    1.8K20发布于 2018-07-20
  • 来自专栏一“技”之长

    iOS10语音识别框架SpeechFramework应用

    iOS10语音识别框架SpeechFramework应用 一、引言         iOS10系统是一个较有突破性的系统,其在Message,Notification等方面都开放了很多实用性的开发接口 本篇博客将主要探讨iOS10中新引入的SpeechFramework框架。 SFSpeechRecognizer:这个类是语音识别的操作类,用于语音识别用户权限的申请,语言环境的设置,语音模式的设置以及向Apple服务发送语音识别的请求。 三、申请用户语音识别权限与进行语音识别请求         开发者若要在自己的App中使用语音识别功能,需要获取用户的同意。 SFSpeechRecognitionResult         SFSpeechRecognitionResult类是语音识别结果的封装,其中包含了许多套平行的识别信息,其每一份识别信息都有可信度属性来描述其准确程度

    1.4K20发布于 2018-08-15
  • 来自专栏Deep Learning 笔记

    图像识别(三)cifar10.py

    cifar10.py文件包含以下函数,用于搭建模型 def _activation_summary(x): def _variable_on_cpu(name, shape, initializer): _data', """Path to the CIFAR-10 data directory.""") tf.app.flags.DEFINE_boolean #描述 CIFAR-10 数据集的全局常量 IMAGE_SIZE = cifar10_input.IMAGE_SIZE NUM_CLASSES = cifar10_input.NUM_CLASSES NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN = cifar10_input.NUM_EXAMPLES_PER_EPOCH_FOR_TRAIN NUM_EXAMPLES_PER_EPOCH_FOR_EVAL = cifar10_input.NUM_EXAMPLES_PER_EPOCH_FOR_EVAL : raise ValueError('Please supply a data_dir') data_dir = os.path.join(FLAGS.data_dir, 'cifar-10

    1.6K40发布于 2018-09-02
  • 来自专栏毛利学Python

    智能盘点—钢筋数量AI识别

    赛题名称 https://www.datafountain.cn/competitions/332 智能盘点—钢筋数量AI识别 赛题背景 在工地现场,对于进场的钢筋车,验收人员需要对车上的钢筋进行现场人工点根

    1.2K10编辑于 2022-12-20
  • 来自专栏燧机科技-视频AI智能分析

    AI智能工服识别算法

    AI智能工服识别算法通过yolov5+python网络深度学习算法模型,AI智能工服识别算法通过摄像头对现场区域利用算法分析图像中的工服特征进行分析实时监测工作人员的工服穿戴情况,识别出是否规范穿戴工服 AI智能工服识别算法特征提取是指提取工服中的点或者块。因此不需要精确的人体定位和跟踪,并且局部特征对人体的表观变化,视觉变化和部分遮挡问题也不是很敏感。因此在行为识别中采用这种特征的分类器比较多。 AI智能工服识别算法识别中的局部特征点是视频中时间和空间中的点,这些点的检测发生在视频运动的突变中。因为在运动突变时产生的点包含了对人体行为分析的大部分信息。 AI智能工服识别算法对于卷积层,主要使用1x1卷积来做channle reduction,然后紧跟3x3卷积。 除了上面这个结构,AI智能工服识别算法提出了一个轻量级版本Fast Yolo,其仅使用9个卷积层,并且卷积层中使用更少的卷积核。

    54920编辑于 2023-09-14
  • 来自专栏燧机科技-视频AI智能分析

    AI人员打闹监测识别算法

    AI人员打闹监测识别算法通过yolo+python网络模型框架算法, AI人员打闹监测识别算法能够准确判断出是否有人员进行打闹行为,算法会立即发出预警信号。 图片在介绍AI人员打闹监测识别算法之前,首先先介绍一下滑动窗口技术,这对我们理解AI人员打闹监测识别算法Yolo算法是有帮助的。 但是这个方法有致命的缺点,就是你并不知道要检测的目标大小是什么规模,所以你要设置AI人员打闹监测识别算法不同大小和比例的窗口去滑动,而且还要选取合适的步长。 AI人员打闹监测识别算法很好的解决了这个问题,它不再是窗口滑动了,而是直接将原始图片分割成互不重合的小方块,然后通过卷积最后生产这样大小的特征图,基于上面的分析,可以认为AI人员打闹监测识别算法特征图的每个元素也是对应原始图片的一个小方块 ,然后用每个元素来可以预测那些中心点在该小方格内的目标,这就是AI人员打闹监测识别算法的朴素思想。

    45830编辑于 2023-09-23
  • 来自专栏燧机科技-视频AI智能分析

    ai安全帽识别检测

    ai安全帽识别检测通过python+yolov5网络模型深度学习AI视频分析技术,ai安全帽识别检测对现场人员是否佩戴安全帽进行识别检测,ai安全帽识别检测一旦发现现场工人员没有按要求佩戴安全帽,自动进行预警并保存图像到本地同步提示后台人员及时处理 我们选择当下YOLOv5来进行安全帽识别检测。6月9日,Ultralytics公司开源了YOLOv5,离上一次YOLOv4发布不到50天。而且这一次的YOLOv5是完全基于PyTorch实现的!

    78230编辑于 2023-03-20
  • AI图像识别检测系统

    在数字化转型浪潮中,图像识别检测系统正成为连接物理世界与数字空间的核心纽带。 一、核心技术优势解析相较于传统方案,AI图像识别检测系统在多个维度实现突破性提升:在识别精度上,传统方案受光照、角度影响大,而智能系统通过自适应环境增强模型鲁棒性,大幅降低环境干扰带来的误差;处理速度方面 (二)医疗影像辅助诊断放射科医生面对海量CT/MRI片子时,AI助手能优先标出可疑病灶区域,并标注置信度分数。在肺结节筛查场景中,系统对微小钙化点的敏感度达到96%,有效弥补人为阅片的视野盲区。 更创新的是姿态识别技术的应用——当顾客拿起商品超过5秒未放回时,自动推送产品详情到其手机APP。某连锁超市应用后,关联销售转化率提升22%,库存周转天数缩短4天,优化零售运营效率。 这些突破将推动图像识别技术向更多长尾场景渗透,真正实现“所见即所知”的智慧愿景。

    57210编辑于 2025-10-16
领券