首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Coding01

    TensorFlow (2) CIFAR-10 简单图像识别

    本文 2345.5字,需要 5.86 分钟 CIFAR-10 图像识别 本文主要学习获取 CIFAR-10 数据集,通过简单的模型对数据集进行训练和识别。 (32, (3, 3), activation='relu', input_shape=(32, 32, 3))) model.add(layers.MaxPooling2D((2, 2))) model.add (layers.Conv2D(64, (3, 3), activation='relu')) model.add(layers.MaxPooling2D((2, 2))) model.add(layers.Conv2D ________________________ max_pooling2d (MaxPooling2D) (None, 15, 15, 32) 0 __________ _______________ conv2d_2 (Conv2D) (None, 4, 4, 64) 36928 ___________________

    1.6K20发布于 2021-02-24
  • 来自专栏一点人工一点智能

    小白系列(2)| 图像识别中的Vision Transformers

    图像识别中的ViT模型 Vision Transformers是如何工作的? 主流的图像识别算法包括ResNet、VGG、YOLOv3和YOLOv7。 相比之下,stride=2的3*3卷积增加了稳定性并提高了精度。 CNN将基本像素转换为特征图。随后,特征图由tokenizer转换为一系列标记,然后输入到Transformer中。 为了以更好的分辨率进行微调,需要完成了预训练位置嵌入的2D表示。这是因为可训练线性层可以对位置嵌入进行建模。 04 Vision Transformers的应用 ViTa在诸如目标检测、分割、图像分类和动作识别等主要的图像识别任务中有广泛的应用。

    1.9K30编辑于 2022-12-27
  • 来自专栏python3

    【python 图像识别图像识别从菜鸟

    一、安装配置(python2.7) 1.pip install pytesseract 2、pip install pyocr 3、pip install pillow 4、安装tesseract-ocr Python27\Lib\site-packages\pytesseract\test.png') code = pytesseract.image_to_string(image) print(code) 2、 count + 1 if pixdata[x+1,y] > 245: count = count + 1 if count > 2: img1=binarizing(img,190) # img2=depoint(img1) img1.show() code = pytesseract.image_to_string(img1) print

    12.4K41发布于 2020-01-10
  • 来自专栏AILearning

    图像识别

    连续模式继续显示改进,每次实现新的最先进的结果: QuocNet,AlexNet,Inception(GoogLeNet),BN-Inception-v2。 我们现在正在采取下一步,发布在最新型号Inception-v3上运行图像识别的代码。 Inception-v3 使用2012年的数据对ImageNet大型视觉识别挑战进行了培训。 AlexNet通过在2012年验证数据集上设置了15%的前5个错误率来实现; 初创(GoogLeNet)达到6.67%; BN-Inception-v2达到4.9%; 初创v3达到3.46%。

    22.3K80发布于 2018-01-05
  • App Inventor 2 Personal Image Classifier (PIC) 拓展:自行训练AI图像识别模型,开发图像识别分类App

    这里仅仅介绍一下AI图像识别App的实现原理,AI的基础技术细节不在本文讨论范围。通过拓展即可开发出一款完全自行训练AI模型,用于特定识别场景的App了。 App Inventor 2 使用拓展及AI模型数据,对图像进行识别和分类PersonalImageClassifier (PIC) 拓展的用法请参考demo,或直接看英文文档自行研究,这里暂时不做展开

    90210编辑于 2024-03-06
  • 来自专栏aardio

    aardio 图像识别

    今天终于学会了编程中的 OCR 技术!原来计算机真的能识别图片里的文字,这种让程序 "看懂" 图像的能力太神奇了,赶紧把学习过程记录下来。

    70210编辑于 2025-06-20
  • 来自专栏腾讯移动品质中心TMQ的专栏

    Airtest图像识别

    Airtest是一款网易出品的基于图像识别面向手游UI测试的工具,也支持原生Android App基于元素识别的UI自动化测试。 图示为AirtestIDE中脚本运行范例 本文重点是针对Airtest中的图像识别进行代码走读,加深对图像识别原理的理解(公众号贴出的代码显示不全仅供参考,详细代码可以在github查看)。 ()  五、最终用到的就是OpenCV的两个方法:模版匹配和特征匹配 1.模板匹配:  cv2.matchTemplate(i_gray, s_gray, cv2.TM_CCOEFF_NORMED) 2 OpenCV的图像识别算法。 六、总结 1、图像识别,对不能用ui控件定位的地方的,使用图像识别来定位,对一些自定义控件、H5、小程序、游戏,都可以支持; 2、支持多个终端,使用图像识别的话可以一套代码兼容android和ios哦,

    14.6K21发布于 2019-01-08
  • 来自专栏企鹅号快讯

    图像识别——MNIST

    本文使用NEURAL程序来介绍一下在SAS里如何实现图像识别。例子所用的数据集是MNIST数据集,从http://yann.lecun.com/exdb/mnist/可以获取。

    7.1K40发布于 2018-02-28
  • 来自专栏小鹏的专栏

    图像识别之mixupcutmix

    代码如下: def rand_bbox(size, lam): W = size[2] H = size[3] cut_rat = np.sqrt(1. - lam) cut_w uniform cx = np.random.randint(W) cy = np.random.randint(H) bbx1 = np.clip(cx - cut_w // 2, 0, W) bby1 = np.clip(cy - cut_h // 2, 0, H) bbx2 = np.clip(cx + cut_w // 2, 0, W) bby2 = np.clip(cy + cut_h // 2, 0, H) return bbx1, bby1, bbx2, bby2 def cutmix(data, targets1, targets2

    7.5K10发布于 2020-02-18
  • 来自专栏小鹏的专栏

    图像识别之GridMask

    数据下载:https://www.kaggle.com/c/bengaliai-cv19/data 代码: import os import cv2 import numpy as np import

    6.3K10发布于 2020-02-18
  • 来自专栏决策智能与机器学习

    算法集锦(14)|图像识别| 图像识别算法的罗夏测试

    随着对基于深度学习的图像识别算法的大量研究与应用,我们倾向于将各种各样的算法组合起来快速进行图片识别和标注。 罗夏测验材料由10张结构模棱两可的墨迹图组成,其中5张全为黑色,2张是在黑色和灰色图外加了红色墨迹,另3张全为彩色。 算法分类器 为了对罗夏测试的各个图片进行分类,我们尝试了以下算法: ResNet50 VGG16 VGG19 InceptionV3 InceptionResNetV2 Xception MobileNet MobileNetV2 DenseNet NASNet 各个算法模型的结构及权重特点如下表所示。 例如,InceptionResNetV2、nasnetbig和DensetNet201认为卡片1是一架战机(分数分别为88.3%、46.2%和18.6%)。我把它加起来是153.1的无量纲分数。

    6.8K20发布于 2020-08-04
  • 来自专栏小鹏的专栏

    图像识别之augmix

    augmix: https://github.com/google-research/augmix

    6.5K10发布于 2020-02-18
  • 来自专栏燧机科技-视频AI智能分析

    智能视频图像识别

    智能视频图像识别系统选用人工智能识别算法技术,能够随时监控和剖析现场各大品牌相机中的视频图像。 智能视频图像识别系统软件关键运用相机拍摄的图像开展智能实时分析,抓拍监控识别和检作业现场的违规操作及行为,并向责任人推送信息。 与传统监控系统软件对比,智能视频图像识别系统软件增强了自主监控报警的能力,增强了数据检测和解析功能。智能视频图像识别系统具备很大的经济价值和广泛的应用领域,引起了国内外研究工作人员的广泛关注。 智能视频图像识别识别系统实现了下列识别优化算法:(1)施工作业安全帽子识别(2)混色+响应式工作服装识别(3)未系安全带高处作业识别(4)超长距离地区警示(5)浓烟+明火识别(6)睡岗识别(7)手机识别 智能视频图像识别可应用于全部必须生产安全/工程施工的场地,包含在建工地、在建地铁/铁路线/道路、新建加工厂和经营加工厂、煤矿业和工作船,给施工作业产生很大的方便。

    8K40编辑于 2022-09-14
  • 来自专栏Bingo的深度学习杂货店

    图像识别——突破与应用

    最近,图像识别领域发布了白皮书,简单翻译一下做个总结。 ---- 目录 [1] Introduction      1.1 Exponential Growth of Image and Video      1.2 Statistics [2] Image 这个数字起初可能令人震惊,但考虑到每天通过智能手机访问Facebook站点的活跃用户数量(每月20亿)(截至2017年2月1日,每天有11.5亿移动活跃用户)加上人们依赖这些设备上的相机,数字是有道理的 ---- [2] 图像识别 图像识别的目标是识别图像中的对象和人,并理解上下文。图像识别属于机器知觉,机器知觉是机器学习(ML)和人工智能(AI)的一部分。 这是图像识别史上的一个转折点,也是这个领域前途光明的开始。这个成就将焦点从传统的图像识别方法转移到了使用深度神经网络的新方法。

    15.8K113发布于 2018-04-25
  • 来自专栏瓜大三哥

    图像识别(自己训练模型)

    1.数据集:从VGG网下载,这是一些各种猫和狗的图片(每个文件夹下面大约200张图片,有点少,所以训练的结果并不是很好,最好是上万的数据) 2.做得图像识别网络模型:(这个是技术核心,但是在神经网络里也有一句话 出错的原因主要有三个方面: (1)数据太少 (2)网络模型有待优化 (3)各种动物之间差距太小,所以特征值不好提取,比如你用这个模型人和狗,那几乎可以达到百分之百的准确率

    6.7K70发布于 2018-02-24
  • 来自专栏梦无矶测开实录

    python文字图像识别tesseract

    [AI测试]python文字图像识别tesseract 七夕了,咱来学点知识! pwd=mwj6 提取码:mwj6 2、进行安装 (1)双击下载好的exe,建议右键以管理员身份运行 (2)点击next (3)点击I Agree (4)根据需要选择,第一个是为这台电脑所有用户下载 /tesseract-ocr/tessdata_best 网速不好的用这个 链接:https://pan.baidu.com/s/11k5od_fd3_THN2YiGgmH3w? , # we need to convert from BGR to RGB format/mode: img_rgb = cv2.cvtColor(img_cv, cv2.COLOR_BGR2RGB) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # cv2让图片黑白 # 2、执行文字识别和坐标提取 英语就是eng results = pytesseract.image_to_data

    4.1K30编辑于 2023-09-08
  • 来自专栏数据科学与人工智能

    【研究】图像识别及应用

    1 图像识别是什么? 2 图像识别的应用场景有哪些? 什么是图像识别 图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。 实际上,图像识别和图像分割并不存在严格的界限。从某种意义上,图像分割的过程就是图像识别的过程。 图为图像识别系统图 图像识别的国内外研究现状 图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。 2、电商购物 ? 图像识别在安防领域应用较多,未来在软硬件铺设到后端软件管理平台的建设转型中,图像识别系统将成为打造智慧城市的核心环节。

    8.3K70发布于 2018-02-26
  • AI图像识别检测系统

    在数字化转型浪潮中,图像识别检测系统正成为连接物理世界与数字空间的核心纽带。 一、核心技术优势解析相较于传统方案,AI图像识别检测系统在多个维度实现突破性提升:在识别精度上,传统方案受光照、角度影响大,而智能系统通过自适应环境增强模型鲁棒性,大幅降低环境干扰带来的误差;处理速度方面 这些突破将推动图像识别技术向更多长尾场景渗透,真正实现“所见即所知”的智慧愿景。

    57710编辑于 2025-10-16
  • 来自专栏飞鸟的专栏

    使用python实现图像识别

    图像识别是人工智能中的重要分支之一,通过使用机器学习算法来训练模型,使其能够识别图像中的物体、场景或人脸等。 在本文中,我们将介绍使用Python实现图像识别的方法,其中主要使用的是深度学习框架Keras和OpenCV库。 可以通过pip命令安装: pip install keras tensorflow opencv-python 数据准备 图像识别的第一步是准备数据集。 activation='relu', input_shape=(28, 28, 1))) # 添加一个最大池化层 model.add(MaxPooling2D(pool_size=(2, 2))) 可以使用以下代码对一张图像进行预测: import cv2 # 读取图像 img = cv2.imread('test_image.png', cv2.IMREAD_GRAYSCALE) # 调整图像大小为

    14.3K72编辑于 2023-03-28
  • 来自专栏燧机科技-视频AI智能分析

    视频监控智能图像识别

    视频监控智能图像识别技术实际上是一种,它为建筑工程施工品质和安全工作给予了优秀的方式方法。施工人员的安全隐患因为欠缺高度重视或因为缺少较好的监管方式 ,施工工地安全事故的次数较高。 视频监控智能图像识别根据在施工工地安装的各种各样不限品牌的监控设备,可以有效的填补传统式监控方式 和技术性的缺点,完成工作人员、机械设备、原材料、自然环境的全方位即时监控,将处于被动监管变化为积极监控, 视频监控智能图像识别分析系统依据在施工工地进出口、安全通道、护栏等地方组装智能监控摄像头,将监控视频与云服务平台进行联接,管理者依据监控器大屏幕可以检查施工工地各地区的及时情况。

    6K20编辑于 2022-09-12
领券