首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器之心

    7 Papers & Radios | 推理速度比Stable Diffusion快2倍;视觉Transformer统一图像文本

    随后,作者建议在概括性和鲁棒性、可信推理、从反馈中学习和多模态数学推理方面改进目前的工作(第 7 节)。 推荐:深度学习如何慢慢推开数学推理的门。 推荐:推理速度比 Stable Diffusion 快 2 倍,生成、修复图像谷歌一个模型搞定。 值得一提的是,我们的模型在单卡 P100 上实现了 4K 超高分辨率图像的实时推理。 推荐:一键抹去瑕疵、褶皱。 (from Xiangyu Zhang, Jiaya Jia) 7. (from Kai Chen) 7.

    53120编辑于 2023-03-29
  • XVERSE-7B-chat Transformers 推理

    XVERSE-7B-Chat为XVERSE-7B模型对齐后的版本。 XVERSE-7B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),参数规模为 70 亿,主要特点如下: 模型结构:XVERSE-7B 使用主流 Decoder-only ', cache_dir='/root/autodl-tmp', revision='master') Transformers 推理以及 INT8、INT4 量化推理 我们在 /root/autodl-tmp 默认是支持 INT8 和 INT4 类型的量化,这样在推理的适合可以大幅降低模型加载所需的显存。 INT4 量化推理的运行效果如下:

    19110编辑于 2025-07-21
  • 来自专栏计算机工具

    本机实现Llama 7B推理及部署

    本机实现Llama 7B推理及部署 使用llamafile在Windows系统部署- **部署步骤**:首先从[https://www.modelscope.cn/api/v1/models/bingal `是web界面访问端口,可自行修改.- **推理时间**:其推理速度取决于所使用的GPU性能等因素,使用较高端的GPU如NVIDIA GeForce RTX 3090等可以获得较快的推理速度,一次推理时间可能在几秒到十几秒不等 7. 创建一个Python脚本,如`inference_api.py`,在脚本中实例化模型并通过API生成推理。 - **推理时间**:如果仅使用CPU推理推理速度相对较慢,一次推理时间可能在十几秒甚至更长;若使用支持Metal框架的Mac设备且有较好的GPU性能,推理时间会有所缩短,但通常仍比使用高性能独立GPU -2-7b-guf/resolve/main/llama-2-7b.q5_k_m.guf`。

    87520编辑于 2024-12-30
  • 来自专栏新智元

    【Science】DeepMind关系推理ANN,在图像理解中击败人类

    【新智元导读】人类通常相当擅长关系推理,但对 AI 来说是难点。谷歌 DeepMind 研究人员提出了用于关系推理的人工神经网络。 这些问题需要关系推理,这对于 AI 来说是难点。现在,谷歌 DeepMind 的研究人员已经开发了一种简单的算法来处理这种推理,而且它已经在复杂的图像理解测试中打败了人类。 它拥有处理图像、分析语言甚至学习游戏的专门架构。在这种情况下,新的“关系网络”设计用来比较各个场景中的每一对对象。 对于这个任务,关系网络与另外两种类型的神经网络组合:一个用于识别图像中的对象,一个解释问题。在许多图像和问题上,其他机器学习算法在 42% 到 77% 的时间是正确的。人类取得了 92% 的好成绩。 “我希望可以实现自己生成策略的模型”,他表示:“ DeepMind 正在致力于一种特定类别推理的建模,并非普遍意义上的关系推理。但是向着正确方向迈进的及其重要的一步”。

    1.1K170发布于 2018-03-28
  • 《数字图像处理》实验7-图像特征提取

    title('G通道', 'FontSize', 12); subplot(3,3,6); imshow(B); title('B通道', 'FontSize', 12); subplot(3,3,7) 、灰度变化最剧烈的区域; 应用场景:适用于图像匹配、目标识别(如物体追踪、图像拼接)。 '请选择要分析的图像文件'); % 处理文件选择(取消则使用默认图像) if isequal(fname, 0) || isequal(pname, 0) fprintf('用户取消了文件选择 ,使用默认示例图像... 通过本次实验,系统掌握了五大类图像特征的提取方法,理解了不同特征的核心优势与适用场景,为后续计算机视觉高级应用(如图像分类、目标检测)奠定了基础。

    13810编辑于 2026-01-21
  • 来自专栏AIoT技术交流、分享

    LabVIEW图像灰度测量(基础篇—7

    像素灰度是图像最为典型的特征之一,基于图像像素灰度能衍生更多的图像特征,包括图像的直方图、线灰度分布曲线、图像线灰度均值、ROl边界灰度曲线、灰度定量描述以及图像结构相似度等,如下图所示: ? 拓展学习:https://handsome-man.blog.csdn.net/article/details/116572729 在机器视觉领域,图像灰度特征可用于实现目标的存在性检测和基于灰度的模式匹配 在进行目标的存在性检测时,机器视觉系统会不断计算并监测指定ROI范围内的图像灰度量化指标是否在设定的范围内,若指标超限,则认为所检测的目标不存在。 基于灰度的模式匹配,可以计算图像中的灰度或梯度,并从中寻找可与模板图像匹配的特征。 在牙线生产过程中,常会出现牙线未安装或牙线断裂的情况。为了能剔除此类次品,可监测安装牙线区域的图像灰度均值及标准差。 通过一个基于图像灰度特征进行牙线检测的实例程序,了解其使用方法。 该实例使用了字符串状态机结构,包括程序初始化、基于标准样本设置ROI、更新测量坐标系、产品检

    77130发布于 2021-08-10
  • 原生多模态推理:Gemini 3 如何“理解世界”而非“拼接图像”?

    @TOC开篇引言在人工智能领域,多模态推理一直是一个重要的研究方向。传统的多模态模型通常将不同模态的数据(如文本、图像、音频)进行简单的特征拼接,然后进行联合推理。 Gemini 3 是一种新型的多模态推理框架,它通过原生多模态推理技术,能够更好地“理解世界”,而不仅仅是“拼接图像”。 通过结合用户的历史听歌记录(文本)、专辑封面(图像)和音乐片段(音频),Gemini 3 能够更准确地理解用户的音乐偏好,并推荐符合其口味的音乐。 这种原生多模态推理技术不仅能够更好地“理解世界”,还能够应用于各种实际场景,如猴子音悦100万正版音乐的推荐系统。 总结本文深入探讨了原生多模态推理:Gemini 3 如何“理解世界”而非“拼接图像”?的相关技术,从原理到实践,从基础到进阶,希望能够帮助读者全面掌握这一技术。

    28210编辑于 2025-12-25
  • 来自专栏贾志刚-OpenCV学堂

    图像编辑器 Monica 之生成漫画风格的图像、以及使用 GPU 实现推理

    图像编辑器 Monica Monica 是一款跨平台的桌面图像编辑软件(早期是为了验证一些算法而产生的)。 ONNXRuntime 部署的模型都支持使用 GPU 来加速推理。 风景图动漫化.png 2.2 模型的加载、推理 下面展示 AnimeGANv3 相关模型的加载、推理方法,先定义一个 AnimeGAN 类 #include<iostream> #include<fstream ,将图像转换成漫画的风格。 使用 GPU 推理 在使用 GPU 做推理时,需要有个前提就是确保安装了 CUDA、cuDNN 以及 CUDA 对应的 ONNXRuntime 版本。

    10600编辑于 2026-04-02
  • 来自专栏信数据得永生

    OpenCV 图像处理学习手册:6~7

    捕获的图像可以传输到开发计算机,并用于创建 HDR 图像。 注意 从 iOS 7 开始,本机相机应用具有 HDR 模式,可自动快速捕获三幅图像,每幅图像具有不同的曝光度。 这些图像也会自动组合为单个(有时更好)的图像。 创建 HDR 图像 我们如何将多张(例如三张)曝光图像合成为 HDR 图像? 甚至还有一个名为hdr_imaging的教程示例,该示例从图像文件中读取图像文件和曝光时间列表,并创建 HDR 图像。 seamlessClone函数获取源图像,目标图像和遮罩图像以及目标图像中将插入裁剪对象的点(可以从这个页面)。 Intel SDK:此 SDK 在 Intel Core 处理器和 Intel HD GPU(例如 Intel + SSE4.1,SSE4.2 或 AVX,Intel Core i7,i5 和 i3(

    2.1K30编辑于 2023-04-27
  • 来自专栏计算摄影学

    7. 图像处理的应用-运动滤波

    在前面的章节中,我讲了很多图像变换中的基本操作:图像滤波,包括空域滤波和频域的滤波。今天来给大家分享一个非常有意思的图像滤波的应用:运动滤波。 这里我们会看到计算摄影中图像的像素操作的新奇的应用,而且由于今天所讲述的操作对象是视频,因此我还会学习到图像的时域操作。 植物生长的原始视频 联想到我们之前学过的图像滤波的知识,你会怎么做来去除这些短期的晃动呢?我想你肯定想到了之前提到的一些图像滤波技术,例如高斯滤波,或者Box滤波。 naive的时域滤波带来的问题 也有人提出,对图像的特征点进行跟踪,观察它在每一帧的变换,获取到图像每个局部的变换模式,并利用这种模式进行平滑。 这种方法能得到远好于最基础的时域图像滤波技术处理的视频。 ?

    1.2K21发布于 2020-04-17
  • 来自专栏OpenCV与AI深度学习

    干货 | YOLOv7目标检测论文解读与推理演示

    导读 本文主要介绍简化的YOLOv7论文解读和推理测试以及YOLOv7与 YOLO系列的其他目标检测器的比较。 YOLO 框架具有三个主要组件: Backbone Head Neck Backbone主要提取图像的基本特征,并通过Neck将它们馈送到Head。 在缩放模型大小时,会考虑以下参数: 分辨率(输入图像的大小) 宽度(通道数) 深度(网络层数) 阶段(特征金字塔的数量) NAS(Network Architecture Search)是一种常用的模型缩放方法 上述实验结果表明,YOLOv7 模型在速度和准确度上确实优于目标检测器。 YOLOv7目标检测推理 现在,让我们进入博文中令人兴奋的部分,即使用 YOLOv7 对视频进行推理。 让我们看看使用 YOLOv7-Tiny(顶部)和 YOLOv7(底部)模型对第一个视频的检测推理结果。以下命令分别用于使用 Tiny 和 Normal 模型运行推理

    6.2K30编辑于 2022-09-26
  • 《数字图像处理》第7章:小波变换和其他图像变换

    欢迎来到《数字图像处理》第7章的实战解析。本章聚焦于小波变换和其他图像变换,这是图像处理的核心工具之一。 (8), np.arange(8)) # 0-7的斜坡 print("\n原始8x8图像块:\n", original_block) # DCT变换(手动使用基图像) dct_coeffs = np.zeros 重建图像 img_rec = idct2(dct_compressed) # 7. (效率低于DCT) 【与DCT对比】 DCT: 压缩率高,JPEG标准 WHT: 计算快,适合实时系统 """) # ==================== 7. 第7章。 2.Mallat, S. (1999).

    51921编辑于 2026-01-21
  • 来自专栏石开之旅

    图像处理笔记(7)---- OpenCV 绘制无填充矩形

    ,(0,255,0),1) else: cv.circle(img,(x,y),abs(x-ix),(0,0,255),1) #创建一个黑色的图像 ),(x,y),(0,255,0),1) else: cv.circle(img,(x,y),5,(0,0,255),-1) #创建一个黑色的图像

    1.2K20发布于 2020-09-21
  • 来自专栏AI大模型应用开发炼丹房

    解剖vLLM:高吞吐LLM推理引擎的7大核心技术​

    作为分布式大模型推理引擎,vLLM通过分页注意力、连续批处理等核心技术实现高吞吐与低延迟。今天我将深度解析其架构设计。如果对你有所帮助,记得告诉身边有需要的朋友。​​ tokens/块),通过内存池动态分配:​​调度器​​:支持FCFS/优先级调度,维护等待队列与运行队列,混合处理预填充与解码请求​​执行器​​:驱动模型前向传播,支持即时执行与CUDA图优化​​1.2 推理流程​​​​ latency:测量端到端延迟vllm bench throughput:压力测试峰值吞吐自动SLO优化:动态调整参数满足延迟约束最后​​总结​一下​vLLM通过创新内存管理、分布式调度与算法优化,在LLM推理场景实现数量级性能提升 当然,主流的LLM推理框架除了vLLM,还有其它几大框架,具体的选择根据实际项目需求来定,几大框架的优势对比及选型,我这里也做了一个技术文档,实力宠粉。 粉丝朋友自行领取:《大型语言模型(LLM)推理框架的全面分析与选型指南(2025年版)》好了,今天的分享就到这里,点个小红心,我们下期见。

    1.3K10编辑于 2025-09-04
  • 来自专栏人人都是架构师

    HugggingFace 推理 API、推理端点和推理空间使用介绍

    本文将介绍 HuggingFace 的推理 API、推理端点和推理空间的使用方法。 页面小组件 推理 API 有两种使用方式,一种是在模型页面的右侧找到推理 API 的小组件页面,初始界面如下图所示: 我们可以在这个页面中上传图片,然后就可以看到模型进行推理运行,等一会后推理结果就出来了 (Endpoint) 推理 API 虽然方便,但推理 API 一般用于测试和验证,由于速率限制,官方不推荐在生产环境中使用,而且也不是所有模型都有提供推理 API。 信息确认无误后点击Create Endpoint按钮创建推理端点,创建成功后可以进入推理端点的详情页面看到如下信息: 其中Endpoint URL就是部署好的推理端点地址,我们可以跟调用推理 API 总结 本文介绍了 HuggingFace 的推理 API、推理端点和推理空间的使用方法,推理 API 是免费的,使用 HuggingFace 自建的 API 服务,推理端点是部署自己专属的 API 服务

    4.4K40编辑于 2023-09-17
  • 来自专栏DeepHub IMBA

    vLLM推理加速指南:7个技巧让QPS提升30-60%

    GPU 永远不够用,这大概是每个做推理服务的人都有的共识。相比无脑加卡,更实际的办法是把现有资源榨干。下面这些是我在实际项目里反复用到的几个调优手段,有代码、有数据、也有一些踩坑经验。 7、热路径预热和指标监控 还有两个看起来无聊但实际很关键的点。 第一是预热。 总结 在最后总结之前先给一个实测的数据 单张 80GB 的 GPU 跑 7B 到 8B 的聊天模型,从无限制无流式改成流式加 256 token 上限,用户感知响应速度能翻倍,可持续 QPS 提升 30%

    54710编辑于 2025-11-15
  • 来自专栏EMQ 物联网

    eKuiper 1.8.0 发布:零代码实现图像视频流的实时 AI 推理

    该版本的主要亮点有: 零编码 AI 推理: 通过通用 AI 函数,用户无需编码即可针对流式数据或视频流实现实时 AI 算法推理。该函数可以推理任意的 Tensor Flow Lite 模型。 图像/视频流推理 配合新版本提供的视频流源(详情见下文),eKuiper 提供了视频接入并定时获取图像帧的能力。图像帧可在规则中,使用 tfLite 函数进行 AI 推理。 Tensor Flow 模型通常是针对特定的图像大小进行训练的,对图像进行推理时,经常需要进行变更大小等预处理。eKuiper 也提供了 resize、thumnail 等预处理方法。 连接生态扩展 eKuiper 可以处理二进制图像数据,但是此前的测试中,图像都是经由 MQTT、HTTP 等偏向文本数据传输的协议来发送。新版本提供了视频流源,增加了一种新的二进制数据源。 通过视频源接入的数据,可以使用已有的 SQL 功能,例如 AI 推理函数功能等,转换成数据进行计算或输出为新的二进制图像等。 规则自动化运维 部署在边缘端的规则运维相对困难。

    1.5K20编辑于 2023-03-01
  • 来自专栏往期博文

    【OpenCV】Chapter7.图像噪声与滤波器

    最大值滤波器:用预定义的像素邻域中的灰度最大值来代替像素的值,可用于找到图像中的最亮点,或用于消弱与明亮区域相邻的暗色区域,也可以用来降低胡椒噪声。 最小值滤波器:用预定义的像素邻域中的灰度最小值来代替像素的值,可用于找到图像中的最暗点,或用于削弱与暗色区域相邻的明亮区域,也可以用来降低盐粒噪声。 j:j + n] imgMiddleFilter[i, j] = int(pad.max() / 2 + pad.min() / 2) plt.figure(figsize=(9, 7) 选择d的大小对图像处理的效果影响很大,当 d=0 时简化为算术平均滤波器,当 d=mn/2−1 简化为中值滤波器。 :m * n - d - 1]) imgAlphaFilter2[i, j] = sumAlpha / (m * n - 2 * d) plt.figure(figsize=(9, 7)

    1.2K30编辑于 2022-09-26
  • 来自专栏CreateAMind

    因果推理比概率推理更难吗?

    统计和因果推理中的许多任务可以被解释为合适的形式语言中的蕴含问题。我们问,从计算的角度来看,对于因果概率语言来说,这些问题是否比纯概率(或“关联”)语言更困难。 尽管从多种意义上讲,因果推理确实更复杂——无论是表达上的还是推理上的——我们表明因果蕴涵(或可满足性)问题可以系统地、稳健地简化为纯粹的概率问题。因此,计算复杂性不会增加。 毫无争议的是,因果推理比纯粹的概率或统计推理更困难。后者似乎已经足够困难了:估计概率、根据过去的观察预测未来事件、确定统计显着性、在统计假设之间做出裁决——这些已经是艰巨的任务,长期陷入争议。 因果推理问题似乎只会让我们的任务变得更加困难。推断因果效应、预测干预结果、确定因果方向、学习因果模型——这些问题通常需要统计推理,但也对研究者提出更多要求。 从推理的角度来看,概率信息远远不能确定因果信息。 统计推断和因果推断的一个共同特征是,每种方法最突出的方法都可以(至少部分地)理解为试图将归纳问题转化为演绎问题。

    27810编辑于 2024-03-25
  • 来自专栏bit哲学院

    知识推理

    参考链接: 从列表中移除满足Java中给定谓词元素 目录   本体知识推理简介与任务分类  OWL本体语言  知识推理任务  OWL本体推理  ​ 实例化(materialization)的一个例子:   OWL本体推理:不一致性检测  OWL本体非标准推理:计算辩解   本体推理方法与工具介绍  基于Tableaux运算的方法  ​  Tableaux运算的正确性  相关工具简介  ​ 基于逻辑编程改写的方法    本体推理的局限:  (1) 仅支持预定义的本体公理上的推理(无法针对自定义的词汇支持灵活推理)  (2) 用户无法定义自己的推理过程   引入规则推理  (1) 可以根据特定的场景定制规则,以实现用户自定义的推理过程    上下位推理  查询的同时已经做出了推理!   查询触发推理 查询输入类别s和o之间有无上下位关系    添加推理机   OWL推理: 构建OWL推理机  构建一个含OWL推理功能的Model  Model myMod = ModelFactory.createDefaultModel

    2K00发布于 2020-12-13
领券