首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏深度学习和计算机视觉

    加速 PyTorch 模型训练的 9 个技巧

    我明白,网上都是各种神经网络加速指南,但是一个checklist都没有(现在有了),使用这个清单,一步一步确保你能榨干你模型的所有性能。 [1_CER3v8cok2UOBNsmnBrzPQ](9 Tips For Training Lightning-Fast Neural Networks In Pytorch.assets/1_CER3v8cok2UOBNsmnBrzPQ.gif 你得到的加速取决于你所使用的GPU类型。我推荐个人用2080Ti,公司用V100。 9. 多节点GPU训练 每台机器上的每个GPU都有一个模型的副本。每台机器获得数据的一部分,并且只在那部分上训练。每台机器都能同步梯度。 英文原文:https://towardsdatascience.com/9-tips-for-training-lightning-fast-neural-networks-in-pytorch-8e63a502f565‍‍‍

    1.2K20编辑于 2022-02-09
  • 来自专栏Python绿色通道

    9 个小技巧,加速 Python 的优化思路

    本文对一些 Python 代码加速运行的技巧进行整理。 0. 代码优化原则 本文会介绍不少的 Python 代码加速运行的技巧。在深入代码优化细节之前,需要了解一些代码优化基本原则。 result = computeSqrt(size) main() 在第 1 节中我们讲到,局部变量的查找会比全局变量更快,因此对于频繁访问的变量sqrt,通过将其改为局部变量可以加速运行 sum def main(): size = 10000 for _ in range(size): sum = computeSum(size) main() 9.

    1K30发布于 2021-07-13
  • 来自专栏刘旷专栏

    AI主播、AI记者、AI编辑,传媒AI加速

    但随着AI的深入,Microsoft News方面逐渐转向 AI,其鼓励出版商和新闻工作者使用AI辅助工作,或用AI替代人工进行内容的处理、过滤、发表。 微软作为全球名企,每个改变都会引起其他企业效仿和学习,这一次AI替代编辑人员的改变也将影响传媒行业的发展。国外传媒AI之路是如此,国内传媒AI化之路也在逐渐升温。 传媒行业正在AI化 目前为止,AI对于各行各业起到的作用都是正面性的,传媒行业也不例外。 AI化。 传媒行业加速AI化,本质上是主流媒体、科技巨头为强化自身竞争实力所作出的改变,而新趋势将带来新格局,又一轮竞争开始了。 文/刘旷公众号,ID:liukuang110

    1.2K30发布于 2020-06-28
  • 来自专栏CSDN技术头条

    Facebook开源Torchnet,加速AI研究

    近日,Facebook 发表了一篇学术论文和一篇博客帖子详述Torchnet——一个用于简化人工智能——深度学习的新型开源软件。 图片描述 深度学习涉及海量数据,比如图片之上训练人工神经网络是目前的一大技术趋势。利用神经网络来预测新的数据,相比于构建一个全新的深度学习框架,Facebook决定在Torch基础之上来构建深度学习框架,Torch是一个Facebook之前开源的源程序库。 Facebook人工智能研究实验室深度学习专家Laurens van der Maaten表示:“深度学习让一切变得很容易,

    64690发布于 2018-02-12
  • 来自专栏人人都是极客

    解密AI芯片的加速原理

    下面我们从以上三点阐述下目前比较主流的深度学习在芯片层面实现加速的方法。 AI 芯片的加速原理 乘加运算硬件加速,脉冲阵列 ? 脉动阵列并不是一个新鲜的词汇,在计算机体系架构里面已经存在很长时间。 上面讲了一些比较经典的加速方法。下面分享几个已经存在的AI加速芯片的例子,相信这样会更加直观。 AI 芯片实例 TPU ? 这是Google的TPU。 从其论文披露的信息也可以看到,二代TPU在第一代的基础上增加了我们前面说到的剪枝,权重压缩等方面做了很多尝试,也是一个非常经典的云端AI加速芯片的例子。 这一个是Rokid和杭州国芯共同打造的一颗针对智能音箱的SoC,AI加速只是里面的一个功能。通过上面右边的框图可以看到里面集成了Cadence的DSP,还有自己设计的语音加速硬件IP——NPU。 这款芯片还集成了一些实现智能音箱必要的interface,最值得一提的是在SiP层面封装了Embedded DRAM,可以更好的在系统层面实现数据的交互,实现存储和运算的加速,也实现了AI加速的功能。

    92630发布于 2019-05-14
  • 来自专栏云上修行

    vLLM: 加速AI推理的利器

    * "npcache"将以pytorch格式加载权重并存储numpy缓存以加速加载。* "dummy"将以随机值初始化权重,主要用于性能分析。

    3.3K10编辑于 2024-07-22
  • 来自专栏人人都是极客

    解密AI芯片的加速原理

    下面我们从以上三点阐述下目前比较主流的深度学习在芯片层面实现加速的方法。 AI 芯片的加速原理 乘加运算硬件加速,脉冲阵列 ? 脉动阵列并不是一个新鲜的词汇,在计算机体系架构里面已经存在很长时间。 上面讲了一些比较经典的加速方法。下面分享几个已经存在的AI加速芯片的例子,相信这样会更加直观。 AI 芯片实例 TPU ? 这是Google的TPU。 从其论文披露的信息也可以看到,二代TPU在第一代的基础上增加了我们前面说到的剪枝,权重压缩等方面做了很多尝试,也是一个非常经典的云端AI加速芯片的例子。 这一个是Rokid和杭州国芯共同打造的一颗针对智能音箱的SoC,AI加速只是里面的一个功能。通过上面右边的框图可以看到里面集成了Cadence的DSP,还有自己设计的语音加速硬件IP——NPU。 这款芯片还集成了一些实现智能音箱必要的interface,最值得一提的是在SiP层面封装了Embedded DRAM,可以更好的在系统层面实现数据的交互,实现存储和运算的加速,也实现了AI加速的功能。

    4.5K30发布于 2018-09-25
  • 来自专栏大数据文摘

    英特尔9亿美元收购交通数据AI公司,加速无人驾驶布局

    本周一,英特尔宣布,计划斥资9亿美元收购以色列城市交通数据初创公司Moovit,从而进一步进军智能移动和自动驾驶领域。 4月9日,英特尔在2020年中国年度战略线上媒体交流会上宣布,Mobileye的EyeQ芯片已卖出5400万枚,搭载在全球超过5000万辆汽车上,高精地图覆盖全球3亿多公里道路。 英特尔首席执行官Bob Swan在一份声明中表示,“Mobileye的ADAS技术已经改善了数百万辆汽车的行车安全,而Moovit可以真正做到加速变革交通运输。”

    43610发布于 2020-05-19
  • 来自专栏机器之心

    详解AI加速器(四):GPU、DPU、IPU、TPU…AI加速方案有无限种可能

    在这篇文章中,我们将跟着作者的思路回顾一下相关 AI 硬件公司,看看都有哪些公司在这一领域发力。 这是本系列博客的第四篇,主要介绍了 AI 加速器相关公司。 全球科技行业最热门的领域之一是 AI 硬件, 本文回顾了 AI 硬件行业现状,并概述相关公司在寻找解决 AI 硬件加速问题的最佳方法时所做的不同赌注。 AI 芯片领域,或者更准确地说,AI 加速器领域(到目前为止,它已经不仅仅是芯片)包含了无数的解决方案和方法,所以让我们回顾这些方法的主要原则。 GraphCore GraphCore 是首批推出商业 AI 加速器的初创公司之一,这种加速器被称为 IPU(Intelligent Processing Unit)。 图源:ZDNet 详解 AI 加速器(一):2012 年的 AlexNet 到底做对了什么? 详解 AI 加速器(二):为什么说现在是 AI 加速器的黄金时代?

    2.6K30编辑于 2022-03-04
  • 来自专栏ADAS性能优化

    AI Weekly | Nov. 9, 2019

    Researchers tout AI that can predict 25 video frames into the future In a preprint paper, researchers propose an AI model that can predict up to 25 video frames into the future given only two to five starting Applause targets AI bias by sourcing training data at scale Software-testing company Applause wants to reinvent AI testing with a service that detects AI bias by crowdsourcing larger training data sets. Remember that scary AI text-generator that was too dangerous to release?

    27210编辑于 2022-05-13
  • 来自专栏量子发烧友

    量子+AI:量子计算加速机器学习

    机器学习技术的快速发展有赖于计算能力的提高,而量子计算因其独特性质,使得它无论在数据处理能力还是数据储存能力,都远超经典计算,从而可以解决目前机器学习算法处理海量大数据时计算效率低的问题,也有利于开发更加智能的机器学习算法,将大力加速机器学习的发展 通过量子算法使某些在经典计算机上不可计算的问题变为可计算的, 从而大幅降低机器学习算法的计算复杂度, 如量子退火(quantum annealing,QA)算法、Gibbs采样等; (2) 量子理论的并行性等加速特点直接与某些机器学习算法深度结合 plot_histogram(counts) 3.3 Paddle Quantum Paddle Quantum(量桨)是一种开放源代码的机器学习工具包,旨在帮助数据科学家在量子计算应用程序中训练和开发AI

    1.9K40编辑于 2023-02-24
  • 来自专栏量子位

    浪潮发布OpenStack AI云平台,加速行业AI进程

    △ 浪潮集团副总裁 彭震 云+AI融合基础架构加速行业AI落地 随着AI在社会生产生活各环节的渗透加速,可以预见的是AI将会快速步入到“应用繁荣期”,商业组织与科研机构的AI技术与应用研发将趋向多样化, 因此,如何将云计算与AI融合,使得IT基础架构既能具备云的灵活性,也能保留AI所需的高性能,将成为推动AI真正成为一项社会性变革技术的重点所在。 此次浪潮发布的OpenStack AI云平台,可帮助行业AI用户快速便捷的构建CPU+GPU的弹性异构云环境,并实现对异构计算资源池的动态调度与分配,支撑数据管理、模型训练、模型部署等各类AI应用场景。 △ 浪潮OpenStack AI云平台架构 高集成度进一步简化AI开发 浪潮自主开发的AIStation在集成度上有显著提升,极大的降低了AI开发难度并简化操作。 浪潮AI&HPC总经理刘军表示:“浪潮OpenStack AI云平台为用户提供了面向未来的云+AI融合基础架构,使其在开源云平台上能够简单、快速构建易用、先进、完整的AI开发环境,赋能更多行业快速利用人工智能技术进行产品服务开发

    97540发布于 2018-09-29
  • 来自专栏CODING DevOps

    X加速计划 | 聚焦机器人& AI 领域的产业加速营!

    海归创业学院在第一期人工智能主题班成功经验基础上,今年强势联合科沃斯共同主办X 加速计划。         X加速计划 深圳第一期 上海第二期 同步开始招募 加速计划内容 PROJECT COURSE 加速计划流程 PROJECT SCHEDULE 备注:深圳、上海两地课程时间基本一致。 AI人工智能:声学处理、语音识别、语义理解、计算机视觉 3. 大数据:基于大数据基础,AI为引擎的消费、金融、安防等行业应用 项目筛选基本情况 1. 创始团队占股超过50%; 2. 报名方式 若你想报名参加X加速计划,可通过以下方式报名: 点击左下角的“阅读原文”,在活动行的入口“我要报名”进行报名。 X加速计划仅针对创始人,创始人,创始人,重要的事情说三遍; 3. 加速计划不收取课程费用,活动期间餐费、住宿费、交通费、学杂费自理; 4.

    38710编辑于 2023-05-17
  • 来自专栏存储公众号:王知鱼

    Micron:SSD替换主存,加速AI落地

    Fig-1 AI/ML 处理数据量越来越多,一说数据每年增长430x。 IGB 在 AI 领域受到关注,尤其是在图学习和图计算的研究中,因其能够帮助研究者比较不同算法的效果和效率。该数据集的多样性和真实场景的代表性使其成为图相关任务的一个重要基准。 Fig-2 NVIDIA 加速计算常见的存储案例。 Zero推理 (图示推理过程负载分布) • 98%读取 • 2%写入 • DeepSpeedZero首先从磁盘读取模型(读取)到GPU • 在磁盘上更新参数(写入) • 在推理过程中继续从磁盘读取 Fig-9 和不少AI从业人员交流,共性认知是,尚未出现 Killer APP,部分原因是技术本身成熟度尚未达标,另一部分可能还是基础设施建设成本高昂,“贫穷限制了想象”。

    45610编辑于 2025-02-11
  • 来自专栏媒矿工厂

    VP9到HEVC转码的帧间加速算法

    我们选择两个阵营中各自的代表标准VP9和HEVC,设计它们之间的转码加速算法。为此,我们首先比较了HEVC和VP9在部分编码技术上的异同,两者的对比如表1所示 表1. 而VP9相关的转码加速研究目前并不多,比较重要的一个是文献[4],其实现了HEVC到VP9的转码加速。主要有两个关键点,其一是减少帧间模式的搜索。 转码算法和结果说明 上海交通大学图像所研究团队基于传统H.264/AVC到HEVC的转码方法研究,提出了VP9到HEVC转码的帧间加速算法,一定程度上加速了转码过程,此方案主要包含以下几个步骤: 第一步是特征信息的提取 通过监督学习就可以建立输入输出之间的映射关系,在实际的转码过程中利用映射关系完成VP9到HEVC转码的帧间加速部分。 加速算法 表2所示为VP9到HEVC转码的帧间加速的实验结果,其中Depth0是仅对CU64进行加速的实验结果,Depth1是仅对CU32进行加速的实验结果,Depth0&1是结合了两者。

    2.1K81发布于 2018-03-06
  • 亚马逊Nova AI挑战赛加速生成式AI发展

    亚马逊Nova AI挑战赛加速生成式AI领域发展首届全球大学竞赛,致力于推动安全、可信的AI辅助软件开发。发布时间:2025年3月10日在负责任AI发展框架下,通过与顶尖大学合作以培育突破性研究。 虽然该挑战赛将探索生成式AI的多个方面,但今年的重点聚焦于“可信AI:推进安全的AI辅助软件开发,以构建更安全、更可靠的应用程序”。 、快节奏的锦标赛,旨在加速面向实际应用的学术研究。 挑战赛本质上是跨学科的——位于负责任AI、生成式AI、安全、对话式AI和自动化软件开发的交叉点。因此,它汇集了在多个研究领域具有专业知识的团队,为竞赛带来了不同的才能和视角。 研究领域对话式AI安全、隐私和滥用防护标签生成式AI负责任AI大语言模型学术合作某Nova关于作者撰稿人

    9410编辑于 2026-01-13
  • 来自专栏白话互联

    Ai Agent】Ai Agent News | 9月11日速递

    今天是9月11日星期四,让我们一起来看看今天 Ai Agent 带来的 AI 领域的重要动态吧! ❤ Indeed Unveils AI Agents for Job Seekers and Recruiters 求职招聘领域迎来AI助手新时代 Indeed推出了两款AI Agents,分别面向求职者和招聘方 ❤ Secure AI Agents at Runtime with Docker Docker推出AI Agent运行时安全解决方案 Docker发布了关于如何在运行时保护AI Agent的新方法, 随着AI工具的强大和普及,它们也变得不可预测且易受攻击。从LLM输出中的幻觉到提示注入,AI工作流面临多重安全威胁。 AI Agent时嵌入运行时安全,为AI原生开发提供更可靠的安全保障。

    33210编辑于 2025-09-17
  • 来自专栏媒矿工厂

    VP9到HEVC转码的帧内加速算法

    在前一部分我们讨论了VP9到HEVC的帧间转码加速算法,在这一部分我们探讨帧内部分的转码加速算法。表1所示为HEVC和VP9在部分编码技术上的异同,我们可以发现相似点与不同点。 转码算法和结果说明 上海交通大学图像所研究团队基于传统H.264/AVC到HEVC的转码方法研究,提出了VP9到HEVC转码的帧内加速算法,一定程度上加速了转码过程,此方案主要包含两个部分,分别是利用VP9 的深度信息进行帧内转码加速以及利用VP9采用的帧内预测模式进行方向的映射。 对于上述的最大划分深度不能进行加速的情况(例如VP9最大深度为4的情况),我们可以进一步使用深度图来对比较浅的深度进行一定的加速,这一思路和前半部分的帧间加速思路较为相似,作为一种补充。 帧内转码加速的实验结果 ? 表3所示为VP9到HEVC转码的帧内加速的实验结果,我们可以看到单独使用方向优化在帧内加速方面仅有少量的加速效果,同时会产生较大的BD-Rate增加。

    1.7K80发布于 2018-03-06
  • 来自专栏MixLab科技+设计实验室

    AI 加速你的想法 | MixLab+AI 第39期

    Knowledge / def mix( ): 本期收录 新增13+ NO. 39 设计流程的加速包 #每周ai工具 快速验证想法的工具——UIzard,基于图像识别,将线框图快速转化成高保真原型,帮助设计师能快速验证可行性 设计流程的加速包 | 每周ai工具 #游戏##技术美术 Alex Strook 最近分享了模拟油画的 NPR(非现实渲染)技术项目,非常赞。 包括AI产品、AI技术、AI场景、AI投资事件、AI的思维方式等。MIX的主题包括:AR、VR、计算设计、计算广告、智能设计、智能写作、虚拟偶像等。 加入星球后,即可加入Mix读书会。

    61341发布于 2020-10-19
  • 来自专栏计算机视觉战队

    详解AI加速器:为什么说现在是AI加速器的黄金时代?

    选自 Medium 作者:Adi Fuchs 机器之心编译 机器之心编辑部 在上一篇文章中,前苹果工程师、普林斯顿大学博士 Adi Fuchs 解释了 AI 加速器诞生的动机。 在这篇文章中,我们将跟着作者的思路回顾一下处理器的整个发展历程,看看 AI 加速器为什么能成为行业焦点。 转自《机器之心》 这是本系列博客的第二篇,我们来到了整个系列的关键所在。 如今,随着越来越多表现出「良好」特性的应用程序成为加速的目标,加速器越来越受关注:视频编解码器、数据库处理器、加密货币矿机、分子动力学,当然还有人工智能。 是什么让 AI 成为加速目标? AI 是一个「可加速」的应用领域 AI 程序具有使其适用于硬件加速的所有属性。首先最重要的是,它们是大规模并行的:大部分计算都花在张量运算上,如卷积或自注意力算子。 如果没有适当的加速硬件来满足你的 AI 需求,对 AI 进行实验和发现的能力将受到限制。

    1.9K20编辑于 2022-03-04
领券