搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏TencentOS-tiny
ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算
引言笔者接触嵌入式领域软件开发以来，几乎用的都是 ARM Cortex M 内核系列的微控制器。 ARM探索之旅 01 | 带你认识ARM Cortex-M阵营 ARM探索之旅 02 | ARM Cortex-M 用什么指令集？三、使用 ARM FPU 加速浮点计算 1. ARM FPU的魅力 FPU（Floating Point Unit，浮点单元）是ARM内核中的硬件外设，用于硬件计算浮点数，要想使用FPU计算浮点数，需要程序和编译器配合。四、使用Julia测试FPU加速性能 1. 测试准备需要准备一份裸机工程，具有屏幕打点显示功能和串口打印功能。
4.8K20发布于 2021-07-01
来自专栏刘旷专栏
ARM加速更迭，国产替代迎新战机
随着众多厂商的入局以及ARM技术优势的显现，ARM架构在数据中心服务器市场的渗透率正在逐年提升，基于此业内甚至不时发出ARM时代到来的感叹。 ARM架构加速渗透根据TrendForce数据预测，随着云数据中心采用推动的逐渐增长，预计到2025年，ARM架构在数据中心服务器市场渗透率将达到22%。 ARM服务器崭露头角其实，ARM早就对服务器芯片市场“垂涎已久”，怎奈ARM在整个市场的发展并不如意，其也曾经几度在服务器市场折戟。尽管ARM的增长势头喜人，但截至去年为止，全球服务器芯片的架构依旧以X86为最大，据去年9月份IDC发布的《全球服务器季度跟踪报告》显示，X86服务器收入占全球服务器收入的90.3%，非X86（包括X86 不难预见在技术革新加速的今天，依托国内规模庞大的物联网生态和信创软件生态，国内操作系统有望利用内外部机遇，寻找到破除“缺芯少魂”卡脖子困境的最优解。
56920编辑于 2022-08-13
来自专栏全栈程序员必看
arm的一些概念(ARM9、Cortex的区别)
arm的一些概念(ARM7、Cortex-M的区别) ARM7：ARMv4架构，ARM9：ARMv5架构，ARM11：ARMv6架构，ARM-Cortex 系列：ARMv7架构。 ucOS、ucLinux这些精简实时的RTOS不需要MMU，当然可以在ARM7上运行。 ARM9、ARM11，是嵌入式CPU（处理器），带有MMU，可以运行诸如Linux等多用户多进程的操作系统，应用场合也不同于ARM7。所以看上去ARM7跟Cortex-M很像，因为他们都是MCU，但确是不同代不同架构的MCU（Cortex-M比ARM7高了三代！），所以性能也有很大的差距。想必楼主现在肯定知道了ARM7、Cortex-M的区别，不过还是花了点时间整理在此，可以帮助后来的初学者搞明白这些基本的概念性问题。
2.4K10编辑于 2022-09-02
来自专栏全栈程序员必看
ARM9开发之学习过程总结
需要说明的是，这仅仅说是ARM，其间涉及到别的知识也是需要很多时间去学习的，这里我就不列举了。 9，学习ARM汇编与C语言的混合编程，GCC内联汇编，掌握参数传递方式和ARM过程调用标准（APCS）即可。 11，现在要学习ARM工作模式，异常处理机制，要非常熟悉中断处理，会编写中断处理程序。 15，此刻，若你依然深爱着ARM920T，那么你可以在上面写一个操作系统（或者称为调度器），使用ARM920T的MMU。虽然刚毕业几个月，工作中也没有接触ARM9，但是我有时间就会坚持学习ARM9这款CPU，希望有朝一日，在接触新的ARM处理器时，也能快速入手。
1.1K10编辑于 2022-06-28
来自专栏云实例评测
免费易用，腾讯Arm云实例评测 - AI推理加速
腾讯CVM标准型SR1是腾讯云推出的首款搭载ARM架构处理器的新一代CVM标准型计算实例规格。
6.4K390编辑于 2022-06-23
来自专栏深度学习和计算机视觉
加速 PyTorch 模型训练的 9 个技巧
我明白，网上都是各种神经网络加速指南，但是一个checklist都没有（现在有了），使用这个清单，一步一步确保你能榨干你模型的所有性能。 [1_CER3v8cok2UOBNsmnBrzPQ](9 Tips For Training Lightning-Fast Neural Networks In Pytorch.assets/1_CER3v8cok2UOBNsmnBrzPQ.gif 你得到的加速取决于你所使用的GPU类型。我推荐个人用2080Ti，公司用V100。 9. 多节点GPU训练每台机器上的每个GPU都有一个模型的副本。每台机器获得数据的一部分，并且只在那部分上训练。每台机器都能同步梯度。英文原文：https://towardsdatascience.com/9-tips-for-training-lightning-fast-neural-networks-in-pytorch-8e63a502f565‍‍‍
1.3K20编辑于 2022-02-09
来自专栏全栈程序员必看
MDK5搭建ARM9开发环境「建议收藏」
在使用MDK5开发ARM9程序时，需要安装ARM9的支持包。
1.5K10编辑于 2022-06-28
来自专栏全栈程序员必看
详细讲解移植Uboot到ARM9开发系统上
首先了解ARMer9开发系统硬件设计上和三星原装SMDK2410之间的区别。让uboot在ARMer9开发系统上跑起来，目前只需要关注如下的硬件区别，解决了下面这个问题，uboot就可以在ARMer9开发系统上正常地从串口输出，进入提示符。 SMDK2410 : nor Flash 是AMD的1M的； ARMer9: 是Intel E28F128J3A, 两片并联，一共32M Bytes. (注意：你要安装了交叉编译器才行哦) 修改uboot目录下的Makefile，将 ifeq ($(ARCH),arm) CROSS_COMPILE = arm-Linux- endif 修改成 ifeq debug_insn { u32 arm; u16 thumb; } 修改成： union debug_insn { u32 arm_mode; u16 thumb_mode; } 然后配置板子
2.9K20编辑于 2022-08-14
来自专栏冬雷博客
甲骨文ARM DD重装系统并开启BBR加速详细教程
/debi.sh --architecture arm64 --user root --password iDongLei 重启 sudo shutdown -r now 根据大佬脚本描述，30秒即可执行完毕 tcp_available_congestion_control = reno cubic bbr image.png 查看BBR是否启动 lsmod | grep bbr 打印以下代码即为已启动 root@arm :~# lsmod | grep bbr tcp_bbr 24576 7 拓展上面所讲述的是Oracle（甲骨文）ARM系统重装Debian11的过程，如果需要AMD系统的 DD网络重装教程，请看：甲骨文DD重装系统，甲骨文DD Debian 9/10/11或Windows详细教程汇总
12.7K50编辑于 2022-04-26
来自专栏全栈程序员必看
arm指令周期_arm指令sub
现在的处理器的大部分指令(ARM、DSP)均采用单周期指令，比如CLR,MOV等。多周期指令，比如转移指令、乘法和除法指令。
2.8K30编辑于 2022-09-27
来自专栏全栈程序员必看
ARM 架构简介_芯片arm架构
是半导体知识产权业务中的开拓先锋，目前市面上大量 ARM 设备都是由ARM分布于世界各地的授权商制造的。我相信许多人听说 ARM 是从 ARM7TDMI 处理器内核的成功开始的，从上世纪90年代起这一内核在手机行业得到了广泛采用，也是ARM早期成功的奠基石。目前市场上的大多数ARM内核至少支持两种指令集：原生的32位 ARM 指令集，以及混合了16位和32位的Thumb指令集，我们先看看ARM指令集。下面让我们进一步地剖析ARM的实现原理。 ARM 的技术实现要想深入理解ARM的实现原理是个很大的学习工程，这里一样希望读者读后能对ARM起到一个总体的认识，后续可以进一步的深入学习。 ARM 世界的一扇大门，ARM 网站上有丰富的文档等你去查阅，探索。
3.8K40编辑于 2022-11-04
来自专栏贾志刚-OpenCV学堂
最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速
为什么有扩展模块发布|OpenVINO扩展模块支持原生Pytorch模型转换与ARM加速 OpenVINO刚刚不久之前发布了新版本OpenVINO2021.3版本，其中最引入关注的是有了OpenVINO 当前扩展模块主要包括三个部分 arm_plugin 支持深度神经网络的ARM CPU加速推理 java_api 支持Java的SDK了，什么意思，就是Java程序员也可以使用推理引擎了。其中arm支持给出测试demo是在树莓派4B上面，演示程序运行如下： ? 支持32FP与16FP的模型精度，不支持INT8。 ? 为了让大家更好得理解与使用OpenVINO框架，我特别整理了OpenVINO计算机视觉加速的学习路径，图示如下： ?
2K30发布于 2021-04-21
来自专栏全栈程序员必看
ARM基础了解_arm编程架构
ARM 处理器家族早起经典处理器包括ARM7、ARM9、ARM11等，Cortex-A系列是它们的升级版从ARM11之后就变成了Cortex系列 Cortex-M系列控制 ARM的内核是基于RISC（精简指令集）体系结构的 SOC的概念片上系统指的是在单个芯片上集成一个完整的计算机系统，所谓完整的系统一般包括中央处理器（CPU）、存储器、以及外围电路等。 STM32F0/F1是指某一款SOC intel、ARM是指SOC里面的CPU 半导体厂商：意法半导体（ST） ---- ROM RAM ROM 只读存储器(read only memory)，英文简称
1.5K20编辑于 2022-11-10
来自专栏物联网学习
ARM NEON卷积神经网络加速简介-技术创作101训练营
为了加速乘法运算，可以使用ARM-NEON技术，比如ncnn就依据此类技术实现，除了ncnn外，ARM还提供了官方的基于NEON技术的计算库ARM Compute Library以及专为深度学习设计的ARM Winogard变换] 在不更换硬件平台的情况下，可以使用ARM NEON技术更好地发挥硬件性能。基于ARM NEON技术的矩阵乘法加速可以理解为利用矩阵乘法并行性，如图3所示。矩阵乘法并行性] 2.3 卷积神经网络转换矩阵乘法如果为了使用GEMM方法进行卷积神经网络加速，需要将卷积神经网络中的卷积层计算转换成矩阵乘法，然后利用GEMM进行加速，卷换过程如图4所示。 [卷积计算转换矩阵乘法](https://hal.inria.fr/inria-00112631/document)] 三、总结通过ARM NEON技术进行卷积神经网络加速，可以采用的路径有： 1.参考 2.3将卷积神经网络转换成矩阵乘法，然后参考openblas的实现过程，使用ARM提供的ACL库（ARM Compute Library）或者ARM NN实现。
2.7K53发布于 2020-09-23
为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人
虽然Arm公司一直都是一家仅提高半导体IP/指令集授权的企业，并且基于Arm架构的芯片已经几乎无处不在，绝大多数的智能手机、平板电脑都是基于Arm架构的芯片，此外众多的物联网芯片、汽车芯片，乃至一些PC 芯片和服务器芯片也都是基于Arm架构。但是，Arm并不满足于仅仅是提供IP技术授权。 Arm甚至还希望自研芯片来直接销售给客户。目前尚不清楚 Arm自研芯片进展如何，但拥有丰富的芯片研发经验的Rami Sinno的加入，或将进一步助力Arm公司自研芯片项目。编辑：芯智讯-浪客剑
14810编辑于 2026-03-20
来自专栏媒矿工厂
VP9到HEVC转码的帧内加速算法
在前一部分我们讨论了VP9到HEVC的帧间转码加速算法，在这一部分我们探讨帧内部分的转码加速算法。表1所示为HEVC和VP9在部分编码技术上的异同，我们可以发现相似点与不同点。转码算法和结果说明上海交通大学图像所研究团队基于传统H.264/AVC到HEVC的转码方法研究，提出了VP9到HEVC转码的帧内加速算法，一定程度上加速了转码过程，此方案主要包含两个部分，分别是利用VP9 的深度信息进行帧内转码加速以及利用VP9采用的帧内预测模式进行方向的映射。对于上述的最大划分深度不能进行加速的情况（例如VP9最大深度为4的情况），我们可以进一步使用深度图来对比较浅的深度进行一定的加速，这一思路和前半部分的帧间加速思路较为相似，作为一种补充。帧内转码加速的实验结果 ? 表3所示为VP9到HEVC转码的帧内加速的实验结果，我们可以看到单独使用方向优化在帧内加速方面仅有少量的加速效果，同时会产生较大的BD-Rate增加。
1.8K80发布于 2018-03-06
来自专栏VoiceVista语音智能
ARM DevSummit - CNN Enhanced Inference on ARM NPU
mmbiz.qpic.cn/sz_mmbiz_jpg/qoJKEGSFicLQSMpeQibcr2d5dl3SrPrMkDRNkiaib4Sz0ibCCTFc0427u7FD6PcfR4MibZ6EAEuqyGABx9gNjcxN7stA
94920发布于 2021-11-05
来自专栏媒矿工厂
VP9到HEVC转码的帧间加速算法
我们选择两个阵营中各自的代表标准VP9和HEVC，设计它们之间的转码加速算法。为此，我们首先比较了HEVC和VP9在部分编码技术上的异同，两者的对比如表1所示表1. 而VP9相关的转码加速研究目前并不多，比较重要的一个是文献[4]，其实现了HEVC到VP9的转码加速。主要有两个关键点，其一是减少帧间模式的搜索。转码算法和结果说明上海交通大学图像所研究团队基于传统H.264/AVC到HEVC的转码方法研究，提出了VP9到HEVC转码的帧间加速算法，一定程度上加速了转码过程，此方案主要包含以下几个步骤：第一步是特征信息的提取通过监督学习就可以建立输入输出之间的映射关系，在实际的转码过程中利用映射关系完成VP9到HEVC转码的帧间加速部分。加速算法表2所示为VP9到HEVC转码的帧间加速的实验结果，其中Depth0是仅对CU64进行加速的实验结果，Depth1是仅对CU32进行加速的实验结果，Depth0&1是结合了两者。
2.2K81发布于 2018-03-06
来自专栏韩曙亮的移动开发专栏
【嵌入式开发】ARM 芯片简介 (ARM芯片类型 | ARM处理器工作模式 | ARM 寄存器 | ARM 寻址)
ARM 分类 (1) ARM 分类类型(芯片 | 核 | 指令架构) ARM 分类 : -- ARM 芯片类型 : 6410, 2440, 210; -- ARM 核类型 : arm11, arm9, CortexA9; -- 指令架构 : armv7, armv6; (2) ARM芯片与 ARM核关系芯片和核关系 : 芯片包含核; -- 2440 芯片 : 包含 arm9 核; -- 6410 芯片 : 包含 arm11 核; -- 210 芯片 : 包含 CortexA8 核; (3) ARM核与指令架构关系 ARM 核与指令架构关系 : -- ARM9 : armv4 ARM 演化变迁 (1) 经典阵营发展历程 : ARM7 --> ARM9 --> ARM11, ARM11 性能最高, ARM7 性能最低; (2) Cortex 阵营 Cortext 系列 : , 但是高的有限; -- ARM9 和 ARM11 : ARM9 和 ARM11 与 Cortex-R4 性能类似, ARM11 不如 Cortex-A5, 远远比不上 Cortex-A8 和 Cortex-A9
2.8K30编辑于 2023-03-27
来自专栏全栈程序员必看
什么是ARM？_arm开发板
比如为高速度设计的Cortex A8、A9都是ARMv7a 架构;Cortex M3、M4是ARMv7m架构;前者是处理器（就是内核），后者是指令集的架构（也简称架构）。 ARM Cortex-A5处理器、Cortex-A7处理器、Cortex-A8处理器、Cortex-A9处理器、Cortex-A15处理器隶属于Cortex-A系列，基于ARMv7-A架构。三星的Exynos 4412 SCP 是一款基于Cortex-A9的SOC；如下图所示，Exynos 4412包含了4个Cortex-A9的处理器（核）； Cortex-A9是基于ARMv7 由上图可知，exynos 4412除了包含4个Cortex-A9核，还包括大量的外设控制器：DRAM Controller、SROM Controller、Camera IF、JPEG、GPS/GLONASS ； ARM处理器名字：以前叫ARM9、ARM11, 新的命名规则改以Cortex命名，分别是Cortex-A，Cortex-R，Cortex-M；这三个字母A、R、M合到一起又是ARM。
3.7K10编辑于 2022-11-04

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算

ARM加速更迭，国产替代迎新战机

arm的一些概念(ARM9、Cortex的区别)

ARM9开发之学习过程总结

免费易用，腾讯Arm云实例评测 - AI推理加速

加速 PyTorch 模型训练的 9 个技巧

MDK5搭建ARM9开发环境「建议收藏」

详细讲解移植Uboot到ARM9开发系统上

甲骨文ARM DD重装系统并开启BBR加速详细教程

arm指令周期_arm指令sub

ARM 架构简介_芯片arm架构

最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速

ARM基础了解_arm编程架构

ARM NEON卷积神经网络加速简介-技术创作101训练营

为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人

VP9到HEVC转码的帧内加速算法

ARM DevSummit - CNN Enhanced Inference on ARM NPU

VP9到HEVC转码的帧间加速算法

【嵌入式开发】ARM 芯片简介 (ARM芯片类型 | ARM处理器工作模式 | ARM 寄存器 | ARM 寻址)

什么是ARM？_arm开发板

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算

ARM加速更迭，国产替代迎新战机

arm的一些概念(ARM9、Cortex的区别)

ARM9开发之学习过程总结

免费易用 ，腾讯Arm云实例评测 - AI推理加速

加速 PyTorch 模型训练的 9 个技巧

MDK5搭建ARM9开发环境「建议收藏」

详细讲解 移植Uboot到ARM9开发系统上

甲骨文ARM DD重装系统并开启BBR加速详细教程

arm指令周期_arm指令sub

ARM 架构简介_芯片arm架构

最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速

ARM基础了解_arm编程架构

ARM NEON卷积神经网络加速简介-技术创作101训练营

为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人

VP9到HEVC转码的帧内加速算法

ARM DevSummit - CNN Enhanced Inference on ARM NPU

VP9到HEVC转码的帧间加速算法

【嵌入式开发】ARM 芯片简介 (ARM芯片类型 | ARM处理器工作模式 | ARM 寄存器 | ARM 寻址)

什么是ARM？_arm开发板

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

免费易用，腾讯Arm云实例评测 - AI推理加速

详细讲解移植Uboot到ARM9开发系统上