搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏刘旷专栏
ARM加速更迭，国产替代迎新战机
随着众多厂商的入局以及ARM技术优势的显现，ARM架构在数据中心服务器市场的渗透率正在逐年提升，基于此业内甚至不时发出ARM时代到来的感叹。 ARM架构加速渗透根据TrendForce数据预测，随着云数据中心采用推动的逐渐增长，预计到2025年，ARM架构在数据中心服务器市场渗透率将达到22%。再加上ARM本身的低费用和高运行速度，用户自然更愿意选择性价比更高的ARM，ARM的这种性价比优势，也让它在曾经“败北的”服务器市场再次“卷土重来”。 ARM服务器崭露头角其实，ARM早就对服务器芯片市场“垂涎已久”，怎奈ARM在整个市场的发展并不如意，其也曾经几度在服务器市场折戟。不难预见在技术革新加速的今天，依托国内规模庞大的物联网生态和信创软件生态，国内操作系统有望利用内外部机遇，寻找到破除“缺芯少魂”卡脖子困境的最优解。
56920编辑于 2022-08-13
来自专栏TencentOS-tiny
ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算
引言笔者接触嵌入式领域软件开发以来，几乎用的都是 ARM Cortex M 内核系列的微控制器。 ARM探索之旅 01 | 带你认识ARM Cortex-M阵营 ARM探索之旅 02 | ARM Cortex-M 用什么指令集？三、使用 ARM FPU 加速浮点计算 1. ARM FPU的魅力 FPU（Floating Point Unit，浮点单元）是ARM内核中的硬件外设，用于硬件计算浮点数，要想使用FPU计算浮点数，需要程序和编译器配合。四、使用Julia测试FPU加速性能 1. 测试准备需要准备一份裸机工程，具有屏幕打点显示功能和串口打印功能。
4.8K20发布于 2021-07-01
来自专栏云实例评测
免费易用，腾讯Arm云实例评测 - AI推理加速
腾讯CVM标准型SR1是腾讯云推出的首款搭载ARM架构处理器的新一代CVM标准型计算实例规格。
6.4K390编辑于 2022-06-23
来自专栏冬雷博客
甲骨文ARM DD重装系统并开启BBR加速详细教程
/debi.sh --architecture arm64 --user root --password iDongLei 重启 sudo shutdown -r now 根据大佬脚本描述，30秒即可执行完毕 tcp_available_congestion_control = reno cubic bbr image.png 查看BBR是否启动 lsmod | grep bbr 打印以下代码即为已启动 root@arm :~# lsmod | grep bbr tcp_bbr 24576 7 拓展上面所讲述的是Oracle（甲骨文）ARM系统重装Debian11的过程，如果需要AMD系统的
12.7K50编辑于 2022-04-26
来自专栏全栈程序员必看
ARM 架构简介_芯片arm架构
是半导体知识产权业务中的开拓先锋，目前市面上大量 ARM 设备都是由ARM分布于世界各地的授权商制造的。我相信许多人听说 ARM 是从 ARM7TDMI 处理器内核的成功开始的，从上世纪90年代起这一内核在手机行业得到了广泛采用，也是ARM早期成功的奠基石。目前市场上的大多数ARM内核至少支持两种指令集：原生的32位 ARM 指令集，以及混合了16位和32位的Thumb指令集，我们先看看ARM指令集。下面让我们进一步地剖析ARM的实现原理。 ARM 的技术实现要想深入理解ARM的实现原理是个很大的学习工程，这里一样希望读者读后能对ARM起到一个总体的认识，后续可以进一步的深入学习。 ARM 世界的一扇大门，ARM 网站上有丰富的文档等你去查阅，探索。
3.8K40编辑于 2022-11-04
来自专栏贾志刚-OpenCV学堂
最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速
为什么有扩展模块发布|OpenVINO扩展模块支持原生Pytorch模型转换与ARM加速 OpenVINO刚刚不久之前发布了新版本OpenVINO2021.3版本，其中最引入关注的是有了OpenVINO 当前扩展模块主要包括三个部分 arm_plugin 支持深度神经网络的ARM CPU加速推理 java_api 支持Java的SDK了，什么意思，就是Java程序员也可以使用推理引擎了。其中arm支持给出测试demo是在树莓派4B上面，演示程序运行如下： ? 支持32FP与16FP的模型精度，不支持INT8。 ? 为了让大家更好得理解与使用OpenVINO框架，我特别整理了OpenVINO计算机视觉加速的学习路径，图示如下： ?
2K30发布于 2021-04-21
来自专栏全栈程序员必看
arm指令周期_arm指令sub
现在的处理器的大部分指令(ARM、DSP)均采用单周期指令，比如CLR,MOV等。多周期指令，比如转移指令、乘法和除法指令。
2.8K30编辑于 2022-09-27
来自专栏物联网学习
ARM NEON卷积神经网络加速简介-技术创作101训练营
为了加速乘法运算，可以使用ARM-NEON技术，比如ncnn就依据此类技术实现，除了ncnn外，ARM还提供了官方的基于NEON技术的计算库ARM Compute Library以及专为深度学习设计的ARM Winogard变换] 在不更换硬件平台的情况下，可以使用ARM NEON技术更好地发挥硬件性能。基于ARM NEON技术的矩阵乘法加速可以理解为利用矩阵乘法并行性，如图3所示。矩阵乘法并行性] 2.3 卷积神经网络转换矩阵乘法如果为了使用GEMM方法进行卷积神经网络加速，需要将卷积神经网络中的卷积层计算转换成矩阵乘法，然后利用GEMM进行加速，卷换过程如图4所示。 [卷积计算转换矩阵乘法](https://hal.inria.fr/inria-00112631/document)] 三、总结通过ARM NEON技术进行卷积神经网络加速，可以采用的路径有： 1.参考 2.3将卷积神经网络转换成矩阵乘法，然后参考openblas的实现过程，使用ARM提供的ACL库（ARM Compute Library）或者ARM NN实现。
2.7K53发布于 2020-09-23
为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人
虽然Arm公司一直都是一家仅提高半导体IP/指令集授权的企业，并且基于Arm架构的芯片已经几乎无处不在，绝大多数的智能手机、平板电脑都是基于Arm架构的芯片，此外众多的物联网芯片、汽车芯片，乃至一些PC 芯片和服务器芯片也都是基于Arm架构。但是，Arm并不满足于仅仅是提供IP技术授权。 Arm甚至还希望自研芯片来直接销售给客户。目前尚不清楚 Arm自研芯片进展如何，但拥有丰富的芯片研发经验的Rami Sinno的加入，或将进一步助力Arm公司自研芯片项目。编辑：芯智讯-浪客剑
14810编辑于 2026-03-20
来自专栏全栈程序员必看
ARM基础了解_arm编程架构
ARM 处理器家族早起经典处理器包括ARM7、ARM9、ARM11等，Cortex-A系列是它们的升级版从ARM11之后就变成了Cortex系列 Cortex-M系列控制 ARM的内核是基于RISC（精简指令集）体系结构的 SOC的概念片上系统指的是在单个芯片上集成一个完整的计算机系统，所谓完整的系统一般包括中央处理器（CPU）、存储器、以及外围电路等。 STM32F0/F1是指某一款SOC intel、ARM是指SOC里面的CPU 半导体厂商：意法半导体（ST） ---- ROM RAM ROM 只读存储器(read only memory)，英文简称
1.5K20编辑于 2022-11-10
来自专栏VoiceVista语音智能
ARM DevSummit - CNN Enhanced Inference on ARM NPU
From Deeplite.ai http://mpvideo.qpic.cn/0bf2eiaaiaaaiqagjcdw2vqvaiwdaqraabaa.f10002.mp4?dis_k=62fb42
94920发布于 2021-11-05
来自专栏韩曙亮的移动开发专栏
【嵌入式开发】ARM 芯片简介 (ARM芯片类型 | ARM处理器工作模式 | ARM 寄存器 | ARM 寻址)
ARM 分类 (1) ARM 分类类型(芯片 | 核 | 指令架构) ARM 分类 : -- ARM 芯片类型 : 6410, 2440, 210; -- ARM 核类型 : arm11, arm9, 6410 芯片 : 包含 arm11 核; -- 210 芯片 : 包含 CortexA8 核; (3) ARM核与指令架构关系 ARM 核与指令架构关系 : -- ARM9 : armv4 ARM 演化变迁 (1) 经典阵营发展历程 : ARM7 --> ARM9 --> ARM11, ARM11 性能最高, ARM7 性能最低; (2) Cortex 阵营 Cortext 系列 : 对比 ARM 与 Cortext 对比 : -- ARM7 : ARM 7 与 Cortext-M3 类似, 都没有操作系统, 性能上 Cortex-M3 略高, 但是高的有限; -- ARM9 和 ARM11 : ARM9 和 ARM11 与 Cortex-R4 性能类似, ARM11 不如 Cortex-A5, 远远比不上 Cortex-A8 和 Cortex-A9; 3.
2.8K30编辑于 2023-03-27
来自专栏FPGA开源工作室
Arm 传奇
ARM1 作为第一版设计，还不够完善，它的升级版本 ARM2、ARM3 相继推出。 Arm 公司成立后，直接跳到了 ARM6，并基于ARM6 设计了 ARM610 芯片，用于苹果的 Newton 项目。设计授权的公司再在 ARM 中央处理器的基础上添加外围设备(比如 DSP、图形加速模块，DMA)从而设计出各具特色的芯片，ARM 从中先收取一次性授权费用，当芯片公司设计的芯片上市销售后，ARM 再根据销量收取版税提成 2000 年， ARM920T 发布，一年后升级为 ARM926EJ-S ，五级流水线，带有 MMU，支持 Java 加速和 DSP 扩展，可以运行 Linux 操作系统。 ARM 架构的命名规则随之改变：不再像以前的 ARM7、ARM9、ARM11 这样。
2.3K30发布于 2020-02-25
来自专栏全栈程序员必看
什么是ARM？_arm开发板
二、ARM内核与架构任何一款arm芯片主要由两大部分组成：arm内核，外设。 ARM内核 arm内核： arm内核主要由：寄存器、指令集、总线、存储器映射规则、中断逻辑和调试组件等。 ARM11之前的处理器和指令集架构 ARM11芯片之前，每一个芯片对应的架构关系如下： ARM11之后处理器和指令集架构 ARM11芯片之后，也就是从ARMv7架构开始，ARM的命名方式有所改变 ARM11系列包括了ARM11MPCore处理器、ARM1176处理器、ARM1156处理器、ARM1136处理器，它们是基于ARMv6架构。 ARM指令集，就是ARM架构，比如ARMv8，每个处理器都需要依赖一定的ARM架构来设计； **SOC：**各大厂商买来ARM的授权，得到ARM处理器的源代码，而后自己搞一些外围设备的IP（或者买或者自己设计
3.7K10编辑于 2022-11-04
来自专栏韩曙亮的移动开发专栏
【Android 逆向】ARM CPU 架构体系 ( ARM 内存模型 | ARM 架构堆的实现 | ARM 架构栈的实现 )
文章目录一、ARM 内存模型二、ARM 架构堆的实现三、ARM 架构栈的实现一、ARM 内存模型 ---- ARM 架构体系中 , CPU 直接访问内存 , 控制内存中的状态和数据 , 内存中映射外部设备通过内存状态转换 , 告知内存已经读取完毕 , CPU 可以直接访问内存中内存块 B 中的数据 ; 所有的外设基本都有一块属于自己的内存 , 有的时在内存中映射的 , 有的自带内存 , 如显卡显存 ; 二、ARM - 应用程序向系统请求内存 , 系统通过系统调用 , 分配内存 , 内存分配完毕后 , 返回内存的首地址给应用程序 ; 申请完内存后 , 需要 free 释放内存 , 否则会造成泄漏 ; 三、ARM , R1, R2 这 3 个寄存器存放参数 , 这 3 个寄存器变相的称为了栈 ; 如果参数大于等于 4 个 , 则 R3 寄存器记录栈地址 ( 栈的起始位置 ) , 如下图所示 ; 在 ARM
3.5K10编辑于 2023-03-29
来自专栏全栈程序员必看
arm和mips架构区别_arm架构详解
这就是ARM这个名字的由来。架构和ARM内核 ARM处理器与架构对应表 ARM核对应的时间表 5、ARM的特点 ARM 数据类型约定: Byte：8bits(1byte) ARM9、ARM11，是嵌入式CPU（处理器），带有MMU，可以运行诸如Linux等多用户多进程的操作系统，应用场合也不同于ARM7。 8.2、 ARM9流水线技术 ARM9系列处理器的流水线分为取指、译码、执行、访存、回写。 ARM 在这一点很像x86。
4.3K10编辑于 2022-11-04
来自专栏C语言
【ARM】ARM Cortex 处理器详细讲解
ARM Cortex处理器详细讲解 ARM Cortex处理器系列是ARM公司推出的一系列高性能、低功耗的处理器核心，广泛应用于不同类型的电子设备。 ARM DS-5：高性能的开发工具，支持Cortex-A系列处理器的开发，提供详细的调试和性能分析功能。 ARM NN ARM NN：为Cortex-A处理器提供机器学习推理支持。它包括优化的卷积神经网络（CNN）和深度学习模型推理，能够在嵌入式设备上高效运行机器学习任务。 5. Cortex-A系列处理器引入了AI加速功能，Cortex-M系列则通过CMSIS-NN库支持边缘计算中的推理任务。总结 ARM Cortex处理器系列涵盖了从高性能计算到低功耗嵌入式应用的广泛需求。
3.1K10编辑于 2024-12-11
来自专栏优图实验室的专栏
TNN行业首发Arm 32位 FP16指令加速，理论性能翻倍
如果该指令用于加速网络推理，相比于FP32预期能达到2倍加速。 1.2 为什么要支持Arm32位FP16指令加速？智能手机分为Arm32和Arm64位两种架构，其中Arm64占绝大比例，苹果从2013年9月发布iPhone5s后，所有机型全都是Arm64架构。经调研，行业开源推理框架如ncnn、MNN等仅支持Arm64位FP16指令加速，这样32位App无法享受FP16指令加速效果。针对这个行业缺失，TNN在架构兼容、模型兼容、代码结构设计等方面率先进行探索，对Arm64位和Arm32架构均实现了FP16指令优化，让64位和32位App都能发挥硬件FP16向量加速的能力。实现如下： ①在ArmDevice下维护一个全局的layer_precision_map，将算子类型映射到其支持的数据类型； ②每实现一个FP16加速算子，使用REGISTER_ARM_PRECISION_FP16
3.1K20发布于 2021-01-15
来自专栏Java实战博客
WordPress加速 – Redis加速 – Opcache加速
本页目录 Redis加速 Opcache – PHP脚本加速任何网站的加速都离不开缓存，Wordpress也是一样，我们本次采用Redis做Wordpress的缓存！同时我们采用Opcache给PHP脚本加速！ Redis加速我们去宝塔，下载一个Redis，然后启动Redis，然后配置文件配置如下。 // 设置使用的Redis库 define( 'WP_REDIS_DATABASE', 0 ); Opcache – PHP脚本加速在宝塔里安装一下。
3.6K10编辑于 2022-11-18
来自专栏人人都是极客
ARM SoC漫谈
功能这个主要就是看芯片提供了什么接口，比如闪存，内存，PCIe，USB，SATA，以太网等，还看内部有什么运算模块，比如浮点器件，解码器，加解密，图形加速器，网络加速器等等。当然，作为整体的芯片功耗，还得包括各种加速器和接口，尤其是会被用到的模块。在设计SoC的时候，性能，功耗和价格就转换成了PPA。啥是PPA？其实就是性能，功耗和面积。其中，性能有两层含义。这个过程做好了，可以让软件处理以太网或者存储单元的速度超过硬件加速器。事实上，在Freescale的网络处理器上，有了硬件加速器的帮助，处理包的平均延迟需要200处理器周期，已经慢于至强了。如果上面一段看完你没什么感觉，那我可以换个说法：对于没有完整支持stashing的ARM SoC，哪怕处理器跑在10Ghz，网络加速器性能强的翻天，基于DPDK的简单包转发（快于Linux内核网络协议栈转发几十倍）还是只能到zhi强的30%，而包转发是网络处理器的最重要的指标之一,也是服务器用跑网络转发软件的指标之一，更可以用在存储领域，加速SPDK之类的存储应用。
2K10编辑于 2024-04-02

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

ARM加速更迭，国产替代迎新战机

ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算

免费易用，腾讯Arm云实例评测 - AI推理加速

甲骨文ARM DD重装系统并开启BBR加速详细教程

ARM 架构简介_芯片arm架构

最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速

arm指令周期_arm指令sub

ARM NEON卷积神经网络加速简介-技术创作101训练营

为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人

ARM基础了解_arm编程架构

ARM DevSummit - CNN Enhanced Inference on ARM NPU

【嵌入式开发】ARM 芯片简介 (ARM芯片类型 | ARM处理器工作模式 | ARM 寄存器 | ARM 寻址)

Arm 传奇

什么是ARM？_arm开发板

【Android 逆向】ARM CPU 架构体系 ( ARM 内存模型 | ARM 架构堆的实现 | ARM 架构栈的实现 )

arm和mips架构区别_arm架构详解

【ARM】ARM Cortex 处理器详细讲解

TNN行业首发Arm 32位 FP16指令加速，理论性能翻倍

WordPress加速 – Redis加速 – Opcache加速

ARM SoC漫谈

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

ARM加速更迭，国产替代迎新战机

ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算

免费易用 ，腾讯Arm云实例评测 - AI推理加速

甲骨文ARM DD重装系统并开启BBR加速详细教程

ARM 架构简介_芯片arm架构

最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速

arm指令周期_arm指令sub

ARM NEON卷积神经网络加速简介-技术创作101训练营

为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人

ARM基础了解_arm编程架构

ARM DevSummit - CNN Enhanced Inference on ARM NPU

【嵌入式开发】ARM 芯片简介 (ARM芯片类型 | ARM处理器工作模式 | ARM 寄存器 | ARM 寻址)

Arm 传奇

什么是ARM？_arm开发板

【Android 逆向】ARM CPU 架构体系 ( ARM 内存模型 | ARM 架构堆的实现 | ARM 架构栈的实现 )

arm和mips架构区别_arm架构详解

【ARM】ARM Cortex 处理器详细讲解

TNN行业首发Arm 32位 FP16指令加速，理论性能翻倍

WordPress加速 – Redis加速 – Opcache加速

ARM SoC漫谈

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

免费易用，腾讯Arm云实例评测 - AI推理加速