搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏刘旷专栏
ARM加速更迭，国产替代迎新战机
随着众多厂商的入局以及ARM技术优势的显现，ARM架构在数据中心服务器市场的渗透率正在逐年提升，基于此业内甚至不时发出ARM时代到来的感叹。 ARM架构加速渗透根据TrendForce数据预测，随着云数据中心采用推动的逐渐增长，预计到2025年，ARM架构在数据中心服务器市场渗透率将达到22%。再加上ARM本身的低费用和高运行速度，用户自然更愿意选择性价比更高的ARM，ARM的这种性价比优势，也让它在曾经“败北的”服务器市场再次“卷土重来”。 ARM服务器崭露头角其实，ARM早就对服务器芯片市场“垂涎已久”，怎奈ARM在整个市场的发展并不如意，其也曾经几度在服务器市场折戟。不难预见在技术革新加速的今天，依托国内规模庞大的物联网生态和信创软件生态，国内操作系统有望利用内外部机遇，寻找到破除“缺芯少魂”卡脖子困境的最优解。
56920编辑于 2022-08-13
来自专栏TencentOS-tiny
ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算
ARM探索之旅 01 | 带你认识ARM Cortex-M阵营 ARM探索之旅 02 | ARM Cortex-M 用什么指令集？三、使用 ARM FPU 加速浮点计算 1. ARM FPU的魅力 FPU（Floating Point Unit，浮点单元）是ARM内核中的硬件外设，用于硬件计算浮点数，要想使用FPU计算浮点数，需要程序和编译器配合。四、使用Julia测试FPU加速性能 1. 测试准备需要准备一份裸机工程，具有屏幕打点显示功能和串口打印功能。 red = red >> 3; red = red << 11; green = green >> 2; green = green << 5;
4.8K20发布于 2021-07-01
来自专栏云实例评测
免费易用，腾讯Arm云实例评测 - AI推理加速
腾讯CVM标准型SR1是腾讯云推出的首款搭载ARM架构处理器的新一代CVM标准型计算实例规格。
6.4K390编辑于 2022-06-23
来自专栏linux驱动个人学习
linux cpufreq framework(5)_ARM big Little driver
4.1 初始化和ARM big·Little driver有关的初始化过程主要分为三个部分： 1）CPU core的枚举和初始化，具体可参考“ Linux CPU core的电源管理(5)_cpu core的电源管理(5)_cpu control及cpu hotplug”得描述可知，start_kernel之后，系统的possible CPU包含所有的8个core。 generic_bL_probe(struct platform_device *pdev) 2: { 3: struct device_node *np; 4: 5: CPUFREQ_STICKY | 4: CPUFREQ_HAVE_GOVERNOR_PER_POLICY | 5: struct cpufreq_policy *policy) 3: { 4: u32 cur_cluster = cpu_to_cluster(policy->cpu); 5:
1.4K20编辑于 2023-05-03
来自专栏往期博文
【目标检测】YOLOv5推理加速实验：TensorRT加速
前言前两篇博文分别讨论了YOLOv5检测算法的两种加速思路：采用多进程或批量检测，不过效果均收效甚微。本问将讨论使用TensorRT加速以及半精度推理/模型量化等优化策略对检测加速的实际影响。 )进行检测(忽略精度，只注重速度) 环境搭建关于TensorRT的安装在之前博文【目标检测】使用TensorRT加速YOLOv5中已经写过，这里不作赘述。 YOLOv5最新版本可以将检测前后三个步骤(预处理、推理、非极大化抑制)分别统计时间，yolov5s.pt和yolov5s.engine的时间如下： yolov5s.pt Speed: 1.0ms inference, 2.0ms NMS per image at shape (1, 3, 1280, 1280) 可以看到，转成TensorRT之后，推理(inference)时间确实如某些资料所述，加速了五倍以上 1.140 0.878 yolov5n.engine 1.100 0.910 yolov5n.engine(量化后) 0.793 1.261 yolov5s.pt 1.184 0.845 yolov5s.engine
2.5K40编辑于 2023-04-12
来自专栏晓飞的算法工程笔记
简单的特征值梯度剪枝，CPU和ARM上带来4-5倍的训练加速 | ECCV 2020
论文通过DBTD方法计算过滤阈值，再结合随机剪枝算法对特征值梯度进行裁剪，稀疏化特征值梯度，能够降低回传阶段的计算量，在CPU和ARM上的训练分别有3.99倍和5.92倍的加速效果undefined 经理论推理和实验证明，这种方法不仅能够有效地稀疏化特征值梯度，还能在加速训练的同时，不影响训练的收敛性。 [1240] 在不同的设备上进行加速效果验证。 Conclustion *** 论文通过DBTD方法计算过滤阈值，再结合随机剪枝算法对特征值梯度进行裁剪，稀疏化特征值梯度，能够降低回传阶段的计算量，在CPU和ARM上的训练分别有3.99倍和5.92 倍的加速效果。
85320发布于 2020-09-08
来自专栏安智客
编译Arm物联网可信固件---DS-5
Arm物联网可信固件需要用DS-5进行编译！ ❶ 下载DS-5 v5.27.1 (DS-5 终极版，提供ARM编译器v6.7.1版本的) 官网下载。 ?
77130发布于 2018-07-30
来自专栏冬雷博客
甲骨文ARM DD重装系统并开启BBR加速详细教程
/debi.sh --architecture arm64 --user root --password iDongLei 重启 sudo shutdown -r now 根据大佬脚本描述，30秒即可执行完毕，但是有时候因为网络和负载原因，请等待3-5分钟再重新登陆。 tcp_available_congestion_control = reno cubic bbr image.png 查看BBR是否启动 lsmod | grep bbr 打印以下代码即为已启动 root@arm :~# lsmod | grep bbr tcp_bbr 24576 7 拓展上面所讲述的是Oracle（甲骨文）ARM系统重装Debian11的过程，如果需要AMD系统的
12.7K50编辑于 2022-04-26
来自专栏全栈程序员必看
keil5 for arm_keil can’t open file
前言：写这个文章时还在上大三，转眼间都研二了，当时写的比较浅陋，结构也比较混乱，抽空整理整理，增加些人气。最近在写程序时，出现了个大问题，想在我用Keil写程序那么多个月，什么Bug我没见过，就在我建立好STM32的模板时后向里边添加文件时，编译后出现了这个问题，
74230编辑于 2022-10-02
来自专栏全栈程序员必看
ARM 架构简介_芯片arm架构
最右边的5位显示当前的处理器模式，它们在响应异常中出现模式更改时自动设置，也可以手动修改以便在程序控制下更改模式。下面举例说明，第一个真的很简单： SUB r0, r1, #5 它显然是个减法指令，有3个参数。第一个参数是寄存器，指定减法结果的目的地；另外两个参数指定输入参数，可以理解为从左到右为”r0 = r1 – 5”。 ADDEQ r5, r5, r6 这又是一个ADD，它是有条件指令，该助记符带有“EQ”后缀，表明只有在达到EQ条件为真时才会执行这一指令，如果该条件不为真，指令将表现为NOP。 as program.s -o program.o ld program.o -o program 我们从最底层来看下，在最底层，电路上有电信号，信号是将电压切换为两个电平来形成的，例如0伏(关)或5伏
3.8K40编辑于 2022-11-04
来自专栏全栈程序员必看
MDK5搭建ARM9开发环境「建议收藏」
在使用MDK5开发ARM9程序时，需要安装ARM9的支持包。链接：http://www2.keil.com/mdk5/legacy 安装后即可在DEVICE选项找到我们需要的芯片型号发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn
1.5K10编辑于 2022-06-28
来自专栏量化投资与机器学习
5倍提升，加速CPython！Quant如何看？
微软将资助一个由Guido van Rossum、Mark Shannon（加速计划的提出者，精通 Python 性能研究）、Eric Snow（Python 核心开发者之一、微软高级工程师）等多人组成的小团队来加速加速CPython！在今年2021 Python语言峰会上，Guido Van Rossum在表示：他打算在2022年10月发布3.11版本时将快CPython的速度提高1倍。在接下来的四年里，他的目标是将CPython的速度提高到原来的5倍。相关阅读最新！想学CPython，Python之父Guido亲上阵整个计划被称为“香农计划”（即“Shannon Plan”，得名于提出者），期望花 4 年时间把 Python 提速 5 倍，即每年 1.5 倍。 benchmarksgame-team.pages.debian.net/benchmarksgame/fastest/gpp-python3.html 量化圈内人评价 Citadel的前量化分析师Jeffrey Ryan评价道，Python的速度提高2-5倍在金融领域不会产生多大影响
1.5K10发布于 2021-07-07
来自专栏贾志刚-OpenCV学堂
最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速
为什么有扩展模块发布|OpenVINO扩展模块支持原生Pytorch模型转换与ARM加速 OpenVINO刚刚不久之前发布了新版本OpenVINO2021.3版本，其中最引入关注的是有了OpenVINO 当前扩展模块主要包括三个部分 arm_plugin 支持深度神经网络的ARM CPU加速推理 java_api 支持Java的SDK了，什么意思，就是Java程序员也可以使用推理引擎了。其中arm支持给出测试demo是在树莓派4B上面，演示程序运行如下： ? 支持32FP与16FP的模型精度，不支持INT8。 ? 为了让大家更好得理解与使用OpenVINO框架，我特别整理了OpenVINO计算机视觉加速的学习路径，图示如下： ?
2K30发布于 2021-04-21
来自专栏全栈程序员必看
arm指令周期_arm指令sub
1.大部分算术运算和逻辑运算指令都是单周期的，例如加法、减法、位级运算和移位 2.乘法指令根据操作数位数的不同，从2-5个周期都有可能。现在的处理器的大部分指令(ARM、DSP)均采用单周期指令，比如CLR,MOV等。多周期指令，比如转移指令、乘法和除法指令。
2.8K30编辑于 2022-09-27
来自专栏程序员泥瓦匠
5分钟了解 CDN 加速原理
二方面把获取的数据返回给客户端，完成数据服务过程）通过以上的分析我们可以得到，为了实现对普通用户透明（使用缓存后用户客户端无需进行任何设置）访问，需要使用 DNS（域名解析）来引导用户来访问 Cache 服务器，以实现透明的加速服务智能调度 DNS（比如 f5 的 3DNS）智能调度DNS是CDN服务中的关键系统.当用户访问加入CDN服务的网站时，域名解析请求将最终由 “智能调度DNS”负责处理。缓存功能服务负载均衡设备(如lvs,F5的BIG/IP) 内容Cache服务器(如squid）共享存储三、名词解释 CNAME记录（CNAME record） CNAME即别名( Canonical CNAME域名接入CDN时，在CDN提供商控制台添加完加速域名后，您会得到一个CDN给您分配的CNAME域名，您需要在您的DNS解析服务商添加CNAME记录，将自己的加速域名指向这个CNAME域名，这样该域名所有的请求才会都将转向CDN的节点，达到加速效果。
2.5K10编辑于 2021-12-17
来自专栏往期博文
【目标检测】使用TensorRT加速YOLOv5
很早就听说TensorRT可以加速模型推理，但一直没时间去进行实践，今天就来把这个陈年旧坑填补一下。背景知识在实践之前有必要了解一下相关知识。 TensorRT支持几乎所有主流深度学习框架，将python框架转换成C++的TensorRT，从而可以加速推理。如果提示没装pycuda，还需要再安装一下 pip install pycuda YOLOv5使用TensorRT加速下面内容有点乱，是我实验时的草稿，明天再起来整理。 ---- python export.py --weights yolov5s.pt --data data/coco128.yaml --include engine --device 0 --half 程序花费时间8.395954370498657秒半精度 python detect.py --weights yolov5s.engine 程序花费时间4.830101728439331秒全精度
5.7K60编辑于 2022-11-21
来自专栏物联网学习
ARM NEON卷积神经网络加速简介-技术创作101训练营
为了加速乘法运算，可以使用ARM-NEON技术，比如ncnn就依据此类技术实现，除了ncnn外，ARM还提供了官方的基于NEON技术的计算库ARM Compute Library以及专为深度学习设计的ARM 根据实现方式分为以下两种： ncnn：针对不同平台实现高效的几种卷积核（1x1/3x3/5x5/7x7）运算，以点乘为主(特别地，1x1的可以看做是gemm)。 Winogard变换] 在不更换硬件平台的情况下，可以使用ARM NEON技术更好地发挥硬件性能。基于ARM NEON技术的矩阵乘法加速可以理解为利用矩阵乘法并行性，如图3所示。矩阵乘法并行性] 2.3 卷积神经网络转换矩阵乘法如果为了使用GEMM方法进行卷积神经网络加速，需要将卷积神经网络中的卷积层计算转换成矩阵乘法，然后利用GEMM进行加速，卷换过程如图4所示。 [卷积计算转换矩阵乘法](https://hal.inria.fr/inria-00112631/document)] 三、总结通过ARM NEON技术进行卷积神经网络加速，可以采用的路径有： 1.参考
2.7K53发布于 2020-09-23
为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人
虽然Arm公司一直都是一家仅提高半导体IP/指令集授权的企业，并且基于Arm架构的芯片已经几乎无处不在，绝大多数的智能手机、平板电脑都是基于Arm架构的芯片，此外众多的物联网芯片、汽车芯片，乃至一些PC 芯片和服务器芯片也都是基于Arm架构。但是，Arm并不满足于仅仅是提供IP技术授权。 Arm甚至还希望自研芯片来直接销售给客户。目前尚不清楚 Arm自研芯片进展如何，但拥有丰富的芯片研发经验的Rami Sinno的加入，或将进一步助力Arm公司自研芯片项目。编辑：芯智讯-浪客剑
14810编辑于 2026-03-20
来自专栏全栈程序员必看
ARM基础了解_arm编程架构
ARM 处理器家族早起经典处理器包括ARM7、ARM9、ARM11等，Cortex-A系列是它们的升级版从ARM11之后就变成了Cortex系列 Cortex-M系列控制 ARM的内核是基于RISC（精简指令集）体系结构的 SOC的概念片上系统指的是在单个芯片上集成一个完整的计算机系统，所谓完整的系统一般包括中央处理器（CPU）、存储器、以及外围电路等。 STM32F0/F1是指某一款SOC intel、ARM是指SOC里面的CPU 半导体厂商：意法半导体（ST） ---- ROM RAM ROM 只读存储器(read only memory)，英文简称
1.5K20编辑于 2022-11-10
来自专栏空空裤兜
ARM架构LNMP下部署Microsoft 365 E5 Renew X
参照《Microsoft 365 E5 Renew X 部署记录》操作，记录一下在甲骨文ARM机器上LNMP环境下的操作过程。 file: /usr/local/nginx/conf/cert.key //私钥 cert.key 部署程序： 1、下载地址 2、发布地址用ftp工具将下载的程序解压后传至网站目录，我的为arm.yyds.dev 配置Nginx： cd /usr/local/nginx/conf/vhost/ nano arm.yyds.dev.conf 在最后的log定义文件前加上 location ~ / { proxy_set_header Cd /etc/systemd/system nano e5renewx.service 粘贴下面代码： [Unit] Description="Microsoft E5 Renew API Web dotnet daemon-reload #开机自启动 systemctl enable e5renewx.service #启动服务 systemctl start e5renewx.service 本文由空空裤兜
1K10编辑于 2023-03-03

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

ARM加速更迭，国产替代迎新战机

ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算

免费易用，腾讯Arm云实例评测 - AI推理加速

linux cpufreq framework(5)_ARM big Little driver

【目标检测】YOLOv5推理加速实验：TensorRT加速

简单的特征值梯度剪枝，CPU和ARM上带来4-5倍的训练加速 | ECCV 2020

编译Arm物联网可信固件---DS-5

甲骨文ARM DD重装系统并开启BBR加速详细教程

keil5 for arm_keil can’t open file

ARM 架构简介_芯片arm架构

MDK5搭建ARM9开发环境「建议收藏」

5倍提升，加速CPython！Quant如何看？

最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速

arm指令周期_arm指令sub

5分钟了解 CDN 加速原理

【目标检测】使用TensorRT加速YOLOv5

ARM NEON卷积神经网络加速简介-技术创作101训练营

为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人

ARM基础了解_arm编程架构

ARM架构LNMP下部署Microsoft 365 E5 Renew X

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

ARM加速更迭，国产替代迎新战机

ARM探索之旅03 | 如何使用 ARM FPU 加速浮点计算

免费易用 ，腾讯Arm云实例评测 - AI推理加速

linux cpufreq framework(5)_ARM big Little driver

【目标检测】YOLOv5推理加速实验：TensorRT加速

简单的特征值梯度剪枝，CPU和ARM上带来4-5倍的训练加速 | ECCV 2020

编译Arm物联网可信固件---DS-5

甲骨文ARM DD重装系统并开启BBR加速详细教程

keil5 for arm_keil can’t open file

ARM 架构简介_芯片arm架构

MDK5搭建ARM9开发环境「建议收藏」

5倍提升，加速CPython！Quant如何看？

最新发布 | OpenVINO扩展模块支持原生Pytorch模型转换与ARM CPU加速

arm指令周期_arm指令sub

5分钟了解 CDN 加速原理

【目标检测】使用TensorRT加速YOLOv5

ARM NEON卷积神经网络加速简介-技术创作101训练营

为加速自研芯片研发，Arm挖来了亚马逊AI芯片掌门人

ARM基础了解_arm编程架构

ARM架构LNMP下部署Microsoft 365 E5 Renew X

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

免费易用，腾讯Arm云实例评测 - AI推理加速