图 | Ampere产品高级副总裁 Jeff Wittich 市场需求的变化要求云计算产业链变革,Ampere抓住的正是这样的机会。 策划&撰写:Lynn 云计算市场越来越大。 对于初创公司Ampere来说,市场机会也出现了。 因此,在瞄准了市场的需求之后,Ampere团队打破既有桎梏,基于Armv8.2+架构,操刀设计了新一代服务器CPU,也是首款满足这三类需求的处理器芯片——Ampere Altra。 ? 如此种种,作为首款面向云计算的CPU,Ampere Altra处理器还是足够让人印象深刻。 ? 而且全球云服务市场规模在不断扩大,Ampere可以抢占的细分市场规模也很可观。
交易完成后,Ampere 将成为软银集团的间接全资子公司。 资料显示,Ampere是一家半导体公司,专门为下一代云计算和 AI 工作负载设计高性能、高能效的处理器。 据甲骨文2024年10月年度报告显示,其不仅持有Ampere 29%股分,还拥有期权和可转换票据,因此有机会获得Ampere控股权。 在产品方面,Ampere 在 2020 年就推出了具有多达 128 个内核的 Ampere Altra 和 Ampere Altra Max CPU,在 2023 年又推出了具有多达 192 个内核的 2024年,Ampere又推出了256个内核的处理器,随后Ampere甚至在其路线图中添加了 512 核 AmpereOne Aurora CPU。 2022 年,Ampere曾秘密提交了 IPO,但随着市场条件发生变化,Ampere的业绩持续下滑,迫使其之后重新评估其战略,包括出售公司。此前,Ampere 的估值曾一度达到了80 亿美元。
That's a Good Thing for Ampere,作者 Alex Williams。 Ampere 的亮点是什么?云原生是其中之一,此外还有其性能以及它对虚拟机可能带来的嘈杂邻居问题的看法。 Ampere 重新设计了 CPU 以避免嘈杂邻居的问题。 Jakubiuk 说,Ampere 提供开箱即用的推理。 由 GPU 训练的模型在 Ampere 上运行,建议使用 TensorFlow 或 PyTorch。 随着推理逐渐成为大型和小型公司的基本策略,这非常适合 Ampere。
英伟达的Ampere架构和Hopper架构分别代表了该公司在GPU设计上的两个重要里程碑,两者在性能、能效、以及针对不同应用场景的支持上都有显著的进步和差异。 Ampere架构(安培架构) 发布时间:Ampere架构首次在2020年随NVIDIA A100计算卡亮相,主要面向数据中心、专业图形应用及高端游戏市场。 关键技术特点: 1. 更高的并发运算能力:相比前代架构,Ampere设计支持更多并发运算,提升了对高性能计算(HPC)和复杂数据分析任务的处理能力。 2. 应用场景:Ampere架构广泛应用于数据中心加速、专业工作站、高端游戏显卡等,如RTX 30系列游戏显卡。 总结而言,Hopper架构是对Ampere架构的一次全面升级,它在晶体管数量、芯片设计、制造工艺等方面均有显著提升,目标在于满足未来几年内对更高计算性能和能效的需求,尤其是在快速增长的AI和数据中心市场
Oracle近几年来在Ampere上总共投资4.26亿美元。 在Oracle悄然向英特尔前总裁Renée James掌舵的Ampere投资4.26亿美元后,公开上市将为Ampere注入大笔现金,并有可能在将来通过公开市场进一步获得更多的资金。 外部资金可能会帮助Ampere在数据中心闯出一片天地,目前两大劲敌英特尔和AMD称霸数据中心服务器市场。 Oracle最新的季度收益报告表明,根据会计规则,它在Ampere持有20%至50%的股份。 Ampere设计基于Arm架构的服务器芯片,旨在挑战英特尔和AMD制造的基于x86设计的芯片。微软和Oracle是Ampere的两大客户,后者已向这家初创公司投资了数亿美元。
Ampere的股权。 去年,剥离了成为Ampere的Arm芯片业务的Macom技术解决方案公司表示,它已将其在Ampere的股权出售给甲骨文附属于甲骨文的买家,价格为1.277亿美元。 Ampere拒绝回应,甲骨文也没有回应置评请求。 今年早些时候报道,甲骨文对Ampere的投资规模在三月份变得清晰起来,此前甲骨文将部分运营亏损归咎于Ampere。 当时,美国证券交易委员会的文件显示,甲骨文已向该公司投资了4.26亿美元,根据会计规则,将Ampere纳入其经营亏损,意味着其拥有Ampere约20%至50%的股份。 甲骨文早期对Ampere的部分投资包括在2021年3月的股权融资轮次中再支付3亿美元,以及购买由Ampere设计的价值数千万美元的服务器芯片的协议。
最近随着下一代NVIDIA Ampere计算架构全新发布,腾讯云作为国内云厂商的领导者,将成为业内率先推出采用NVIDIA A100 Tensor Core GPU的云服务实例的云厂商之一。
它还支持 HBM 内存和 Ampere 的下一代 AI 加速模块,但该公司尚未公布具体的发布时间。 作为一家专业面向数据中心应用的Arm架构芯片设计厂商,Ampere的重点是高能效以及核心密集设计,并且更为偏向风冷设计。 而且在价格方面,风冷比液冷要更容易得多,因此 Ampere 非常关注电源效率,这也减轻了冷却负担。 Ampere 还有其他六种型号,为堆栈提供一系列SKU,涵盖 96、128、144、160 和 192 核心型号。 TDP 是 Ampere 根据 SPEC 整数工作负载将其指定为“使用功率”的,功率范围从 185W 到 332W。Ampere 的功率特性使其功耗难以与竞争对手的功耗进行比较。
且WASM由预编译字节码构成,可在Ampere® Altra®驱动的服务器平台上执行,无需其他CPU通常带来的多线程和微码开销——在诸如此类计算强度较低的场景中,这些开销本就多余。 实施为展示SpinKube的有效性,蔡司集团的IT工程师与Ampere、Fermyon和微软合作,构建了一个在即时场景中随需求上升而启动新WASM Pod的系统。 蔡司集团杰出架构师Kai Walter表示:“当我们处理Node.js的高运行时工作负载时,在相同时间内处理相同订单量,Ampere处理器VM环境的成本比x86 VM实例低60%。”
伴随云游戏发展,在2022 年 8 月 29 日 – NVIDIA 和 Ampere Computing 宣布推出 AICAN 服务器平台。 AICAN 服务器平台(Android-in-Cloud-with-Ampere-and-NVIDIA)是由 Ampere Computing 和 NVIDIA 所共同打造,它采用 Ampere® Altra Ampere Computing 首席产品官 Jeff Wittich 表示:“凭借 Ampere Altra Max 领先的核密度,单机架 AICAN 服务器可以同时向大约 2,500 多个移动用户传输串流 图2:浪潮 AICAN 服务器 浪潮服务器部门总经理赵帅表示:“浪潮与 Ampere 和 NVIDIA 紧密合作,共同设计的 Aoqin AICAN 服务器内置两个 Ampere Altra Max CPU 我们十分高兴能够与 Ampere 和 NVIDIA 一起帮助客户推广移动游戏流式传输解决方案。”
之前已经有消息称,架构代号很有可能是 Ampere。 DigitalTrends 网站作者 Kevin Parrish 分析,Ampere 可能要替代英伟达当前基于 Pascal 的 GeForce GTX 10 系列显卡,Ampere GV104 芯片可作为新的高端解决方案 基于 Ampere 芯片的显卡有望在 4 月 12 日发售,这与英伟达即将在 GTC 2018 上发布游戏产品显卡的报道相一致。 但是 Ampere 和 Turing 代号可能用于在新形势下描述两种不同市场的显卡:游戏和虚拟货币挖矿。之前的谣言称 Ampere 代号游戏显卡,而 Turing 可能针对虚拟货币挖矿显卡。 同时有推测,英伟达已彻底取消 Ampere 代码的名称,因为该名称已被基于 ARM 的服务器制造商使用。
最近,谷歌云发布ARM主机的消息传来,推出采用Ampere处理器的Tau T2A实例。至此,前几大公有云厂商都推出了ARM云主机。 国际市场上,甲骨文云(OCI)、微软Azure也推出了基于Ampere的ARM主机。 最近,谷歌云推出基于Ampere的ARM主机多少还是有点令人意外的,这是全球顶级云厂商中最后一家推出ARM主机的云厂商。 性价比真香 有分析认为,多家云服务商都采用了Ampere一家的ARM芯片,所以,Ampere的成本优势可能会进一步放大,从而更容易为超大规模数据中心市场带来变化。 目前,采用Ampere方案的云厂商用的都是80核的Ampere Altra,而不是128核的Ampere Altra Max。
Ampere为基于Ampere Altra处理器的SR1实例提供了优化过的AI框架(Ampere AI),并通过腾讯镜像市场提供免费的镜像给客户使用。 图片镜像选择“镜像市场”-> “从镜像市场选择”,然后搜索“Ampere”,选取“Ampere® Optimized TensorFlow - Ubuntu 20.04”镜像即可免费使用Ampere针对 ssh ubuntu@<public ip address of the instances>登录后将看到下面的Ampere AI的欢迎界面。 结论采用Ampere® Altra®处理器的腾讯SR1实例,充分发挥了单核单线程的性能优势,同时Ampere® AI优化软件栈将SR1在AI推理应用中,相对x86架构的性价比优势提升到了70%。 Ampere Computing免费试用计划为开发者开放了SR1实例的申请通道,有兴趣的同学可以通过该计划免费试用SR1实例。
在Ampere架构创造了一代神话之后,它的继任者又有什么新的绝技? NVIDIA新一代GPU即将流片! 传奇的Ampere 在去年5月的GTC大会上,NVIDIA创始人黄仁勋在自家厨房里为大家带来了最新一代基于安培架构的GPU。 ? 这使得Ampere架构成为了NVIDIA旗下的一代经典,而最近,关于它的继任者Hopper系列也是传言不断。 Hopper:性能要达到Ampere的三倍! GPU核心都以著名的科学家名字命名,比如Tesla(特斯拉)、Fermi(费米)、Kepler(开普勒)、Maxwell(麦克斯韦)、Pascal(帕斯卡)、Volta(伏特)、Turing(图灵)、Ampere 并且可靠消息表明,与Turing和Ampere架构不同,Hopper系列架构的GPU将被单独用作计算加速使用,而未来推出的RTX4000系列显卡使用的GPU将基于Ada Lovelace架构。 ?
Tensor Core:Tensor Core 是 NVIDIA Volta 架构及其后续架构(如 Ampere 架构)中引入的一种特殊计算单元。 Ampere 架构:Ampere 架构是 NVIDIA GPU 的第八代架构,2020 年发布。Ampere 架构在计算能力、能效和深度学习性能方面都有重大提升。 A100 采用全新的 Ampere 架构。它拥有高达 6912 个 CUDA 核心和 40GB 的高速 HBM2 显存。 架构:A100采用了最新的Ampere架构,而V100则采用了前一代的Volta架构。 Ampere架构相对于Volta架构具有更高的计算密度、更多的CUDA核心和更快的内存带宽,因此A100在计算能力上更强。
最让Dally兴奋的是,Ampere破解了如何利用神经网络的稀疏性来获得更好的性能。 与此同时,Ampere技术的真正优势在于,它不仅在深度学习方面表现出色,在高性能计算方面也有不俗的表现。 下面这张图表展示了从2012年的Kepler,一直到今年5月份的Ampere A100,单芯片推理性能提高了317倍。 这就是「黄氏法则」——推理性能每年翻一倍。 此表上只有3代制程技术,从Kepler架构28nm,到16nm,再到最近Ampere是7nm。 性能方面,Ampere的速度要快2.5倍。相比Google自家的TPU v3和华为,尽管领域不同,但都被Ampere打败。 在数据中心的推理测试中,差距还是拉开了。
基于Ampere的g6r实例(g代表通用场景) 在宣布推出倚天710之前,阿里还低调预览了基于安晟培Altra处理器的实例,如今,打开阿里云官网还是能看见g6r系列实例的规格。 最近,微软Azure也发布了Arm实例Dpsv5的预览版,与AWS自研Graviton芯片不同,微软Azure用的是来自安晟培(Ampere)的 Altra处理器。 AzureDpsv5实例规格 安晟培(Ampere)这两年被曝光的次数其实挺多的,安晟培(Ampere)在芯片行业还是很有背景的,毕竟,安晟培(Ampere)的创始人兼CEO的Renee James之前是英特尔的高管 可以说,拿下Azure对于安晟培(Ampere)的背书意义还是非常大的,对于提振Arm阵营士气很有帮助。 Arm服务器怎么用? Arm生态行不行? OracleA1实例的性价比优势 2021年,Oracle云也推出了基于Ampere Altra的A1实例,性价比相比较于AMD的米兰都高出了32%。
Ampere被认为是全球第二大Arm服务器CPU供应商。伯恩斯坦的报告估计,Ampere在Arm服务器CPU市场的份额在5%至10%之间。 不过,市场调研机构Counterpoint 今年年初的报告显示,2022年全球服务器CPU市场,按营收统计,Ampere拿下了全球1.52%的服务器CPU市场份额。 除了亚马逊AWS和Ampere之外,中国的华为和飞腾也是Arm服务器CPU领域的主要玩家,但是由于美国方面的打压,这两家厂商的在Arm服务器CPU市场的发展受到了很大的影响。
NVIDIA 发布了基于新一代 Ampere 架构的多款 GPU 加速器 A100、A10,相较于上一代有显著的算力提升。 搭载NVIDIA A10通用加速器的实例开放内测 腾讯云正式发布搭载 NVIDIA Ampere 架构的新一代加速器 NVIDIA A10 实例 GPU 计算型 PNV4/GPU 渲染型 GNV4 和 算力升级:基于最新代次的 Ampere 架构, 显著优化图形和计算工作流程的运算效率和性能。应用推理性能相对 T4 提升2.5倍,图形性能提升2.5倍。 在兼顾性能最优的同时做到更高密度,有效降低单卡成本,为客户提供更具性价比的异构计算实例 搭载NVIDIA A100高性能计算实例开放内测 腾讯云重磅推出 GPU 型高性能计算实例 HCCPNV4h,以 NVIDIA Ampere
云深之无际 下面主要是加一点算法解释: PPK2非常好用 Nordic Power Profiler App 两种工作模式 分别是: Source Meter Mode(源表模式) Ampere Meter PPK2 引脚 连接目标 VOUT 接 DUT 的供电引脚(比如 VCC、VDD) GND 接 DUT 的地 VIN 不用连接(仅 Ampere 模式用) 若 DUT 电流消耗可能超过 400 mA, Ampere Meter 模式:DUT 外部供电 + PPK2 串测电流 DUT 自己通过 USB 或其他电源供电。 PPK2 不供电,只负责测电流;类似“电流表串入 VCC 路”。 模式选择总结对比表: 特性 Source Meter 模式 Ampere Meter 模式 DUT 电源来源 PPK2 提供(VOUT) 外部电源提供 是否连接 VIN 不需要 必须连接,作为电源入口