从某种意义上讲,智算中心不只是称呼上的改变,更是应对AI时代算力爆炸性增长的实质性突破,新标杆的示范效应值得期待。 该来的总会来。 如果说新基建将外延扩展至智算中心,是算力供给侧改革的序曲;那么《三年行动计划》则是层次清晰的组合乐章,推动算力供给侧改革向纵深挺进。 国家信息中心信息化和产业发展部主任单志广认为,长三角是未来智能经济发展的桥头堡,智算中心将有效推动整个地区智能产业创新集聚与经济能级提升。 类似南京智算中心这样的算力枢纽节点,借助生产、聚合、调度和释放四大关键作业环节,可以提供人工智能全链条所需的算力服务。 智算中心致力于填平AI技术研发与行业应用之间的鸿沟,与浪潮倡导的元脑生态与“左右手”合作理念不谋而合。
简单来说,智算中心就是专门服务于人工智能的数据计算中心,能够为人工智能计算提供所需的专用算力。 数据来源:《智能计算中心规划建设指南》 相比传统数据中心,智算中心能满足更具针对性的需求,以及更大的计算体量和更快的计算速度。 从硬件上来看,传统数据中心多采用通用计算的CPU,而智算中心中更多的是GPU等进行AI训练的芯片;软件上,智算中心会部署不同的人工智能框架,用于分配计算任务提高效率,并且提供了人工智能应用开发工具。 而智算中心不仅包含算力基础设施,还有算法基础设施。算力基建化只是第一步,接下来,还需要加强算法基础设施建设。 只有实现算法基建化,才能让更多的企业享受普适普惠的智算服务。 未来,智算中心将围绕开放标准、集约高效、普适普惠三个原则开展建设,并呈现出三个主要趋势:更加开放多元的架构与标准体系;通过算力、算法的基建化和一体化,让服务更高效;建立智算生态,让智算中心更好用。
2021年8月23日,成都智算中心一期项目(人工智能算力平台)(第01包:项目建设)招标公告发布,预算108853万元。 采购人:智算云腾(成都)科技有限公司(云头条备注:成都高新区财政金融局持股90%、四川省财政厅10%)
像搭建乐高积木一样建设数据中心? 没错,这就是成都智算中心的建设模式。 成都智算中心是“东数西算”国家一体化大数据中心成渝枢纽节点的样板工程、西南地区最大的人工智能计算中心,包括人工智能算力平台、城市智脑平台和科研创新平台等三大平台,同时也是首个应用“预制模块化+钢构+土建 02 为绿色数据中心 打个样儿 在成都智算中心,我们真正见证了绿色数据中心建设的高效与快速:作为西南首个人工智能计算中心和国内首创采用履带吊的项目,成都智算中心仅用4个月时间就完成从施工到上线,7天完成 事实上,成都智算中心之所以如此高效,要得益于华为预制模块化数据中心解决方案。华为方案的创新思路在于超融合化理念。 2大解决方案包括室外的预制模块化数据中心方案和室内的智能微模块方案;3大核心子系统包括智能供电、智能温控和智能管理,2大解决方案+3大核心子系统支撑起数据中心走向模块化和智能化。
去年底商汤科技上市时,其招股书中披露的人工智能算力中心吸引了人们的注意:这家公司在上海临港建设的 AI 算力基础设施投资 56 亿元,在去年 2 月仅花费 168 天就迅速宣布建筑物结顶,刷新了临港建设的新纪录 作为 SenseCore 商汤 AI 大装置计算基础设施的重要组成部分,AIDC 一期工程的设计算力为每秒 3740 Petaflops(1 Petaflops 为每秒千万亿次浮点运算),是亚洲最大的超算中心之一 目前国内已知最大的人工智能的算力中心是鹏城实验室的「鹏城云脑 II」,输出 1000 Petaflops 算力。商汤 AIDC 的算力,每天可处理时长 23600 年的视频。 2019 年,商汤在上海的超大规模智能计算中心计划提上了日程,2020 年 3 月份公司和临港签约,7 月开工,去年通过验收。 AIDC 启动运营后,将进一步扩展商汤的 AI 超算规模,使商汤的总算力超过每秒 4910 Petaflops。 在短时间内建设如此大规模的 AI 计算中心,在国内范围内尚属首例。
本篇为“揭秘AI智算中心网络流量“系列的第二篇,前篇请参阅:一文揭秘AI智算中心网络流量 – 大模型训练篇 。有关数据存储流量的分析将于下篇呈现,敬请关注。 因此,U个用户的并发推理,中间激活值的总网络流量为另外,在一次推理中,KV缓存的大小为因此,U个用户的并发推理,KV缓存传递的网络流量为以Llama3-120B模型为例,模型层数140, 隐藏状态大小8192 这便要求基础设施具备相当的开放性——网络不但要连接底层的异构算力(GPU、CPU、NPU)系统,还需要实现与上层管理系统的对接集成,例如与基于K8s的算力调度平台、已有的云管平台等等。 在已被用户场景充分验证的数据中心开放云网能力之上(BGP、VXLAN、Calico容器路由、RoCE、NVMe-oF等),星融元推出的 星智AI 网络解决方案基于通用、解耦、高性能的以太网硬件和开放的SONiC 软件框架,为AI智算中心提供10G-800G速率的以太网交换机,灵活支持单一速率或混合速率交换机组网,在保持极致性能的同时可编程、可升级,帮助客户构建高性能的AI智算中心网络,提供用于AI训练、推理、分布式存储
---- 新智元报道 编辑:好困 【新智元导读】11月17日,浙江省青田县人民政府与浪潮信息、谷梵科技签署战略合作协议,三方共建国内首个元宇宙智算中心,建成后每秒算力性能将超过10亿亿次, 元宇宙智算中心作为数实融合的重要基础设施,通过领先的「算力基础设施+全栈元宇宙」解决方案,为元宇宙的构建和运转提供核心源动力。 青田元宇宙智算中心设计采用全球领先的智算架构,部署业界领先的元宇宙服务器MetaEngine,助力用户更高效地创建数字资产。 青田元宇宙智算中心将建设成为国内首个算力、算法、开发平台一体化的新型元宇宙基础设施,通过协同创建、高精仿真、实时渲染、智能交互四大作业环节,面向企业管理、工业、交通运输、金融、城市等多产业的元宇宙场景提供高效的算力支撑 未来,青田元宇宙智算中心将为青田县乃至浙江、长三角地区的元宇宙产业提供基础设施支撑,推动数字人、数字孪生、数字经济、数字政府、数字社会等领域的发展,加快推进数实融合产业进程。
当前,很多城市不约而同地将目光瞄向智算中心。 得益于数字经济的蓬勃发展,以智算中心为代表的新型基础设施正在迅速兴起。 事实上,国内已经有超过20多个城市启动或完成智算中心的建设。那么,如何真正规划和建设好一个智算中心?有中国云都之称的宿州,带来了它的答案:淮海智算中心。 可以说,淮海智算中心,绝不仅仅意味着数据中心的建设,更是承载着宿州这座城市产业发展、转型升级目标的梦想,堪称智算中心从规划到建设的标杆。那么,为什么淮海智算中心能够成为标杆样板? 透过淮海智算中心,我们能够看到智算中心建设有哪些重要趋势? 区别于传统的数据中心、超算中心,智算中心之所以称之为新型基础设施的代表,在于它正在推动算力从计算走向智算。 正如浪潮信息总裁彭震所言:“随着人工智能的发展,智算中心会成为主流的算力基础设施。
在东数西算、新基建等一系列国家政策的支持下,国内掀起了智算中心建设潮。 论坛时间:2022 年 9 月 3 日(周六)上午 9:00 论坛看点: 中国工程院院士邬江兴将发表 “晶上系统技术赋能新一代信息基础设施” 主题演讲 《东数西算战略下绿色智算中心产业发展研究报告》发布 本报告分析东数西算战略下数据中心特别是智算中心发展面临的挑战与机遇,分析智算中心行业发展趋势,从产业上、中、下游分别提出解决思路与实现路径,并从能源供给、算力自主可控和智算服务三个代表性行业角度提出了推动绿色智算中心产业发展的专项建议 燧原科技作为本次报告的参编单位及发起单位之一,与 “国家级智库” 国家信息中心及相关参编单位深度合作,基于燧原科技在人工智能算力及智算中心建设的项目实践与长期技术研究,重点围绕智算中心政策、产业、技术趋势 想了解更多 AI 算力中心新实践信息,敬请关注 9 月 3 日(周六)举办的燧原科技 “算尽其用 ·AI 算力中心新实践” 云端 AI 算力产业论坛暨 2022 年燧原科技新产品发布会。
允中 发自 凹非寺 量子位 | 公众号 QbitAI 国内首个元宇宙智算中心,来了! 浙江省青田县人民政府与浪潮信息、谷梵科技官宣:将三方共建元宇宙智算中心—— 每秒算力性能将超过10亿亿次,涵盖元宇宙协同创建、高精仿真、实时渲染、智能交互全流程的元宇宙数字资产创建平台。 元宇宙智算中心作为数实融合的重要基础设施,通过领先的“算力基础设施+全栈元宇宙”解决方案,为元宇宙的构建和运转提供核心源动力。 青田元宇宙智算中心设计采用全球领先的智算架构,部署业界领先的元宇宙服务器MetaEngine,助力用户更高效地创建数字资产。 青田元宇宙智算中心将建设成为国内首个算力、算法、开发平台一体化的新型元宇宙基础设施,通过协同创建、高精仿真、实时渲染、智能交互四大作业环节,面向企业管理、工业、交通运输、金融、城市等多产业的元宇宙场景提供高效的算力支撑
本篇为“揭秘AI智算中心网络流量“系列的第三篇,前篇请参阅:一文揭秘AI智算中心网络流量-大模型训练篇一文揭秘AI智算中心网络流量-AI推理篇01、生成式AI对数据存储有哪些需求? 数据挖掘:需要从多个来源收集非结构化的数据,一般与混合云集成,用数据湖作为存储平台;数据准备:进行数据汇总、标准化和版本控制,关注存储的效率和灵活的数据管理能力,多采用统一存储平台;模型训练和微调:在智算中心内部 02、智算中心的存储网络我们大致可将AI智算中心内部的数据存储系统进行简单的层次分类,主要包括GPU内存、存储网和存储设备。一般来说,在存储层次结构中位置越高,其存储性能(尤其是延迟)就越快。 因为本文的定位在分析网络流量,我们将聚焦于存储网络(data fabric)层次,即智算中心内部GPU服务器内存与远端存储服务器之间传输的数据。 CX664P-N 是一款专为智算/超算中心设计的超低时延RoCE交换机,凭借以下特性在存储场景中脱颖而出。
进一步,随着多模态大模型的兴起,训练数据从单一的文本过渡到图像和视频乃至3D点云,数据规模将是文本数据的1万倍以上。 AI模型的规模巨大并持续快速增长,不仅将带来数据中心流量的指数型增长,独特的流量特征也将为数据中心网络带来崭新的需求。 其中,GPU之间的网络流量与传统数据中心内部流量迥然不同,这与AI大模型的训练方法息息相关——并行训练技术。 并行训练:AI智算中心的主要流量来源 当前广泛应用于AI训练并行计算模式主要有以下三类: 并行计算模式 详情 数据并行 将不同的样本数据分配给不同的GPU,以加快训练速度;用在主机之间 张量并行 将模型的参数矩阵划分为子矩阵 AI训练对智算中心网络的要求 通过以上分析和计算,我们可以得出一个典型的AI智算中心对计算网的核心需求。 超高带宽:一个epoch就会产生85EB的数据量,相当于整个互联网2.5天的流量。
01 什么是智算中心? 浪潮认为,未来人工智能计算需求占比将在80%以上,专门面向AI计算的计算中心呼之欲出,这就是“智算中心”,即AI算力中心。 ? 智算中心,有望化解AI计算需求爆发与传统算力不足的矛盾。 传统云计算的成本,对AI计算来说已日益奢侈,智算中心一定要集约高效,自身应用AI、大数据、IoT、机器人等降本增效的数字科技,大幅降低计算成本。 3、为什么要普适普惠? 智算中心有望成为新基建的重点。3月4日,中央在一次会议上强调要加快数据中心、5G、AI和工业互联网等新型基础设施建设进度,“新基建”将助力疫后经济复苏,成为我国经济增长的新引擎。 但不可否认的是,作为智慧计算和开放计算的先行者、智算中心提出者的浪潮,在智算中心建设中依然会发挥不可替代的作用。 首先,浪潮具有全栈AI计算能力,有能力成为智算中心核心建设者。
根据统计,我国已有超过30个城市正在建设或提出建设智算中心,同时也有不少科技企业正在与地方协同,深度参与到这个进程中,比如浪潮信息的淮海智算中心、商汤的上海智算中心、阿里的张北超级智算中心等等,就在为当地的人工智能产业提供着强效的算力服务 四是智算中心的认知和规范化建设有待加强 智算中心并非是今天的产物,在过去的几年内就已经有部分城市开始建设并投入运营。 而这些智算中心在赋能人工智能产业发展的同时,也正在暴露出一些问题,亟待市场和地方对智算中心的建设进行重新审视与梳理。 02 智算中心如何走好 创新发展之路 创新与突破是人工智能产业发展必不可少的一个基础路径,对于智算中心的建设而言,也同样如此。 当智算中心沿着“四化”技术路线进行迭代发展的过程中,实际上也意味着智算中心本身还存在着些许问题,亟待解决。
智算中心引共鸣,浪潮要做新基建的长期主义者 今年初,浪潮在IPF 2020大会上首次提出“智算中心”概念。 1 智算中心代表基础设施建设的方向 什么是“智算中心”? 从用户自身的角度思考,可能会发出一些疑问,例如:智算中心与过去的数据中心、HPC集群到底有何不同之处?智算中心是否有一定的衡量标准,是不是AI服务器多一些就可以叫智算中心? 刘军透露,山东中国算谷、西安新区人工智能算力平台、智算中南等项目都是“智算中心”落地的代表,并且“智算中心”在金融、交通、汽车自动驾驶等行业也有交叉落地。 3 做基础设施领域的长期主义者 高瓴资本创始人在《价值》一书中认为,长期主义者是把时间和信念投入到长期产生价值的事情中。
比如下面的新闻: 2月18日,一个新的数据舱在海南陵水近海海域被放入海底,与正在运营的全球首个商用海底数据中心相链接,标志着海南海底智算中心集群正式启用 一个长18米、直径3.6米的白色“巨罐”——海南海底智算中心数据舱 ,稳稳沉入30余米深的大海,与2023年3月底在海底“安营扎寨”的海底数据中心成功链接。 “海底智算中心数据舱与正在运营的海底数据中心相链接,构建成海南海底智算中心集群。数据舱里可放置超400台高性能服务器,通过附近地面上的岸站与客户数据端连通,搭建起数据传输的桥梁。 3、本土需求与发展困境 海南自身数字经济发展需要强大算力,但作为热带岛屿,建设传统数据中心面临气温高、能耗大、淡水资源相对紧缺的困境。海底方案能省电、省水、省地,完美匹配本地需求。 同时,海底智算中心全年使用海水作为自然冷源,海底智算中心常年实际运营PUE(能源利用效率)小于1.1。 这确实是一次大胆的尝试,小步快走。
“计算力不仅是生产力,还是创造力,计算正向智算跨越。” 浪潮信息总裁彭震认为,计算力和算法是智算中心的核心,要想产生一流的智慧,就必须要有一流的算法,同时算法的高效运转要依赖领先的计算力,计算力基建化和算法基建化相辅相成。 算力总规模超过140每秒浮点运算次数,近5年年均增速超过30%,算力规模排名全球第二。全国在用超大型、大型数据中心超过450个,智算中心超过20个。 今年3月份,工信部公布首批国家新型数据中心典型案例名单,共有32个大型以上数据中心和12个边缘数据中心入选;工信部近年来先后组织3批国家新型工业化产业示范基地(数据中心)的评选工作,11个产业园区入选, 《新型数据中心发展三年行动计划(2021—2023年)》,明确提出用3年时间,基本形成布局合理、技术先进、绿色低碳、算力规模与数字经济增长相适应的新型数据中心发展格局;11月份,工信部发布《“十四五”信息通信行业发展规划
前文介绍了智算与云网融合的关系,那么智算与算力网络、算网融合的关系又是什么?让我们先来复习一下智算的概念。 而这种能力向边缘的扩展和延伸需要与网络结合,催生了算力网络。算力网络是以算为中心、网为根基,提供一体化服务的新型信息基础设施,可以理解为计算设施和网络设施共同建设的一张传输网络。 三者的关系是什么通过上文对智算概念的描述,我们可以将智算翻译为“数据+算力+算法”,如图4所示。智算涉及丰富的计算场景,需要用到大模型计算,处理海量数据。基于智算的这种特性,算力需求激增。 云数据中心无法承载如此巨大的数据和算力,那么传统的云计算方式就无法满足海量数据的处理要求。 算力网络和算网融合为智算提供了强大的技术支撑,而智算的发展推动了算网融合和算力网络的进步,他们三者是相互促进的关系。智算时代如何打造算力网络在智算时代下,如何打造算力网络,做到算网融合呢?
《智算中心光电协同交换网络全栈技术白皮书》(2025 年 8 月,由湖南大学、中国联通研究院等多单位联合编写)指出,在 AI 大模型参数量指数级增长推动智算需求爆发的背景下,传统纯电交换网络因在端口密度 支撑与时间:编写于 2025 年 8 月,得到国家自然科学基金项目(编号:U24B20150)支持,旨在为智算中心网络领域提供系统参考框架。 互联架构:智算中心网络分为机内互联(PCIe、NVLink 5.0,带宽达1800 GB/s)与机外互联(Fat-Tree/Leaf-Spine 架构,依赖电交换芯片)。 光器件切换速度不足;3. 高速光模块能耗散热问题 尽管光交换技术具有高带宽、低延迟、可扩展等一系列优点,但在智算中心中应用全光交换面临诸多的现实挑战。 现阶段使用光电协同方案组建智算中心网络,以结合光域的高速传输和电域的灵活控制,是更为实际的方案。
超大型智算中心是拥有几千上万张、甚至十万张加速卡,总算力可达几百PFLOPS~EFLOPS级别的智算中心。 ²中国移动智算中心(呼和浩特)部署约2万张AI加速卡,可提供6.7EFLOPS 算力。 ²中国电信智算中心(南京)已建成算力规模2EFlops,2025年底算力规模可达5EFlops ²中国联通长三角(芜湖)智算中心总规划算力为3EFLOPS算力。 这也是为什么国内国外科技巨头、运营商都在建超大型智算中心的动力所在。 超大型智算中心平时都在做什么呢? 为了承载这两类业务,超大型的智算中心需要做到3点,达成极致算效和极致能效的效果: 1.提高算力集群的有效算力,提升基础模型预训练效率,缩短训练时间。