7月16日,南京智能计算中心在南京市麒麟科技创新园落成并投入运营,中心采用业界领先的人工智能芯片和算力机组,已运营系统的AI计算能力达每秒80亿亿次 (800POpS),成为长三角当前投运的最高算力智能计算中心 算力枢纽替代“小、散、乱” 今年7月初,工信部印发《新型数据中心发展行动计划(2021-2023年)》,明确用三年时间,基本形成结构合理、技术先进、绿色低碳、算力规模与数字经济增长相适应的新型数据中心发展格局 如果说新基建将外延扩展至智算中心,是算力供给侧改革的序曲;那么《三年行动计划》则是层次清晰的组合乐章,推动算力供给侧改革向纵深挺进。 国家信息中心信息化和产业发展部主任单志广认为,长三角是未来智能经济发展的桥头堡,智算中心将有效推动整个地区智能产业创新集聚与经济能级提升。 类似南京智算中心这样的算力枢纽节点,借助生产、聚合、调度和释放四大关键作业环节,可以提供人工智能全链条所需的算力服务。
简单来说,智算中心就是专门服务于人工智能的数据计算中心,能够为人工智能计算提供所需的专用算力。 数据来源:《智能计算中心规划建设指南》 相比传统数据中心,智算中心能满足更具针对性的需求,以及更大的计算体量和更快的计算速度。 从硬件上来看,传统数据中心多采用通用计算的CPU,而智算中心中更多的是GPU等进行AI训练的芯片;软件上,智算中心会部署不同的人工智能框架,用于分配计算任务提高效率,并且提供了人工智能应用开发工具。 而智算中心不仅包含算力基础设施,还有算法基础设施。算力基建化只是第一步,接下来,还需要加强算法基础设施建设。 只有实现算法基建化,才能让更多的企业享受普适普惠的智算服务。 未来,智算中心将围绕开放标准、集约高效、普适普惠三个原则开展建设,并呈现出三个主要趋势:更加开放多元的架构与标准体系;通过算力、算法的基建化和一体化,让服务更高效;建立智算生态,让智算中心更好用。
2021年8月23日,成都智算中心一期项目(人工智能算力平台)(第01包:项目建设)招标公告发布,预算108853万元。 采购人:智算云腾(成都)科技有限公司(云头条备注:成都高新区财政金融局持股90%、四川省财政厅10%)
像搭建乐高积木一样建设数据中心? 没错,这就是成都智算中心的建设模式。 成都智算中心是“东数西算”国家一体化大数据中心成渝枢纽节点的样板工程、西南地区最大的人工智能计算中心,包括人工智能算力平台、城市智脑平台和科研创新平台等三大平台,同时也是首个应用“预制模块化+钢构+土建 在我国,2019年中国数据中心的数量超过7万个,约占全球数据中心数量规模的23%,低水平的数据中心数量众多,高能耗、电费居高不下的情况更甚。 02 为绿色数据中心 打个样儿 在成都智算中心,我们真正见证了绿色数据中心建设的高效与快速:作为西南首个人工智能计算中心和国内首创采用履带吊的项目,成都智算中心仅用4个月时间就完成从施工到上线,7天完成 事实上,成都智算中心之所以如此高效,要得益于华为预制模块化数据中心解决方案。华为方案的创新思路在于超融合化理念。
去年底商汤科技上市时,其招股书中披露的人工智能算力中心吸引了人们的注意:这家公司在上海临港建设的 AI 算力基础设施投资 56 亿元,在去年 2 月仅花费 168 天就迅速宣布建筑物结顶,刷新了临港建设的新纪录 商汤科技人工智能计算中心(AIDC)是由商汤科技打造的一个开放、大规模、低碳、节能的先进计算基础设施,该项目于 2020 年 7 月开工建设。 目前国内已知最大的人工智能的算力中心是鹏城实验室的「鹏城云脑 II」,输出 1000 Petaflops 算力。商汤 AIDC 的算力,每天可处理时长 23600 年的视频。 2019 年,商汤在上海的超大规模智能计算中心计划提上了日程,2020 年 3 月份公司和临港签约,7 月开工,去年通过验收。 AIDC 启动运营后,将进一步扩展商汤的 AI 超算规模,使商汤的总算力超过每秒 4910 Petaflops。 在短时间内建设如此大规模的 AI 计算中心,在国内范围内尚属首例。
本篇为“揭秘AI智算中心网络流量“系列的第二篇,前篇请参阅:一文揭秘AI智算中心网络流量 – 大模型训练篇 。有关数据存储流量的分析将于下篇呈现,敬请关注。 另一方面,在实际生产部署中的AI推理业务往往会与前端的业务/应用网络形成紧密配合,经由现有数据中心和云网络基础设施对外提供服务。 这便要求基础设施具备相当的开放性——网络不但要连接底层的异构算力(GPU、CPU、NPU)系统,还需要实现与上层管理系统的对接集成,例如与基于K8s的算力调度平台、已有的云管平台等等。 在已被用户场景充分验证的数据中心开放云网能力之上(BGP、VXLAN、Calico容器路由、RoCE、NVMe-oF等),星融元推出的 星智AI 网络解决方案基于通用、解耦、高性能的以太网硬件和开放的SONiC 软件框架,为AI智算中心提供10G-800G速率的以太网交换机,灵活支持单一速率或混合速率交换机组网,在保持极致性能的同时可编程、可升级,帮助客户构建高性能的AI智算中心网络,提供用于AI训练、推理、分布式存储
---- 新智元报道 编辑:好困 【新智元导读】11月17日,浙江省青田县人民政府与浪潮信息、谷梵科技签署战略合作协议,三方共建国内首个元宇宙智算中心,建成后每秒算力性能将超过10亿亿次, 元宇宙智算中心作为数实融合的重要基础设施,通过领先的「算力基础设施+全栈元宇宙」解决方案,为元宇宙的构建和运转提供核心源动力。 青田元宇宙智算中心设计采用全球领先的智算架构,部署业界领先的元宇宙服务器MetaEngine,助力用户更高效地创建数字资产。 青田元宇宙智算中心将建设成为国内首个算力、算法、开发平台一体化的新型元宇宙基础设施,通过协同创建、高精仿真、实时渲染、智能交互四大作业环节,面向企业管理、工业、交通运输、金融、城市等多产业的元宇宙场景提供高效的算力支撑 未来,青田元宇宙智算中心将为青田县乃至浙江、长三角地区的元宇宙产业提供基础设施支撑,推动数字人、数字孪生、数字经济、数字政府、数字社会等领域的发展,加快推进数实融合产业进程。
当前,很多城市不约而同地将目光瞄向智算中心。 得益于数字经济的蓬勃发展,以智算中心为代表的新型基础设施正在迅速兴起。 事实上,国内已经有超过20多个城市启动或完成智算中心的建设。那么,如何真正规划和建设好一个智算中心?有中国云都之称的宿州,带来了它的答案:淮海智算中心。 可以说,淮海智算中心,绝不仅仅意味着数据中心的建设,更是承载着宿州这座城市产业发展、转型升级目标的梦想,堪称智算中心从规划到建设的标杆。那么,为什么淮海智算中心能够成为标杆样板? 透过淮海智算中心,我们能够看到智算中心建设有哪些重要趋势? 区别于传统的数据中心、超算中心,智算中心之所以称之为新型基础设施的代表,在于它正在推动算力从计算走向智算。 正如浪潮信息总裁彭震所言:“随着人工智能的发展,智算中心会成为主流的算力基础设施。
在东数西算、新基建等一系列国家政策的支持下,国内掀起了智算中心建设潮。 其定位于东数西算战略与人工智能领域的首次碰撞,也是智算中心践行“双碳” 目标和国家总体算力布局的“行动手册”。 本报告分析东数西算战略下数据中心特别是智算中心发展面临的挑战与机遇,分析智算中心行业发展趋势,从产业上、中、下游分别提出解决思路与实现路径,并从能源供给、算力自主可控和智算服务三个代表性行业角度提出了推动绿色智算中心产业发展的专项建议 燧原科技作为本次报告的参编单位及发起单位之一,与 “国家级智库” 国家信息中心及相关参编单位深度合作,基于燧原科技在人工智能算力及智算中心建设的项目实践与长期技术研究,重点围绕智算中心政策、产业、技术趋势 (包括各地的智慧城市以及智能算力中心),以多款云燧 AI 加速产品,满足客户的各类需求,并实践出一条建设自主可控、绿色低碳智算中心的最佳路径。
允中 发自 凹非寺 量子位 | 公众号 QbitAI 国内首个元宇宙智算中心,来了! 浙江省青田县人民政府与浪潮信息、谷梵科技官宣:将三方共建元宇宙智算中心—— 每秒算力性能将超过10亿亿次,涵盖元宇宙协同创建、高精仿真、实时渲染、智能交互全流程的元宇宙数字资产创建平台。 元宇宙智算中心作为数实融合的重要基础设施,通过领先的“算力基础设施+全栈元宇宙”解决方案,为元宇宙的构建和运转提供核心源动力。 青田元宇宙智算中心设计采用全球领先的智算架构,部署业界领先的元宇宙服务器MetaEngine,助力用户更高效地创建数字资产。 青田元宇宙智算中心将建设成为国内首个算力、算法、开发平台一体化的新型元宇宙基础设施,通过协同创建、高精仿真、实时渲染、智能交互四大作业环节,面向企业管理、工业、交通运输、金融、城市等多产业的元宇宙场景提供高效的算力支撑
本篇为“揭秘AI智算中心网络流量“系列的第三篇,前篇请参阅:一文揭秘AI智算中心网络流量-大模型训练篇一文揭秘AI智算中心网络流量-AI推理篇01、生成式AI对数据存储有哪些需求? 数据挖掘:需要从多个来源收集非结构化的数据,一般与混合云集成,用数据湖作为存储平台;数据准备:进行数据汇总、标准化和版本控制,关注存储的效率和灵活的数据管理能力,多采用统一存储平台;模型训练和微调:在智算中心内部 02、智算中心的存储网络我们大致可将AI智算中心内部的数据存储系统进行简单的层次分类,主要包括GPU内存、存储网和存储设备。一般来说,在存储层次结构中位置越高,其存储性能(尤其是延迟)就越快。 因为本文的定位在分析网络流量,我们将聚焦于存储网络(data fabric)层次,即智算中心内部GPU服务器内存与远端存储服务器之间传输的数据。 CX664P-N 是一款专为智算/超算中心设计的超低时延RoCE交换机,凭借以下特性在存储场景中脱颖而出。
AI模型的规模巨大并持续快速增长,不仅将带来数据中心流量的指数型增长,独特的流量特征也将为数据中心网络带来崭新的需求。 并行训练:AI智算中心的主要流量来源 当前广泛应用于AI训练并行计算模式主要有以下三类: 并行计算模式 详情 数据并行 将不同的样本数据分配给不同的GPU,以加快训练速度;用在主机之间 张量并行 将模型的参数矩阵划分为子矩阵 前向过程总网络流量(PB) 前向过程总网络流量 数据并行 1396 PB 1 0 0 FSDP 175 80 175 80 张量并行 26622 160 21840 160*156*10^9 流水线并行 17.9 7 17.9 7 3D并行技术下的网络流量 数据并行、张量并行和流水线并行三个技术通常会组合起来使用,可进一步提高训练大模型时的效率和可扩展性。 AI训练对智算中心网络的要求 通过以上分析和计算,我们可以得出一个典型的AI智算中心对计算网的核心需求。 超高带宽:一个epoch就会产生85EB的数据量,相当于整个互联网2.5天的流量。
01 什么是智算中心? 浪潮认为,未来人工智能计算需求占比将在80%以上,专门面向AI计算的计算中心呼之欲出,这就是“智算中心”,即AI算力中心。 ? 智算中心,有望化解AI计算需求爆发与传统算力不足的矛盾。 王恩东认为“智算中心”需要满足三个基本要求:“开放标准”、“集约高效”、“普适普惠”,他的原话是这样说的: 从硬件到软件、从芯片到架构、从建设模式到应用服务,智算中心都应该是标准化、开放的,开放计算的发展为智算中心提供坚实的产业基础 04 智算中心怎么建? 最早的数据中心由运营商主导建设,IDC数据中心由IDC巨头建设,云数据中心由云计算巨头建设,智算中心建设的主导者会是谁?答案可能是:没有明确的主导者。 但不可否认的是,作为智慧计算和开放计算的先行者、智算中心提出者的浪潮,在智算中心建设中依然会发挥不可替代的作用。 首先,浪潮具有全栈AI计算能力,有能力成为智算中心核心建设者。
根据统计,我国已有超过30个城市正在建设或提出建设智算中心,同时也有不少科技企业正在与地方协同,深度参与到这个进程中,比如浪潮信息的淮海智算中心、商汤的上海智算中心、阿里的张北超级智算中心等等,就在为当地的人工智能产业提供着强效的算力服务 四是智算中心的认知和规范化建设有待加强 智算中心并非是今天的产物,在过去的几年内就已经有部分城市开始建设并投入运营。 而这些智算中心在赋能人工智能产业发展的同时,也正在暴露出一些问题,亟待市场和地方对智算中心的建设进行重新审视与梳理。 02 智算中心如何走好 创新发展之路 创新与突破是人工智能产业发展必不可少的一个基础路径,对于智算中心的建设而言,也同样如此。 当智算中心沿着“四化”技术路线进行迭代发展的过程中,实际上也意味着智算中心本身还存在着些许问题,亟待解决。
智算中心引共鸣,浪潮要做新基建的长期主义者 今年初,浪潮在IPF 2020大会上首次提出“智算中心”概念。 1 智算中心代表基础设施建设的方向 什么是“智算中心”? 从用户自身的角度思考,可能会发出一些疑问,例如:智算中心与过去的数据中心、HPC集群到底有何不同之处?智算中心是否有一定的衡量标准,是不是AI服务器多一些就可以叫智算中心? 事实上,发改委在今年披露,将实施全国一体化大数据中心建设重大工程,在全国布局10个左右区域级数据中心和智算中心,“智算中心”集约化已成为大势所趋。 刘军透露,山东中国算谷、西安新区人工智能算力平台、智算中南等项目都是“智算中心”落地的代表,并且“智算中心”在金融、交通、汽车自动驾驶等行业也有交叉落地。
比如下面的新闻: 2月18日,一个新的数据舱在海南陵水近海海域被放入海底,与正在运营的全球首个商用海底数据中心相链接,标志着海南海底智算中心集群正式启用 一个长18米、直径3.6米的白色“巨罐”——海南海底智算中心数据舱 “海底智算中心数据舱与正在运营的海底数据中心相链接,构建成海南海底智算中心集群。数据舱里可放置超400台高性能服务器,通过附近地面上的岸站与客户数据端连通,搭建起数据传输的桥梁。 按照这个标准,海南海底智算中心属于中等规模,按照规划,以1MW外电配给为参考,海底智算中心按照高功率密度设计,单舱可提供1400Pflops(FP16精度,1PFlops等于1000万亿次计算)算力,算力效率提升 同时,海底智算中心全年使用海水作为自然冷源,海底智算中心常年实际运营PUE(能源利用效率)小于1.1。 这确实是一次大胆的尝试,小步快走。 ddtab=true 全球领先的海底智算平台在海南发布 https://www.cnfin.com/hg-lb/detail/20240416/4036891_1.html 海南海底智算中心集群启用——
在6月29日举行的中国算力大会新闻发布会上,工业和信息化部副部长张云明透露,截至2021年底,我国在用数据中心机架总规模超过520万标准机架,在用数据中心服务器规模1900万台,算力规模排名全球第二。 “计算力不仅是生产力,还是创造力,计算正向智算跨越。” 浪潮信息总裁彭震认为,计算力和算法是智算中心的核心,要想产生一流的智慧,就必须要有一流的算法,同时算法的高效运转要依赖领先的计算力,计算力基建化和算法基建化相辅相成。 算力总规模超过140每秒浮点运算次数,近5年年均增速超过30%,算力规模排名全球第二。全国在用超大型、大型数据中心超过450个,智算中心超过20个。 去年,我国算力相关政策密集发布:5月份,国家发展改革委、工信部等四部门联合印发《全国一体化大数据中心协同创新体系算力枢纽实施方案》,加强顶层设计,推动算力、数据、应用资源集约化和服务化创新;7月份,工信部发布
前文介绍了智算与云网融合的关系,那么智算与算力网络、算网融合的关系又是什么?让我们先来复习一下智算的概念。 而这种能力向边缘的扩展和延伸需要与网络结合,催生了算力网络。算力网络是以算为中心、网为根基,提供一体化服务的新型信息基础设施,可以理解为计算设施和网络设施共同建设的一张传输网络。 三者的关系是什么通过上文对智算概念的描述,我们可以将智算翻译为“数据+算力+算法”,如图4所示。智算涉及丰富的计算场景,需要用到大模型计算,处理海量数据。基于智算的这种特性,算力需求激增。 云数据中心无法承载如此巨大的数据和算力,那么传统的云计算方式就无法满足海量数据的处理要求。 算力网络和算网融合为智算提供了强大的技术支撑,而智算的发展推动了算网融合和算力网络的进步,他们三者是相互促进的关系。智算时代如何打造算力网络在智算时代下,如何打造算力网络,做到算网融合呢?
《智算中心光电协同交换网络全栈技术白皮书》(2025 年 8 月,由湖南大学、中国联通研究院等多单位联合编写)指出,在 AI 大模型参数量指数级增长推动智算需求爆发的背景下,传统纯电交换网络因在端口密度 支撑与时间:编写于 2025 年 8 月,得到国家自然科学基金项目(编号:U24B20150)支持,旨在为智算中心网络领域提供系统参考框架。 2025 年 7 月:《人工智能全球治理行动计划》提出 “加快新一代网络、智能算力等基础设施建设”,推动统一算力标准体系。 高速光模块能耗散热问题 尽管光交换技术具有高带宽、低延迟、可扩展等一系列优点,但在智算中心中应用全光交换面临诸多的现实挑战。 现阶段使用光电协同方案组建智算中心网络,以结合光域的高速传输和电域的灵活控制,是更为实际的方案。
超大型智算中心是拥有几千上万张、甚至十万张加速卡,总算力可达几百PFLOPS~EFLOPS级别的智算中心。 中国已有多个由超大型智算中心,比如: ²上海商汤临港人工智能计算中心可提供14 EFLOPS算力,加上其它全国各地可统一调度数据节点,共有5.4万GPU、可提供20 EFLOPS算力。 ²中国移动智算中心(呼和浩特)部署约2万张AI加速卡,可提供6.7EFLOPS 算力。 ²中国电信智算中心(南京)已建成算力规模2EFlops,2025年底算力规模可达5EFlops ²中国联通长三角(芜湖)智算中心总规划算力为3EFLOPS算力。 这也是为什么国内国外科技巨头、运营商都在建超大型智算中心的动力所在。 超大型智算中心平时都在做什么呢?