首页
学习
活动
专区
圈层
工具
发布

算力成为全球竞赛,国产网卡已率先突围!

全球AI基建正在疯狂提速,算力竞赛的下半场,哨声已经吹响。

“星际之门计划”20个数据中心落地,欧洲80亿欧元砸向智算云,国内算力规模稳居全球第二——这场竞赛的烈度,已经远超几年前的市场预期。

但有一个问题正在浮出水面:卡堆起来了,网跟得上吗?

业内都知道一个数字:稠密模型的通信耗时占10%~20%,到了MoE架构,这个比例直接飙到40%-60%。这意味着,你投几十亿建一个万卡集群,如果网络效率不行,小一半算力都在空转等数据。

算力竞赛的上半场拼的是单卡性能,下半场拼的是网络效率。这个转折点,已经到了。

所以中科曙光最近发布全自研scaleFabric这件事,值得多说两句。

不是因为它填补了国产原生InfiniBand的空白——虽然确实填补了,而是因为它切中了这轮竞赛的真正赛点:当算力规模堆到一定程度,决定集群价值的,不再是堆了多少卡,而是让算力“跑起来”的那张网。

看数据:800Gb/s单端口带宽,端到端延迟低于1微秒,单子网集群可扩展至11.4万张卡,网络成本较进口IB降低约30%。更关键的是落地——国家超算互联网核心节点,36小时完成3套万卡集群部署,稳定运行超10个月,服务超10000名用户。

这是跑出来的实战结果。

在高速网络领域,一直有两条路线:InfiniBand精准高效但被海外垄断,RoCE依托以太网但需要复杂优化才能接近“无损”。过去国内用户没有选择——要么接受RoCE的性能折中,要么忍受IB的高昂成本和供应限制。

曙光的解法很直接:自己造一条路。历时三年,从112G SerDes IP到上层管理软件,100%全栈自研,既继承IB技术优势,又实现自主可控。三年时间,把“中国算力跑在中国网络上”从愿景变成现实。

回头看这轮全球基建竞赛,其实释放了一个明确信号:AI基础设施的竞争,已经从“有没有算力”进入到“算力好不好用”的阶段。而在这个阶段,网络不再是算力的配角,而是核心变量。

中国信通院已经在联合中科曙光等单位推进智算网络行业标准制定。这意味着,中国团队正在从市场参与者转向规则制定者。

毕竟,算力规模全球第二这个位置,想坐稳靠的不是数字,是能让算力真正跑起来的那张网。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OC8PbvhWkoqkxXaeQSg7EQ0Q0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券