当AI数据中心的GPU数量从几千块增长到几十万甚至上百万块,最大的瓶颈反而不是算力,而是通信效率。这么多GPU要协同工作,数据需要以极高的速度在它们之间传输。这就像一个超级大厨,再厉害也忙不过来,需要一百个厨师一起做菜。那中间怎么协调、怎么传递食材和指令,就成了最大的问题。AI数据中心也是一样,GPU再多,数据传不过去也是白搭。
传统的铜缆在224Gbps的速率下已经接近物理极限。信号衰减得太厉害,功耗也高得难以接受。这就像用一根水管给摩天大楼供水,水压到顶楼就没了。所以AI数据中心正在经历一场光进铜褪的变革。光信号比电信号有一个根本性的优势,就是光在光纤里传播几乎没有损耗,而且不受电磁干扰。一束光可以跑几十公里都不需要中继,而电信号在同轴电缆里几百米就衰减得不成样子了。这就是为什么光通信成为AI数据中心内部互联的必然选择。从短期看是光模块替代铜缆,从长期看是整个数据中心从电互联走向光互联。
这个领域中国企业的表现非常亮眼。全球光模块前十强中,中国企业占了七家。特别是市场俗称易中天的三家,也就是中际旭创、新易盛和天孚通信,它们占据了全球800G和1.6T光模块六成以上的市场份额。也就是说全球每卖出三个高速光模块,就有两个来自中国公司。其中中际旭创作为行业龙头,2023年到2024年14个月里股价涨了16倍。为什么涨这么多?因为800G光模块的需求突然爆发,而中际旭创是唯一能大规模量产的供应商,订单多到做不完。这种稀缺性在资本市场上就会被放大。
技术的迭代也远没有停止。800G才刚普及,1.6T已经进入小批量供货,3.2T已经在研发路线上。每一代带宽翻倍,意味着同样的时间内传输的数据量翻倍。这背后的驱动力是什么?是AI模型参数量的持续增长。从GPT-3的一千七百五十亿参数,到GPT-4可能有上万亿参数,模型越大,训练时需要的通信量就越大。下一代技术方向包括CPO,也就是共封装光学,把光引擎和交换芯片封装在一起,进一步降低功耗和延迟。还有NPO和XPO,近封装光学和交叉封装光学,这些都是为了让光模块更靠近核心芯片。更长远看还有全光交换,不用光电转换就能完成信号的交换。这些技术的成熟将推动光模块市场继续高速增长。
还有一个重要的投资逻辑。英伟达去年向Lumentum和Coherent各投了20亿美元,锁定光互联产能,为什么要花这么多钱?因为英伟达非常清楚,网络瓶颈会成为GPU性能的最大拖累。花20亿美元打通光互联,能让几十万块GPU的利用率提高一大截,这笔账非常划算。同时也说明了一个趋势,就是网络设备在整个AI基建中的价值占比在持续提升。从CPO到全光交换,每一步技术的升级,都意味着光模块单价的提升和行业集中度的提高。掌握核心技术的头部光模块公司,将充分受益于量价齐升的确定性趋势。下期我们看看GPU背后那些看不见的关键零部件,PCB、MLCC和先进封装。。
我是云帆,关注我,每天带你进行市场深度分析。