搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial 的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。 以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第二部分的翻译。
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial 的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。 以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第三部分的翻译。
Broadcom是目前仅有的几家发布CPO产品的公司,这篇笔记主要介绍下其CPO技术上的进展与细节。 Broadcom的硅光CPO产品如下图所示。 通过一些机械结构的卡槽设计,光纤阵列可以实现与PIC芯片的无源对准,降低了CPO的封装成本,如下图所示。 (图片来自文献1) 由于CPO中缩小了switch芯片与OE引擎的距离,电学链路损耗大大缩小,在26GHz时,ASIC到Tx端的损耗为2dB,Rx到ASIC的损耗为2.5dB。 相比于可插拔光模块15-20pJ/bit的功耗,CPO系统的功耗降低到5-10pJ/bit,功耗降低了50%多。 Broadcom目前的CPO产品应该还没有使用台积电的硅光平台(TSMC硅光封装平台的最新进展),台积iOIS平台中使用的是在PIC中加工TSV-middle的方案。
该项目始于2021年,于2025年3月结题,核心目标是通过共封装光学(CPO)技术降低数据中心链路功耗。 创新硬件技术 开发超紧凑VCSEL收发器、CPO板及交换机服务器原型,目标是将链路功耗从传统可插拔光模块的20pJ/bit降至7.3pJ/bit(CPO方案)。 2. 五、CPO子板与交换机服务器集成验证 ◆ CPO板设计 单块集成电接口板可容纳8个光学收发器,尺寸10cm×10cm,支持32个收发器垂直光纤布线,适配ASIC芯片,实现高密度光学互连。 ◆ 交换机服务器原型 将CPO板集成至服务器系统,验证其在数据中心交换机中的可行性。实测表明,该方案可显著降低机架内互连的功耗与体积,为AI集群的紧凑化设计提供硬件支撑。 六、结论 古河电工在NICT B5G Brighten项目中,通过超紧凑VCSEL收发器技术创新,在25-56Gbaud速率范围内实现了低至4.5pJ/bit的链路能量,验证了CPO技术在AI
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial 的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。 以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景,机遇与挑战以及光/电/封装的协同优化。以下为第一部分的翻译。 CPO这个领域非常火热,目前有大量的研发工作正在进行,备受重视,也令人振奋,这是理所当然的,因为它是一项令人激动的技术。
前面根据ECTC 2023的会议文章,介绍了Broadcom的CPO技术(Broadcom的CPO进展)。 但文中的CPO产品并不是Broadcom最新一代CPO,最近凑巧在Linkin上划水时看到了一张图片,涉及到了博通最新一代51.2T CPO产品的一些技术细节,这里和大家分享一下。 厂商合作,从而得到CPO生态系统的支持。 (图片来自文献2) 根据官网给出的数据,新一代CPO的功耗为5.5W/800G, 对应能效比为6.8pJ/bit,性能非常优秀,这是整个系统协同设计优化的结果。 下一步,Broadcom会往单波200Gbps速率努力,从而实现102.4T的CPO产品。 参考文献: 1. S.
以下列出LPO与CPO的主要差异点, 1. 采用MRM方案的CPO功耗有望进一步降低。 3. 而CPO的典型单波速率为200Gbps,Broadcom最新CPO里单个光引擎含64通道,总带宽为12.4Tbps,而Nvidia CPO中单个光引擎含8个道通,总带宽为1.6Tbps。 CPO可靠性的要求更高。 AI互联场景下对带宽密度、功耗、延迟等要求都非常高,可能CPO是唯一的技术选择,迎难而上是更好的选择。LPO与CPO是相互竞争,还是长期共存,应用在各自所擅长的场景?
本部分将首先介绍当前及即将上市的CPO产品——从英伟达和博通的产品组合开始,再详细阐述各专注于CPO的公司的解决方案,包括英特尔CPO、联发科(MediaTek)的CPO布局、Ayar Labs )CPO 2025年GTC大会上,英伟达首次推出了用于scale out网络的基于CPO的交换机,共发布三款不同的CPO交换机。 Spectrum 6800 409.6T CPO交换机盒结构 ② 博通(Broadcom)CPO交换机产品组合 博通CPO产品路线图 博通是首批提供真正基于CPO的系统的公司之一,被视为CPO ◆ 专注于CPO的公司 尽管英伟达、博通和美满电子正沿着自己的路径开发专有解决方案,但多家专注于CPO的公司正在探索另一系列方案。 与其他CPO方案相比,该方案实现了铜缆和光学的通用占位面积;随着时间推移,这有望构建一个开放的可插拔CPO生态系统。
Start with why,为什么英伟达需要做CPO交换机? 后续Nvidia是否会推出类似Broadcom的多波长版本CPO交换机?这可能也取决于市场的需求。当前推出的三款CPO交换机均采用的是单波长方案,如下图所示。 Nvidia CPO交换机内部有四颗小的switch芯片,不知道这样设计的原因是为何,可能是出于CPO良率的考虑。两家都开发了可插拔光连接器,便于CPO的维护。 去年OFC, 小豆芽曾写过一篇笔记(OFC2024: CPO时代来临了吗?), 讨论CPO时代是否来临。时隔一年,Nvidia CPO交换机的推出给出了一个肯定的回答。 CPO不仅仅是光电芯片设计,涉及到先进封装、激光器、光封装、结构设计、散热等多个技术难点,Nvidia利用其一流的供应链,整合了多方技术力量,最终实现了基于MRM的CPO交换机量产,开启了CPO时代!!
Broadcom从2021年开始布局CPO,如下图所示,经过4年多的研发,在2024年实现了第二代51.2T CPO交换机Baily的demo, 并相继与腾讯、字节等多家公司展开合作,在其数据中心内部署 CPO交换机。 博通采用的是TWMZM方案,没有像Nvidia那样直接采用MRM方案(Nvidia与Broadcom CPO方案的对比,可以参看CPO时代来临——Nvidia公司CPO交换机的一点分析)。 ,Broadcom为此推出了BiDi CPO方案。 不知道今年的标题会不会变成"We need CPO now! "。看起来,随着Nvidia、Broadcom这些巨头们在CPO交换机的布局与推进,CPO交换机的到来与应用已经是必然趋势。
作为准上市公司 终于有钱做市场宣传了 借着OCP大会Ragile土豪了一把 一连搞了三个NPO/CPO交换机的演讲 Ragile何方神圣? NPO交换机闪亮登场 Ragile这么投入 是因为要干件烧钱的事情 它摊上了NPO&CPO这件大事 25.6T的NPO交换机 最早在去年的OCP已经展示 51.2T的NPO原型 年初刚刚在OFC大会亮相 25.6T的CPO交换机 就是企鹅最近官宣的大事件 腾讯月薪85473,CPO交换机燥起来 CPO看上去很美 但是小手莫动且慢下手 在刚刚召开的ECOC 2022大会 Arista再次强调现在没有 技术大概还需要十年的时间 之前预测中Switches with CPO应该包含光模块 旗帜鲜明说一句 海燕啊,你长点心吧! 昨天是CPU,今天是GPU 你真觉得帝国主义会放过CPO 这么强绑定的技术路线以前也就忍了 但在分道扬镳的今天嫁衣裳会随时收回哦 当然了 争论不影响学习 COBO作为CPO规范领头羊 新推出的交换机白皮书值得一读
在今年的ECOC会议上,Meta发表了其对Broadcom CPO系统的一系列评估测试结果, 从使用方的角度考察评估了CPO交换机的各项性能。 Meta在其数据中心规模化部署CPO交换机,下图中共8个机架,每个机架内放置7台CPO交换机。 作为对比,不同vendor家的FR4*2光模块的功耗在15mW左右,采用CPO后,功耗降低了65%。而与LPO方案相比,CPO方案节省约35%功耗。 这一系列可靠性数据的收集,是CPO技术发展历程中的重要里程碑,充分证明了CPO方案在数据中心/智算中心部署的可行性,回答了产业界对其reliability的质疑。 腾讯、字节、Meta等公司先后与Broadcom合作,进行不同规模的CPO验证测试,接下来谁将成为第一个吃螃蟹之人,在数据中心大规模部署CPO交换机,让我们拭目以待!
由于Nvidia CPO交换机的重磅发布,#CPO 技术受到了业界广泛的关注。 Broadcom的CPO测试包括PIC wafer测试筛选出known-good-die、利用可插拔光连接器进行光引擎的测试和最终的51.2T CPO模组测试。 可测试性是CPO制造过程中需要解决的首要难题。 以上是对CPO可制造性这一workshop讨论的简单整理。CPO作为硅光技术的最为耀眼的一颗明珠,在大量部署应用前,需要攻克多个技术难题。 对于可插拔光学连接器的研发,是CPO实现可测试性不可或缺的一环。为了保障CPO的可靠性,采用外置激光器模块也基本成为共识。
文章来源:https://newsletter.semianalysis.com/p/co-packaged-optics-cpo-book-scaling ◆ CPO光引擎的制造考量与市场化路径 CPO尚未实现与广泛应用相匹配的量产规模。 博通是唯一一家已出货基于CPO的量产系统(Bailly和Humboldt交换机)的厂商,而英伟达如今也加入了这一行列——但这些产品的出货量都非常低。CPO引入了许多新的制造流程和显著的可制造性挑战。 这也是博通为何要将其CPO解决方案转向台积电COUPE的原因——尽管博通已通过日月光(SPIL)开发的扇出晶圆级封装(FOWLP)方案迭代了多代CPO。 光纤耦合(即精确对准光纤与片上波导,以实现光的平稳高效传输)是CPO的关键且具挑战性的步骤,而光纤阵列单元(FAU)在CPO中被广泛用于辅助这一过程。
CPO的驱动力在哪里? CPO的驱动力,其实也就是回答为什么选择CPO这一技术路线。CPO的驱动力主要来自以下三个方面, a) 降低功耗 提及CPO, 大家都会讲到它在降低功耗方面的优势。 Broadcom预估CPO技术会有40%的成本降低。 2. CPO的难点与挑战 虽然CPO技术的优势很明显,但是也存在较多的技术难点与挑战。 各厂家在CPO方向的进展 a) Marvell Marvell展示了其首款CPO样机,带宽为1.6Tbps, 未来将支持其51.2T的交换机芯片。 b) Broadcom Broadcom去年发布了其首款CPO产品,今年报告上展示了一些细节,单个CPO模块支持3.2Tbps,整个系统包含4个CPO模块,共12.8Tbps的带宽,如下图所示。 短期内CPO无法在数据中心大范围部署,CPO未来也会与pluggable光模块共存一段时间。硅光技术在CPO的角色是无可替代的,大部分厂家都是采用微环调制器这一技术,需要控制电路调节微环的工作点。
Nvidia GTC 2025大会,老黄的Keynote报告介绍了基于Nvidia Photonics与众多合作伙伴开发的Spectrum-X和Quantum-X硅光CPO交换机,预计分别于 采用CPO交换机在数据中心内可以节省几十MW的电力,相当于近百个Rubin Ultra机架(单个6MW)的耗电量。 Quantum-X是一款115.2Tb/s的硅光CPO交换机,即144×800G的版本,相比可插拔光模块方案实现了3.5倍的能耗降低,10倍的网络弹性提升以及1.3倍的部署效率提升,包含4个Switch
关于CPO的基础知识,可以参看这篇笔记共封装光学(co-packaged optics)简介。小豆芽这里整理下OFC 2021相关的最新进展。 1. II-VI提出了一个有意思的观点,CPO只是换了一种封装形式的光模块,如下图所示, ? 关于CPO的应用场景,现在大部分报道里都是将光引擎围绕着交换机芯片排布,微软的报告里提到了更多的潜在应用场景,如下图所示。CPO也可以应用到AI计算场景中,发挥其功耗低、带宽大的优势,值得期待。 Broadcom、Intel、Cisco等公司都在积极推动CPO技术的落地, Corning公司提出了用于CPO场景的光连接器。 但不管如何,如何降低数据传输的功耗与成本是大家的最大痛点,这也是CPO技术得到青睐的主要原因。如下图所示,CPO技术有望在2025年附近真正落地,信号速率达到102Tb/s。 ?
今年的OFC大会上,来自Marvell的Matthew Traverso做了题为"Advancement in CPO and Ecosystem"的邀请报告,系统地梳理了芯片大厂在CPO领域的进展。 Ranovus在CPO领域经营多年,主要的技术亮点在采用量子点激光器、微环调制器等。Ranovus最近也与联发科展开CPO相关的合作, 发布了其最新一代的6.4Tbps光引擎。 关于Broadcom CPO的具体细节,可以参看小豆芽先前的笔记,这里不再赘述(Broadcom的CPO进展, Broadcom的CPO进展(续))。 Broadcom与腾讯展开合作,在其数据中心中部署带有CPO的网络交换机。 3. Cisco Cisco在OFC2023展示过其基于CPO的25.6T交换机原型机。 另外,CPO技术也提高了系统的带宽密度。 对CPO技术与商业模式的质疑,也一直存在。
所以这里我们换个角度来讲述,不直接介绍cpo,而是尝试从定制本身说起,结合经典的定制方式,逐步理解cpo出现的原因和它开始被广泛使用的底层逻辑是怎么样的。 (一)cpo与concept 当然,有了对泛型良好支持的CPO机制,我们很多地方还需要对CPO所能接受的参数类型进行约束。 如下图所示,ranges中就定义了大量辅助性的concept: (二)ranges cpo实现范例-微软版 我们以ranges::begin这个cpo为例来看一下ranges库大概是以哪种方式来完成cpo (三)ranges cpo小结 泛型的cpo+表达各种约束的concept,一扬一抑,使得这种表达能够很好的用于库代码的组织和实现。 四、tag invoke-更好的cpo使用方式 考虑一个问题,如果库的规模扩大化,相关的cpo实现比ranges多比较多,或者就拿ranges来说,cpo多了之后,层层的Wrapper明显会给开发者带来不小的负担
一、技术本质:CPO的定位与价值边界CPO(Co-Packaged Optics)的核心创新在于光电转换单元与ASIC/GPU等主芯片的一体化封装集成,其诞生直指传统可插拔光模块的物理瓶颈:电互连损耗瓶颈 空间与集成度限制:ASIC芯片周边面积无法容纳传统光模块,CPO通过特制小型化光引擎(CPO Transceiver Module)与主芯片紧邻封装,将电互连距离缩短至毫米级,显著降低功耗与延迟。 需明确概念区分:CPO系统:指光电共封装后的完整计算单元。CPO光模块:专为CPO系统设计的高集成度光收发组件,需适配硅光集成、3D封装等工艺。 可靠性验证:CPO系统需通过高温老化、振动冲击等严苛测试,确保10万小时无故障运行。Meta数据显示光模块故障可导致AI集群效率骤降40%,而CPO的不可插拔特性增加维护难度。 五、产业格局:中国厂商的差异化路径2025年全球CPO市场呈现“双轨竞争”态势:路径一:全栈自研技术驱动通过自主研发硅光芯片(支持50G通道后向兼容),实现核心交换设备CPO端口密度显著提升。