搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial 的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。 以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第二部分的翻译。 但问题是,这给专用集成电路带来了沉重负担,因为它是一个进行大量数据运算的芯片,需要用非常先进的nm级 CMOS 技术来实现,而现在却要求这个芯片还要容纳一堆带宽高达数十GHz的放大器,可这些技术原本不是用来做这个的 最后一种情况,就是利用硅光子的光电集成例如GF的 45 nm CMOS 加硅光子学技术就是一个例子。
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial 的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。 以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景、机遇与挑战以及光/电/封装的协同优化。以下为第三部分的翻译。 如果在这里利用小芯片范式,有两个小芯片被封装在一起,间隔1mm甚至更小,通过先进的封装技术实现非常密集的布线,就能实现5 Tbps/mm甚至更高的数据传输速率。 但共封装光学器件存在的问题是,通常光纤是每毫米布置 4 根左右,如果要跟上这种进出专用集成电路能达到的5Tbps/mm的带宽密度,那每根光纤就得每秒传输 1 Tbps的数据才能跟得上。
前段时间,关于TSMC和Nvidia、Broadcom合作开发硅光技术的新闻引起了大家的广泛关注。巨头们的强强联合,必定会对硅光产业带来深远的影响。 Broadcom是目前仅有的几家发布CPO产品的公司,这篇笔记主要介绍下其CPO技术上的进展与细节。 Broadcom的硅光CPO产品如下图所示。 相比于可插拔光模块15-20pJ/bit的功耗,CPO系统的功耗降低到5-10pJ/bit,功耗降低了50%多。 (图片来自文献1) 以上是对Broadcom硅光CPO技术的简单介绍,主要有三个特色:1)采用在EIC上TSV last的方案进行3D封装方案;2)通过双透镜阵列实现可插拔光学连接器;3)采用外置可插拔光源模块的方案 一方面我们看到了Broadcom的技术方案,可以借鉴参考,更重要的是他们为何没有选择其它方案,这背后的考虑。
搬运一个Alphawave Semi公司首席技术官Tony Chan Carusone在2023年的关于CPO的报告,这家公司本身是做高速Serdes和Chiplet的,这个报告也类似于Tutorial 的性质,不过介绍得蛮清楚的,把CPO的发展和演进及未来挑战都做了客观的呈现。 以下是直接将演讲者的发言原文直接翻译,分成四个部分,分别介绍背景,CPO的应用场景,机遇与挑战以及光/电/封装的协同优化。以下为第一部分的翻译。 CPO这个领域非常火热,目前有大量的研发工作正在进行,备受重视,也令人振奋,这是理所当然的,因为它是一项令人激动的技术。 另外一个推动因素是无线网络的持续铺设,比如 5G 网络的推出,这意味着用户数量持续增加,向这些用户提供的带宽也在增加,这促使特定应用的计算设施更靠近数据端点进行部署。
一、引言 在日本信息通信技术研究所(NICT)主导的B5G Brighten国家项目框架下,日本古河电气(Furukawa Electric)的Hideyuki Nasu团队针对AI机器学习互连场景 该项目始于2021年,于2025年3月结题,核心目标是通过共封装光学(CPO)技术降低数据中心链路功耗。 二、项目背景与研究方向 NICT B5G Brighten项目聚焦两大研究方向: 1. 创新硬件技术 开发超紧凑VCSEL收发器、CPO板及交换机服务器原型,目标是将链路功耗从传统可插拔光模块的20pJ/bit降至7.3pJ/bit(CPO方案)。 2. 六、结论 古河电工在NICT B5G Brighten项目中,通过超紧凑VCSEL收发器技术创新,在25-56Gbaud速率范围内实现了低至4.5pJ/bit的链路能量,验证了CPO技术在AI
前面根据ECTC 2023的会议文章,介绍了Broadcom的CPO技术(Broadcom的CPO进展)。 但文中的CPO产品并不是Broadcom最新一代CPO,最近凑巧在Linkin上划水时看到了一张图片,涉及到了博通最新一代51.2T CPO产品的一些技术细节,这里和大家分享一下。 FOWLP技术原本是为了解决随着芯片面积的减小和I/O接口数的增多,导致芯片内无法提供足够多空间放置I/O接口的难题。 借助FOWLP技术,在molding中制作VIA,同时给EIC和PIC供电。在FOWLP流程中,需要对edge coupler区域做特殊保护。 厂商合作,从而得到CPO生态系统的支持。
电学链路损耗 根据Broadcom的分析,单波100G时,LPO的电学链路损耗约为15dB, CPO场景仅有5dB, 单波200G时,LPO的链路损耗约为21dB, CPO约为8dB。 而当电学损耗增加到31dB时,CTLE需要增加到5.6dB,此时硅光方案的BER在1e-5水平,而TFLN方案的BER仍可控制下1e-6以下。 比较有趣的是,Andy大佬在OCP 2018年邀请报告里提及了CPO技术,当时还是比较认可CPO技术路线的,但是需要较长时间的持续投入,"This is a multi-year project, let 而对于CPO技术,风浪大,收益也大,需要克服多个领域的工程难题,make it ready for deployment。 AI互联场景下对带宽密度、功耗、延迟等要求都非常高,可能CPO是唯一的技术选择,迎难而上是更好的选择。LPO与CPO是相互竞争,还是长期共存,应用在各自所擅长的场景?
传统电互连与板级光模块已难以满足这一诉求,而共封装光学(CPO)技术通过将光电转换器与CPU、GPU等处理单元(xPUs)近距离集成,缩短电互连路径,实现了功耗降低与带宽密度提升,成为行业关注的焦点。 2023年,光互联论坛(OIF)发布实施协议(IA),明确了CPO模块的结构与传输条件,为技术标准化与产业化奠定基础。 5. 六、结论 SIEOM技术的研发成功,突破了传统倒装芯片键合仅适用于电连接的局限,实现了CPO模块中光电转换器与聚合物波导的同步电光互连。 实验证实,SIEOM技术可将面内对准精度控制在±5 μm以内,光电耦合损耗低至0.3 dB,满足32 Gbps NRZ传输的性能要求,为CPO模块的标准化量产提供了高效、可靠的技术方案。
Hou博士,于2025年8月在中国台湾台北举办的OCP APAC会议上发表的Keynote报告,聚焦异构芯片集成与先进共封装光学(CPO)技术,旨在为HPC(高性能计算)/AI领域提供性能与能效突破方案 报告首先介绍两大核心技术平台:一是CoWoS®,作为通用型2.5D封装技术,按中介层尺寸分为CoWoS-S/L/R等版本,可实现逻辑芯片与多颗HBM(高带宽内存)的高效集成,是HPC/AI加速器的关键异构集成支撑 ;二是COUPE,基于台积电SoIC®堆叠技术的紧凑型通用光子引擎,通过将EIC(电集成电路)与PIC(光子集成电路)堆叠,具备小尺寸、高功率效率优势,晶圆级测量显示其净插入损耗(IL)为0,1D光栅耦合器 报告核心围绕二者集成的CPO封装展开,指出该方案相较传统铜布线(Cu Wire)、可插拔式光引擎(OE),功耗未来可降至>2pJ/bit(传统可插拔方案>10pJ/bit),延迟仅为传统方案的<0.05X 报告最后总结,CoWoS®与COUPE的集成将推动HPC/AI组件进入功耗与性能新纪元,同时强调需通过供应链创新与合作,满足下一代硅光子CPO的高带宽要求。
RANOVUS的ODIN® CPO技术将功耗降至传统方案的1/3(3MW),尺寸与成本压缩至1/10,预计2027年开始,CPO使能大规模AI集群的计算+存储+光互连将会到来。 三、CPO技术图谱:从芯片设计到生态落地的多维竞争 1. 技术路线分化:XPU-CPO vs Switch-CPO - XPU-CPO:聚焦算力单元集成,如RANOVUS 2024年推出的ODIN® ASOE系列,内置激光源版本功耗低至4pJ/bit,外置版本则为 5 pJ/bit。 RANOVUS作为少数覆盖全AI计算细分领域(商用、定制、晶圆级)的CPO厂商,其技术路线被视为行业标杆之一。
本文基于NTT Innovative Devices的Wataru Ishida在2025年OCP APAC会议上的技术分享,系统梳理了CPO的技术背景、核心挑战、关键特性及未来前景。 这一特性对CPO的散热设计提出了严苛要求——如何将激光器与热源隔离,成为技术突破的关键。 五、Retimers、LPO与CPO:技术路径的对比 在高速互联技术演进中,Retimers、LPO(Linear Pluggable Optics)与CPO代表了不同的技术选择,各有其局限性与优势 OCP educational webinar的调查显示了行业对CPO部署时间的预期: - 2-5年内:49% - 2年内:39% - 已就绪:8% - 未来十年(或永不):5% 对于行业而言,当下的核心任务是凝聚共识,推动标准化与实用化技术的突破,让CPO从“潜力技术”真正转化为“生产力工具”。
会议发表了一篇题目为High Density Multiple Series Optical Connector for Glass Waveguide Substrate 的文章,介绍了一款面向玻璃基板CPO ◆ CPO技术背景下的光互连需求 共封装光学(CPO)技术通过将光收发器与交换ASIC集成于同一基板,实现下一代数据中心低功耗高容量的交换功能。 实际应用中,光子集成电路(PIC)与光纤的连接需满足三大要求: - 可拆卸性:避免封装过程中光纤处理的复杂性,需移除光纤侧连接器端子 - 回流兼容性:CPO基板的回流焊工艺要求连接器耐260℃高温 - 高密度集成:玻璃基板因低介电常数(高频传输优势)、低翘曲(<5μm)及低热膨胀系数(2.8ppm/℃),成为CPO优选基板之一,需适配其边缘的多通道光连接。 ◆ 结论 Furukawa研发的超小型可分离光连接器可实现玻璃基板上的多通道高密度连接,具备低插入损耗、高稳定性和耐久性,适用于CPO技术需求。
需要说明的是,这些子组件是可拆卸的,因此严格来说,纯粹主义者可能认为这在技术上属于“近封装光学(NPO)”,而非严格意义上的“共封装光学(CPO)”——不过,SA认为可拆卸光引擎带来的额外信号损耗,不会对性能产生显著影响 TH5-Bailly:第二代CPO系统产品亮点 第一代到第二代的另一大显著转变,是从硅通孔(TSV)工艺转向扇出晶圆级封装(FOWLP):在该设计中,EIC利用模内过孔(TMV)将信号路由至 尽管博通在CPO领域拥有最多经验,但这种技术方案的转变意味着,博通必须在某些技术方面重新开始——问题在于,台积电能为博通的设计提供多少支持,以降低设计难度。 插入损耗与复用需求:锗硅EAM的插入损耗约4-5 dB,与MRM和MZM(3-5 dB)相当;但MRM可直接复用不同波长,而EAM需单独的复用器实现CWDM或DWDM,这会略微增加损耗预算。 Marvell在交易摘要中宣布,预计到2028年1月底(Marvell 2028财年末,即F1/28),Celestial AI的营收年化率将达到5亿美元;在巴克莱全球技术大会上,Marvell进一步表示
虽然大会前期已经有很多小道消息,但是看到最终的产品与技术方案,小豆芽还是受到了很大的震撼。这篇笔记主要分析下一些技术细节,方便大家参考。如果有不准确的地方,希望大家不吝指出! 交换机内部涉及到的技术细节,如下图所示,包括EIC、PIC、3D封装、光耦合、可插拔光连接器、光学模组、外置激光器模块、激光器芯片封装、interposer等。 以下是对于基于MRM的单个光引擎,Nvidia与这三家公司MRM方案的技术指标对比,能效上Nvidia还有进一步优化的空间。 对于CPO交换机和微环调制器,这两项技术都不是最新的idea, 但它们的组合带来的能效提升,大大降低了AI集群中在网络连接上的功耗与成本。这也是Nvidia大力推动该技术落地的初衷。 CPO不仅仅是光电芯片设计,涉及到先进封装、激光器、光封装、结构设计、散热等多个技术难点,Nvidia利用其一流的供应链,整合了多方技术力量,最终实现了基于MRM的CPO交换机量产,开启了CPO时代!!
核心封装光学(CPO)工作组(ColorChip 公司 Bryan Hall主导):针对CPO技术落地挑战,推动生态系统驱动的标准化,减少封装方案差异化。 4. 四、先进封装技术:IBM的CPO创新与挑战 (一)3D封装技术架构与高密度集成实践 IBM凭借其在半导体先进封装领域的深厚积累,构建了覆盖“研发-制造-测试”的全流程技术体系: 在光纤阵列安装环节,通过激光焊接技术将单模块封装时间缩短至5分钟以内,较人工操作效率提升80%。 (三)测试技术瓶颈与标准化探索 - 多阶段测试体系: 1. 支持光功率、消光比等20+参数同步测试,单次全检时间<5分钟。 随着CPO、多芯光纤等技术的成熟,光子集成有望成为数据中心物理层的核心基础设施,为人工智能的持续突破提供底层支撑。
◆ OFC 2026前夕:Lightmatter四大核心技术与产业动作集中发布 在OFC 2026开幕前,Lightmatter于2026年3月11日-12日密集发布四项重磅公告,覆盖CPO ④ 联合高通实现1.6Tbps单光纤带宽纪录,8倍领先行业现有方案 2026年3月11日,Lightmatter联合高通技术公司宣布,其Passage CPO芯粒成功实现单光纤1.6Tbps ◆ OFC 2026技术论文深度解析 本届OFC上,Lightmatter将发布两篇核心技术论文,均聚焦于硅光CPO链路的核心性能突破,分别针对链路余量提升与单光纤带宽密度两大行业痛点,完成了业界首创的实验验证与性能测试 ▲ 研究背景与核心目标 O波段IMDD硅光CPO已成为数据中心与高性能计算的核心技术,基于微环调制器(MRM)的DWDM光引擎凭借紧凑的尺寸与高能效,广泛应用于中等波特率的NRZ信号传输。 本次分享将聚焦AI算力向百亿亿次及以上发展的过程中,光子技术作为核心使能者带来的底层变革,分析从PIC、AI算力Pod到AI工厂全链路的数据传输挑战,探讨硅光技术、线性光学与CPO、光交换(OCS)等先进光互连技术的最新突破
在没有 DMA 技术前,I/O 的过程是这样的: 1、CPU 发出对应的指令给磁盘控制器,然后返回; 2、磁盘控制器收到指令后,于是就开始准备数据,会把数据放入到磁盘控制器的内部缓冲区中,然后产生一个中断 DMA 技术: DMA 技术,也就是直接内存访问(Direct Memory Access) 技术。 DMA 技术:在进行 I/O 设备和内存的数据传输的时候,数据搬运的工作全部交给 DMA 控制器, 而 CPU 不再参与任何与数据搬运相关的事情,这样 CPU 就可以去处理别的事务。 进一步将 I/O 请求发送给磁盘; 4、磁盘收到 DMA 的 I/O 请求,把数据从磁盘读取到磁盘控制器的缓冲区中,当磁盘控制器的缓冲区被读满后, 向 DMA 发起中断信号,告知自己缓冲区已满; 5、
CPO交换机。 博通采用的是TWMZM方案,没有像Nvidia那样直接采用MRM方案(Nvidia与Broadcom CPO方案的对比,可以参看CPO时代来临——Nvidia公司CPO交换机的一点分析)。 (图片来自文献1) 对于TH5-Baily CPO交换机,博通展示了非常细节的功耗对比,如下表所示。 比较有趣的是,在ECOC 2023大会上,Broadcom的报告题目为"Will you need CPO in 5 years", 2024年则变成"Will you need CPO in 3 years 不知道今年的标题会不会变成"We need CPO now! "。看起来,随着Nvidia、Broadcom这些巨头们在CPO交换机的布局与推进,CPO交换机的到来与应用已经是必然趋势。
Meta测试的CPO为51.2T的TH5 Baily ,并且使用了不同厂商家的FR4可插拔模块在相同的实验环境下进行了A/B对比实验。 512个通道的BER均小于5e-8。 可靠性测试主要包含5大项,包括激光器芯片、可插拔激光器模块、PIC芯片、光连接器和电互联的可靠性。 这一系列可靠性数据的收集,是CPO技术发展历程中的重要里程碑,充分证明了CPO方案在数据中心/智算中心部署的可行性,回答了产业界对其reliability的质疑。 Pancholy, "Will you need CPO in 5 years, 3 years, or do you need it Now?", ECOC 2025 2. S.
由于Nvidia CPO交换机的重磅发布,#CPO 技术受到了业界广泛的关注。 可插拔光学连接器 可插拔光学连接器(detachable optical connector)的开发,是CPO可测试性的必要条件,因此每家公司都花费了较多的资源开发这一技术。 以上是对CPO可制造性这一workshop讨论的简单整理。CPO作为硅光技术的最为耀眼的一颗明珠,在大量部署应用前,需要攻克多个技术难题。 CPO的可测试性、可靠性、可插拔光学连接器与大批量组装方案,是大家比较关注的方向。虽然每家公司的技术路线目前并不完全一致(未来是否会形成统一标准?),但是涉及到的问题是共性的。 而为了提高良率与降低成本,采用便于大批量生产组装的方案,采用晶圆级的先进封装技术。