首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >400Gbps/lane数据中心光互连:低维相干vs IM-DD

400Gbps/lane数据中心光互连:低维相干vs IM-DD

作者头像
光芯
发布2026-01-26 17:02:55
发布2026-01-26 17:02:55
2830
举报
文章被收录于专栏:光芯前沿光芯前沿

随着大型语言模型(LLM)驱动的机器学习应用爆发式增长,数据中心内与DCI的带宽需求呈现指数级攀升。传统基于强度调制直接检测(IM-DD)的光通信技术在支撑200Gbps/ lane以上速率时面临诸多瓶颈,而优化后的相干技术(尤其是低维相干方案)正成为突破挑战的关键方向。来自谷歌的研究团队近期在JLT期刊发表邀稿论文,系统梳理了下一代数据中心与园区光通信技术的演进脉络,深入解析IM-DD技术的局限与改进路径,阐述相干技术的核心优势与应用障碍,并重点介绍新型低维相干技术的创新突破,为超高速光互连技术选择提供参考。

(链接:https://ieeexplore.ieee.org/document/11354510)

一、引言:带宽爆炸式增长下的光通信需求变革

过去二十年,数据中心集群与园区网络一直是大规模计算发展的核心支撑,主流云服务与机器学习应用均运行在超大规模数据中心基础设施中,其核心诉求是在海量计算与存储服务器间实现低时延、高带宽互联。数据中心网络普遍采用三层交换架构(架顶式ToR交换机、汇聚交换机、核心交换机),核心层已从传统电分组交换机(EPS)演进为光电路交换机(OCS),形成EPS/OCS混合架构,兼具低成本、低时延、高能效优势,且OCS对光传输技术的透明性支持不同代际汇聚模块的快速迭代。

为满足机器学习的规模扩展需求,两类新型扩展网络应运而生:GPU集群通过低时延电交换机与铜缆实现机架内直连;TPU Superpod则采用基于OCS的环形可重构架构,跨机架互联数千个TPU,其同构特性使得光模块无需向后兼容,更聚焦低时延与高带宽密度,且支持单纤复用更多波长以降低OCS成本、提升可用性。而园区网络的覆盖范围已从传统2km扩展至5km以上,对光传输的传输距离与链路损耗预算提出了更高要求。

在1.6Tb/s速率以下,IM-DD技术凭借低成本、低功耗优势成为数据中心集群、ML芯片间互联(ICI)与园区网络的主流选择,其带宽提升主要通过波特率、并行通道数(波长/光纤)与调制阶数的扩展实现。但当单通道速率向400Gbps突破时,IM-DD技术面临传输距离与链路预算的严峻挑战,而相干技术虽能克服这些障碍,传统四维(4D)相干方案却存在功耗、兼容性等问题。因此,探索兼顾性能与实用性的光通信技术成为行业焦点。

二、IM-DD技术:演进、改进与400Gbps扩展瓶颈

(一)IM-DD技术的演进历程

数据中心互联技术的演进始终围绕匹配交换机电I/O速率、优化成本、功耗与密度展开。针对不同传输距离,形成了明确的技术路线:2米内采用直连铜缆(DAC);100米内采用多模光纤(MMF)空分复用短距光模块(SR)或单模光纤(SMF)并行光模块(PSM);1公里内采用单模光纤粗波分复用(CWDM4)长距技术(LR)。

数据中心光模块已发展六代,从第一代10G SFP+(DML、PAM2、无时钟数据恢复)演进至最新1.6Tb/s OSFP(EML、PAM4、数字CDR),带宽提升160倍,能效提升超9倍,线密度提升48倍。OCS的引入推动CWDM4长距光模块采用单纤双向(BiDi)技术与向后兼容设计,以提升OCS端口密度、降低成本。

TPU ICI光模块则发展了四代,其演进驱动力是匹配TPU更快增长的I/O带宽需求,除成本、功耗、密度外,高可靠性与低时延更为关键——单条光链路故障可能因同步处理特性显著拖慢LLM训练。与异构数据中心网络不同,同构TPU网络无严格扇出与向后兼容要求,支持多链路捆绑至单纤以提升可用性、降低OCS端口成本。

(二)IM-DD系统的先进损伤抑制技术

为应对BiDi传输、长距离传输等场景下的信道损伤,业界开发了三类核心改进技术:

1. 带内光干扰(OI)抑制技术(OIM)

BiDi系统中,传输链路组件的单次反射会导致反向传输信号的带内干扰,对PAM4等高阶调制影响尤为严重。基于DSP的OIM技术利用IM-DD信号的强直流分量特性,通过预判决、数据擦除、窄带滤波重构直流-直流拍频噪声,实现干扰抑制。

为应对实际系统中未知且时变的频偏,采用FFT-based低速频率跟踪算法,虚警率低于10⁻¹⁷,且功耗仅为5nm CMOS节点PAM4 DSP ASIC总功耗的6%。测试表明,在-32dB OI与5dB消光比(ER)条件下,OIM技术可使接收灵敏度提升约2dB。

2. 调制啁啾管理技术

光纤色散(CD)是低成本IM-DD系统的主要传输距离限制因素,基于马赫-曾德尔调制器(MZM)的啁啾管理技术通过不均衡分配上下支路功率引入调制啁啾,实现CD补偿。当啁啾参数α≤0.7时,光调制幅度(OMA)损耗可控制在0.5dB以内;当α=1时,CWDM4最差波长(1264.5nm)的传输距离从2km(零啁啾)扩展至6km(0.5dB CD penalty阈值),且通过调整MZM偏置点可生成负啁啾,补偿正色散。

3. 无损光预均衡技术

基于硅光子集成技术,利用MZM的互补信号输出进行延迟与衰减,通过偏振合束器(PBC)正交偏振复用,避免光耦合器固有的3dB损耗,等效实现带负系数的有限冲激响应(FIR)滤波。该技术可降低组件带宽需求或改善窄带宽组件性能:在113Gbaud PAM4系统(电组件50GHz、MZM 30GHz)中,1抽头预均衡可提升链路损耗容限1dB,2抽头可提升1.8dB,且1抽头方案无需相位控制,功耗为零。

(三)IM-DD向400Gbps/ lane扩展的核心瓶颈

尽管存在上述改进技术,IM-DD向400Gbps/ lane扩展仍面临四大核心限制:

1. 色度色散(CD)与偏振模色散(PMD)

CD引入的系统代价与波特率平方成正比,即使采用理想MZM啁啾管理,400Gbps PAM4系统的CWDM4传输距离仍不足2km。PMD对老旧光纤影响显著,400Gbps/ lane系统在1km传输时PMD代价达0.5dB,即使采用功耗较高的非线性最大似然序列估计(MLSE)均衡,传输距离也仅能扩展至2km。

2. O波段四波混频(FWM)

CWDM波长栅格位于SMF零色散窗口(1300-1324nm),高发射功率下FWM非线性效应显著。改进的FWM模型通过二阶色散项直接计算相位失配因子,更精准描述宽信道间隔(>10nm)下的非线性作用,实验验证表明传统线性色散模型会低估信道间隔>12nm时的FWM效应。10nm间隔的WDM8系统中,FWM串扰限制了发射功率,2km传输时最大允许发射功率仅3dBm,链路损耗预算大幅降低。

3. 链路损耗预算约束

IM-DD带宽扩展的三种方式(提升波特率、调制阶数、并行通道数)中,前两种虽成本更低,但会加剧链路损耗预算压力:波特率翻倍导致噪声带宽翻倍,信噪比(SNR)下降3dB;调制阶数提升(如PAM6较PAM4)需额外4dB SNR,且带内OI容忍度显著降低。同时,高速光电探测器(PD)响应度与跨阻放大器(TIA)输入噪声密度恶化,50Gbps PAM4升级至200Gbps PAM4时,接收OMA灵敏度下降6dB,速率每翻倍损失约3dB SNR。

尽管可通过提升激光器功率(如O波段DFB激光器输出功率达20dBm)或调制ER(TFLN/BTO调制器将ER从5dB提升至12.5dB,OMA提升2.5dB)缓解,但受限于可靠性、功率转换效率与FWM非线性,激光器功率提升空间有限,且高ER会引入额外非线性。

4. 纠错编码与星座成形的局限性

相干系统中1dB SNR增益可直接转化为1dB链路预算提升,但IM-DD系统中仅能实现0.5dB提升;高编码增益软判决FEC虽有效,但会引入额外时延(如800G相干ZR FEC时延约1μs,而200Gbps/ lane IM-DD FEC时延<200ns),不适用于低时延场景。概率整形(PCS)在峰值功率受限的短距IM-DD系统中效果有限,难以成为带宽扩展的有效支撑。

三、相干技术:核心优势与传统4D方案的应用障碍

(一)相干技术的四大核心优势

与IM-DD技术相比,相干技术在超高速、长距离传输场景中具备根本性优势:

1. 接收灵敏度显著提升

相干检测通过本地振荡器(LO)放大接收信号,理想相干接收机的功率灵敏度提升因子可达4PL/Pav(PL为LO功率,Pav为接收平均光功率),相较于完美的无限ER下的IM-DD信号,灵敏度优势明显。

2. 调制效率更高

相干技术可利用光的四维特性(两个偏振态×两个正交相位),光谱效率(SE)较一维IM-DD提升4倍;同时支持光场双偏振调制,相同峰值光功率下星座点欧氏距离翻倍,进一步优化传输性能。

3. 激光功率效率优化

理想双偏振调制下,忽略散粒噪声与非本征插入损耗时,传输相同数据速率,相干系统所需激光功率较IM-DD系统低B/2 dB(B为端到端链路损耗)。即使考虑LO散粒噪声(与TIA热噪声相当),功率效率优势仍可达约1dB。

4. 信道损伤容忍度极强

数字相干系统可通过先进DSP完全补偿CD、PMD等线性损伤;对带内OI的容忍度远超IM-DD,113Gbaud 16QAM相干系统无需额外抑制技术即可耐受-32dB OI,且无突发误码,而IM-DD系统即使开启OIM,仍存在明显误码拖尾。其本质原因是IM-DD接收机的最坏情况下干扰噪声幅度为2PsPOI,而相干接收机仅为POI,干扰抑制因子达4/(1-1/ER)²。

(二)传统4D相干技术的应用障碍

尽管优势显著,传统4D相干技术在数据中心场景中面临三大核心挑战:

1. 组件要求更为严苛

传统长距相干系统依赖窄线宽、低相位噪声的可调谐外腔激光器,即使短距场景可采用固定波长DFB激光器,仍需TEC微调波长;调制器方面,相干系统需2Vπ驱动摆幅以消除调制损耗,而IM-DD仅需1Vπ,0.4Vπ驱动下相干系统调制损耗达10.2dB,远超IM-DD的2.2dB,对低Vπ调制器技术依赖度极高。

2. DSP功耗居高不下

尽管近年来相干技术能效持续提升,5nm CMOS节点800G LR1相干收发器的功耗仍高于同速率IM-DD系统。相干DSP需额外集成CD、PMD补偿与相位恢复模块,且为满足过采样需求,时钟速率更高,进一步增加功耗。

3. 速率粒度不匹配数据中心需求

传统4D相干接收机需同时处理偏振与相位维度,即使传输一维调制信号(如单偏振相干PAM4),仍需4D接收架构,导致单波长最小速率为IM-DD系统的4倍,难以满足数据中心网络“按需扩展”的带宽升级需求与向后兼容性要求,在异构数据中心与园区网络中应用受限。

四、低维相干技术:数据中心场景的创新突破

为解决传统4D相干技术的局限,业界提出了多款低维相干技术,在保持相干技术核心优势的同时,实现更精细的速率粒度与更低的实现复杂度。

(一)2D自相干光学技术

该技术通过正交偏振或单独光纤将LO从发射端传输至接收端,大幅降低激光器的频率与相位噪声要求。典型系统采用单偏振16QAM等二维调制格式,通过偏振合束器(PBC)复用信号与LO,接收端需多级无间断偏振控制器分离信号与LO,实现二维相位分集零差相干检测。其优势是速率粒度提升2倍,但LO与信号承受相同链路损耗,放大能力受限(尤其大损耗链路),且偏振控制器的鲁棒性与跟踪速度仍需实际应用验证。

(二)2D偏振折叠(PoFo)时间分集相干技术

该技术的核心创新是在时域解析偏振态,无需偏振分集接收,使单偏振mQAM信号的接收组件数量减少一半。接收端PoFo单元通过偏振分束器(PBS)将信号分为X、Y偏振分量,对Y分量施加一个符号周期(T)延迟后,通过3dB耦合器与X分量重组,形成二维部分响应(PR)信号,采用1抽头最大似然序列检测器(MLSD)恢复。

改进型PoFo设计进一步优化性能:发射端在正交偏振态传输原始信号与延迟90度旋转共轭副本(源自QAM调制器未使用的输出端),接收端通过PBS选择任一偏振态,即可包含X、Y分量(时间延迟T),信号功率提升3dB。

仿真结果显示,400Gbps SP-16QAM信号在最坏偏振条件下,PoFo接收机性能仅略逊于4D接收机;而SP-QPSK信号在BER<1×10⁻²时,PoFo接收机性能优于4D接收机,且组件带宽相同,核心组件(PD/TIA/ADC)数量减半。需注意的是,PR信号会增大接收机等效星座 size,降低激光相位噪声容忍度,显著PMD场景需MLSE均衡补偿。

(三)2D外差单边带(H-SSB)相干技术

针对实数值调制信号(如相干PAMm),H-SSB技术利用上下边带的共轭特性,通过检测单一边带即可恢复完整信号,使组件带宽需求减半。其实现流程为:LO与信号引入B/2频率偏移(B为信号带宽);接收端模拟带宽从B降至B/2,仅接收上边带(USB)及其镜像;将USB信号下变频至基带,通过2×2 MIMO均衡器实现偏振跟踪与PMD补偿,结合数字导频与块盲相位搜索(BPS)算法完成载波相位恢复。

400Gbps DP-CohPAM4系统仿真验证显示,采用FFE+1抽头MLSE均衡时,H-SSB接收机较4D接收机仅存在1dB代价,而核心组件数量减半。尽管H-SSB仅利用1/4信号功率(SNR下降6dB),但通过减少信号与LO的分路次数(2路vs 4D的4路),检测信号功率提升4倍,且LO功率翻倍抵消部分散粒噪声影响。此外,DP-CohPAM4无I/Q合束器的3dB插入损耗,较SP-mQAM多3dB发射功率冗余,更适用于链路预算受限的无放大数据中心互联场景。

(四)1D PoFo-H-SSB相干技术

该技术结合PoFo偏振解析与H-SSB相位解析,追求极简的一维收发架构。理论上可通过2抽头MLSE恢复CohPAM4信号,但仿真显示最坏偏振条件下部分响应代价高达7dB,性能损失严重。未来可通过数字子载波QAM调制格式优化,仅需1抽头MLSE即可恢复信号,或探索Alamouti空时编码与外差检测结合方案,但后者需加倍发射端组件(DAC、驱动、调制器),权衡成本与性能。

五、结论:技术抉择与未来展望

IM-DD技术凭借成熟的产业链与低成本优势,在TFLN/BTO低Vπ调制器、2nm CMOS DSP等技术支撑下,有望实现400Gbps/ lane速率突破,但传输距离受限(<1km),且需通过提升发射功率或调制ER缓解链路损耗预算压力。对于传输距离>1km、尤其是>2km的400Gbps/ lane及未来更高速率场景,相干技术成为必然选择。

传统4D相干技术虽性能强劲,但速率粒度粗、功耗高,难以适配异构数据中心与园区网络的向后兼容及“按需扩展”需求。2D PoFo时间分集、2D H-SSB等低维相干技术通过创新架构设计,在保持相干技术核心优势的同时,实现了更精细的速率粒度、更低的组件复杂度与功耗,有效解决了传统相干技术的应用障碍,成为异构数据中心网络的理想候选方案。

未来,光通信技术的演进将呈现“IM-DD与相干技术协同发展”的格局:短距低带宽场景仍以IM-DD为主,长距高速场景则由低维相干技术主导。后续需进一步优化低维相干技术的相位噪声容忍度、偏振跟踪鲁棒性与功耗效率,推动其在超大规模数据中心与广域园区网络中的规模化应用,为AI、云计算等算力密集型应用提供坚实的光互连支撑。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-01-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档