首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >OFC 2026前瞻:AI 数据中心光交换OCS相关成果梳理

OFC 2026前瞻:AI 数据中心光交换OCS相关成果梳理

作者头像
光芯
发布2026-03-10 11:19:10
发布2026-03-10 11:19:10
3320
举报
文章被收录于专栏:光芯前沿光芯前沿
下周即将举办的第 51 届光纤通信大会(OFC 2026),是全球光通信与光子学领域最具影响力的行业盛会。在生成式 AI 大模型算力爆发的背景下,AI 数据中心对网络带宽、能效、延迟与扩展性提出了极致要求,光交换(OCS)凭借超低功耗、高带宽密度、低传输延迟的核心优势,成为本届大会 AI 光互联方向的重要议题之一。本文基于大会已公布的官方议程,梳理了全球顶尖科研机构、AI 算力巨头发布的与 AI 数据中心 OCS 相关的报告与论文。

一、产业界特邀报告

本章节聚焦谷歌、英伟达、阿里云等全球 AI 与算力产业龙头发布的 OCS 相关特邀报告、高分论文,覆盖 OCS 在 AI 超算集群的规模化落地实践、AI 工厂网络架构级方案、数据中心资源池化与高可靠组网等核心场景。

M3F.1(邀请报告):Recent Advancements in Optical Circuit Switches for AI Applications

  • 完成单位:Google
  • 核心摘要:本文展示了谷歌为 AI 应用自研的两代 OCS 光交换,探讨了其设计、制造工艺,以及在多代 TPU 加速器超算集群中的落地应用。

M3F.6(邀请报告):Optical Switching for AI Factories

  • 完成单位:Nvidia
  • 核心摘要:AI 技术的进步持续驱动算力生产力提升,GPU 集群的规模需求也随之激增。满足这一需求,需要前所未有的带宽、更优的能效与高鲁棒性的网络架构。本文将光交换技术作为应对上述挑战的架构级方案展开深入研究。

M3F.4(Top-Scored 高分论文):Reconfiguration-Aware Direct-Connect AI Cluster Using Spatial-and-Wavelength Selective Switching

  • 完成单位:哥伦比亚大学 / 麻省理工学院 / Nvidia/ 康涅狄格大学
  • 核心摘要:本文通过将空间与波长选择性交换机与 Linux 网络栈集成,提出了一种完全可重配置感知的直连 AI 集群架构。实验验证了该架构可同时实现 6.4-TBytes 批量传输的网络重配置,以 及 4 个 ResNet-18 实例的多租户训练。

W2A.41:PCIe-Over-Optics With OSFP DR8 LPO and an Optical Circuit Switching Fabric for Composable CPU-GPU Resource Pooling

  • 完成单位:阿里云/锐捷网络
  • 核心摘要:本文实验验证了采用标准 OSFP DR8 LPO 模块的 PCIe5.0-over-optics 互连方案,x16 PCIe 链路实现了 100m 无误码传输。包含动态 OCS 光交换的系统级基准测试,验证了可组合化 CPU-GPU 资源池化方案的可行性。

W4H.6(邀请报告):Research and Practice of Optical Network Technology for High Reliability Interconnection of Large Scale Data Centers

  • 完成单位:中国电信
  • 核心摘要:本文展示了一套可扩展光网络架构,该架构融合了 800Gbit/s 及以上速率相干传输、光交换OCS、电信级超快重路由技术,可实现高可靠、低延迟、大规模的数据中心内与数据中心间组网,相关方案已通过实验室与现网验证。

Tu2E.1:Optical Switching in PON: Improved Energy-Efficiency and Cost-Effective Protection

  • 完成单位:诺基亚贝尔实验室/英国电信
  • 核心摘要:本文将光交换技术应用于 PON 系统,实现了 OLT 功耗随流量动态适配,同时支持高性价比的网络保护。基于原型机验证,提出了实现不低于 B 类保护倒换速度、甚至更短业务中断时间的技术路径。

M3F.2:Experimental Demonstration of O-Band 4×4x8λ Wavelength Selective Switch at 100Gbps/λ for Data Center Networks

  • 完成单位:埃因霍芬理工大学/ 华为技术有限公司(德国)
  • 核心摘要:本文基于 400GHz 8 通道光子集成平顶 AWG 与 SOA 阵列,实验演示了偏振无关的 O 波段 4×4x8λ 波长选择开关(WSS)。测试结果显示,该器件的光纤到光纤插损小于3.5dB,通道间串扰<-37 dB,实现了 42dB OSNR,在100Gb/s-PAM4 速率下的传输代价为 0.8dB。

二、OCS 核心器件与芯片级技术突破

本章节覆盖 OCS 核心光器件、硅光子集成芯片、交换矩阵与调度芯片的技术突破,是 OCS 实现高性能、高可扩展性、低成本落地的核心底座。

M2D.3(邀请报告):High Port Count Silicon Photonic MEMS Circuit Switch

  • 完成单位: nEye.ai 公司
  • 核心摘要:将 MEMS 技术与硅光子集成,可赋予光电路开关超低功耗与高可扩展性优势。本文探究了硅光 MEMS OCS 的技术潜力与核心设计要求,涵盖开关速度、功耗、偏振特性与损耗等关键指标。

M2D.2:Curved Tunable Directional Couplers Empower Ultralow-Crosstalk, Low-Loss Optical Switch Fabrics

  • 完成单位:英国剑桥大学/ 比利时根特大学
  • 核心摘要:本文提出了一款紧凑型弯曲可调定向耦合器,可用于校正马赫曾德干涉仪的功率不平衡,基于该器件实现了超紧凑尺寸、超低串扰、低损耗的 4×4 交换矩阵。

M2D.5:Pixelated NOEM Grating for Wavelength Selective Switching and Spectral Shaping in ROADM Systems

  • 完成单位:新加坡国立大学
  • 核心摘要:本文提出了一款像素化纳光电机械(NOEM)光栅,可用于片上波长选择开关与光谱整形。该 NOEM 光栅实现了纳秒级重配置速度与超过 100nm 的带宽调谐范围,可支撑 WDM 系统中的高速可重构光分插复用应用。

M2D.6:O-Band SiPh 2x2x2λ Polarization Diversity Optical Switch with PDL ≤ 0.5dB

  • 完成单位:美国加州大学圣巴巴拉分校
  • 核心摘要:本文基于耦合环形谐振器(CRR),演示了一款 O 波段硅光 2x2x2λ 波长选择开关(WSS)。该光开关实现了创纪录的 0.41dB 平均偏振相关损耗(PDL)。

M3F.3:A 4,096×4,096 Strictly Non-Blocking Optical Circuit Switch Delivering 819.2 Tb/s via Space-and-Wavelength Routing

  • 完成单位:日本名古屋大学
  • 核心摘要:本文提出了一种融合空间与波长路由的无阻塞 OCS 架构,采用星形耦合器避免级联损耗。仿真验证了架构的可扩展性,实验在单层交换结构中实现了 4096×4096 端口交换,总容量达 819.2 Tb/s。

M4F.1(Top-Scored):1024x1024 All-to-All Interconnect Thin CLOS-LION System Using 64 Lambda Routing on Athermal 64x64 ULCF AWGRs

  • 完成单位:美国加州大学戴维斯分校/美国劳伦斯伯克利国家实验室/ Enablence 公司
  • 核心摘要:本文基于无热化 64×64 均匀损耗的循环AWGR,通过 64 波长路由技术,设计、集成并测试了 1024×1024 全互连 Thin-CLOS-LION 系统,实现了低至 7.5dB 的系统级损耗与 - 24dB 的串扰指标。

Th2A.7:Leveraging a Nonvolatile MEMS Switch for Sub Lithography Silicon Photonics

  • 完成单位: 瑞典皇家理工学院/Tyndall/根特大学/imec
  • 核心摘要:硅光子技术正在加速高性能计算的发展,集成 MEMS 器件可实现低功耗重配置,但 MEMS 器件性能受限于光刻分辨率。本文基于非易失性 MEMS 开关,提出了一种后加工技术,可将光流片厂定义的 230nm 初始间隙缩小至 50nm。

三、面向 AI 大模型训练 / 推理的 OCS 架构与调度优化

本章节聚焦 OCS 与 AI 大模型训练、推理场景的深度融合,覆盖 LLM 训练流量感知的 OCS 重配置、集体通信加速、推理性能阈值分析、低延迟调度等核心方向,是 OCS 在 AI 集群落地的核心场景创新。

Th2A.35:HOCSS: a Hardware-Accelerated Optical Circuit Switch Scheduler for low-Latency Optimal Ports Matching

  • 完成单位:中国科学院大学
  • 核心摘要:本文提出了一款面向OCS的低延迟最优端口匹配调度器 HOCSS。基于硬件加速计算架构,最优场景下端口匹配延迟低于 1us,相比 CPU 实现方案实现了最高 68.8 倍的速度提升。

W2A.28:Performance Thresholds for Optical Circuit Switching in LLM Inference

  • 完成单位:美国加州大学伯克利分校/Ayar Labs
  • 核心摘要:本文针对 LLM 推理场景分析了基于 OCS 的网络架构,结果表明:无高链路扇出的场景下,亚 700ns 的重配置速度是 OCS 性能超越电分组交换(EPS)的核心条件;而在各类集体通信模式下,高链路扇出可使 OCS 即使在较慢重配置速度下仍具备竞争力。

M3F.5:Training-Phase-Aware Optical Circuit Switching Reconfiguration for Large Language Model

  • 完成单位:英国剑桥大学/imec
  • 核心摘要:本文提出了一种训练阶段感知的光网络,采用 OCS 动态重配置为阶段最优拓扑,同时结合 Rabenseifner/Bruck 映射与时隙分摊技术,在标准 LLM 训练配置下,相比静态光网络实现了 37.5% 的通信加速。

M4F.3:All-Optical Analog AllReduce and Digital Switching Using a Silicon Hybrid Computing-Switching Optical Processor

  • 完成单位:日本AIST
  • 核心摘要:本文通过动态配置 4×4 硅光开关,提出并实验验证了全光 AllReduce 运算 —— 这是 xPU 集群中的基础集体通信操作。该成果为未来超低功耗、低延迟 AI 数据中心提供了技术支撑。

M4F.4:High-Speed Optical Alternate Switching Between the Networks for Expert/Tensor and Data Parallelism

  • 完成单位:日本AIST
  • 核心摘要:本文提出了一种高效架构,利用 AI 并行处理的确定性交替通信模式,实现了硅光开关的高速控制与单边通信,光路径建立后的额外时间开销低于 2µs。

四、数据中心与算力网络 OCS 规模化研究

本章节覆盖 OCS 在 AI 数据中心组网、跨集群扩展、算力网络资源池化等规模化落地场景的创新方案,旨在解决 OCS 商用部署的扩展性、能效、兼容性等核心问题。

W4H.4:Auto-Allocating OCS Based on Real Time Flow-Granularity Controller for LM Training

  • 完成单位:北京邮电大学/中国联通研究院/上海基流科技/中国科学院计算技术研究所
  • 核心摘要:本文提出了一套面向光电混合网络的逐流控制系统,可将 All-Reduce 耗时降低 50.3%,带宽利用率提升 47.1%,相比全电网络实现了更快的语言模型训练速度,同时功耗降低 32.14%。

M4F.2:Accelerating LLM Training in Optical AI Clusters With Asynchronously-Invoked Hitless in-Job Partial TPE

  • 完成单位:中国科学技术大学
  • 核心摘要:本文提出了一套通用框架,可支撑光 AI 集群在 LLM 训练的不同通信阶段,对 OCS 进行作业内无中断部分重配置。通过将机架间拓扑动态适配训练过程中的时变流量矩阵,该方案提升了空闲连接的资源利用率,有效加速了 GPT-2 模型训练。

W4H.3:Cluster- and Reach-Scalable Optical Switching for Scale-Across AI System

  • 完成单位:日本 KDDI 综合研究所/台湾 GeNopsys 科技有限公司
  • 核心摘要:本文提出了一种基于 OCS 的跨尺度 AI 系统架构,具备集群与传输距离可扩展性,同时可减少部署光缆数量。实验结果表明,集群间 30km 的传输距离不会劣化 AI 作业完成时间。

W2A.31:OCS-Based Double Resource Pooling for Flexible Intra- and Inter-Rail Connectivity in AIDC Networks

  • 完成单位:上海交通大学
  • 核心摘要:本文提出了 ocs-DRP 方案,一种基于 OCS 的扁平化、可扩展 AI 数据中心网络架构,通过双资源池化实现灵活的轨内与轨间连接。相比轨优化胖树架构,ocs-DRP 在保持相当延迟性能的同时,功耗降低 40%。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、产业界特邀报告
    • M3F.1(邀请报告):Recent Advancements in Optical Circuit Switches for AI Applications
    • M3F.6(邀请报告):Optical Switching for AI Factories
    • M3F.4(Top-Scored 高分论文):Reconfiguration-Aware Direct-Connect AI Cluster Using Spatial-and-Wavelength Selective Switching
    • W2A.41:PCIe-Over-Optics With OSFP DR8 LPO and an Optical Circuit Switching Fabric for Composable CPU-GPU Resource Pooling
    • W4H.6(邀请报告):Research and Practice of Optical Network Technology for High Reliability Interconnection of Large Scale Data Centers
    • Tu2E.1:Optical Switching in PON: Improved Energy-Efficiency and Cost-Effective Protection
    • M3F.2:Experimental Demonstration of O-Band 4×4x8λ Wavelength Selective Switch at 100Gbps/λ for Data Center Networks
  • 二、OCS 核心器件与芯片级技术突破
    • M2D.3(邀请报告):High Port Count Silicon Photonic MEMS Circuit Switch
    • M2D.2:Curved Tunable Directional Couplers Empower Ultralow-Crosstalk, Low-Loss Optical Switch Fabrics
    • M2D.5:Pixelated NOEM Grating for Wavelength Selective Switching and Spectral Shaping in ROADM Systems
    • M2D.6:O-Band SiPh 2x2x2λ Polarization Diversity Optical Switch with PDL ≤ 0.5dB
    • M3F.3:A 4,096×4,096 Strictly Non-Blocking Optical Circuit Switch Delivering 819.2 Tb/s via Space-and-Wavelength Routing
    • M4F.1(Top-Scored):1024x1024 All-to-All Interconnect Thin CLOS-LION System Using 64 Lambda Routing on Athermal 64x64 ULCF AWGRs
    • Th2A.7:Leveraging a Nonvolatile MEMS Switch for Sub Lithography Silicon Photonics
  • 三、面向 AI 大模型训练 / 推理的 OCS 架构与调度优化
    • Th2A.35:HOCSS: a Hardware-Accelerated Optical Circuit Switch Scheduler for low-Latency Optimal Ports Matching
    • W2A.28:Performance Thresholds for Optical Circuit Switching in LLM Inference
    • M3F.5:Training-Phase-Aware Optical Circuit Switching Reconfiguration for Large Language Model
    • M4F.3:All-Optical Analog AllReduce and Digital Switching Using a Silicon Hybrid Computing-Switching Optical Processor
    • M4F.4:High-Speed Optical Alternate Switching Between the Networks for Expert/Tensor and Data Parallelism
  • 四、数据中心与算力网络 OCS 规模化研究
    • W4H.4:Auto-Allocating OCS Based on Real Time Flow-Granularity Controller for LM Training
    • M4F.2:Accelerating LLM Training in Optical AI Clusters With Asynchronously-Invoked Hitless in-Job Partial TPE
    • W4H.3:Cluster- and Reach-Scalable Optical Switching for Scale-Across AI System
    • W2A.31:OCS-Based Double Resource Pooling for Flexible Intra- and Inter-Rail Connectivity in AIDC Networks
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档