二、800G光模块在InfiniBand(IB)网络的应用InfiniBand网络凭借高带宽、低时延和RDMA(远程直接内存访问)特性,成为AI训练和科学计算的优选方案。 800G光模块在IB网络中的价值体现在:支持NDR(Next Data Rate)标准:800G模块可满足NDR 400G/800G速率需求,实现单端口带宽翻倍,适配NVIDIA Quantum-2 InfiniBand 三、800G光模块在RoCE(RDMA over Converged Ethernet)网络的应用RoCEv2协议允许在以太网上实现RDMA功能,800G光模块在此场景下的应用特点包括:高吞吐与低时延平衡 :800G QSFP-DD模块支持以太网802.3ck标准,通过PAM4调制和FEC(前向纠错)技术,在100Gbps/lane速率下保持误码率低于1E-12,满足RoCEv2的严苛要求。 随着1.6T光模块标准逐步成熟,800G光模块在2024-2026年会进入大规模部署周期。
800G光模块今年开始量产,由于ChatGPT等AI技术的爆发,进一步增加了市场对800G光模块的需求。这篇笔记梳理下800G光模块的信息,方便大家参考。 ,主要有两种800G光模块的标准,对应传输距离100m以下的情况。 2)800G SR4.2 该方案采用850nm/910nm两个波长,在单根光纤里双向传输两种波长的信号,即所谓的bi-directional传输,模块中需要采用DeMux对两种波长进行分光。 对于单模的情况,存在多种800G光模块的标准, 1)800G DR8, 800G 2xDR4和800G PSM8 这三种标准的内部架构类似,包括8个Tx和8个Rx,单通道速率为100Gbps,需要16根光纤 目前已经量产的单模800G光模块,主要采用EML方案。硅光方案是否能够占据一席之地?犹未可知,主要还取决于成本和功耗。对于单波200G的方案,EML或者薄膜铌酸锂是两个可能的技术路线。
800G光模块关键特性与400G技术相比,800G光模块通过单端口带宽倍增,实现了单位比特成本下降35%以上与功耗降低40% 的显著优势,成为突破网络带宽瓶颈的关键选择。 这些模块采用PAM4调制技术和先进的数字信号处理器,能够在单通道100G或200G的基础上,通过8通道或4通道集成实现800G的总带宽。800G光模块主要分为单模和多模两类。 应用场景与市场需求800G光模块正在多个领域发挥关键作用:数据中心互连是800G光模块的主要应用领域之一,它促进了数据中心之间的无缝通信,为现代互连基础设施的骨干提供动力。 5G和通信网络也依赖800G光模块的先进功能,确保了下一代通信网络基础设施的稳定性和响应速度。中国厂商市场表现中国企业在全球800G光模块市场中展现出强劲竞争力。 光模块的迭代周期已从过去的3-4年缩短到现在的1-2年,在算力基础设施持续投入下,这一市场的高景气度有望延续。
外部接口包括以太网、Infiniband、Fiber Channel、SAS,这些网络早已使用光模块进行互联,下面我们一起来以光模块的视角来探讨一下不同网络的应用。 所以客户在购买光模块时,只需关注的是:工作速率,封装形式和传输距离。本文也是从这三个方面来讨论。为了便于记忆,本文提及的速率均取整数。1.以太网 以太网的协议我们之前整理过,这里不在赘述。 800G和400G的封装形式IB均指定为OSFP,200G的封装形式IB指定为QSFP56。 ,在AI存储领域,FC和SAS网络接口已经远远的赶不上以太网和IB。 目前仍旧是以太网和IB的直接竞争,现阶段在IB优秀的RDMA能力下,已经取得技术的领先优势。
随着高性能计算(HPC)和数据中心的不断发展,对800G光模块的需求大幅增长,这些光模块对于在现代网络中实现高速连接至关重要。 选择800G光模块时需考虑的关键因素传输距离800G光模块的传输范围取决于其类型,不同型号适用于不同的应用场景:800G SR8(短距离8通道): 适用于50m以内的多模光纤传输,适合短距离互联和数据中心内部连接 连接器类型在选择800G光模块时,评估其与现有光网络的兼容性至关重要。组织应评估其当前的基础设施,包括连接器类型、光纤类型(单模或多模)和网络协议。 平衡有效的散热管理与设备特定兼容性,能够确保在不同网络环境中实现高效性能、提升可靠性,并延长硬件寿命。功耗功耗能够直接影响网络效率,是选择800G光模块时需考虑的关键因素。 飞速(FS)800G光模块在以下方面表现出色:严格测试:每个光模块均经过英伟达(NVIDIA)/迈络思(Mellanox)InfiniBand交换机和网卡的兼容性及满负载传输测试,模拟真实应用场景,确保稳定可靠的性能
IEEE 802.3ck标准:该标准定义了800G以太网物理层的传输规范,包括线路编码、误码率和电气特性等参数,确保800G光模块在高速数据传输中的稳定性和低误码率。 800G光模块在AI算力场景中的应用在AI算力集群中,800G光模块主要用于服务器、GPU集群和交换机之间的数据互联,可显著提升数据传输速度,降低网络延迟。 数据中心高性能互联 在超大规模数据中心,800G光模块被广泛应用于服务器与交换机之间的高速互联。 通过在IB网络中部署800G光模块,能够确保大规模数据集在节点间快速传输,减少通信瓶颈,提高计算效率。 未来,随着AI应用的持续扩展,800G光模块将在智能算力网络中发挥更加关键的作用。
800G光模块在AI数据中心部署中的必要性随着AI和机器学习技术的飞速发展,数据中心的带宽与网络性能面临前所未有的挑战。800G光模块的部署,正是应对这些挑战的关键解决方案。 高带宽与吞吐量AI应用对数据处理和交换的速度提出更高要求,800G光模块能够为数据中心提供充足的带宽储备,满足未来更大规模的AI计算需求。 在高性能计算(HPC)、自动驾驶、智能制造等场景中,800G光模块将推动数据中心实现更高速的数据传输与计算交互。 低延迟800G光模块能够有效降低数据传输延迟,在高频交易、实时视频分析、自动驾驶等延迟敏感型AI应用中发挥关键作用,有助于AI模型在训练与推理阶段保持更高效的数据处理速率,提升整体业务效率。 总结随着AI技术的广泛应用,数据中心面临着前所未有的带宽和延迟挑战。800G光模块作为解决这一挑战的关键技术,不仅满足了高带宽、高效率的数据传输需求,还为数据中心的扩展性和未来发展提供了坚实基础。
前两期我们讲到:光流模块的作用、飞控融合光流数据的方法,本期继续讲光流模块使用过程中需要注意的问题。 主要问题包括倾角补偿和光流数据的距离伸缩:倾角补偿主要是因为当无人机产生倾角时,光流模块也会检测到位移,这是我们不想要的,所以需要利用IMU测得的倾角将这个值给补偿掉,不然无人机会左右摇晃。 具体的倾角补偿思路如图3,无人机开始处于状态1,发生小的倾角后,处于状态2,而此时对于光流模块而言,相当于无人机平移到了状态3,所以会测得Δx位移,而此时IMU测到了倾角β,当倾角较小时,Δx=H*tan 光流数据的距离伸缩主要是因为大部分光流模块输出的数据是像素位移,需要乘以高度后才能真正的表征无人机在物理世界中的位移,而凌启科技公司开发的双目测距及光流一体模块输出的光流数据本身就是无人机在物理世界中的位移 ,所以在使用该模块时,不用进行距离伸缩。
连接方案概述在高性能计算平台Quantum-2 InfiniBand、ConnectX-7网卡、高性能数据处理单元BlueField-3 DPU和为高性能计算和数据中心应用提供强大的支持的DGX™ H100 在100G EDR系统和200G HDR系统中,交换机和网卡上适配的是QSFP28光模块和QSFP56光模块;在100G PAM4系统中,交换机、网卡、DPU等各自适用的光模块封装形式是不一样的。 ConnectX-7网卡:CX7网卡上面的端口搭配的是平顶式400G单端口OSFP光模块或者是QSFP112、QSFP56、QSFP28封装形式的光模块。 英伟达LinkX IB网络解决方案的光模块、堆叠线和有源光缆特点:传输距离:数据中心用的光模块连接方案最远可达2km,但实际应用中,一般不超过50米。 800G双端口OSFP光模块,平顶版和带散热片的具有相同的内部结构,一般应用于使用液冷系统中的设备和用于GPU链路的大型DGX H100机箱。
以太网是一种计算机局域网技术。IEEE组织的IEEE 802.3标准制定了以太网的技术标准,它规定了包括物理层的连线、电子信号和介质访问层协议的内容,是光模块设计研发的重要标准之一。 之前的文章800G/1600G及以下以太网协议整理整理了40G-1.6T以太网物理层协议。 今天我们将开启全新文章系列,以表格等形式整理以太网和IB网络协议物理层参数,为客户在以太网物理层设备开发或光模块选型提供快速参考。 本文整理的是100M~800G以太网物理层光层吞吐量、线速度、编码开销、带宽。1.6T以太网的规范IEEE802.3dj尚未正式公布,未列出。部分协议有多种FEC可选,本次整理选用开销最大的种类。
中国联通方面,在山东、浙江、上海等多地建成400G试验网。 400G高速互联,是全光运力的再次升级,是全光转发低时延、高速光模块等多种技术的合力。 值得一提的是,除了400G之外,800G、1.6T的技术研究和标准建设也在稳步推进中。部分厂商都已推出了样品,并进行试点。 800G和以上的光模块,在多个标准组织中都在持续的开展。 而更强的SerDes,就意味这成本会变高。 此前应用较为广泛的光模块是基于50G的SerDes,目前400G、800G的光模块都是基于100G的SerDes,以后就是200G的SerDes。 传统的光模块的封装形式多种多样,到了400G、800G、1.6T,这种情况要有所改变。封装格式在不断收敛,比如缩减到QSFP-DD和OSFP,相关的模块可能会缩减到OSFP和CFP8。 所以国外在抓紧搞基于800G光模块的智算集群。我们还是以400G为主,对800G的需求不算太强烈。但持续的追赶,还是必须的。未来几年,我们就是想办法从400G干到800G。
400G光模块是光通信行业的主流产品。QSFP-DD是最常用的400G光模块产品封装。 本文介绍了QSFP-DD光模块常见类型SR8、DR4、FR4、FR8、LR4、LR8、ER4、ER8和ZR,分析了各型号之间的区别和应用场景并对QSFP-DD与QSFP112及OSFP光模块进行了对比。 1. 400G QSFP-DD光模块概述400G QSFP-DD光模块主要应用在数据中心、高性能计算领域。QSFP-DD模块在QSFP基础上增加了额外的信号通道,支持更高的数据传输速率。 应用:QSFP-DD FR4光模块适用于数据中心,QSFP-DD FR8光模块更高性能计算尝尽。 应用:ER4适用于数据中心互联,以太网,IB互联,传输网等;ER8适用于大规模数据中心,广域网和城域网等应用场景。 4.
800G光模块作为当前数据中心互连的主流技术选择,正推动着光通信市场进入新一轮增长周期。市场趋势:需求爆发,规模部署加速2025年已成为800G光模块大规模部署的关键年份。 根据知名研究机构LightCounting的报告,2025年第二季度光模块市场迎来环比10%的增长,主要驱动力正是来自数据中心对800G以太网光模块的强劲需求。 中际旭创在电话会议中透露,公司2025年第一季度收入和净利润持续增长,800G光模块出货量同比和环比均有明显增长。这一趋势背后是科技巨头们对AI基础设施的高强度投入。 在更低功耗方面,Credo发布了用于1.6T光模块的高性能、低功耗Bluebird DSP,采用台积电3nm工艺制造,实现1.6T光模块整体功耗远低于20W。这种功耗优化对大型AI集群至关重要。 公司还致力于突破高端光芯片技术瓶颈,实现应用于800G/1.6T光模块的100G/lane PAM4高速光芯片的国产自主可控。
在这一背景下,800G光模块作为下一代高速光通信的核心组件,正迅速成为数据中心和网络通信领域的热门话题。本文将为您深入解析800G光模块的技术优势、应用场景以及市场前景。什么是800G光模块? 与传统的100G、400G光模块相比,800G光模块在技术上实现了质的飞跃,不仅在传输速率上达到了400G光模块的两倍,同时在能效比和密度方面也展现出了卓越的性能。 800G光模块的应用场景 1. 数据中心互联加速云计算发展:在云计算技术蓬勃发展的今天,数据中心之间的数据传输需求呈爆发式增长。 5G网络的大规模部署对传输速率和网络容量提出了严苛要求。800G光模块肩负重任,为5G基站和核心网提供强大的传输支持,在5G网络建设中扮演关键角色。 (四)高性能计算满足复杂计算需求 在科学研究、金融分析、气象预测等高性能计算领域,800G光模块发挥着关键作用。其卓越的传输速率和稳定性能满足了复杂计算的需求,从而为各个领域的应用提供了强有力的支持。
Infiniband专为高性能计算设计,采用原生RDMA技术,提供超低延迟和高吞吐量,支持无阻塞Fat-Tree拓扑,在大型模型训练(如千卡GPU集群)中能显著减少通信瓶颈,但其有别于以太网的物理层标准 ,对光模块设计研发提出了不一样的要求。 今天整理10G~800G IB物理层吞吐量、线速度、编码开销、带宽,为各位在IB设备选型提供快速参考。IB物理层通道数支持1/2/4/8/12通道,本次选取常用可插拔光模块的4/8通道数汇总。 在最新IB协议2.0中规定支持多种FEC模式,并且在低延迟模式下EDR和HDR支持RS-FEC(271,257),NDR支持RS-FEC(272,257+1),XDR支持RS-FEC(274,260), 本文汇总是取一般模式下FEC的选用。
由于这种现象是由于哈希运算导致的,因此不论是IB还是以太网RoCE都面临着这种概率可能性。 在以太网中,两端均使用400G QSFP-DD、400G QSFP112或者400G OSFP的封装模式,需要根据两端设备端口类型决定;在IB网络中,两端均使用400G OSFP的封装模式,OSFP为IB 产品形态交换机端口连接线网卡端口光模块400G QSFP-DD 光模块MPO跳线400G QSFP-DD 光模块光模块400G QSFP112 光模块MPO跳线400G QSFP112 光模块光模块400G ;在IB网络中,交换机端使用400G OSFP的封装模式,网卡端使用200G QSFP56封装模式,OSFP和QSFP56为IB指定封装。 一是使用分支线缆进行互联:如图6所示,LEAF层在下行网络中也存在哈希冲突的可能,此时使用分支线缆连接LEAF和TOR交换机,比如使用800G分支2*400G的光模块连接方式或者AOC分支线缆(DAC长度不够
网络上的文章基本上是根据设备商规划好的网络架构来计算AI/HPC算力光模块(以下简称光模块)的数量。 今天,大成鹏通信就以LLaMa 65B模型训练实例来阐释AI训练模型需要的网络架构对应的光模块数量如何计算。本案例的训练模型为LLaMa 65B,使用的GPU为A100,数量2048个。 实际应用中要考虑训练效率:A100的实际利用率50%左右,并以此为基础推算单个A100的算力A=312* 10^12FLOPS *50%=156*10^12FLOPS。 ③光模块数量计算如果全部使用400G光模块互联:48*64+1024=4096个。 深圳市大成鹏通信有限公司目前正在研发适用于AI算力计算的800G产品,届时将形成200G~800G AI/HPC算力光模块解决方案,完美兼容Infiniband设备,替代原装光模块、AOC、DAC!
在此背景下,RoCEv2(RDMA over Converged Ethernet v2)凭借其零拷贝传输、微秒级延迟及以太网兼容性,成为替代InfiniBand(IB)的高性价比方案。 它通过标准以太网实现远程内存直接访问(RDMA),在降低硬件成本的同时,支持跨厂商设备的灵活组网,为大规模AI集群提供了可扩展、易维护的互联底座。 DeepSeek 推理集群测试网络800G 交换机端口配备 800G OSFP 光模块,使用两根 MPO-12 电缆与两个 400G NIC 建立两个 400G 连接,每个电缆与相应 NIC 上的 400G 更高的 TGR 意味着:每秒处理的更多请求更高的输出效率更好的资源利用率降低运营成本测试结果清楚地表明,与传统的 InfiniBand (IB) 相比,AI智算交换机可提供更低的 P90ITL 和更高的 800G AI RoCE 交换机:性能和成本的突破无与伦比的性能:凭借更高的 TGR 和更低的 P90ITL,它提高了推理速度、响应能力和系统吞吐量。
上期讲光流模块在无人机上的作用,本期主要讲的是基于串级PID控制算法介绍如何使用光流数据。 光流数据的使用方法通常分为两种,一种是光流数据和IMU数据单独使用,以一种逐层递进的方式控制无人机悬浮,具体如下图1: 第二种是光流数据和IMU数据进行深度融合,然后再进行控制算法的运算, 具体如下图2: 在IMU、光流及测距数据都很稳定时,采用方式一无人机也可以稳定的悬浮,初学者建议采用这种方式。 数据融合的思想就是将不同传感器的数据进行融合,而不是单独依赖某一个模块的数据,融合后的数据会更加稳定可靠。 对比方式一和方式二可知,其区别主要是方式二对输入到整个PID控制的最前端的数据进行了融合,不单独依赖光流数据,这样可保证最开始的目标更加稳定可靠,在控制系统中,目标值的稳定比精度更重要。
姿态可以用IMU数据解算出来,而位移数据或者是位置数据就需要GPS、RTK、光流及测高模块等传感器提供。 光流模块基于数字图像处理技术,能够获取无人机的相对位移数据,也就是当前帧相对上一帧的位移,但该位移数据的单位是像素(简称像素位移),同一像素位移在不同的高度对应着不同的物理位移,实际的物理位移与像素位移和无人机高度的乘积成正比 市面上有很多光流测距一体模块,如某宝的凌启科技开发的双目测距及光流一体模块LQ-S01,该算法基于双目视觉,不但能输出光流X、Y及距离H数据,还能测得无人机的旋转角度R,旋转角度与地磁计融合后可以获得更加准确的航向角 模块应用在无人机上在室外强光下正常使用,不仅能解决温漂补偿,也可以根据色环境制定量程测距方案,在15m以外空中飞行的量程数据也不会失效。 将IMU的姿态数据和光流及测高模块的位移数据送入飞控中,经过滤波及融合处理后,飞控通过控制算法就可以控制无人机在空中稳定悬浮。