误码率低两个量级、时延降低50ns、温度直降15℃……实测干货来了
大模型训练到底有多“烧”光模块?
功耗、时延、误码率、温度,样样都是坎。
过去大家都觉得,带DSP的传统光模块虽然“稳”,但功耗高、发热大、还不便宜。
而LPO(线性可插拔光模块)喊了好几年,到底能不能在现网大规模用?
阿里云和锐捷给出了实践答案:能,而且很好用。
16.8K模块,4天从上电到验收
双方这次合作基于阿里云飞天企业版CPN 1.0智算网络,在某大规模集群中,累计交付了400G LPO模块16.8K(没错,1.68万个)。
最让人惊喜的是交付速度:从上电,调测,验收完毕仅4天。
传统DSP方案搞这么大批量,少说得两周。4倍效率提升,客户业务上线直接快人一步。
误码率实测:比传统方案好两个量级
现网跑出来的数据最硬气。
锐捷在现网统计了海量链路误码率(BER),结果LPO全面碾压:
LPO全网平均误码率:E-10
传统DSP光模块平均误码率:E-8
整整低了两个数量级。
放张对比表更直观(样本数越大,说明该误码率下链路越多):


LPO的样本在高量级(e-10以下)明显更集中,链路质量稳定可靠。
低误码率意味着更少丢包重传,大模型训练不容易“卡死”,这个价值算力集群都懂。
温度:LPO平均31.5℃,传统46.5℃
温度直接关系可靠性和寿命。
现网跑下来,LPO模块平均工作温度只有31.5℃,而传统DSP模块飙到46.5℃。


低了15℃,什么概念?
光模块温度每降10℃,故障率大约减半。低故障率 = 少掉卡、少断连。
按典型512集群算,5年CTO周期内,低故障率可减少算力损失400万以上——这还没算训练中断的隐性成本。
时延:单端口降低50ns
LPO去掉了DSP芯片,时延天然低。
实测端到端链路平均单端口延时:比传统方案降低约50纳秒。
别看50ns小,在万卡级All-Reduce通信里,差50ns可能让整个迭代慢一截。
更低的时延 = 训推跑得更快、同等算力能承载更大模型、更高并发。
功耗:单体降50%,一年省20万电费
LPO功耗优势是“祖传技能”。
锐捷400G LPO比传统DSP模块单体功耗降50%。
别小看一个模块省几瓦,512集群堆到16.8K模块,一年节省电费约20万元。
这还没算散热省下来的空调钱。
为800G LPO铺路:从CPN 1.0到2.0
这次16.8K大规模交付,不是终点,是起点。
阿里云已经明确,800G以太网智算集群2026年规模上线,并且重点储备LPO/LRO技术。
锐捷这边,400G/800G LPO都已具备量产能力,1.6T LPO原型也有了。
在OFC 2026上,双方还联合发表了面向102.4T交换机的800G LPO适配成果。
这次CPN 1.0上的成功,直接为CPN 2.0向TH6+800G LPO演进复制了经验。
技术领先、迭代持续、收益可复制——10万卡800G时代,稳了。
一句话总结
16.8K模块,4天交付,误码率低两个量级,温度低15℃,时延降50ns,功耗砍一半。
阿里云×锐捷网络,LPO已经从“实验室明星”变成了“现网实干家”。
下一站:800G LPO,十万卡集群见。
相关标签:
点赞
更多技术博文
-
什么,锐捷极简以太彩光一张网竟然有两幅面孔?锐捷极简以太彩光方案以“双超架构”在同一张物理网络上融合超聚合与超融合两种模式。超聚合模式采用1:16波分复用,实现每个房间独享万兆带宽、弱电间无源免运维,适用于教学楼、实验室、质检等场景。超融合模式基于XGS-PON,单台1U设备支持1280个房间弹性共享万兆,实现“一园一核心”,适合宿舍、病房等场景。两套模式共享核心设备、统一UNC管理平台与以太运维逻辑,无需学习两套技术,可灵活混合部署,真正实现一张网随需而变、极简高效。
-
#医疗
-
#制造业
-
#交换机
-
#园区网
-
#全光网
-
#普教
-
#高职教
-
-
智领安全・云启新境:锐捷安全云办公 4.0 焕新升级,重塑企业数字办公基石锐捷网络正式发布安全云办公4.0,以“VDI+安全”重塑终端数据安全治理架构。方案集成零信任访问(身份、终端、数据、网络四层防护)、透明加密2.0(外发自动加密)、全链路审计与智能录屏溯源等核心能力,同时支持弹性算力调度与vGPU图形加速,适配3D设计等高性能场景。发布会上,启东中远、数世咨询等嘉宾深入探讨AI时代无边界办公与国产合规实践。安全云办公4.0帮助企业将AI智能体纳入可控环境,化解安全与效率对立,构建统一数字工作平台,驱动数智化转型。
-
#云桌面
-
#制造业
-
#互联网
-
-
2026企业办公安全困境:趋势在飞,安全在追,你的数据还好吗?面对混合办公常态化、AI工具普及、IP保护需求升级与合规要求加码四大趋势,企业数据安全面临严峻挑战。锐捷网络将于2026年5月15日发布安全云办公4.0方案,覆盖常规办公、产线、代码开发、3D设计等六大高风险场景,实现数据全生命周期防护与端网协同治理。方案兼顾业务效率与员工体验,避免传统安全软件的性能拖累和管理混乱,为企业提供统一、无感、智能的安全办公新范式。诚邀收看直播,共探数据安全破局之道。
-
#云桌面
-
#制造业
-
#互联网
-
#办公网
-
-
图纸 + 代码双防护,锐捷网关 2.0 破解创新型企业数据泄漏难题锐捷推出多功能安全网关EG/CMG2.0系列,为创新型企业提供轻量高效的数据防泄漏方案。采用端网协同架构,无需改造网络,云端订阅快速部署;终端插件CPU占用<5%、内存<100M,不卡顿办公。支持对图纸、源代码等核心文件打标签,穿透改名、改后缀等规避动作进行精准管控,实时阻断违规外发,并可选严格或审计模式灵活适配不同部门。帮助企业履行数据守门人法律义务,以可控成本守护核心资产安全。
-
#安全
-
#办公网
-