面向高端数据中心和AIDC智算场景推出的新一代高性能、高密度800GE/400GE/200GE的智算网络解决方案,满足AIDC对数据中心网络的高性能、高速率的需求。
产品特性:
RG-S6900AI系列交换机采用DDC(Distributed Disaggregate Chassis,分布式物理分离机架网络设备系统)架构,是锐捷网络向高端数据中心和AIDC智算场景推出的新一代高性能、高密度800GE/400GE/200GE的智算网络解决方案,满足AIDC对数据中心网络的高性能、高速率的需求。
DDC是在传统机架式网络设备基础上,将管理板、线卡、Fabric卡做成物理上独立的盒式设备,去掉机框,再通过线缆相连组成一个逻辑上的机架交换机。打破了传统的集中式机架交换机设计,采用分布式解耦的方法来提高数据中心网络的灵活性和可扩展性。这些盒式交换机可以承担转发线卡或交换网板的角色,能够分散安装在多个机柜中,从而提供更好的散热管理、功耗控制,并且克服了设备升级和空间扩展的局限。DDC架构组网包含两种类型的物理设备,NCF(Network Cloud Fabric,云网络交换单元)和NCP(Network Cloud Processor,云网络业务单元)。其中:
NCP:类比机架式交换机的业务板功能,负责报文转发,业务口用来连接内网和外网,是整个 DDC 架构对外输入、输出接口。
NCF:类比机架式交换机的交换网板功能,如果报文需要跨NCP转发,则需要通过NCF将入口NCP收到的报文转发给出口NCP。
RG-S6900AI系列交换机包含RG-S6940-18OC20F4/RG-X112-128F4产品:
RG-S6940-18OC20F4:NCP角色产品,采用先进的硬件架构设计,单机提供18个800GE端口,其中800GE端口可拆分为400GE端口或者200GE端口,并兼容LPO光模块,2个25GE带内管理口、2个10GE带外管理口,以及20个800GE背板接口(用于与NCF互联);
RG-X112-128F4:NCF角色产品,支持128个800GE背板接口。
针对智算训练场景的流数少、大象流多的特征,传统的ECMP均衡方式会导致负载不均衡,进而影响性能,拉长AI训练时长。而且,传统的ECMP方式基于逐跳路由转发,不能很好地感知端到端转发路径带宽利用情况,转发路径中存在拥塞时,容易发生丢包。DDC系列交换机采用信元交换技术,通过把报文切分成大小一致的Cell单元,并将它们逐一转发,以此实现跨NCP流量的高效均衡转发,大大提高了转发效率。同时,DDC架构还支持基于VOQ(Virtual Output Queuing,虚拟输出队列)+Credit机制的路径感知,NCP在转发数据包时提前获知路径带宽是否可用,只在所有可用的路径上进行负载均衡,实现无阻塞均衡交换。并且与端侧设备(如网卡、GPU等)解耦,不同类型端侧设备混组网下也能保持高效吞吐和负载效率。
AI机器学习、大数据、高性能计算、分布式存储等应用的高速发展,驱动下一代数据中心网络向200G/400G/800G演进,下一代数据中心网络,要求设备在单位空间内,具备更高的性能、更大的带宽。单台RG-S6940-18OC20F4可提供提供18个800GE端口,其中800GE端口可拆分为400GE端口或者200GE端口,并兼容LPO光模块,2个25GE带内管理口、2个10GE带外管理口,更好的满足下一代数据中心网络的演进需求。
DDC系列交换机支持数据中心无损网络RoCE技术,基于PFC/ECN等网络流控技术,以及MMU调优技术,可构建端到端、无损、低时延转发的RDMA(Remote Direct Memory Access,远程直接内存访问)基础承载网络。
RG-S6940-18OC20F4交换机支持1+1电源冗余,3+1风扇冗余,RG-X112-128F4交换机支持2+2电源冗余,7+1风扇冗余。在保证最小在位要求情况下,所有电源模块以及风扇模块均可以热插拔而不影响设备的正常运行。此外整机还支持电源和风扇的故障检测及告警,可以根据温度的变化自动调节风扇的转速,更好的适应数据中心的环境。还具备设备级和链路级的多重可靠性保护。采用过流保护、过压保护和过热保护技术。
支持基于芯片故障感知和切换,实现us级链路故障收敛。支持零丢包故障隔离,预期内Shutdown/Reload实现零丢包,如NCF故障替换,能够做到业务无损。
支持独立的MGMT口和2个25GE带内管理端口,2个10GE带外管理端口,不占用800GE/400GE业务口情况下,仍能做到带内、带外管理,提升管理平台可靠性和业务口带宽利用率。
整个DDC架构能够做到即插即用,通过RoCE网络参数自动配置,模板导入自动开局,千卡规模做到周内完成部署。
支持自动验收检测,包括线缆检测、光模块检测、设备内丢包自检测等,确保交付质量。
结合RG-ONC_ANALYZER运维平台,支持RoCE网络关键指标实时遥测,端侧状态和RoCE业务可视化,且支持拥塞分析和丢包分析。
支持丰富的管理接口,例如Console、MGMT口、USB口,支持SNMPv1/v2c/v3,支持通用网管平台。支持CLI命令行,Telnet,集群管理,使设备管理更方便,并且支持SSH2.0、SSL等加密方式,使得管理更加安全。
支持ERSPAN镜像;支持sFlow功能,可以对报文进行精细化统计。可以对网络流量进行分析以采取相应管理维护措施,使原本不可见的网络业务应用流量变得一目了然,可以为用户提供多种网络流量分析报表,帮助用户及时优化网络结构,调整资源部署。
DDC架构简化设计和解耦控制平面,重定义了网络建设和运营的经济模型,带来了绿色节能的同时提供了显著的成本优势。除此之外,DDC系列交换机可配套LPO光模块,模块功耗降低37.5%。
| 规格名称 | RG-S6940-18OC20F4 | RG-X112-128F4 |
| 产品尺寸(宽x深x高) | 440mm x 760mm x 86mm | 442mm×580mm×308.5mm |
| 机架尺寸 | 2U | 7U |
| 产品重量 | 26kg(空机箱、2个电源模块和4个风扇模块) | 40.98KG(空机箱、4个电源模块和8个风扇模块) |
| 交换容量 | 14.4T | 102.4T |
| 包转发率 | 5400Mpps | 43200Mpps |
| 业务接口 | 18个800G/36个400G/72个200G OSFP接口 20个800G OSFP接口(仅用于NCP互联,不可用于服务器连接) 2个1G/10G/25G SFP28接口 |
128个800G OSFP接口(仅用于NCP互联,不可用于服务器连接) |
| 管理接口 | 1个RJ45的Console接口
1个RJ45的MGMT接口 2个1G/10G SFP+接口* |
|
| USB接口 | 1个USB 2.0接口(Type A连接器) | |
| 模块插槽 | 2个电源模块插槽 4个风扇模块插槽 | 4个电源模块插槽 8个风扇模块插槽 |
| 整机功耗 | 最大功耗:2420W 典型功耗:1820W 静态功耗:700W | 最大功耗:4500W 典型功耗:2500W 静态功耗:900W |
| 电源输入 | PA2700II-F(AC输入): 额定输入电压:100V~240V AC,50/60Hz 最大输入电压:90V~264V AC,47Hz~63Hz 额定输入电流:16A(100V~240V AC) 电源接口类型:C20 PA2700II-F(HVDC输入): 额定输入电压:240V DC 最大输入电压:180V~320V DC 额定输入电流:16A 电源接口类型:C20 |
|
| 温度 | 工作环境温度:0°C~40°C 存储环境温度:-40°C~70°C 说明:在海拔1800~3000米范围内,海拔每升高220米,最高温度规格降低1℃ | |
| 湿度 | 工作环境湿度:10%RH~90% RH(无凝结) 存储环境湿度:5%RH~95%RH(无凝结) | |
| 海拔 | 工作海拔: ≤1800m 存储海拔: ≤5000m | |
| 散热 | 风冷散热,前后风道(端口侧进风) | |
*表示未来支持特性
| 软件规格 | DDC系列交换机(RG-S6940-18OC20F4/RG-X112-128F4) |
| L3协议(IPv4) | 静态路由、BGP4、LPM Routing、Route-policy、ECMP* |
| IPv6基础协议 | ND(邻居发现)、ICMPv6、Path MTU Discovery、DNSv6、DHCPv6、ICMPv6、ICMPv6重定向、ACLv6、TCP/UDP for IPv6、SNMP v6、Ping /Traceroute v6、IPv6 RADIUS、Telnet/SSH v6、FTP/TFTP v6、NTP v6、IPv6 MIB support for SNMP |
| IPv6特性 | 静态路由、等价路由、BGP4+等 |
| 数据中心特性 | 支持 RDMA 支持PFC、ECN 支持AI ECN* |
| 可视化 | 支持Telemetry 支持 sFLOW高精度采样 |
| QoS | 支持ACL流分类,支持优先级标记Mark/Remark,支持SP、WRR、WFQ、DRR、SP+WRR、SP+WFQ、SP+DRR等多种队列调度机制,支持WRED、尾丢弃等拥塞避免机制 |
| 高可靠设计 | 支持GR for BGP等路由协议 支持基于芯片故障感知和切换、支持零丢包故障隔离、链路故障降速 支持电源冗余备份、风扇采用冗余设计、所有单板和电源模块支持热插拔功能 |
| 安全功能 | 基础网络保护策略(NFPP,Network Foundation Protection Policy)、CPP、支持RADIUS/TACACS+、支持基于标准、扩展的IPv4/v6 ACL报文过滤、支持BGP报文的明文及MD5密文认证、支持受限的IP地址的Telnet的登录和口令机制、支持广播报文抑制、支持用户分级管理 |
| 管理方式 | SNMP v1/v2c/v3、Telnet、Console、MGMT、RMON、SSHv1/v2、FTP/TFTP文件上下载管理、支持NTP时钟、支持Syslog、支持ERSPAN、支持ZTP、支持NETCONF、支持PYTHON、支持风扇、电源告警以及温度异常告警 |
| 其它协议 | DHCP Client、DHCP Relay、DHCP Server、DNS Client、ARP Proxy、Syslog |
*表示未来支持特性