1 前言
随着万兆以太网技术的飞速发展以及应用的不断提升,采用性价比极高的以太网技术来构建大型的企业网、城域网已经成为一个不可阻挡的趋势。在这类规模大、业务多的网络环境里面,传统的多级级联式的树型以太网,在故障恢复时间、保护机制以及对组播应用的支持方面还存在一定不足,难以支持宽带数据网络用户不断发展的需求。
以太环网作为一种大型的环形以太网部署技术,将高端的万兆链路技术和高性能、高可靠性的环网自愈协议相结合,解决了传统数据网保护能力弱、故障恢复时间长等问题,是高端网络部署的一种重要的技术选择和解决方案。
在二层网络中,对于网络可靠性一般采用STP协议,STP协议是由IEEE开发的一种标准的环网保护协议,并得到广泛应用,但实际应用中受到网络大小的限制,收敛时间受网络拓扑影响。STP一般收敛时间为秒级,网络直径较大时收敛时间更长,采用RSTP/MSTP虽然可以减少收敛时间,但是对于3G/NGN语音等高服务质量要求的业务仍然不能满足要求。
环保护技术是针对特殊的以太网环形拓扑结构及高端链路技术而设计的,可以为用户提供50毫秒级的运营业务保护和快速恢复能力。以太环网保护技术在RFC3619(EAPs)中有一个初步的描述,但仅仅是作为一个参考草案,目前业界仅有少数厂商提供了相关的产品实现。锐捷网络基于对万兆以太网技术的深刻理解,在RFC3619的基础上,自主开发了RERP协议,并已在锐捷网络的RG-S8600、RG-S9600等高端系列交换机上实现。
RERP是一个专门应用于以太网环的链路层协议,它在以太网环中能够防止数据环路引起的广播风暴;当以太网环上一条链路断开时,能迅速启用备份链路以恢复环网上各个节点之间的通信通路。和STP协议相比,RERP协议具有拓扑收敛速度快(低于50ms) 和收敛时间与环网上节点数无关的特点。
2 RERP基本概念
2.1 基本概念
RERP域(RERP Region)
在RERP里面,一个域就是一组配置了相同域值且相互连通的交换机群体。不同域之间通过一个全局的整数值来唯一标识,称为域标识值。
一个完整的RERP域包含如下组成要素: RERP环,RERP控制VLAN,主控设备,传输设备,备份主控设备和主从边缘设备。
RERP环(RERP Ring)
网络设备间以环形拓扑通过Trunk口连接,在这种拓扑里,每台设备都有两个端口接入到环。一个RERP域,可由一个或多个这样的环组成。在一域多环的情况下,我们定义其中一个为主环,其它的为子环。RERP环的角色可由用户通过配置决定。
RERP环同样由一个全局的整数值来惟一标识,称为环标识。每个RERP环都是其所在的RERP域的一个局部单元。RERP协议在RERP环中运作。
如上图所示,RERP域Domain1中包含了两个环,一个为主环Ring1,一个为子环Ring2。
RERP控制VLAN(Control VLAN)
RERP的控制VLAN是相对于数据VLAN来说的。数据VLAN用来传输数据报文;在RERP中,控制VLAN只用来传送RERP协议报文。每个RERP域中可包含两种控制VLAN。
一种叫做主控制VLAN,是配置在主环中的,有且只能有一个。
一种叫子控制VLAN,配置在子环中,个数由子环的个数决定。
当然,在单环的拓扑中,只要一个控制VLAN即可。主环的RERP协议报文在主控制VLAN中传播,子环的RERP协议报文在子控制VLAN中传播。
每台设备接入以太网环的所有RERP端口都必须属于控制VLAN,而且也只有接入到环中的端口才能属于RERP控制VLAN。RERP接口的类型必须是Trunk口,其Native VLAN需为相应环的控制VLAN。
还需特别要注意的是,在相交环中,主环的RERP端口既属于主控制VLAN又属于子控制VLAN。而子环的RERP端口只属于子控制VLAN。如图所示,主环的控制VLAN为VLAN2,子环的控制VLAN为VLAN3,端口旁的数字2、3就表示了端口所属的VLAN。主环的RERP端口同属于VLAN2和VLAN3。这样,主环就能为子环提供两条备份链路。一条是主环与子环相交的公共链路;一条是主环上的非公共链路。在双环健康的情况下,子环的报文是通过公共链路传输的。主环可以看做是子环的一个逻辑节点,子环的报文可以通过主环透传;而主环的报文只能在主环中传播。
数据VLAN可以包含RERP端口,也可以包含非RERP端口。
此外,不同于数据VLAN的是,控制VLAN的SVI接口上不允许配置IP地址。
主控设备(Master)
主控设备是RERP环的主要设备,不但要负责RERP环的拓扑健壮性的探测,还要负责在拓扑变化后发起环的拓扑信息更新。每个RERP环有且只有一个主控设备。如图:主环和子环各有一个且只有一个主控设备。
主控设备是环网健康检测机制的发起者。主控设备的主端口周期性地发送Hello健康检测报文,依次经过环上的各个传输设备,如果主控设备的从端口能收到该健康探测报文,则认为环网链路完整;此时,主控设备会将自己的从端口阻塞,避免数据报文在环形拓扑上传播引起广播环路;而如果在规定时间内,收不到该检测报文,则说明环网链路出现故障。主控设备将开放其从端口,以保证环网上各节点通信不被中断。
传输设备(Transit)
传输设备也称为受控设备。RERP环上除主控设备外的其它所有设备都可以认为是传输设备(备份主控设备、主从边缘设备都可以看做是特殊的传输设备)。传输设备窥视主控设备的探测报文,并在本机链路发生变化时通告主控设备,由主控设备来决策如何处理。
当传输设备检测到接入环的端口(主端口或从端口)发生链路故障Down掉时,传输设备就会通过接入环的健康端口发送Link-up报文通知主控设备。当链路恢复,此时,传输设备接入环的两个端口都可以处于Up状态,但恢复端口并不直接从Down状态直接迁回Up状态,而是先阻塞其刚刚Up的端口。因为当传输节点的端口恢复的瞬间,主控设备并不能马上知晓其链路的恢复,其从端口还处于转发状态。如果此时立即将传输节点的恢复端口迁移到Up状态,势必造成报文在环网上形成广播环路。因此,先将传输节点的恢复端口暂时置为Block状态。直到其收到主控设备发送的Flush报文或在Fail Timer超时后,端口才能从Block状态转换成Forwarding状态。
备份主控设备(Backup)
备份主控设备是RERP环中特殊的传输设备。和其它传输设备的区别在于,如果备份主控设备在一定时间(RERP的失效时间即Fail Timer,一般等于三倍的Hello Timer)内没有检测到主控设备发出的Hello报文,则认为主控设备失效,并自身升级为主控设备。同时通过Hello报文告知环内的其它传输设备更新主控设备的信息。备份主控设备切换为主控设备后,如果又收到了原有主控设备发出的报文,则将控制权交给原有的主控设备,自身降级为备份主控设备。
用户可以任意指定某台传输设备为备份主控设备。每个环最多可配置一个备份主控设备。主边缘设备和从边缘设备(Primary-edge &Secondary-edge)
相交环中,两环相交必有两个交点。因此,子环与主环相交,也存在两个交点。我们定义其中一个为子环主边缘设备,另一个即为子环从边缘设备。对主从边缘设备的配置没有特殊的要求,只要能在配置上区别开这两个角色就好。
如图所示:其中S3是子环的主边缘设备,S4是从边缘设备设备。您也可以配置S4为子环主边缘设备,S3为子环为从边缘设备。
主从边缘设备也是特殊的传输节点。其端口状态迁移基本与传输设备相同。在主环上,它做为普通的传输节点;但对于子环来说,主从边缘设备较传输节点特殊,它肩负着替子环检查主环完整性的任务。主边缘设备和从边缘设备是主环上子环完整性检测机制的两个主体。主边缘设备是机制的发起者,由从边缘设备判断主环的完整性并通告给子环的主控设备,进行相应操作。这一机制将在下文中详细介绍。
主端口和从端口(Primary-port&Secondary-port)
环上每台设备必须配置一对端口接入指定环,其中一个为主端口,一个为从端口。端口的角色也由用户的配置决定。主控设备的主从端口在功能上是有区别的,而传输设备和备份主控设备的主从端口是没有任何区别的。
主控设备的主端口周期性地发送环网健康检测Hello报文,如果能从其从端口上收到该报文,则说明主控设备所在环路是完整的,因此需要阻塞其从端口,防止数据环路引起广播风暴;而如果在规定时间内,收不到该检测报文,则说明其所在环网链路出现故障。主控设备将放开其从端口,以保证环网上节点的相互通信。
缺省情况下,当启用RERP,主控设备的主从端口均Up时,默认将从端口置于Block状态,避免环路。而非主控设备的主从端口Up时,均默认处于Forwarding状态。
共享端口和子端口(Shared-port&Sub-port)
主从边缘设备接入到子环的两个端口中,一个为共享端口,一个为子端口。其中共享端口是主从边缘设备主环和子环公共链路上的端口。而子端口是主从边缘设备只接入子环的端口。如图所示:红色圆点标注的是共享端口;蓝色圆点标注的是子端口。
在概念上,我们把共享端口看做是主环上的端口,属于主环的一部分。相应的,公共链路也看做是主环上的链路,不把它认为是子环的一部分。因此,公共链路状态变化的Link_up和Link_down报文只在主环内通告,让主环的主控设备知晓。
2.2 RERP协议报文
2.2.1 RERP协议报文类型
报文类型 |
报文简述 |
Hello |
环网健康检测报文。由主控设备的主端口发出,主控设备的从端口接收。用来检测环路的完整性。 |
Link_up |
链路恢复报文。由与所恢复链路直连的传输设备(包括备份主控设备)、边缘设备或从边缘设备发起,通知主控设备环路上有链路恢复。 |
Link_down |
链路中断报文。由与故障链路直连的传输设备(包括备份主控设备)、边缘设备或从边缘设备发起,通知主控设备环路上有链路中断,环网被破坏。 |
Flush |
刷新报文。由主控设备发起,通知非主控设备更新各自MAC地址表。 |
Edge_hello |
边缘健全检测报文。相交环中,由主边缘设备发起,从边缘设备接收。用来帮助子环检测主环环路的完整性。 |
Major_fail |
主环故障通知报文。相交环中,由从边缘设备发起,子环的主控设备接收。当主环失效时,用于通告子环,主环的公共链路和至少一条的非公共链路故障。 |
Major_resume |
主环故障恢复通知报文。相交环中,由从边缘设备发起,子环的主控设备接收。用于通告子环,主环的公共链路或非公共链路中至少有一者已经恢复,即子环在主环上的通道已经恢复。 |
Sub_complete |
端口状态改变通知报文。相交环中,由子环主控设备收到Major_resum报文的那个端口发出,从边缘设备接收。用来通告从边缘设备放开阻塞的子端口。 |
2.2.2 RERP协议报文格式
DES MAC(6B) |
||||
SRC MAC(6B) |
||||
802.1Q(4B) |
Length/Type(2B) |
|||
Protocol(2B) |
Version |
Msg-Type |
Length(2B) |
|
Regin ID |
Ring ID |
Ctrl VLAN ID(2B) |
Bridge ID(2B) |
|
Bridge ID(4B) |
Role(2B) |
|||
Hello Timer(2B) |
Fail Timer(2B) |
shared_port_state(2B) |
||
shared_port_state(2B) |
|
协议报文各字段含义如下:
DES MAC: 值为私有组播地址01d0.f800.0003。
SRC MAC:本机桥地址。
Length/Type: 以太网协议类型:0x0788,表示我司的私有以太网协议族。
Protocol:值为3。
Version:目前该值为1。
Type: 值0表示Master-hello报文,1表示Link_up报文,2表示Link_down报文,3表示flush报文,4表示Edge_hello,5表示Major_fail报文。
Length: RERP协议报文长度。
Region ID: 域标记。
Ring ID: 环标记。
Ctrl Vlan ID: 该域内控制vlan的id
Bridge ID: 发送该报文的桥ID。
Role: 0表示Master,1表示Backup,2表示Transit,3表示primary-edge,4表示secondary-edge。
Hello Timer: Master的Hello间隔时间。默认是1S。
Fail Timer: Hello失败的时间。Fail Timer=Hello Timer×Max Timeout,这个值对backup也有用。
shared_port_state:公共链路状态标志。
3 RERP工作原理
这里我们举一个例子来说明RERP的工作原理,如上图所示,五台设备都是核心以太网设备,它们构成一个环形的核心环网(Ring)。在这样的一个拓扑里,每台设备仅有两个端口接入这个环。这样的一个环我们将其称为一个 Region,并用一个整数值来唯一标识(即域标识值)。
每个Region只允许指定一台Master,一台Backup,其余设备均为Transit。Region中的每台设备都必须配置域标识值和control vlan,并指定相应的Primary Port和Secondary Port。
下面分以下几种状态分别进行介绍:
Master的Region健康检测
环路的阻断
链路中断
链路恢复
设备异常检测
Master失效检测
3.1 Master(主控设备)的Region健康检测
如图所示,Master定期从Primary Port向Region发送RERP Hello报文来检测链路健康状况,如果Region中的所有链路都是健康的,则该报文会在Master的Secondary Port接收到。
3.2 环路的阻碍
在正常情况下,Master通过将Secondary Port阻塞,使得所有数据vlan的数据在该端口上不会被转发,从而可以剪除整个环网中的二层环路。
3.3 链路中断
当环网中某条链路出现故障,比如说Transit1设备和Transit2设备间的线路中断掉,此时Transit1和Transit2都会识别到线路中断的情况(线路DOWN)。Transit1会通过另一个健康端口的Control Vlan向Master的Secondary发送一个链路LINK DOWN信息。Transit2也通过另一个健康端口的Control Vlan向Master的Primary Port发送一个链路LINK DOWN信息。
Master在收到LINK DOWN信息后将清除本机保存的的数据VLAN 相关的二层转发信息和三层的IP转发信息,以便重新学习新的地址信息。同时,Master还将向环路发送FLUSH NOW报文,通知所有的Transit设备清除所有数据VLAN相关的二层转发信息和三层的IP转发表,同时将Secondary的阻塞状态恢复为转发状态,实现链路的切换。
3.4 链路恢复
当环网的中断链路恢复时,比如说Transit1和Transit2间的中断线路又恢复连接(线路UP)。此时Transit1和Transit2都会将连接在这条刚恢复的链路两端的端口设置成临时阻塞状态,不允许转发任何数据vlan的报文,而后它们都通过之前健康的端口向Master发送链路LINK UP通告。
Master收到LINK UP通告后将Secondary Port重新设置成阻塞状态,而后Master会通过Primary Port和Secondary Port向Region发送FLUSH NOW报文通告Region中的各个Transit清除所有数据VLAN中的二层地址表信息和三层的IP转发表。Transit1和Transit2两台设备在收到Master的FLUSH NOW报文后,除了清除所有数据VLAN内的二层地址表信息和三层的IP转发表外,同时将处于临时阻塞的端口恢复成转发状态。
3.5 设备异常检测
Master通过Primary Port定期向所属Region发送HELLO报文。如果Master的Secondary Port没有收到Primary Port发出的HELLO报文,则认为环路上的某些链路出现了通信故障。此时Master将做以下事情:
1. 清除自身的数据VLAN相关的二层地址表信息和三层的IP转发表。
2. 向所属Region发送FLUSH NOW报文,通知域上所有的受控设备清除所有数据VLAN相关的二层转发表信息和三层转发信息。
3. 将Secondary Port的阻塞状态改为转发状态。
而当Master的Secondary Port再次收到Primary Port发出的HELLO报文后,马上将从属口的状态置为阻塞,并向Region发送FLUSH NOW报文通告各个Transit清除所有数据VLAN中的二层地址表信息和三层的IP转发表。
3.6 Master(主控设备)失效检测
用户可以指定某台Transit设备为Backup。如果Backup在一定时间内没有检测到Master发出的HELLO报文后,将认为Master失效,同时自动将自己升级为Master,并通过Hello报文告知Region内的其它Transit设备更新Master信息。
Backup切换为Master后,会即刻将从端口阻塞,防止可能的环路出现。由于Master失效有多种原因,包括:Master两个端口的链路断裂、Master二层交换异常、Master二层交换正常但软件异常无法发出Hello报文。在前两种情况下,由于Backup无法在secondary port上接收到Backup自己发出的Hello报文,因此一段时间之后,Backup将把secondary port设置成转发状态。对于Master异常发不出报文的情况,由于Master的二层交换还是正常的,Backup会在secondary port上接收到Hello报文,因此Backup的secondary port会一直处于阻塞状态。
如果Backup再次收到原来Master发出的Hello报文,则会将控制权重新交还给原有的Master,并将secondary port设置成转发状态,然后自身重新降级为Backup。
3.7 相交环RERP工作原理
3.7.1 双环相交健康状态
双环的情况与单环大体相同。在双环均处于健康的状态下,为了避免环网数据环路,主控设备必须阻塞其子端口。环主控设备的主端口会周期性地(默认间隔1S)发送环网健康探测Hello报文。
从上图可以看出,子环的Hello探测报文,到达主边缘设备时,除了朝公共链路方向传播外,还会沿着主环非公共链路传输(主环的RERP端口既属于主控制VLAN,又属于子控制VLAN),直至主环主控设备。而因主环主控设备的从端口是Block的,因此子环Hello报文在主环非公共链路上传输中断。
由此可以看出,在双环健康的情况下。主环主控设备的从端口是Block的,Block端口不转发协议报文,子环的协议报文无法通过,因此正常情况下,子环的协议控制报文是通过公共链路传输的。
3.7.2 双环相交故障及恢复状态
双环相交主环非公共链路故障及恢复
从上文描述,我们知道,双环健康的情况下,子环的报文是通过公共链路传输的。因此主环非公共链路发生故障,对于子环来说是没任何影响的。
而对于主环自身来说,环网断裂,其故障的检测和恢复原理同单环是一致的。请参照单环RERP工作原理章节部分描述。
双环相交子环非公共链路故障及恢复
双环相交,主环可以看作是子环上的一个逻辑节点。子环的报文在主环上透传。当主环健康时,子环出现故障时,不会对主环的协议报文和数据报文产生影响。子环的故障与恢复原理同单环完全一致。
双环相交公共链路故障及恢复
双环健康的情况下,子环的报文是通过两环公共链路(边缘设备和从边缘设备之间的直连链路)对协议报文和数据报文进行传输的。主环为子环提供两条备份链路,当公共链路故障时,子环可以通过主环提供的另一条链路进行传输。以下,对这个过程的细节进行描述。
当公共链路故障,主从边缘节点立即向主环主控设备发送Link_down报文,主控设备收到此Link_down报文后,将放开原阻塞的从端口,并更新自己的二层MAC地址表信息,同时分别通过主从端口向主控制VLAN发送Flush报文,通知主环的各个传输设备(包括备份主控设备和主从边缘设备)刷新地址表信息。
在这个过程中,子环的Fail Timer尚未超时。因为协议规定Fail Timer等于三倍的HelloTimer时间,这个时间远大于主环设备状态迁移时间。
此时,主环主控设备的副端口早已迁移到转发状态。子环主控设备发出的Hello健康探测报文经过主环的非公共链路到达了自己的从端口上。子环根本察觉不到也根本不必知道公共链路故障的存在。
双环相交公共链路故障恢复
当公共链路恢复时,主从边缘设备通过与主环相对的端口向主环主控设备发送Link_up报文,虽然链路已经Up,但共享端口不能立即迁移到Forwarding状态,而是先迁移到阻塞状态,避免主环上出现数据环路。如下图所示。
当主环主控设备接收到Link_up报文后,立即阻塞从端口,并更新自己的地址表信息。同时向主环控制VLAN发送Flush报文,通知主从边缘设备放开阻塞的端口,并通告主环所有传输设备刷新VLAN相关的二层MAC地址表信息。
在主环主控设备状态切换瞬间,有可能导致子环主控设备发出的Hello健康探测报文丢失。但因为主环状态切换的时间小于子环Fail Timer的超时时间,在定时器超时之前,子环主控设备很快就能收到通过公共链路传输的后续的Hello探测报文。因此,在公共链路故障恢复期间,子环主控设备的状态不会改变。
双环相交公共链路且主环非公共链路故障及恢复
双环相交,当公共链路故障,且主环上至少一非公共链路故障时,主环和子环均失效。主环的主控设备,可以根据与故障链路直连传输设备发起的环路状态变化机制来得知环路的状态。但对于子环来说,主环非公共链路变化状态通知报文并不会发送到子控制VLAN,为了让子环主控设备能第一时间知晓子环在主环上通道的链路状态,我们引入了边缘健康检测机制。具体细节请参见上文的边缘健康检测机制章节。
4 锐捷网络RERP技术特点
4.1 多域相切环技术
为了更灵活地适应复杂拓扑环境下的应用,满足用户特定网络规划的需求,RERP提供了单机支持多环相切的功能,也就是允许多个Region共享一台设备。
当多个Region由于业务需求需要进行通信时,如果使用一般的环保护技术,为了维持现有的环保护拓扑,通常需要在多个环之间增加路由设备进行互联,增加了用户的网络建设成本。
使用锐捷网络RERP提供的多环相切功能,用户只需进行一些简单的配置,即可满足应用需求,无需增加新的路由设备。
如上图所示,Region1和Region2由于业务需求需要进行互相通信。通过配置,我们指定两个Region共享一台设备,这样在该设备上将有两组主从端口分属于两个Region。这两组主从端口间的RERP信息是隔离的,但数据报文却允许通信,从而保证了数据vlan连通,但各自的环路控制隔离。这样该设备既能负责两个Region间的数据转发,又能在所属的两个Region里承担各自的环路保护角色。
4.2 安全性
接入RERP环的每个端口一般配置成trunk(以提供对数据vlan二层通道的支持)。为了保护RERP环不受来自其它vlan的恶意攻击,同时也为了简化用户在端口上的vlan配置,每个RERP域的control vlan要求是本机上未创建过的vlan。
如果使用一般的vlan技术,则用户必须对那些不在环上的trunk配置大量的vlan剪枝。而RERP技术保证了该control vlan可在RERP环端口上传输RERP报文,但在其它端口上,该control vlan的报文会被过滤。这样在保证RERP环安全性的同时,无需增加用户的配置负担。
4.3 业务稳定性
一般的环保护技术里面,Backup如果在一段时间内无法收到Master的Hello消息,就需要主动升级成Master,而这种升级会引起环网短时间的震荡。在实际应用中,这种切换有时是不必要的。典型情况如下:
Master设备当前正处于繁忙的处理过程,无法准时向环网发送Hello消息;
Backup处于繁忙状态,无法确保准时接收Master的Hello消息。
基于这种现实需求,RERP技术能够结合锐捷网络提供的拓扑防震荡功能,在发现网络繁忙时有效地避免这类不必要的震荡,使得环网更稳定。
另外,锐捷网络的RERP技术具有极高的链路收敛速度,可以实现50ms的链路切换,同时保证二层业务倒换时间至多不超过200ms,三层业务至多不超过500ms,为用户提供稳定的业务保证。
5 RERP典型应用
5.1 单环组网
当网络拓扑中只有一个环的情况下,只需定义一个RERP域和一个RERP环。每台设备都有两个端口接入到环,网络设备间以环形拓扑通过Trunk口连接。当网络拓扑发生改变时,单环的收敛时间很短。
5.2 切环组网
锐捷网络RERP支持多环相切组网,即网络拓扑中有多个环,各个环属于不同的域且相互之间只有一个公共点。如下图所示,Region1和Region2由于业务需求需要进行互相通信。通过配置,我们指定两个Region共享一台设备,这样在该设备上将有两组主从端口分属于两个Region。这两组主从端口间的RERP信息是隔离的,但数据报文却允许通信,从而保证了数据VLAN连通,但各自的环路控制隔离。这样该设备既能负责两个Region间的数据转发,又能在所属的两个Region里承担各自的环路保护角色。当网络规模较大,同级网络需要划分管理时,可以采用这种组网方式。
5.3 相交环组网
网络中有两个或两个以上的环,两环相交有两个交点。交点即为两环公共节点。公共节点之间直连的链路为两环的公共链路。此时只要配置一个域,选择其中一个为主环,其它的为子环。在相交环中,主环可以为子环提供两条备份链路,使得组网的灵活性和稳固性加强。如下图所示。
5.4 RERP与STP混合组网应用
RERP协议端口同STP协议端口在配置和使用上是互斥的,为了避免STP和RERP在计算端口状态上产生冲突。在RERP环与STP环相邻接时,不允许两种协议有公共的端口。因此RERP环和STP环只能存在相切状态的组网拓扑。如下图所示。
6 RERP性能测试
以下是对RERP协议的收敛时间进行了实际测试。
6.1 测试拓扑
如上图所示,六台设备组成了一个RERP环。节点均之间采用千兆光纤连接。配置Node2为主控设备,其余节点均为传输设备。主控设备、传输设备角色如图所示。
6.2 二层测试步骤及结果
本节测试RERP协议对二层数据流的收敛时间。二层数据流由Ixia1/2设备发包产生,在Transit1和Transit4之间双向传输。Ixia1和Ixia2之间对发目的MAC地址已知的单播报文。报文长度为64字节(Untag),发帧速率为1,000,000pps。
为了测试RERP协议的性能,在实测过程中,采用多种方法制造RERP环进行链路的中断与恢复,同时,统计发送和接收数据包的数量,计算出丢包数。将丢包数除以端口发送速率即为收敛时间。测试步骤及结果如下表所示。
步骤
|
描述
|
方向
|
收敛时间(ms)
|
丢包数
|
1
|
直连链路故障
Node2、3之间
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
2
|
直连链路恢复
Node2、3之间
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
3
|
直连端口shutdown
Node2 P口
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
4
|
直连端口undo shut
Node2 P口
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
5
|
传输链路故障
Node5、6之间
|
节点1->节点4
|
30.1
|
30,090
|
节点4->节点1
|
60.5
|
60,452
|
||
6
|
传输链路恢复
Node5、6之间
|
节点1->节点4
|
1.9
|
1,850
|
节点4->节点1
|
1.9
|
1,856
|
||
7
|
传输链路端口(Node5 S口)down
|
节点1->节点4
|
33.8
|
33,781
|
节点4->节点1
|
33.8
|
33,797
|
||
8
|
传输链路端口(Node5 S口)up
|
节点1->节点4
|
1.6
|
1,630
|
节点4->节点1
|
1.6
|
1,624
|
||
9
|
传输节点故障
Node5断电
|
节点1->节点4
|
35.4
|
35,426
|
节点4->节点1
|
35.4
|
35,445
|
||
10
|
传输节点恢复
Node5上电
|
节点1->节点4
|
2.6
|
2,637
|
节点4->节点1
|
2.6
|
2,643
|
6.3 三层测试步骤及结果
本节测试RERP协议对三层数据流的收敛时间。三层数据流由Ixia3/4发包产生,在Transit1和Transit4之间双向传输。Ixia3和Ixia4之间对发三层数据流。报文长度为68字节(带Tag),发帧速率为1,000,000pps。
在实测过程中,同样采用多种方法制造RERP环进行链路的中断与恢复,同时,统计丢包数。将丢包并计算收敛时间。测试步骤及结果如下表所示:
步骤
|
描述
|
方向
|
收敛时间(ms)
|
丢包数
|
1
|
直连链路故障
Node2、3之间
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
2
|
直连链路恢复
Node2、3之间
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
3
|
直连端口shutdown
Node2 P口
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
4
|
直连端口undo shut
Node2 P口
|
节点1->节点4
|
0
|
0
|
节点4->节点1
|
0
|
0
|
||
5
|
传输链路故障
Node5、6之间
|
节点1->节点4
|
91.2
|
91,197
|
节点4->节点1
|
103.7
|
103,675
|
||
6
|
传输链路恢复
Node5、6之间
|
节点1->节点4
|
139.4
|
139,434
|
节点4->节点1
|
139.3
|
139,279
|
||
7
|
传输链路端口(Node5 S口)down
|
节点1->节点4
|
111.6
|
111,645
|
节点4->节点1
|
121.7
|
121,688
|
||
8
|
传输链路端口(Node5 S口)up
|
节点1->节点4
|
127.4
|
127,367
|
节点4->节点1
|
126.9
|
126,911
|
||
9
|
传输节点故障
Node5断电
|
节点1->节点4
|
120.7
|
120,732
|
节点4->节点1
|
130.3
|
130,280
|
||
10
|
传输节点恢复
Node5上电
|
节点1->节点4
|
122.9
|
122,858
|
节点4->节点1
|
122.0
|
122,031
|
7 结束语
随着IP网络向多业务承载方向的发展,3G/NGN、IPTV等业务对于网络的可靠性、QOS要求越来越高。在三层网络中,可以通过路由快速收敛来保证,而对于接入网二层网络,传统的技术不能满足快速收敛、链路切换的要求。RERP为二层以太网络提供高可靠性和服务质量保证,可以防止环路上的广播风暴,链路故障时可以提供小于50ms的快速收敛,从而实现链路的快速切换。
锐捷网络的以太网交换机提供对RERP的支持,可以应用于宽带接入网,在二层网络中提供对于电信级业务的高可靠性和QOS的保障。
更多技术博文
-
全调度以太网(GSE),中国智算网络新标准
GSE网络作为一种全调度以太网技术,专为大规模AI训练集群设计,通过按需调度实现无损性能,提供灵活快速的部署方案,构建开放生态,显著提升智算效率和运维体验。
-
#知识百科
-
-
以太和PON,谁能更好地支撑办公室横向流量业务?
了解以太彩光与PON的区别,解析办公资源共享难题,锐捷极简以太彩光方案助您高效适配办公网,共享打印无压力!
-
#交换机
-
-
场景无线 驱动高效办公!锐捷新一代企业无线办公解决方案全新发布!
面对企业数智化转型中的无线办公网络挑战,锐捷新一代企业无线办公解决方案通过全场景AP、智能调度与云端智能运维等技术,实现网络性能、用户体验与运维效率的全面提升。
-
#无线网
-
#办公网
-
-
以太彩光和PON,运维管理谁技高一筹?
锐捷网络提供极简以太全光方案,简化配置流程,降低学习成本,让全光网络升级更平滑。
-
#交换机
-