交换机
园区网交换机
数据中心与云计算交换机
行业精选交换系列
工业交换机
意图网络指挥官
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
无线控制器
行业精选无线系列
统一运维
身份管理
服务产品
运营商
政府
金融
互联网
制造业
高教/职教
医疗卫生
交通
公共安全
1 故障现象
路由器CPOS链路两端业务无法通信,现象包括:
1)show run 看不到CPOS接口,无法进行CPOS接口配置
2)配置好后,通过设备或设备本身无法ping通链路对端地址
3)业务慢,丢包严重
2 故障可能原因
3 故障处理流程
4、故障处理步骤
步骤1 排查线卡是否正确安装
CPOS线卡出现通信故障或无法对线卡配置操作问题时,首先需要确认线卡是否正确的安装。
请使用show version slot 命令确认线卡是否安装正确
(a)如果确认线卡show ver slot状态为“running”,那么说明线卡安装正确,直接跳转“步骤2”处理;
(b)如果线卡状态为“none”,那么请尝试重新拔插下线卡,如果仍无法识别,那么可能是硬件故障,请跳转到“步骤7”收集信息致电400协助处理;
(c)如果线卡状态为“installed”且“Online-Module”为空,说明插入的线卡没被识别到:
那么需要先no install掉该槽位的线卡
Ruijie(config)#no install 4 //4标识槽位号
然后重新拔插线卡,如果状态依然是“none”,那么请跳转到“步骤7”收集信息致电400协助处理。
(d)如果线卡状态为“conflict”,说明这个槽位插过或手动install过其他线卡且没被卸载掉,导致配置的线卡和实际插入的线卡不一致,线卡无法工作。
那么需要先no install掉该槽位的线卡
Ruijie(config)#no install 1/2 // 1/2表示槽位号
再install实际插入的CPOS线卡或热拔插下线卡
Ruijie(config)#install 1/2 FNM-2CPOS-STM1
通过以上操作,如果还是无法正确识别到线卡,请尝试整机下电重启;如果依然不能解决,请跳转到“步骤7”收集信息致电400协助处理
如果通过以上步骤已经正确安装了线卡但通信依然有问题,请继续步骤2排查。
步骤2 排查光纤连接是否正确
通过show controller sonet 1/2/0确认物理链接是否UP。
(1)如果状态在UP/DOWN跳变:
请检查两端的CPOS接口,看其是否同为多模光模块或同为单模光模块以及模块的波长是否一致。如果接口类型不相同,请予以更换。在多数情况下,多模光纤接口和单模光纤接口之间采取直连方式对接是可以互通的,但有时会出现上述现象。
同时需要确认,是否有单模光模块却使用多模光纤的情况,这也会大大损耗光功率。
总结,请确保以下一致性:
单模模块 对接 单模模块
多模模块 对接 多模模块
单模模块 配套 单模光纤
多模模块 配套 多模光纤
双方光模块波长需一致
(2)如果状态始终为DOWN:
如果始终无法UP,建议用一根光纤将光模块两个光接口短接,看接口是否UP。警告:这是个有风险的操作!长距光模块短接,可能会由于“光功率”超过“过载光功率”导致光模块损坏。以下红框内三种模块可以直接短接,另外两种长距光模块需要加上光衰减器才能短接。
如果短接打环可以使得物理UP,说明本端光模块没有问题;那么也可能是:
a)光在传输过程中衰减太大,导致光信号弱,需要运营商测试光功率是否正常;
b)双方的光模块传输距离选择不正确。比如,两端距离10km,本应该选用“SDH155-SFP-LH15-SM1310”15km及以上光模块,但却选用了“SDH155-SFP-SX-MM1310”2km光模块;
c)光纤配线架布线错误或者运营商线路开通有问题;需要运营商确认。
如果短接打环仍然不能使得物理UP,那可能是本端硬件故障,有条件请更换光模块、板卡、光纤测试。
通过以上步骤排查,如果状态已经UP,但依然无法通信,那么请跳转到“步骤3”处理;
如果通过本步骤排查,始终无法使得物理状态UP,那么可能是硬件故障,请跳转到“步骤7”处理。
步骤3 排查CPOS接口是否UP
CPOS链路的控制接口是 controller接口,而实际通信接口为CPOS通道化出的E1子接口,即serial 1/2/0.1/1/1/1:0 (编号规则:slot/port.au- 4 - number/tug- 3- number/tug- 2 - number/e1 - number:channel- group - number)类型的接口。因此,要确保CPOS接口通信正常,需要对controller和E1两个接口下的配置联调。
通过sho interfaces serial 1/2/0.1/1/1/1:0 命令确认通道化serial接口协议是否UP
(1)如果协议状态已经UP(说明接口协商,包括PPP或HDLC协商已经完成)但通信时断时续或CRC校验错误很多,那么请排查:
1)时钟配置是否正确:时钟步调不一致可能导致时钟失调或时钟互锁,进而导致丢包或通信异常。
a)CPOS母接口controller接口时钟:推荐配置从时钟模式,即从线路上获取传输时钟。
Ruijie (confi g)# controller sonet 1 /0
ruijie(config-controller)#clock source line (默认即为line时钟)
b)通道化E1接口时钟:推荐设置中心路由器的CPOS的子接口工作在主时钟模式,同时设置远端路由器工作在从时钟模式。
Ruijie (confi g)# controller sonet 1 /0
Ruijie (config- controller)# au- 4 1 tug - 3 1
Ruijie (config- ctrlr- tug3)# tug2 1 e1 1 clock source
2)光信号弱或光模块不适配
如果调整了时钟配置仍然无法解决故障,那么需要跳回 “步骤2”,再次确认光模块和光纤的适配情况。如果依然无法解决,请跳转到“步骤7”收集信息,致电400协助排查
(2)如果协议状态DOWN(说明接口协商不成功),那么请继续排查
步骤4 排查基本配置是否正确
(1)基本配置模版:
controller sonet 1/2/0
framing sdh //a) 帧模式,分为sdh和sonet两种,锐捷只支持sdh,如果对端为sonet,建议对端设备修改为sdh
aug mapping au-4 // b)载荷复用标准,分为au-4和au-3,主流的是au-4,锐捷只支持au-4。
!
au-4 1 tug-3 1
tug2 1 e1 1 using-e1
!
interface Serial 1/2/0.1/1/1/1:0
encapsulation PPP
ip address 1.1.1.1 255.255.255.0
(2)检查配置的通道化E1接口时隙是否和运营商提供的一致(运营商一般一ITU-T的方式提供时隙)。如果时隙对应不正确,双方根本无法对接。
例如:运营商告知,和A分支机构对应的时隙为22;那么按照下表 查找到22,那么就查找到了22对应的时隙为
au-4 1 tug-3 1
tug2 1 e1 2 using-e1
(3)确认通道化E1接口的封装形式是否一致
双方必须确保同为PPP封装或同为HDLC封装;锐捷链路层的协议缺省为PPP,CISCO的缺省是HDLC,华为的缺省是PPP,JUNIPER的缺省是PPP;和思科对接时需特别注意。
HDLC封装必须确保双方IP地址属于同一网段。
(4)确认通道化E1接口是否启用PPP认证,认证配置是否正确
如果启用认证,一般在中心端为被认证端:
username ruijie password ruijie
interface Serial 1/2/0.1/1/1/1:0
encapsulation PPP
ppp authentication chap //启用chap认证,要求对端链接我的时候有正确帐号;一般单向认证,所以不要误操作在A设备配置了该命令,但在B设备没有对应的帐号。
分支机构为认证端:
interface Serial 1/2
ppp chap hostname ruijie //用户名密码需要和对端设备的本地或AAA帐号一致,协商不通过的时候请确认下密码是否错误,后面是否多个空格。
ppp chap password ruijie //需要根据对端设备启用的认证模式来配置用户和密码,CHAP or PAP
通过以上基本配置排查,如果无法解决,那么就要进行CPOS更详细的参数调试。请继续下一步排查。
步骤5 排查CRC校验是否一致。
CRC校验不一致,PPP无法协商,接口协议无法UP
CRC的校验有CRC16和CRC32两种。锐捷的CPOS接口缺省是CRC16;友商设备缺省值可能不一致;需要两端配置为一致。
ruijie(config)#int s 1/2/0.1/1/1/1:0
ruijie(config-if-Serial 1/2/0.1/1/1/1:0)#crc 32
确认两端一致后,如果还不能解决,请继续下一步排查。
步骤6 排查开销字段是否一致
不同厂商,对开销字段的检查规则不尽相同。设备对开销可能不敏感,双方不匹配可能也不会影响连通性;思科设备对开销字段相对敏感,双方不匹配就有可能无法联通。锐捷设备默认也对开销字段不敏感,不进行检查。
但不管与什么厂商对接,将开销字段调整为和对端一致即可。
通过show controller sonet 1/0 可以查看开销字段参数:
config :是本端配置的开销
detect: 是检测到对端的开销
锐捷路由器默认值:
C2:2
J0: 1
J1:Length 为 16 ; 标识符为 Ruijie 或者 Red-Giant (根据不同版本而定)
本端设备根据对端设备值修改配置,使得双方一致:
Ruijie(config)#int atm 4/1/0
Ruijie(config-if-ATM 4/1/0)#overhead c2 2 //华为 C2 默认值是0x16,十进制为22;CISCO C2 默认值为0xcf,十进制为207
Ruijie(config-if-ATM 4/1/0)#overhead j1 length 16 //如果检测到的J1值为空,可能就是双方Length长度不一致无法识别代码,先把Length配置成一致,再用show controller sonet 1/0 就可以看到J1值了。
RSR77(config-if-Pos 1/1/0)#overhead j1 message red
RSR77(config-if-Pos 1/1/0)#overhead j0 sonet 1 //sonet 使用单字节标识,取值范围0~255
RSR77(config-if-Pos 1/1/0)#overhead j0 sdh ruijie //在10.4(3b5)版本后,新增支持sdh方式,后面使用16字节字符串标识
通过以上所有步骤,如果仍然无法解决故障,请收集信息,致电400寻求技术支持。
步骤7 收集信息,请联系4008111000协助处理
拨打4008111000寻求技术支持,收集如下故障信息,进行故障进一步处理。
show run
show ver
show cpu
show memory
show slot
show ver slot
show ip route
show controller sonet 1/2/0 (1/2/0是实际对应的接口)
show interface
show log
-----------------------------------------------------------------------------------------------------------
*/注意,开启debug调试可能影响客户在网业务,请与客户沟通后谨慎使用!!!/*
打开如下debug信息,ping 对端地址触发协商,搜集协商过程中的debug信息
debug ppp negotiation
debug ppp authentiation
debug ppp error
*/注意,debug信息搜集完成后,必须通过undebug all命令关闭所有debug调试,否则可能会对客户在网业务造成持续影响/*
-----------------------------------------------------------------------------------------------------------