交换机
园区网交换机
数据中心与云计算交换机
行业精选交换系列
意图网络指挥官
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
行业精选无线系列
无线管理与应用
1.故障现象:
上网时打开网页慢,在线视频缓冲很久,下载速度慢等
2.故障可能原因:
3.故障处理流程
4.故障处理步骤
步骤1:检查是否配置流控
如果没有配置流控,各应用相互竞争带宽,可能导致个别应用过分地抢占带宽,影响其他应用的正常使用。如果带宽足够充足,可以允许不配置流控,但是如果带宽不够充足,需要配置流控来保证关键应用正常使用。判断充足和不充足可依据高峰期时带宽的占用情况,如果高峰期时,带宽占满,网络变卡,说明网络带宽不充足,应该配置流控。上网速度慢时可开启流控功能进行限速,改善上网体验。
1、检查流控是否已经配置
在流控策略页面,如果能够看到关键应用/普通应用/抑制应用三个分组的页面,说明已经配置了流控策略,如图1。如果看到的页面如图2,表示流控未配置。如果没有配置流控可点击图2中的流控马上体验选择场景相应的流控方案即可完成流控设置如图3。配置流控之后观察上网速度是否改善,如果无改善,请按步骤2继续处理。
图1
图2
图3
注意:
除了上述方法,通过快速配置也能够选择流控方案。
流控可以采用系统预设的流控方案,也可以功通过高级配置来实现。
流控原理知识:
EG的流控是通过划分通道的方式来实现的,即通过应用分类库对数据流进行识别,根据策略规则将识别的不同流量匹配进入不同的流控通道,因为不同通道大小不一样,从而实现流控。通道是根据线路真实带宽划分的,为了简化流控的配置,系统缺省为线路带宽划分三个通道:关键通道、普通通道、抑制通道,三个通道分别对应图1中的关键应用,普通应用和抑制应用。关键通道占有较大保障带宽,普通通道次之,保障带宽就是承诺带宽,因此能够保证关键应用得到更多带宽。当某个通道无流量时,其他通道可以借用该通道的流量以获得更多带宽,关键通道、普通通道、抑制通道的借用优先级从高到低。
步骤2、检查流控策略是否生效
不管是采用系统预设的流控方案,还是高级配置自定义的流控策略,均需检查流控策略是否开启生效。
在流控策略页面中点击流控高级 ,选择相应的出口线路,查看流控策略是否已经开启,如果没有开启请将其开启。如下图,勾选开关即可启用该策略。如果状态为未生效,请点击旁边的问号泡,根据提示信息修改策略使其生效。如下图。
每个接口都会有流控策略,依次选择不同的接口进行检查。只要保证需要用到的策略生效即可,没有用到的策略可以不开启或者未生效。如果策略已经开启并且生效,但是仍未解决问题,按下一步继续处理。
注意:
图中的两条未生效的策略因为是针对vpn应用的,在没有开启vpn流控的时候不会显示生效,不影响普通流控。
步骤3:检查上下行带宽值和调整带宽配置
如步骤1和2所描述,流控策略已经配置,并且检查是生效的。而网络还是卡,那么需要检查一下流控策略参数配置是否合理。
首先检查线路的上下行带宽值设置是否正确,流控是基于上下行带宽进行控制的,设置错误会导致带宽配置参数错误,带宽利用率计算不准,流控不准。检查方法是在接口配置中查看外网口的上行带宽和下行带宽的设置,如下图。
观察网络中各线路的带宽利用率,如果出现如下两种情况,分别按照对应的方法进行处理:
带宽利用率低,但是上网速度慢
带宽利用率高,上网速度慢
1、带宽利用率低,但是上网速度还是慢的处理办法
在“流量监控”页面查看线路的带宽利用率如图1,各线路的带宽利用率不高(80%以下),但是下载速度慢(单个用户下载速度不超过1.5M)。检查流控参数设置如图2,点击“流控策略”页面的“带宽配置”按钮打开带宽配置页面,在页面中可以看到抑制应用组的各类应用每ip最大带宽为1.5M(下载属于抑制应用组),那么即使在带宽空闲时每个用户的最大带宽也仅能达到1.5M,因此为了提高下载速度,可以将抑制应用组的各类应用每ip最大带宽调整为3M或者5M,这样子每个用户的抑制应用在带宽空闲时就能够使用更多的带宽。依此类推,如果关键应用组/或者普通应用组的速度慢,可调整相应分组的各类应用每IP最大带宽。
调整之后如果上网速度没有改善,带宽利用率也没有明显上升,可进一步关闭流控查看效果,如果效果仍不理想,说明可能是其他原因引起,如打开网页慢可能跟dns解析有关系,下载速度慢可能跟资源少有关系,对于多线路可能跟路由选择有关系。
图1
图2
2、带宽利用率高,上网速度慢的处理办法
如果带宽利用率较高(80%以上),说明此时带宽已经比较紧张了,此时是无法保证所有应用都不卡的,因此需要分配好各分组的带宽,让重要的应用(如办公业务,网页浏览等)能够使用更多的带宽,按下述步骤进行流控配置调整。
第1步:调整应用分类
在流控配置页面,将关键的应用拖动到关键应用组中,将占用带宽较大的非关键应用拖动到抑制应用组中。关键应用一般是跟业务相关的重要应用,如视频会议,办公OA等,而迅雷下载等P2P应用,在线视频等则是抑制应用,应拖动抑制应用组中,如图3。
图3
注意:移动鼠标到应用名称上,出现十字箭头后可直接拖拽。
第2步:调整关键/普通/抑制的带宽配置
打开流控策略配置页面,点击左上角的带宽配置按钮,打开带宽配置页面,可调整线路的关键/普通/抑制的带宽分配。如图4,根据实际情况调大关键应用的的各类应用保障带宽、各类应用最大带宽和各类应用每ip最大带宽。调小抑制应用的各类应用保障带宽、各类应用最大带宽和各类应用每ip最大带宽。
名词解释:
各类应用保障带宽:保障带宽也就是承诺带宽,当流量在承诺带宽以下时是受到保障的,是不会被抢占的,当超过了保障带宽则需通过带宽借用获得更多的带宽。
各类应用最大带宽:即各组应用(关键/普通/抑制)所能达到的最大带宽,该值不小于保障带宽。如图4,当没有普通和抑制应用时,关键应用能使用100%的带宽。
各类应用每ip最大带宽:即各组应用(关键/普通/抑制)每个ip地址所能达到的最大带宽,如图4,单个ip地址的抑制应用的带宽不超过1M。
图4
第3步:阻断非必要的应用节约带宽
在带宽较为紧张时,如果发现一些非必要的应用等占用了较多的带宽,如视频流媒体软件和P2P应用软件,可以通过“阻断应用”将其阻断以节约带宽给更重要的应用使用,如图5.
图5
第4步:调整带宽紧张阀值
带宽紧张阀值一般无需调整,默认阀值是90%。适当调大带宽紧张阀值,可以提高带宽利用率。建议阀值最大设置不超过95%,因为要预留一部分带宽作为动态调整用,可在流控高级中调整紧张阀值,依次调整每条线路的紧张阀值。如图6。
图6
第5步:检查上行方向带宽是否被占满
该步骤在上行带宽被占满时检查,未被占满时可跳过不检查。上行带宽较小的线路(如ADSL)比较容易被占满,因此需检查上行带宽配置。在流量监控中观察线路的上行带宽利用率,如果被占满,在流控策略中调整相应线路的上行方向的带宽配置。如图5,拨号线路的上行带宽为512K(0.5M),在带宽配置中限制每ip的上行带宽。
图7
第6步:命令行下删除vpn通道
vpn通道是默认在关键通道(key)下生成的,如果按照上述步骤调整之后关键应用组中的应用还是卡的话,可考虑在命令行下将vpn通道删除,以使得关键应用组获得更多的保障带宽。前提是没有配置vpn功能,或者无需对vpn做流控。
在命令行下删除vpn通道:
Ruijie#con
Ruijie(config)#flow-control Gi0/1 //应用于外网口Gi0/1的流控策略
Ruijie(config-flow-control)#channel-tree inbound //下行方向
Ruijie(config-channel-tree)# no channel-group vpn-key //删除vpn关键通道
Ruijie(config-channel-tree)# no channel-group vpn-normal //删除vpn普通通道
Ruijie(config-channel-tree)# no channel-group vpn-default //删除vpn默认通道
Ruijie(config-channel-tree)# exit
Ruijie(config-flow-control)#channel-tree outbound //上行方向
Ruijie(config-channel-tree)#no channel-group vpn-key //删除vpn关键通道
Ruijie(config-channel-tree)#no channel-group vpn-normal //删除vpn普通通道
Ruijie(config-channel-tree)#no channel-group vpn-default //删除vpn默认通道
Ruijie(config-channel-tree)#end
Ruijie#wr
注意:按照上述方法删除外网接口上的流控VPN通道,如果要恢复vpn通道,方法是通过重新进行流控方案选择。
第7步:升级线路的带宽
按照上诉步骤调整后,如果最终关键应用,普通应用和抑制应用的流量维持在设定的保障带宽大小,也就是没有空余的带宽可供借用了,但是上网体验仍然慢,可转后续步骤检查处理,后续步骤如果检查没有问题,则说明带宽已经不足以满足日常业务需求,需要升级线路的带宽了。
步骤4:检查是否存在免审计用户和会话数限制
免审计用户可以免流控也可以免上网行为审计,免流控后,该用户将不受流控限制,如果这类流量太大,将会抢占受流控用户的流量。导致流控用户上网速度慢。而会话数限制会限制每个用户的会话数和整机的会话数,如果每个用户的会话数限制过小,将导致该用户上网卡,而整机的会话数如果设置过小,将影响整体的上网体验。
1、检查是否存在免审计用户
在流量监控中查看是否存在免识别流量,如果存在则说明配置了免审计用户,如图1。如果免识别流量很大,那么将免审计用户设置为只免审计,不免流控,如图2,这样子就能防止免识别流量过大。
注意:不免流控后,免识别流量被当作普通应用,受普通应用的带宽配置限制。
图1
图2
2、检查是否存在会话数限制
在流量监控的用户页签中查看每个用户的会话数情况,如图3。如果每个用户的会话数都较小,且都是在同一个上限值时,则可能存在会话数限制。如果会话数总数小于设备缺省值,则说明会话数性能未充分得到利用。如图4,在配置全局会话数限制时,最大总会话数配置不得高于设备支持的最大总会话数,而每ip最大会话数设置在300~800即可满足普通用户的基本上网需求,服务器可另外配置较高的每ip会话数。
图3
图4
如果检查没有免审计用户配置和会话数限制的配置,按下一步继续处理。
步骤5:检查线路带宽是否真实和物理线路质量
1、检查线路带宽是否真实
因为有些线路是共享带宽,实际带宽值并不能达到运营商所承诺的带宽值。所以需要测试线路的真实带宽值是多少。
测试方法如下:
在“流控策略”--“流控高级”中将流控关闭(如图1,如果多条线路,需要每条线路都关闭),关闭后通过下载或测速网站在流量监控中查看最大带宽能达到多少。
也可以在方便断网的时候,找一台pc直连外网线路进行带宽测试,此种测试方法会比较准确。
如果测试的真实带宽没有达到运营商所承诺的带宽值,请联系运营商解决。
确认好线路的真实带宽之后,在接口配置——外网口设置中配置带宽值(如图2)。
注意:一般线路的上行和下行是对称的,对于拨号等特殊线路,上行带宽通常和下行带宽不对称,配置时要注意。
图1
图2
2、检查端口协商速率和物理线路质量
端口协商和线路质量也会影响到上网速度,因此需要检查。
在命令行下show int查看端口速率,双工协商,CRC统计等信息,如图3。图中5口是千兆口,但是协商为10M,全双工,并且有较多的CRC校验错误。说明线路两端设备协商或者线路存在问题。
图3
解决办法:
a、查看两端接口的配置是否都设置为自动协商。或者强制两端指定为一样的速率,一样的双工类型。
对应的命令:
interface GigabitEthernet 0/5
duplex auto //自动协商,若要强制为全双工,则命令为duplex full
speed auto //自动协商,若要强制成100M,则命令为speed 100
b、更换网线测试
c、更换端口测试
d、更换对端设备
如果带宽值是真实的线路带宽,线路协商的结果也是正确的,按下一步骤进行处理。
步骤6:检查路由选路是否正确
当存在多条线路时,不同线路的资源丰富程度不一样,从不同线路访问资源的速度也不一样。可通过自动选路,负载均衡等功能优化选路。
测试上网卡是否跟路由选路有关系:
在设备上配置策略路由使内网pc从指定线路上访问,然后在pc上开启反映卡的应用,测试上网速度,比如打开网页是否流畅,下载速度多少。依次测试每条线路。
如果应用还是卡,转步骤6处理,如果该应用不卡了,那么说明路由选路影响了该应用的上网体验,优化路由选路。
1、开启地址库实现自动选路
系统自带了4个地址库,分别是电信,联通,教育和移动。配置地址库选路,实现访问电信资源走电信,访问联通资源走联通,访问教育走教育,访问移动走移动。自动选路能够一定程度的保证访问时延最小。
自动选路的配置方法如图1,在接口基本配置中为外网线路配置网络服务商,配置之后将启动该网络服务商的地址库选路。其他接口依次类推。
图1
2、开启负载均衡优化线路的带宽应用
多线路情况下,各线路可能出现不均衡的现象,个别线路可能会被占满,导致从该线路转发的流量卡,可使用负载均衡分担流量。
负载均衡策略有三种,分别是基于带宽,基于负载,基于时延,如图2。因为时延策略只考虑时延,因此可能导致时延最小的线路带宽利用率最高,因此建议优先使用基于带宽或者基于负载的均衡策略。在开启地址库之后观察各线路的带宽均衡情况,如果出现线路被占满的情况,开启负载均衡,平衡线路的带宽利用。
图2
3、检查是否开启应用路由
应用路由的作用是指定某些应用走某条线,如图3,目前支持部分应用分类,如p2p应用软件,http视频,视频流媒体软件等。
如果配置了应用路由功能之后上网变卡,可尝试以下两个方式解决:
如果上述两种方式还无法解决问题,需检查该应用识别是否准确,比如存在A和B两条线路,优酷视频被应用路由到B线路,而在A和B线路都看到优酷视频的应用,则说明应用识别不准确。可联系4008111000或者在线客服webchat.ruijie.com.cn反馈。
如果应用识别正确,需检查当前使用场景是否适合开启应用路由。比如:存在电信和联通两条线路,应用路由将web应用走联通线路,而当前内网的主DNS是电信的,因此将导致web应用卡。而其他应用如果在应用路由线路的资源较少时,被路由之后也会变卡。因此建议应用路由的选择的应用类型是不太关注的应用。
如果上述优化之后,无明显改善,请按照步骤7进行处理。
图3
步骤7:检查是否受到网络攻击
网络攻击可导致网络拥塞,影响转发性能
1、检查cpu利用率是否正常
在命令行下执行show cpu查看cpu利用率,当cpu超过80%,并且经常处于高位时,需要引起注意了,参考收集信息章节,收集信息之后联系4008111000。
2、检查接口流量是否正常
show int 查看所有接口的流量,比较内网口的input流量是否等于外网口的output流量,内网口的output流量是否等于外网口的input流量。一般情况下是一致的,如果存在较大差异比如:内网口input流量远大于外网的output流量,则说明可能存在内网流量攻击;外网口的input流量远大于内网口的output流量则说明可能存在外网攻击。如下图,外网口Gi0/5和Gi0/6的流量之和相当于内网口Gi0/0的流量,网络流量正常。
3、检查会话数是否正常
在命令行下执行show ip fpm sta查看当前的会话数情况,如果会话数已经接近或者达到了最大总会话数,那么网络可能存在异常。参考收集信息章节,收集信息之后联系4008111000。
4、查看丢包和流老化统计
在命令行下使用命令show ip fpm counter查看,多show几次,对比数值的增长情况,如果发现某些项增长速度很快(超过1000/s),那么需要引起注意。参考收集信息章节,收集信息之后联系4008111000。
步骤8:收集信息后,请联系4008111000协助处理:
如通过上述故障处理步骤无法解决您的故障,请按照如下步骤收集信息,并联系锐捷技术支持热线4008111000或者在线客服webchat.ruijie.com.cn,以便我们能够快速定位问题。
详细描述故障现象(什么时间,什么地点,执行什么操作,出现什么现象)
故障现象截图
收集拓扑图(内外网拓扑)
show run
show ver
sh flow-control pa
sh flow-control Gi0/x auto-pir
sh flow-control-policy rule
show int
sh ip fpm sta
sh online statistics global
sh flowrate application global order-by pa download desc
show log
show run:收集配置信息
show ver:收集版本信息
sh flow-control pa :在上网卡时收集流控队列缓存 间隔数秒收集三次
sh flow-control Gi0/x auto-pir : 在上网卡时收集通道的实时情况 间隔数秒收集3次,Gi0/x是外网口
sh flow-control-policy rule :收集流控配置信息
show int:收集各个接口的流量
sh ip fpm sta :上网卡时收集会话数信息
sh online statistics global :上网卡时收集会话数信息
sh flowrate application global order-by pa download desc 收集流量统计信息,收集完整
show log:收集日志信息