交换机
园区网交换机
数据中心与云计算交换机
行业精选交换系列
工业交换机
意图网络指挥官
无线
放装型无线接入点
墙面型无线接入点
智分无线接入点
室外无线接入点
场景化无线
无线控制器
行业精选无线系列
统一运维
身份管理
服务产品
运营商
政府
金融
互联网
制造业
高教/职教
医疗卫生
交通
公共安全
我是一名运维
也是一个折翼的天使
我就职于某A股上市制造类企业
旗下有江东、济南、石家庄三个厂区
大家都尊称我为“张工”
这是一名运维工作者的日常
专家统计:70%的业务问题是用户先发现的
因此,被用户抱怨是常有的事
专家还说了,
90%的精力花费在故障分析和定位上
因此,被用户“连环夺命催”也是难以避免的
销售总是说:
业务部门总是说:
业务运维总是说:
网络运维总是说:
好好好,大家都没问题
所以是老板的问题咯?
每天疲于应付部门间扯皮的我:
2019年8月22日
这是我职业生涯中再平常不过的一天
一如既往又有问题发生了
ERP系统打开特别慢,一个订单半分多钟才能打开
我顿时有点慌
因为消费者在门店下单后,工厂通过ERP系统接收到订单,然后开始进行备料、生产、交付,该业务出现问题,整个生产活动都会受到影响。
虽然我熟悉各区域的网络,但处理这种问题还是非常没底。
我需要从报障的终端用户到ERP业务服务器之间的设备,逐一检查
运气好的话,1个小时
运气不好的话,5、6个小时也有可能
忽然想起公司最近新采购了“猎豹”
听说猎豹是一个智能运维平台,能站在最终用户的视角评估业务应用的好坏,及时感知用户的访问体验,并可以快速定位问题,界定责任人。
我嗤之以鼻,这种业界难题
是你一个系统就能解决的吗?
那我倒要看看这只“猎豹”到底行不行
没想到的是
打脸来的太快就像龙卷风
我的难题三步就被解决了:
Step1:
我接收到了猎豹通过邮件和短信发来的告警通知
Step2:
通过猎豹提供的告警详情,分析故障时刻用户与U9业务交互的体验KPI,对指标进行钻取分析,了解到具体是哪些用户与U9业务访问过程中产生了慢的体验,然后基于这些源IP进一步缩小故障影响范围的判定。
Step3:
经过一轮分析,最终判定问题出在某一家运营商链路上,数据包分析的结论给了张工充足的依据证明该运营商链路存在较多丢包、不稳定的现象导致了此故障的发生
我赶紧把这一信息反馈给了运营商
运营商对自己的广域网链路排查分析后,故障修复了。
整个过程,没有扯皮,没有抱怨,
处理问题快、狠、准,
我忍不住想要为猎豹鼓掌??
原来,故障定位,用猎豹就够了!
以前,我们没有数据支撑来说明业务体验的好不好,考核指标也只是根据业务是否宕机。而现在,猎豹可以帮助我们量化和提升用户体验;
以前,我们总是晚于用户发现问题,只要不是非常大的延迟问题,用户不会主动反馈,一旦反馈就是大面积问题。而现在,猎豹主动在延迟出现的时候发现体验问题,更早排查原因,运维从此不再被动;
以前,故障无法追溯,经常有些问题过一会就没了,原因根本没法找。而现在,猎豹帮我们秒级“还原现场”,眼见为实。
猎豹是一只聪明的小豹子,它深刻洞察业务、量化用户的体验、快速定位问题、支持故障自愈、数据回溯,让运维工作,从未如此简单。