产品
产品中心
< 返回主菜单
产品

交换机

交换机所有产品
< 返回产品
交换机
查看交换机首页 >

无线

无线所有产品
< 返回产品
无线
查看无线首页 >

云桌面

云桌面产品方案中心
< 返回产品
云桌面
查看云桌面首页 >

安全

安全所有产品
< 返回产品
安全
查看安全首页 >
产品中心首页 >
行业
行业中心
< 返回主菜单
行业
行业中心首页 >

什么是监控运维系统?

每个企业都意识到监控工作的重要性,但80%企业的监控工作仍然处在监控的初级阶段。那么,什么是初级阶段呢?大概是指被动监控、人肉监控、人肉测试、服务器只能靠重启的传统运维模式。

  • 发布时间:2022-08-25

  • 点击量:

  • 点赞:

分享至

我想评论

背景

每个企业都意识到监控工作的重要性,但80%企业的监控工作仍然处在监控的初级阶段,尚未采用有效的监控运维系统。那么,什么是初级阶段呢?大概是指被动监控、人肉监控、人肉测试、服务器只能靠重启的传统运维模式。

1.被动监控,故障发生运维人员永远不是第一个发现故障的人;

2.监控IP地址与TCP端口,很多时候HTTP 80端口正常接受请求,但WEB服务器不能正常工作。

3.人肉监控(人肉运维),采用人海战术,桌面摆放很多显示器,甚至投影仪,要求监控者盯着各种仪表板界面,制定各种工作流程以及KPI考核监控人员。

4.人肉测试,要求监控人员每间隔几分钟人工操作一次,以确认系统正常工作;

5.万能的重启,定其重启所有的服务器。

关于监控运维系统

监控运维系统的目标:

监控的价值在于帮助企业在业务层面提供更多运维保障,进而帮助企业业务连续运转,主要监控的目标包含四种:

         

监控运维的常用方法:

     

传统监控常用方法如下:    

     

     

监控流程

以Zabbix为例,来了解整个监控流程:

Step 1:数据采集:通过SNMP、Agent、ICMP、SSH等对系统进行数据采集;

Step2:数据存储:存储在MySQL上,也可以存储在其他数据库服务;

Step3:数据分析:当我们事后需要复盘分析故障时,也可存储在其他数据库服务;

Step4:数据展示:Web界面展示

Step5:监控报警:电话报警、邮件报警、微信报警、短信报警等

Step6:报警处理:当接收到报警,根据保障的级别进行处理。

监控指标

同样以Zabbix为例,监控运维系统到底都在监控哪些维度的信息?

1.监控硬件:

可监控硬件,包括CPU温度、物理磁盘、虚拟磁盘、主板温度、磁盘阵列等,zabbix提供IPMI监控模板,Zabbix IPMI Interface 系统自带的IPMI模板只能监控风扇、电源和部分温度。

2.监控系统:

中小型企业基本都是Linux服务器,所以系统监控是基础,主要监控对象包括:

(1)CPU

CPU整体使用百分比;

用户态使用百分比;内核态使用百分比;每个CPU使用情况

(2)磁盘

磁盘读写吞吐;磁盘读写次数

(3)内存

内存使用量;内存剩余量

(4)网络

网卡出入带宽;网卡出入包量;TCP状态监控;进程端口监控

(5)进程

3.监控应用:

应用服务监控也是监控体系中比较重要的内容,如LVS、Haproxy、Docker、Nginx、PHP、MySQL等等,相关服务都需要被监控起来。

4.监控网络:

网络监控是构建监控平台必须考虑的,尤其是针对多个机房的场景,各个机房之间的网络状态,机房和全国各地的网络状态都是需要监控的对象。

5.监控日志:

通常情况下,随着系统的运行,操作系统会产生系统日志,应用程序会产生应用程序的访问日志、错误日志、运行日志、网络日志,可以使用ELK来进行日志监控,对于日志监控来说,最常见的需求是收集、存储、查询、展示。

6.监控API:

由于API变得越来越重要,很显然我们也需要这样的数据来分辨我们提供的API是否能够正常运作。监控API接口GET、POST、PUT、DELETE等等的请求,以可用性、正确性、响应时间为三大重要性能指标。

7.监控性能:

全面监控网页性能,DNS响应时间、HTTP建立连接时间、页面性能指数、响应时间、可用率、元素大小等zabbix提供URL监控:Zabbix Web监控。

8.监控业务:

没有业务指标监控的监控平台,不是一个完善的监控平台,通常在监控系统中,必须讲重要的业务指标进行监控,冰设置阈值进行告警通知。例如:某电商平台每分钟产生多少订单、每分钟注册多少用户、每天有多少推广活动等。

总结

锐捷乐享智能运维管理平台是一款实时检测业务系统运行状态,保障业务连续稳定运行的IT运维管理平台,支持全域资源的统一监控,从用户体验出发感知业务系统异常,及时准确的发现并处理各类故障。对IT资源进行全面、深度的健康检查,自动识别、分析、处理风险隐患,最终实现保障网络和业务持续的稳定运行。

任何需要,请联系我们

返回顶部

请选择服务项目
关闭咨询页
售前咨询 售前咨询
售前咨询
售后服务 售后服务
售后服务
意见反馈 意见反馈
意见反馈
更多联系方式
是否找到您想要的内容?
您遇到了什么问题?
找不到想要的信息
筛选功能不好用
加载速度太慢
页面体验差
提交
您是否找到了与产品相关的文档
筛选功能是否帮助您更快找到所需的文档?
有帮助
一般
没有帮助
没用过
请问您遇到了什么问题?
需要填写的内容太多
有些信息不懂怎么填
页面有问题/错误
其他
确定
这些客户案例是否对您有帮助?
非常有帮助
比较有帮助
没有帮助
请您对这个客户案例进行评价
兴趣度
相关性
可信度
确定
感谢您的反馈!
感谢您的反馈!