背景
数据中心IT运维环境的变化
在过去几年中,企业迅速采用了虚拟化基础设施及云服务。以多实例集群分布式运行及弹性扩容为特性的应用分布式架构使得某个具体硬件设备或中间件、数据库实例是否平稳运行已经不再是IT运维人员的核心关注点。
运维人员职责变化及挑战
万事APP化的时代,应用是否能够稳定运行、及时响应成为数据中心IT运维人员最核心的考核目标。然而数据中心运行在虚拟化基础资源上的应用快速扩张化,应用中间件多样化,需求变动频繁化使得传统IT运维分工各自为政,各搞一摊的方式越来越难保障应用的高可用、高性能、安全和稳定。
什么是应用为核心的IT运维
应用的用户体验起伏变化与背后哪些软件组件、操作系统、IT基础设施及外部服务相关,又有哪些指标、配置影响会影响应用性能,是所有IT运维团队成员在日常巡检、故障处理、事后优化过程中需要了解的。这些关联关系是故障预防、快速恢复的关键、也是资源合理利用的有力依据。
以应用为核心的IT运维是将支撑应用的IT资源、软件组件,以及应用依赖的外部服务全都通过IT应用建模以结构化的方式动态组织在应用视图下。IT运维团队根据业务需求及应用发布计划从网络资源、系统资源池中进行资源的申请、配置、部署并反映到该视图下。在运维阶段依据该视图下应用的用户体验指标及背后的资源依赖支撑关系进行引流、故障处置、调优等。
工作原理
IT应用建模以OBASHI国际标准,构建以应用为核心信息资产配置模型。模型分两类关系:一类是软件组件之间的横向关系“数据交互关系“,是因为组织的业务流运作,而衍生的业务数据流,以及相应产生在各个应用、服务之间的数据访问,数据交互关系,这个视角是理解信息系统配置构成的主线。
另一类是软件和硬件之间的纵向“依存性关系”,也就是代表了每一个应用系统自身能够存活的纵向依存关系。也就是,每一个应用系统与其支撑软件及硬件之间的依存关系。
要构建“数据交互关系”,需要利用进程间通信、网络镜像、主机网络流量、APM Tracing等技术;而要构建“依存性关系”,需要利用SNMP、IPMI、LLDP、SSH、云API、HTTP API等技术。上述技术采集回来的数据依据CMDB模型模版,自动发现组件、自动发现关系完成IT应用模型构建。各种采集技术到的指标、日志、配置、Tracing等数据都依据模型映射到响应资源中,形成能随时反映应用状态的应用拓扑视图。
技术优势
相比较于单纯NPMD只能发现跨设备间的通信关系、分析层面局限在网络流量上来说,应用为核心的建模方式利用多种技术力求自动化构建完整的IT应用模型,使得运维人员从全方位的角度理解应用的结构,从黑盒白盒多种指标体系洞见应用的各个组成部分的运行状态。
相比较与APM产品强调软件间的关系来说,基于应用为核心的IT运维向下打通了基础资源特别是硬件设备层的依存关系,帮助应用运维、系统运维、网络运维构建统一视图,使得沟通更高效,管理有据可循。
总结
对于数据中心IT运维团队来说,基础资源运维人员,网络运维人员和应用运维人员各自使用自己的管理工具管理自己内的资产已经无法适应核心的运维目标了。必须利用综合技术手段统一构建以应用为核心的资源配置、监控视图进行更为高效的运维管理。
相关推荐:
更多技术博文
-
全调度以太网(GSE),中国智算网络新标准
GSE网络作为一种全调度以太网技术,专为大规模AI训练集群设计,通过按需调度实现无损性能,提供灵活快速的部署方案,构建开放生态,显著提升智算效率和运维体验。
-
#知识百科
-
-
以太和PON,谁能更好地支撑办公室横向流量业务?
了解以太彩光与PON的区别,解析办公资源共享难题,锐捷极简以太彩光方案助您高效适配办公网,共享打印无压力!
-
#交换机
-
-
场景无线 驱动高效办公!锐捷新一代企业无线办公解决方案全新发布!
面对企业数智化转型中的无线办公网络挑战,锐捷新一代企业无线办公解决方案通过全场景AP、智能调度与云端智能运维等技术,实现网络性能、用户体验与运维效率的全面提升。
-
#无线网
-
#办公网
-
-
以太彩光和PON,运维管理谁技高一筹?
锐捷网络提供极简以太全光方案,简化配置流程,降低学习成本,让全光网络升级更平滑。
-
#交换机
-