1、华为混合云现代化运维体系核心能力及最佳实践华为云计算技术有限公司李金锋 徐 强 康 铭张进坡 王 立 支新辉 张 凯 张志炯 郭晓征路军科毛明强 耿丽丽 李 恒 谯业石 夏昌琳 李姝漫楚昌俊 李 彬 吴佳朋 王 毅编制委员会P R E P A R A T I O N C O M M I T T E E主 编 单 位编 委 顾 问编 审 组 成 员主 编 人 员(排名不分先后)政企而言,IT架构建设作为组织战略目标实现和业务创新发展 的核心引擎,是一项战略性、系统性工程,然而IT架构的建设往往不会一蹴而就,而是会随着技术革新逐渐引入新的平台、新的产品和技术。因此,政企IT架构的发展演进进程中普遍
2、存在不同架构、不同代际、不同厂商平台并存的情况。运维人员需要全面了解不同平台的部署、升级、维护等操作,这不仅增加了运维人员的工作难度,自动化运维工具的推行也变得举步维艰,使得运维工作变得极为复杂和繁琐。随着政企数智化进程的加速,混合云作为一种灵活、可扩展且安全的云平台解决方案,已逐渐成为政企用户数智化转型的首选IT架构。然而,随着云上业务需求不断增加,云服务资源类型日益丰富,传统的IT运维体系已经难以应对混合云环境下复杂的技术架构和多变的业务需求。为了应对这些挑战,对混合云运维系统架构进行现代化升级势在必行。华为混合云基于自身云平台运维经验,以及服务数千家政企客户的数字化转型实践,持续积累面向
3、现代化的核心运维能力,并沉淀构筑了一套全面构建稳定可靠的现代化运维能力的路径和方法。通过运维现代化核心能力,期望能够帮助政企客户从传统架构运维到云化架构运维转型,以数字化和智能化为驱动,构筑混合云现代化运维新体验。其中,运维体系作为混合云运维能力建设的基础性、系统性工程,面临着对技术、组织、制度进行系统性重构的巨大挑战,其核心在于通过数智化的运维体系实现“效益”、“效能”、“效率”、“效果”的最大化。效益:指经济效益,包括可盈利或其他与盈利相关的要素。运维要以效益为目标,对准业务价值匹配业务发展和架构演进,实施运维改进和提升。对序言P R E A M B L E李金锋华为混合云副总裁,SRE部
4、部长效能:指服务能力,是支撑运维活动顺利进行并达到预期效果和效率的保障。在运维活动中不断提升服务能力,包括对新技术的掌握、新工具的使用等,以及时应对新技术架构的挑战。效率:指在运维活动中,得到的结果与所使用资源之间的关系。在运维工作中,要不断提升作业效率,用更少的资源交付更好的结果。效果:指运维活动达成的结果,衡量是否达到需求或者预期的目标。运维要达到流程、服务或活动的目标,并有切实的成效。围绕这“四效”目标,政企客户需要围绕运维制度规范、运维组织、运维业务、运维知识库、运维平台和运维安全这六大维度进行核心能力的演进设计与持续构建,以不断提高云平台运维管理水平。本文将对如上六大核心能力领域的建
5、设路径和方法进行详细阐述,并通过某集团客户的实际建设案例向读者提供可落地的最佳实践参考,期望对广大混合云用户面向现代化的运维能力提升带来一些启发和思考。目录CONTENTS混合云现代化运维体系参考架构11-152.1 混合云现代化运维体系建设背景2.2 混合云现代化运维体系建设思路2.3 混合云现代化运维体系参考架构2混合云现代化运维体系核心能力16-393.1 运维规范与流程设计3.2 运维组织设计3.3 运维业务设计3.4 运维知识库设计3.5 运维平台设计3.6 运维安全设计3混合云现代化运维体系落地实践40-544.1 建设背景4.2 运维痛点分析4.3 运维体系规划设计4.4 建设成
6、效4混合云现代化运维理念概述08-101混合云现代化运维理念概述华为基于三千多家混合云用户的运维场景和诉求,结合多年来累积的政企客户运维服务实践,提出了混合云现代化运维顶层设计参考架构,将混合云运维划分为四大领域,分别为“运维体系现代化”、“平台运维现代化”、“应用运维现代化”和“安全运维现代化”四个部分。运维体系现代化运维体系现代化定义了在混合云进入深度用云阶段,应该建设什么样的运维体系适配业务的发展,包含运维流程规范、运维组织、运维业务、运维知识库、运维平台、运维安全等多个方面,帮助政企实现从当前运维体系向现代化运维体系的升级。平台运维现代化云平台技术栈的快速增长给云平台运维带来了巨大挑战