1、GOP S 全 球 运 维 大 会 2019上 海 站GOP S 全 球 运 维 大 会 2019上 海 站云之巢,莫问运维路云之巢,莫问运维路浙江移动基础设施浙江移动基础设施AIOps实践及探索实践及探索有人的地方,就有江湖。有江湖的地方,就有纷争。于是,便诞生了武功。这是一个互联网的江湖斗转星移,日月流梭,转眼来到了二十一世纪.武功化身为技术。基础运维则是整个互联网的根本,支撑着江湖的潮起潮涌GOP S 全 球 运 维 大 会 2019上 海 站目录运营商基础设施运维现状1当基础设施运维遇到AIOps2智慧机房实践案例分享3运营商领域AIOps实施的困难及思考4“莫问”AI使能平台介绍5G
2、OP S 全 球 运 维 大 会 2019上 海 站IBM云的信用度受到影响,客户用户访问其Bluemix云基础框架的一个管理网站服务中断了数小时。GitLab极受欢迎的线上代码库GitL遭遇了18小时的服务中断,最终无法完全修复。因服务器故障,今日头条全站及头条号后台全部无法访问微软Azure公有云出现超过8小时存储可用性问题,导致用户无法配置新的存储空间或访问本地现有资源。新浪微博的服务器失去响应,宕机时间接近1小时。某晚间,百度出现大规模宕机事件,故障状态大概持续了半个小时。运运营商基础设施运维现状营商基础设施运维现状互联网纷争互联网纷争网络故障频发网络故障频发GOP S 全 球 运 维
3、 大 会 2019上 海 站更新迭代快建设环节多协作部门多涉及平台多自动化水平弱自2016年起,集团组织三轮NFV试点测试、两轮Novonet试点采购物流部、工程建设部、规划技术部、网络部需求分析、规划开发、业务测试、业务加载、精细运营、下线相关平台脉络复杂,纵横交错人工录入手工配置邮件沟通运运营商基础设施运维现状营商基础设施运维现状基础运维门派解析基础运维门派解析网络故障频发入门庞杂繁琐GOP S 全 球 运 维 大 会 2019上 海 站厂家二网管/控制器厂商依赖厂家一网管/控制器软硬件耦合运运营商基础设施运维现状营商基础设施运维现状基础运维门派解析基础运维门派解析网络故障频发关系错综复杂
4、GOP S 全 球 运 维 大 会 2019上 海 站模式陈旧基础设施运维欠缺自动化、智能化管理能力来访接人登记耗时长,线下操作不够便携,白卡、介绍信易丢失、损坏等。工程进度难管控作业时段不可控,脱离内部人员管控工程时间不确定,内部人员难以掌控工程进度、结果,延长工程时间申请不够正式,难追溯。审核粗放审核操作共用帐号、进出操作共用白卡,风险大进出权限非本人审批,存在引发核心机房故障,用户及重要设备数据泄露的风险。运运营商基础设施运维现状营商基础设施运维现状基础运维门派解析基础运维门派解析网络故障频发管理粗放陈旧GOP S 全 球 运 维 大 会 2019上 海 站l腾讯天津数据中心pue1.3
5、 l阿里巴巴张北数据中心pue=1.2 以PUE=2.0计算lYahoo Lockport pue=1.08 lFacebook Oregon Prineville pue=1.07 全球数据中心耗电量数据来源:2018全球电力报告,Forbes10年数据中心运营成本构成电费占70%,制冷占总能耗30%+注:PUE=数据中心总设备能耗/IT设备能耗运运营商基础设施运维现状营商基础设施运维现状基础运维门派解析基础运维门派解析网络故障频发修炼消耗巨大GOP S 全 球 运 维 大 会 2019上 海 站目录运营商基础设施运维现状1当基础设施运维遇到AIOps2智慧机房实践案例分享3运营商领域AIO
6、ps实施的困难及思考4“莫问”AI使能平台介绍5GOP S 全 球 运 维 大 会 2019上 海 站l AIOps智能运维=机器学习+自动化运维主要是利用单独的脚本、或者一些简单的工具,没有较为完善的系统和运维理念,流程在于摸索阶段。人工运维开发功能较为完善的工具,并经过不断改进,工具越来越成熟,业内就IT研发和运维逐 步 达 成 共 识,Devops理念开始提出。工具运维Devops工具链非常成熟,SRE、Chatops等高级形式出现,运维流程和运维措施方面实现完全自动化。DevOps主要强调运维类人化,机器的自我学习、自行分析决策,自动化去执行脚本。AIOps当基当基础设施运维遇到础设施