当前位置:首页 > 报告详情

1-王峰_系统智能运维实践.pdf

上传人: 张** 编号:169066 2024-07-06 27页 6.65MB

1、D Da at ta aF Fu un nC Co on n#2 20 02 24 4系系统统智智能能运运维维实实践践王峰字节跳动D a t a F u n 上海站嘉宾专享自我介绍王王峰峰 王王峰峰字字节节系系统统智智能能运运维维架架构构师师当前在系统部负责系统技术稳定性、成本优化平台产品、智能运维技术应用等相关工作。一直专注稳定性方向,6年智能运维经验,19年运维平台架构经验,15年DevOps项目经验。微微信信:w wf f_ _a ai io op ps sD a t a F u n 上海站嘉宾专享C Co on nt te en nt ts s目目录录智能运维前沿洞察系统智能运维规划大

2、模型Agent实践AIOPS平台助力提效D a t a F u n 上海站嘉宾专享智智能能运运维维前前沿沿洞洞察察D a t a F u n 上海站嘉宾专享业业界界前前沿沿趋趋势势2021泡沫破裂谷底期2021T To op p5 5优优先先应应用用场场景景智能告警根因分析异常检测容量优化故障自愈A AI IO Op ps s+L LL LMMA AI IO Op ps s G Ge en ne er ra at ti iv ve e A AI I MMo od de el lO Op ps s A Au ut to omma at ti ic c S Sy ys st te emmD a t

3、 a F u n 上海站嘉宾专享软软件件系系统统终终极极目目标标Prof.Joseph Sifakis2007年图灵奖得主随着AI技术的发展和大模型技术的应用,软件系统离“自动驾驶”的目标越来越近。Joseph在2018年的一篇papaer里面详细描述了自治系统的体系特征,给我们软件系统如何实现系统自治一个很好的启发和指导。无论是自动驾驶还是智能运维,最终的理想是实现一个自治的系统。感知决策行动经验知识https:/arxiv.org/ftp/arxiv/papers/1811/1811.10277.pdfD a t a F u n 上海站嘉宾专享L L5 5-智智能能运运维维:解解放放体体力

4、力与与脑脑力力脚脚本本化化运运维维工工具具化化运运维维执行:人+脚本 决策:人专专家家经经验验运运维维执行:人+系统(20%)决策:人使用多个独立工具大部分工作工具化/流程化执行:人+系统(80%)决策:人+系统(20%)运维工具体系基本建设完成运维数据体系建设完成运运维维开开发发融融合合运运维维执行:人+系统(95%)决策:人+系统(80%)主要运维场景实现流程化免干预数数据据化化运运维维执行:系统(100%)决策:人+系统(95%)AI分析与决策无人值守大数据平台 自动化工具链系统数字化可视化智智能能运运维维脚本编辑,人工执行工工具具化化运运维维高高度度自自动动化化+单单点点智智能能化化高

5、高度度自自动动化化+串串联联智智能能化化基基于于已已有有的的经经验验知知识识可可以以在在不不同同场场景景下下自自主主决决策策处处置置L L3 3 -D De ev vO Op ps sL L4 4 -D Da at ta aO Op ps sL L5 5 -A AI IO OP PS SL L1 1 -S Sc cr ri ip pt tO Op ps sL L2 2 -T To oo ol ls sO Op ps s大大模模型型的的出出现现加加速速了了实实现现终终极极L L5 5智智能能运运维维的的步步伐伐D a t a F u n 上海站嘉宾专享系系统统智智能能运运维维规规划划D a t

6、a F u n 上海站嘉宾专享基基础础设设施施运运维维目目标标:快快速速交交付付与与稳稳定定性性运运维维的的对对象象不不是是可可批批量量交交付付的的成成熟熟产产品品,而而是是微微服服务务架架构构下下的的海海量量组组件件和和节节点点。百百级级+服服务务万万级级+组组件件百百万万级级+节节点点VMVMVMVMVMVMVMVM大应用系统百百万万服服务务器器规规模模持持续续版版本本迭迭代代传统软件开发周期以年计,二十分钟煮一锅饭,熟透。DevOps模式发布周期以天计。五分钟煮一碗饭,偏硬。发发布布周周期期变变短短的的代代价价是是每每个个版版本本都都没没有有经经过过充充分分的的现现网网验验证证。高高稳稳

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了字节跳动系统智能运维架构师王峰在2024年DataFunCon上的演讲内容。王峰介绍了智能运维的发展历程,从传统的脚本化运维到工具化、自动化运维,再到如今的大模型AIOPS,运维的智能化程度越来越高。他指出,随着AI技术和大模型技术的应用,软件系统正逐渐实现“自动驾驶”的目标,运维领域也趋向于实现系统自治。 王峰提到,当前的运维对象不再是成熟的产品,而是微服务架构下的海量组件和节点。面对这样的挑战,运维平台需要实现快速交付与稳定性,同时,由于发布周期缩短,每个版本都没有经过充分的现网验证,这就要求运维人员具备全栈运维技能,以保证系统整体可用性。 在演讲中,王峰还分享了AIOPS平台如何助力提效,包括多场景落地的核心TOP公司产品体系、领域知识库、基础算法库、实时数据和离线数据训练服务等。他还提到,通过大模型Agent实践,可以将故障排查效果提升,实现新算法模型上线周期从月提升到周,多个组织可以共建共享算法市场等。 总的来说,王峰的演讲展示了智能运维的发展趋势和字节跳动在智能运维领域的实践成果。
"大模型如何推进智能运维实践?" "AIOPS平台如何实现智能故障诊断?" "如何通过数据智能实现系统自治?"
客服
商务合作
小程序
服务号
折叠