当前位置:首页 > 报告详情

马旭华-大规模节点故障预测技术实践-v2.pdf

上传人: 2*** 编号:153967 2024-02-05 24页 2.23MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大规模云计算下节点故障预测的AIops技术实践。首先,介绍了弹性计算产品ECS的稳定性目标,即提供小型机级别的稳定性。然后,阐述了大规模节点故障预测的背景和问题定义,包括宕机、夯机、抖动等现象及其影响。接着,分析了AIops工业落地需要解决的问题,包括数据质量、数据覆盖率、业务场景覆盖面、算法架构和算法工程系统等。随后,介绍了数据采集系统和节点故障预测算法实践,包括自研算法架构、模型框架和实时故障预测实践。最后,进行了总结和展望,提出了完整、自闭环的大规模云计算节点故障预测技术体系AIops算法体系优化、软硬协同的故障预测技术等展望。
"大规模云计算如何实现节点故障预测?" "AIops技术在云计算中的实践应用有哪些?" "如何构建完整自闭环的大规模云计算节点故障预测体系?"
客服
商务合作
小程序
服务号
折叠