1、可信算力服务 算力调度及算力交易标准解读中国信通院云大所云计算部 王雨萌Part1算力调度标准介绍全球数据储量持续增加,数据计算需求迅猛增长,算力云服务进入快速发展阶段近些年国家在数字经济领域快速发展,云计算、大数据等数字化技术被赋予了推动产业发展的重要使命,随之而来的是各行各业产生的巨量业务数据。从海量数据当中挖掘出对行业发展有价值的信息,成为推动产业数字化转型的关键所在。结合有关政策计划、实施方案的发布,算力云服务开始进入高速发展阶段。p“十四五”数字经济发展规划推进云网协同发展,提升数据中心跨网络、跨地域数据交互能力,加强面向特定场景的边缘计算能力,强化算力统筹和智能调度。0102030
2、4050607080储量:ZB2017-20222017-2022年全球大数据储量预测趋势图年全球大数据储量预测趋势图201720172018201820192019202020202021202120222022数据来源:国际数据公司、中商产业研究院整理p 全国首个算力互联互通验证平台发布北京算力互联互通平台将升级全国算力服务提供模式,激发出新型算力服务形态,引领我国算力调度进入新纪元,创造符合我国算力服务发展的崭新路径。算力云服务发展过程中,供需不均衡问题逐渐呈现随着算力云服务的快速发展,挑战与问题也逐渐呈现,其中算力资源供给过程中,供需不均衡的矛盾凸显。一方面是大量业务需要更多的有保证的
3、算力资源;另一方面,由于传递路径、算力调度、资源度量等问题未得到有效解决,大量算力又被空闲下来。2022 年我国算力总规模已达180EFlops,位居全球第二,但人均算力水平较低,可见算力在传输赋能方面仍存在问题 据统计,全球服务器的平均每日利用率通常最高仅为6%,可见资源消耗存在巨大的“浪费”;算力中心单打独斗分散运营,需投入人力物力自行发展用户,容易出现算力中心间的负载不均衡,导致算力碎片化和算力资源浪费提供方 算力资源需求方从大型企业向中小型企业、个人用户拓展;各算力平台的硬件配置、软件资源等存在差异,也给用户带来诸多不便;算力调度技术能力亟待规范,助力提升算力资源利用效率当前产业各界正
4、积极探索算力调度管理在特定场景下的应用方式,但有关算力调度中需要涉及的环节、能力、定义、方式等尚不清晰。明确调度过程中各能力层的关键技术及基本要求,将能够帮助资源提供方及使用方高效管理和利用资源,加强服务的快速部署。算力调度管理在各行业实践落地现状 当前各界正积极探索算力调度管理在特定场景下的应用,但全局调度能力较弱,难以满足数据对算力随需处理的需求。在云服务中,算力作为一种IaaS资源被使用与管理,单一的云平台调度范围有限,大规模的分布式云算力管理调度将导致云服务质量下降。算力调度算力调度中心中心资源需求方资源需求方资源提供方资源提供方资源匹配流程资源变更需求变更资源接入需求匹配 通过规范算
5、力调度中的各环节,使算力资源、应用等注册、使用场景实现规范化管理;根据需求、场景的变更进行灵活调度,实现业务需求及算力资源的最佳调配,避免资源的闲置或紧缺情况出现,实现资源利用效率最大化算力调度标准制定的意义面向资源的算力调度技术能力要求标准框架有关算力调度技术能力要求标准分为基础能力、编排能力、控制与转发能力和安全性四部分进行描述。算力管理能力:主要对算力调度过程中涉及的任务管理、资源管理、决策能力与可视化能力进行标准化工作,以便明确算力提供方的资源及需求方的任务需求,确保任务调度、资源分配的合理性以及调度过程中的平稳、可控 控制与转发能力:主要对算力调度过程中具体的任务、网络控制与转发环节
6、涉及的技术等进行标准化工作,在调度过程中,控制与转发层需要具备更加灵活的功能,便于更快地调度任务,进而实现资源的敏捷、按需调度 基础能力:主要对算力调度中涉及到的基础设施能力进行标准化工作,以便保障在调度过程中基础设施的平稳运行,为调度提供稳健、可用的底层基础保障 安全性:主要对调度过程中涉及到的外部安全、内部安全内容进行标准化工作,主要包括对于资源、身份的认证、鉴权,以及网络安全的安全组能力保障等面向资源的算力调度技术能力要求标准内容算力调度相关工作后续将从标准研讨、建设咨询、专项计划、业内交流四部分进行拓展,目前面向资源的算力调度技术能力要求已定稿,