1、中国联通新一代 AI 计算基础设施白皮书中国联通新一代 AI 计算基础设施白皮书中国联通研究院2023 年 6 月中国联通新一代 AI 计算基础设施白皮书版权声明版权声明本报告版权属于中国联合网络通信有限公司研究院,并受法律保护。转载、摘编或利用其他方式使用本报告文字或者观点的,应注明“来源:中国联通研究院”。违反上述声明者,本院将追究其相关法律责任。中国联通新一代 AI 计算基础设施白皮书目录目录一、AI 计算基础设施的发展简介.3(一)AI 计算基础设施是人工智能快速发展的实现基础.3(二)人工智能产业对 AI 计算基础设施的算力需求激增.4(三)国家产业政策积极鼓励发展新型 AI 计算基
2、础设施.5二、运营商应积极布局新一代 AI 计算基础设施.5(一)运营商建设新型 AI 计算基础设施的需求.5(二)新一代 AI 计算基础设施的功能架构简介.6三、新一代 AI 计算基础设施发展的关键技术突破点.9(一)高性能计算能力.91.处理器性能.92.并行协同策略.103.分布式通信.11(二)异构并行计算能力.13(三)安全可信能力.14(四)资源弹性调度能力.16(五)绿色低碳计算能力.18四、AI 计算基础设施商业模式简析.18五、展望未来.19参考文献.21缩略语.23中国联通新一代 AI 计算基础设施白皮书-1-前 言人工智能是当今世界发展的重要领域之一,对推动人类科技经济发
3、展起着加速作用。人工智能产业化落地也是推动我国战略新兴产业实现融合集成、促进我国科技高水平自立自强、提振数字经济高质量发展的重要推动力。随着新技术的不断演进,人工智能发展呈现出应用场景多元化拓展、数据体量爆发式增长、算法模型参数量指数级增加的发展态势,这对支持大规模 AI 计算的基础设施提出更高的性能要求。高性能的 AI 计算基础设施应支持大规模、多任务的算法模型训练与推理部署,满足高并发、高弹性、高精度的计算需求;具备兼容异构底层硬件的生态对接能力以实现上层应用和底层硬件的解耦;还需提供安全可信的计算环境以保障数据隐私;并且能够合理地分配计算资源以实现绿色低碳目标。中国联通作为数字信息基础设
4、施运营服务国家队,携手产业链凝聚共识,突破 AI 计算基础设施的发展瓶颈,为 AI 服务于千行百业提供灵活高效的计算基座发布此中国联通新一代 AI 计算基础设施白皮书。白皮书分析了当前 AI 计算基础设施的发展趋势以及规模化部署面临的挑战,系统性地介绍了 AI 计算基础设施的发展背景、总体架构、关键技术、商业模式和未来展望,呼吁产业链携手共建标准化的、开放的 AI 算力生态,加快输出具有中国经验的标准化体系。中国联通新一代 AI 计算基础设施白皮书-2-编写组成员编写组成员(排名不分先后):叶晓煜、郭熹、程新洲、贺鸣、马瑞涛、王鑫、李贝、徐乐西、赵慧英、谢志普、秦守浩中国联通新一代 AI 计算
5、基础设施白皮书-3-一、AI 计算基础设施的发展简介一、AI 计算基础设施的发展简介(一)(一)AI 计算基础设施是人工智能快速发展的实现基础计算基础设施是人工智能快速发展的实现基础人工智能(Artificial Intelligence)起源于 20 世纪五六十年代,历经符号主义、连接主义和行为主义三次浪潮的相互交织发展,到如今作为一项新兴的通用技术,正推动着社会生活与各行各业的巨变。数据、算力、算法是人工智能发展的三要素,也被誉为数字经济时代发展的三驾马车。其中,数据是生产资料,海量优质数据是驱动算法持续演进的基础养料;算法是生产关系,是处理数据信息的规则与方式;算力是生产力,体现为数据处
6、理与算法训练的速度与规模1。作为人工智能三大基础要素之一,算力是决定 AI 产业变革的关键承载基础。回顾人工智能的演进历程,就曾多次遇到因基础设施运算能力不足而无法突破技术瓶颈的案例,例如深度学习早在上世纪80 年代就已被人工智能专家提出,由于训练深度学习模型需要循环迭代上千次,当时的计算机的运算性能不足以支撑上千次的迭代,导致深度学习模型的发展经历数年寒冬。直到 21 世纪高性能计算硬件的出现,加速了人工智能的训练迭代速度,使得大规模的数据训练效率大大提升,才极大地促进了人工智能的快速发展。现阶段 AI 基础设施的概念已不仅仅是承载计算的硬件设备,其范围已经扩展到高速互联网络、资源管理与调度