1、云智算技术白皮书(2025)2前言前言云计算经历了资源云化(2006 年)、云原生化(2013 年)、算力泛在化(2020 年)等阶段,随着人工智能与算力网络深度融合,已迈入智能化的新阶段,向全栈智能、开放融合的云智算升级。中国移动通过打造云智算技术体系,升级 AI IaaS、AI PaaS、MaaS、AI SaaS 四层架构,推动算网大脑向算网智脑跃迁,构建全链路可控用智安全,筑牢“供给者、汇聚者、运营者”定位。作为“供给者”,融合中国移动算力、数据、算法优势,提供全方位能力支持;作为“汇聚者”,打造 AI 生态平台,广泛汇聚多类型模型、多领域能力、多场景智能体;作为“运营者”,以算网大脑为
2、核心提供高效运营服务,深化 AI 赋能。在此基础上,全面激活智能算力与应用普惠新势能。本白皮书详细阐述了云智算的发展背景、内涵,深入介绍云智算的关键技术方向,为云智算的发展奠定基础。云智算的发展成熟需要产学研用各方凝心聚力,实现从基础设施到运营服务的全面升级,中国移动希望同业界合作伙伴一道,共同推动云智算技术、产业、应用和生态成熟,助力千行百业注智赋能。3目录目录云智算技术白皮书.1前言.21.从云计算到云智算.61.1 云计算发展现状及面临挑战.61.2 云智算的内涵.61.3 云智算体系架构.62.云智算关键技术方向.72.1 计算技术.72.1.1 算力芯片.72.1.2 智算超节点.7
3、2.1.3 算力原生.82.2 存储技术.82.2.1 智算文件存储.92.2.2 训推多级缓存.92.3 网络技术.102.3.1 卡间互联.102.3.2 机间互联.112.4 算网一体技术.122.4.1 算力路由.122.4.2 在网计算.122.5 AI 开发平台技术.132.5.1 数据处理.132.5.2 训练框架.142.5.2.1 训练并行优化.142.5.2.2 低精度训练.142.5.2.3 故障容错.152.5.2.4 异构混训.152.5.3 推理框架.162.5.3.1 推理并行效能优化.1642.5.3.2 推理网关优化.162.5.3.3 融合算子监控.172.
4、5.4 智能体生成.172.5.4.1 检索增强生成.172.5.4.2 自主规划.182.5.5 AI 开发工具.182.5.5.1 向量数据库.182.5.5.2 多模数据库.192.5.5.3 低代码模型开发.192.6 模型服务.192.6.1 模型汇聚.202.6.2 模型智能体融合.202.7 算网大脑.202.7.1 资源编排调度.202.7.2 任务式编排调度.212.7.3 智能体编排调度.222.8 安全可信.222.8.1 计算环境可信.232.8.2 数据安全可用.232.8.3 智算服务可靠.242.9 绿色节能.242.9.1 能效管理和提升.242.9.2 数据中
5、心热管理.252.9.3 算电协同和余热回收.252.10 未来技术展望.263.总结倡议.29附录.305缩略语缩略语缩略语英文全称中文解释1IaaSInfrastructure as a Service基础设施即服务2PaaSPlatform as a Service平台即服务3MaaSModel as a Service模型即服务4SaaSSoftware as a Service软件即服务5AIArtificial Intelligence人工智能6DPUData Processing Unit数据处理单元7COCACompute On Chip Architecture片上计算架构8
6、OSOperation System操作系统9RDMARemote Direct Memory Access远程直接内存访问10RoCERDMA over Converged Ethernet基于以太网的 RDMA11SIMTSingle Instruction Multiple Threads单指令多线程12RTTRound-Trip Time往返时延13CXLCompute Express Link高速串行协议14SDKSoftware Development Kit软件开发工具包15OISAOmni-directional Intelligent SensingExpress Archi