1、版权声明版权声明本白皮书版权属于紫金山实验室及其合作单位所有并受法律保护,任何个人或是组织在转载、摘编或以其他方式引用本白皮书中的文字、数据、图片或者观点时,应注明“来源来源:紫金山实验室等紫金山实验室等”。否则将可能违反中国有关知识产权的相关法律和法规,对此紫金山实验室有权追究侵权者的相关法律责任。主要编写单位:主要编写单位:紫金山实验室、北京邮电大学、华为技术有限公司、中兴通讯股份有限公司、中移(苏州)软件有限公司、中移(杭州)信息技术有限公司、天翼云科技有限公司、上海邮电设计咨询研究院有限公司、北京交通大学移动专用网络国家工程研究中心、浙江大华技术股份有限公司、科大讯飞股份有限公司、苏州
2、盛科通信股份有限公司主要编写人员主要编写人员(排名不分先后(排名不分先后):黄韬、汪硕、高新平、肖玉明、徐鹍、李振红、时定兵、赵芷晴、杨彩云、韩红平、黄文浩、袁辉、胡秀丽、郑晓龙、徐峰、龚翔宇、吴涛、符哲蔚、陆振善、张佳玮、谷志群、李和松、段威、陆诗莹、贾玉、赵怡、成伟、王俊杰、罗远、刘静、马玉寅、彭天皓、吕宵双、杨志逵、刘耀华、史银妹、刘文斌、王国栋、周春旭、张涛I前言当前,以生成式人工智能为代表的通用人工智能技术在全球范围内引起了广泛关注,并以前所未有的速度、广度与深度催动经济和社会发展,掀起了新一轮科技革命与产业变革。在人工智能产业发展过程中,智算网络发挥了基础性支撑作用。业界基于高性能
3、网络构建算力集群,从而突破单点算力的性能极限,实现智算中心内外的算力协同与数据交互,并进一步打破智算中心的烟囱式孤立局面,实现更大规模的算力互联,为 AI 技术发展与科技创新提供强有力的支撑。智算算力互联的实现依赖于一个能够支持高性能计算任务的网络环境,这要求智算网络必须具备超大带宽、超低时延、零丢包和稳定可靠的数据传输能力,以确保数据传输的及时性、完整性与准确性,从而满足智算业务对算力资源的按需取用与高效利用需求,并支持面向未来多样化智算应用场景提供定制化的网络服务。针对上述挑战,本白皮书首先系统性梳理了当前智算网络领域的政策背景、产业动态以及技术发展脉络,并深入探讨了未来智算产业对网络能力
4、的核心诉求,分析了高性能智算环境在网络带宽、时延、抖动、丢包等方面存在的挑战,由此引发对智算集群内与集群间核心支撑技术的讨论,涉及新型网络架构、超宽可编程转发、负载均衡、光电融合组网与路由、广域 RDMA 等关键技术。随后,结合智算网络产业的典型案例,阐释了上述关键技术在智算基建建设中的应用。最后针对智算网络提出了技术与产业发展建议,旨在为行业从业者、II决策者及研究者提供一定参考,以推动智算网络技术的创新与应用。III目录前言.I目录.III一、智算网络技术与产业发展概况.1(一)政策态势.1(二)产业形势.3(三)技术趋势.6二、智算产业对于网络的核心要求.11(一)网络带宽要求.11(二
5、)网络时延要求.11(三)网络抖动要求.12(四)网络丢包要求.13三、智算集群内网络关键技术.15(一)新型网络架构.15(二)超宽可编程转发技术.22(三)无损网络技术.26(四)网络负载均衡技术.40(五)端网协同的 NetMind 跨层通信架构.46四、智算集群间网络关键技术.50(一)光电融合组网与路由技术.50(二)广域拥塞控制技术.53(三)广域 RDMA 技术.57IV(四)新型低损光纤技术.60五、智算网络产业典型案例.64(一)天翼云昇腾智算项目.64(二)紫金山新型无损数据中心项目.67六、智算网络技术与产业发展建议.71七、总结与展望.73附录 A:术语与缩略语.75参
6、考文献.771一、智算网络技术与产业发展概况一、智算网络技术与产业发展概况近年来,全球对智能算力的需求急剧增长,推动智算服务进入新一轮爆发期。据统计,2022 年全球智能算力规模已达 142 EFLOPS,并预计 2030 年将达到 16 ZFLOPS,年均增速超 80%,这种增速奠定了智能算力将成为全球算力规模增长主要驱动力的地位。在此背景下,本章将围绕智算政策态势、产业形式与技术趋势等方面展开深入分析。(一)政策态势(一)政策态势随着全球科技革命与产业变革的加速,我国高度重视数字基础设施的建设,尤其在智能计算领域。国家通过“十四五”国家信息化规划明确了未来几年加强数字基础设施的基调,特别是