1、网络之辩,英伟达Blackwell背后的光电演绎证券分析师:李国盛 A0230521080003 杨海晏 A0230518070003 黄忠煌 A0230519110001林起贤 A0230519060002 刘洋 A0230513050006 联系人:李国盛 2024.3.30GenAI系列之342投资案件投资案件结论AI底层硬件向“大系统”演进。市场较多讨论英伟达GB200 NVL系统的通信需求,光与铜“孰轻孰重”;我们认为光电混合是当前重要架构,未来更高速的光网络和芯片层面的光互联是长期方向。基于云厂商视角,我们预计GB200 NVL系统是AI训练+推理在云端的较佳选择。而在英伟达B系列
2、芯片更新的节点上,我们预计后续AI芯片迭代出货,对应的800G/1.6T光模块/光器件需求增长,硅光、液冷产业链投资机会也随之增加,看好海外大厂的高速网络需求的持续性。原因及逻辑1)英伟达的GB200 NVL72方案将72 GPU高密度配置在一个机柜中,用于大模型训推,其中柜内组网以电气信号背板和铜线的NVLink网络为主,而机柜外扩容组网尤其千至万卡互联则需要2-3层交换机网络和光通信方案。前者是芯片互联增量,后者架构延续但整体升级。2)整体看,单一介质网络连接的性能,最大传输距离与最高带宽成反比,且综合考虑成本,同时考虑工程可行性。光电混合是当前出于成本考虑的重要架构,光网络和芯片层面的光
3、互联是长期方向。3)硅光的演进方向明确。芯片算力性能暴增+训练/推理的参数需求,网络、访存性能亟需同步提升。电口瓶颈已至,芯片-板卡-设备间高速互联,光电子几乎是迭代唯一出路。当前放量临近、格局逐步明晰。4)AI硬件高密度、高功耗的路径下,液冷方案的渗透空间巨大。zVnUnVeWhUiYjY8O9R8OnPoOpNnReRnNmQjMnNnP9PoPnNxNmMpQxNtPoR3有别于大众的认识市场担心英伟达GB200系统为代表的AI硬件演进,光通信需求降低。我们从GB200 NVL72系统的拆解与理想化测算、光铜两种方案的应用场景、硅光产业的发展节奏等角度出发,认为光电混合是当前重要架构,未
4、来更高速的光网络和芯片层面的光互联是长期方向。市场担心AI从训练到推理的过程,对硬件的需求降低。而AI大模型参数量的增速显著大于GPU内存与算力增速,高集成度+大内存+多GPU的系统更适配大模型训推,我们认为不管是800G/1.6T光模块/光器件需求,还是硅光、液冷的投资机会,均是后续重要的产业增量,看好高速网络等硬件需求的持续性。相关标的:聚焦AI算力网络产业链光通信之中际旭创、新易盛、天孚通信、华工科技、光迅科技、源杰科技等。算力设备之紫光股份、锐捷网络、中兴通讯、烽火通信以及盛科通信等。液冷与IDC之英维克、飞荣达、润泽科技等。风险提示:1)芯片与系统的技术演进速度几乎是历史最快,同时也
5、意味着演进方向可能多元化,科技大厂定制芯片的需求也说明了这一点。不同的系统架构和网络实践,可能会影响网络器件、设备等的长期需求。2)大模型算法的发展方向,例如参数量的变化、模型设计的变化等,也直接影响了底层的硬件架构设计,可能造成硬件需求的波动。投资案件投资案件主要内容主要内容1.Blackwell:英伟达新架构,变与不变2.高速网络:量化测算,迭代提速3.光通信:NVLink启示,硅光未来4.液冷:技术奇点,算力同行5.结论、相关标的与风险提示451.Blackwell1.Blackwell:英伟达新架构,变与不变:英伟达新架构,变与不变历史对比大表时间2010201220142016中文名
6、费米开普勒麦克斯韦帕斯卡英文名FermiKeplerMaxwellPascal核心参数512 Cuda Cores每SMX192FP32+64 FP64每SM 128 Cuda Cores+32 LD/ST+32 SFU 每SM 64 Cuda Cores+32DP16 SM15 SMX16 SM60 SM关键核心单元Cuda CoresCuda CoresCuda CoresCuda Cores特点首个完整GPU首次GPU DirectSM 单元精简(192到128)NV Link第一代共享内存性能双向带宽160GbpsECC GPUP100 56 SM HBM制程40/28nm28nm28