1、 敬请阅读末页的重要说明 证券研究报告|行业深度报告 2024 年 04 月 17 日 推荐推荐(首次)(首次)GB200 网络架构测算,网络架构测算,1.6T 光光模块需求有望超预期模块需求有望超预期 TMT 及中小盘/通信 2024 年年 3 月,英伟达发布推出月,英伟达发布推出 NVIDIA Blackwell 平台,平台,Blackwell 平台包括平台包括全域全域 NVLink 和和 Infiniband 两种连接方式。两种连接方式。NVLink 连接方式中若单机柜连接,连接方式中若单机柜连接,则全部采用铜缆连接;若构建则全部采用铜缆连接;若构建 576 张卡的集群,则需要光模块与张
2、卡的集群,则需要光模块与 GPU 的比例为的比例为9:1,我们测算光模块价值量,我们测算光模块价值量 5080 万元。万元。Infiniband 架构中,若为两层架构则架构中,若为两层架构则1.6T 光模块与光模块与 GPU 比例为比例为 2.06:1;若为三层架构则;若为三层架构则 1.6T 光模块与光模块与 GPU 比例为比例为2.98:1(将(将 800G 均换算为均换算为 1.6T)。当机柜出货量达到)。当机柜出货量达到 5.8 万时,我们预计有望万时,我们预计有望带来带来 650 万支万支 1.6T 光模块需求,光模块需求,1.6T 光模块需求有望超预期。光模块需求有望超预期。GB2
3、00 机柜内算力密度大幅提升,互联技术是关键。机柜内算力密度大幅提升,互联技术是关键。2024 年 3 月,英伟达宣布推出 NVIDIA Blackwell 平台。Blackwell 平台包括最新一代的 B200 芯片、第二代 Transformer 引擎、第五代 NVLink、RAS 引擎、安全 AI、解压缩引擎六项核心变革性创新。GB200 单机柜算力大幅提升,包括 9 个交换托盘和 18 个计算托盘。在交换托盘内包含两颗最新一代 NVLink 芯片支持 72端口双向 1.8TB 传输速率交换。同时顶部装配一台 NVIDIA Quantum-X800交换机提供 144 端口 800Gb 速
4、率端口用于 Infiniband 架构连接。计算托盘包含两颗Blackwell Superchip芯片,每颗Superchip芯片上包含1颗Grace Cpu与两颗 B200 GPU。同时包含 4 颗 ConnectX-8 SuperNIC 芯片与 1 颗BlueField-3 DPU 芯片。全域全域 NVLink:机柜内部仅用铜缆,外部连接需九倍光模块。1)NVL72:NVL72中单机柜内 18 个 Compute Tray 共有 72 颗 B200 芯片,9 个 Switch Tray 共有 18 颗 NVSwitch 芯片。NVL72 中需要 5184 根铜缆连接。2)NVL576:16
5、机柜互联,光模块数量 9 倍于 GPU。NVL72 方案已将所有 NVLink 端口插满,不具备进一步扩大规模的空间。若要扩大集群规模需降低机柜内算力密度,给出空的 NVLink 端口用于向上连接。在 L2 与 L1 之间连接需要光模块,我们测算第二层总共有 10368 个端口 50GB 端口需要连接,需要 5184 个 1.6T光模块进行连接。假设 1.6T 光模块单价 1400 美金,则 NVL576 总共需要光模块价值量 5080 万元。Infiniband 连接:连接:架构与 H100 SuperPod 相仿,光模块比例介于 2-3 之间。Infiniband 网络传输为单端口单向传输
6、速率 800Gb,远小于 NVLink 单端口单向传输速率的 900GB(7.2Tb),因此应用光模块比例小于 NVLink 连接。GB200 的 Infiniband 连接结构与 DGX H100 SuperPod 的网络架构类似,但是与光模块比例关系略小于 H100 SuperPod 架构。据测算,两层交换机最多支持 9216 张卡互联,光模块与 GPU 比例关系为 2.56:1,将 800G 换算为 1.6T后与 GPU 比例关系为 2.06:1。三层交换机最多支持 73728 张卡互联,光模块与 GPU 比例关系为 3.48:1,将 800G 换算为 1.6T 后与 GPU 的比例为2