当前位置：首页 > 报告详情

利用NeuraScale高基数交换机实现AI扩展.pdf

上传人：明**** 编号：1011769 2025-12-21 PDF PDF 16页 1.61MB

该报告所属合集： 2025年OCP全球峰会（2025 OCP Global Summit）嘉宾演讲PPT合集

打包下载报告合集

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载报告到电脑，查找使用更方便

VIP专享文档

书签

分享

收藏

已收藏

版权投诉

/16

立即下载

《利用NeuraScale高基数交换机实现AI扩展.pdf》由会员分享，可在线阅读，更多相关《利用NeuraScale高基数交换机实现AI扩展.pdf（16页珍藏版）》请在三个皮匠报告上搜索。

1、Saurabh Gayen,Chief Solutions ArchitectBaya SystemsAI Scaling with NeuraScale High-Radix SwitchesNeed for AI scale:Data Center example3Scale-Up(vertical scaling)Increases server performance for larger workloads Supports larger modelsScale-outXPUXPUXPUXPUXPUXPUXPUXPUUltra EthernetUALinkUltra Ethernet

2、Scale-Out NetworkXPUXPUXPUXPUXPUXPUXPUXPUUltra EthernetUALinkServerServerScale-upScale-Out(horizontal scaling)Increases the number of servers to process more workloads in parallel Does not improve model performanceScale-Out is Being OverusedScale Out Fabric Scale-Out is used a lot,but it mostly only

3、 helps with model-level parallelism.Scale-Out does not help with supporting larger AI models.This is what is slowing AI model improvement!More Scale-Up is needed for large AI ModelsSwitchSwitchSwitchSwitchGPUGPUGPUGPUGPUGPUGPUGPUSwitchSwitchSwitchSwitchSwitchSwitchGPUGPUGPUGPUGPUGPUGPUGPUSwitchSwitc

4、hExample:Nvidia DGX-2 supporting 16 GPUs Scale-Up uses a fully non-blocking network with low-latency links and switches.The entire Pod acts as one large GPU using tensor-level parallelism.Next generation needs larger pods.Higher Scale-Up demands high-radix switches.High-Radix Switches enable higher

5、Scale-UpTodays systems:72-Port Switches(S)72-GPU Scale Up SystemsNext gen requires:144-Port Switches(S+)144-GPU Scale Up SystemsNext gen+1 requires:288-Port Switches(S+)288-GPU Scale Up SystemsNVL72 Rack72 GPUs18 NVSwitchesNVL36NVL36NVL36NVL36NVL72NVL72NVL72NVL72NVL72NVL72NVL36NVL36NVL36NVL36NVL36NV

6、L36NVL36NVL36Liquid-Cooled SystemsAir-Cooled SystemsNVL36 Rack36 GPUs18 NVSwitchesNVL36 Rack36 GPUs18 NVSwitchesSS+S+S+S+SSS+S+S+S+S+S+S+S+S+S+S+S+S+S+NeuraScale enables High-Radix SwitchesSwitchSwitchSwitchSwitchGPUGPUGPUGPUGPUGPUGPUGPUSwitchSwitchSwitchSwitchSwitchSwitchGPUGPUGPUGPUGPUGPUGPUGPUSwi

word格式文档无特别注明外均可编辑修改，预览文件经过压缩，下载原文更清晰！

三个皮匠报告文库所有资源均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

根据报告的内容，全文主要探讨了AI模型扩展的挑战和解决方案，特别是通过NeuraScale高基数交换机实现AI模型扩展的必要性。以下是关键点： 1. **AI扩展需求**：数据中心示例表明，AI模型需要扩展以支持更大规模的工作负载和模型。 2. **扩展类型**：区分了向上扩展（Scale-Up）和向外扩展（Scale-Out）。Scale-Up通过增加服务器性能来支持更大模型，而Scale-Out通过增加服务器数量来处理更多并行工作负载。 3. **Scale-Out的局限性**：Scale-Out主要用于模型级并行，不支持更大AI模型。 4. **高基数交换机**：NeuraScale交换机通过提供高基数交换能力，支持更高的Scale-Up。 5. **性能提升**：NeuraScale交换机相比现有72端口交换机，可提供4倍的性能提升，支持288个800Gbps端口。 6. **架构优势**：NeuraScale架构支持低延迟、非阻塞网络，并具有可扩展性和物理设计友好性。 7. **模块化设计**：NeuraScale的模块化设计简化了物理设计，并支持跨多个芯片的扩展。

高基数交换机揭秘" "告别瓶颈，揭秘AI模型加速的秘诀" 开启AI规模新纪元！"

全行业研究报告分享下载平台

0731-84720580
商务合作：really158d
友链申请 (QQ)：1737380874

关于我们

更多

关于我们

三个皮匠报告微信公众号

三个皮匠报告微信小程序

扫码咨询网站充值下载问题

友情链接：

营销自动化亿欧智库微播易阿里妈妈

copyright@2008-2013 长沙景略智创信息技术有限公司版权所有网站备案/许可证号：湘B2-20190120 | 工信部备案号：湘ICP备17000430号-2 | 公安备案号：湘公网安备43010402001071号

客服

小程序

服务号

折叠