当前位置：首页 > 报告详情

短距离光接口规模化连接优化人工智能_机器学习应用中的内存数据传输.pdf

上传人：明**** 编号：1011924 2025-12-21 PDF PDF 42页 1.80MB

该报告所属合集： 2025年OCP全球峰会（2025 OCP Global Summit）嘉宾演讲PPT合集

打包下载报告合集

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载报告到电脑，查找使用更方便

VIP专享文档

书签

分享

收藏

已收藏

版权投诉

/42

立即下载

《短距离光接口规模化连接优化人工智能_机器学习应用中的内存数据传输.pdf》由会员分享，可在线阅读，更多相关《短距离光接口规模化连接优化人工智能_机器学习应用中的内存数据传输.pdf（42页珍藏版）》请在三个皮匠报告上搜索。

1、Short-reach Optical Interface(SRIO)Scale Connectivity for Optimized Data-movement Through Memory for AI/ML ApplicationsSiamak Tavallaei,Sr.Principal Engineer,Samsung Semiconductor,Inc.FTI Workshop:Short Reach Optical InterconnectsTrending requirement and building blocks to helpStargate ChallengeHow

2、a tool may guide the focus on architectural decisionsHow short-reach optics may helpCall-to-action for the SROI teamOutline Baseline Server NodeBaseline Server NodeSRAM/Cache T0CPU-Mem T1Local Node Storage T3Storage on DC Network T4 M:Local DDRx MemoryC:CPUS:NVMe/PCIe SSD StorageN:NICAI/ML-optimized

3、 Memory HierarchySRAM/Cache T0GPU-HBM T1CPU-Mem(+CXL)T2(T2+)Storage on SO T3-SOGPU-HBM-SU T1-SUCPU-Mem-SU(+CXL)T2(T2+)-SUStorage T3Storage on SU T3-SU Storage on DC Network T4 AI Infrastructure Memory SO T2-SOScale-up(SU)Scale-out(SO)Data-movement is through memoryPhysically DisaggregateLogically Co

4、mposeTraditional scale-up fabrics couple CPUs to build large symmetric multi-processing systems(SMP)Run large,parallel processing workloads under one OS with efficient protocols for Load/StoreMemory/cache-coherence in hardware with low-latency for small payloadsCXL fulfills these requirements(Major

5、CPU manufacturers Root Ports)Emerging scale-up fabrics for AI/ML natively couple xPUs to switchesUse the same protocol as native xPUs for distributed processing paradigmNot requiring the hardware-based cache-coherence or the low-latency featuresRequire high-throughput interconnects for emerging soft

6、ware to move data ahead of useHybrid fabric switches emerge to“bridge”between native scale-up fabric protocolsBridge xLink used by xPUs and the standard CXL protocolScale-up disaggregated memory pooling and sharingStretched PyramidIncrease Capacity at each TierSRAM/Cache T0GPU-HBM T1CPU-Mem(+CXL)T2(

word格式文档无特别注明外均可编辑修改，预览文件经过压缩，下载原文更清晰！

三个皮匠报告文库所有资源均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

根据报告的内容，全文主要内容概括如下： - **AI/ML应用需求**：随着AI/ML应用的数据密集型需求增长，对高效数据传输的需求日益增加。 - **内存优化架构**：文章探讨了优化内存层次结构，包括SRAM/Cache、GPU-HBM、CPU-Mem等，以支持AI/ML应用。 - **扩展性解决方案**：提出了扩展性解决方案，包括Scale-up (SU) 和 Scale-out (SO)，以及使用短距离光学接口(SROI)来提高数据传输效率。 - **超级集群挑战**：提出了“Stargate”挑战，目标是构建一个包含100万个高效连接的处理单元的超级集群。 - **连接性与带宽**：强调了连接性和带宽的重要性，包括使用高比特率、高基数连接、高效岸线密度和低误码率。 - **工具需求**：指出需要工具如Super Cluster Builder来进行拓扑探索、复杂性分析和成本及性能分析。 - **短距离光学接口(SROI)**：介绍了SROI的优势，如降低每传输比特的能量消耗、减少插入损耗、提高温度稳定性、小型物理结构尺寸和降低成本。核心数据包括： - 100万个处理单元 - 800Gb/s的互连带宽 - 16:1的聚合器齿轮比

如何连接百万处理器？" 光学互连如何助力？" 光学接口在AI/ML中的应用？"

全行业研究报告分享下载平台

0731-84720580
商务合作：really158d
友链申请 (QQ)：1737380874

关于我们

更多

关于我们

三个皮匠报告微信公众号

三个皮匠报告微信小程序

扫码咨询网站充值下载问题

友情链接：

营销自动化亿欧智库微播易阿里妈妈

copyright@2008-2013 长沙景略智创信息技术有限公司版权所有网站备案/许可证号：湘B2-20190120 | 工信部备案号：湘ICP备17000430号-2 | 公安备案号：湘公网安备43010402001071号

客服

小程序

服务号

折叠