当前位置:首页 > 报告详情

【Memverge】CXL大内存技术加速AI场景初探.pdf

上传人: 张** 编号:153271 2024-01-15 25页 2.03MB

1、CXL大内存技术加速AI场景初探MemVerge2023.12目录 下一代数据中心基础设施架构 CXL内存互联协议介绍 CXL技术解决的问题 GISMO全局内存对象系统在AI场景的应用 GISMO与Alluxio联合解决方案构想下一代数据中心基础设施架构PART 1机房 A机柜A(计算POD)机柜B(计算POD)计算单元CPUGPUXPUCPUGPUXPU内存单元MemoryMemoryMemory高性能存储单元CXL计算单元内存单元MemoryMemoryMemory高性能存储单元RDMA机房B异地数据中心存储POD容量型存储备份存储跨机房:200/400GEthernet带宽型访问毫秒级时

2、延百us级时延公有云跨数据中心400/800G光网络专线CXL柜间RDMA 10us时延带宽型访问秒级时延趋势1:数据中心走向全Disaggregated架构CPUGPUXPUCPUGPUXPU柜内:LD/ST内存语义访问 1us时延趋势2:内存架构重演企业存储的池化和分布式共享之路Memory池化内存分布式内存服务CXLMemory Data ServicesDASSAN存储池分布式存储服务Fibre ChannelStorage Data ServicesCXL内存互联协议介绍PART 2CXL v1.1:服务器内PCI-E扩展HostDeviceCXL.ioCXL.cacheCXL.me

3、mCXL v2.0:内存设备池化H1H2H3H4H#D1D2D3D4D#H1H2H3H4H#D1D2D3D4D#With single logical devicesWith multiple logical devicesCXL SwitchCXL v3.0:多层交换机互联+多服务器CPU缓存一致性Spine switchesLeaf switchesEnd devicesAccelMemCPUGFAMGFAMGFAMNICNICNICInterconnected spine switch systemLeaf switch NIC enclosureLeaf switch CPU encl

4、osureLeaf switch accelerator enclosureLeaf switch memory enclosure基于CXL技术的产品成熟度现状和商用落地路标CXL1.1 单机内存扩展 单机最高8TB内存 商用:2023CXL 2.0 内存资源池化 独立于服务器的外置内存设备 容量按需弹性扩展至百TB级 商用:2024H2/2025H1CXL 3.0 内存数据共享 多机共享内存数据 多内存设备级联 商用:2026+CXL技术解决的问题PART 3CXL技术解决的问题1:如何成本可控地打破内存墙单物理CPU核数每核的内存通道带宽需要革命性改变的内存带宽扩展方案201220132

5、0142015201620172018201920202021增长速度(归一化后)43.532.521.51.50数据来源:Samsung内存带宽增长无法跟上算力的(后)摩尔定律CXL协议对内存带宽的提升通道数协议版本x1x2x4x8x16PCIe 1.x(2.5 GT/s)0.5 GB/s1 GB/s2 GB/s4 GB/s8 GB/sPCIe 2.x(5.0 GT/s)1 GB/s2 GB/s4 GB/s8 GB/s16 GB/sPCIe 3.x(8.0 GT/s)2 GB/s4 GB/s8 GB/s16 GB/s32 GB/sPCIe 4.x(16.0 GT/s)4 GB/s8 GB/s

6、16 GB/s32 GB/s64 GB/sPCIe 5.x(32.0 GT/s)8 GB/s16 GB/s32 GB/s64 GB/s128 GB/sPCIe 6.x(64.0 GT/s)16 GB/s32 GB/s64 GB/s128 GB/s256 GB/sPCIe 7.x(128.0 GT/s)32 GB/s64 GB/s128 GB/s256 GB/s512 GB/sTheoretical hardware performance.Actual results may vary.Source:https:/ I/O-free Shared Mem

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了CXL大内存技术在AI场景的应用及其解决的问题。CXL技术通过内存设备池化和多层交换机互联,实现了多机共享内存数据,解决了内存墙问题和分布式环境数据高效共享的问题。CXL内存互联协议从v1.1升级到v3.0,不断优化内存带宽扩展方案,提高内存访问速度。GISMO全局内存对象系统在AI场景的应用,实现了内存资源利用率最大化,提升了数据交互性能。CXL技术在带宽型和时延型场景下,分别可以提升数据访问效率和分布式训练集合通讯加速。GISMO与Alluxio联合解决方案,进一步优化数据加载和计算的性能。
"CXL技术如何打破内存墙?" "GISMO如何在AI场景中加速?" "CXL内存互联协议有哪些优势?"
客服
商务合作
小程序
服务号
折叠