当前位置：首页 > 报告详情

ACF-S：AI计算结构中高性能数据移动的新方法.pdf

上传人：芦苇编号：651448 2025-05-01 PDF PDF 20页 1.39MB

该报告所属合集： 2024AI硬件和边缘AI峰会（AI Hardware &ampamp； Edge AI Summit 2024）嘉宾演讲PPT合集

打包下载报告合集

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载报告到电脑，查找使用更方便

VIP专享文档

书签

分享

收藏

已收藏

版权投诉

/20

立即下载

《ACF-S：AI计算结构中高性能数据移动的新方法.pdf》由会员分享，可在线阅读，更多相关《ACF-S：AI计算结构中高性能数据移动的新方法.pdf（20页珍藏版）》请在三个皮匠报告上搜索。

1、 2024 ENFABRICA CORPORATION.ALL RIGHTS RESERVED.ACF-S:A Novel Approach to High-Performance Data Movement in AI Compute FabricsSeptember 10,2024Rochan Sankar,Enfabrica 2024 ENFABRICA CORPORATION.ALL RIGHTS RESERVED.3:missionredefine networking for accelerated computing to deliver peak performance,res

2、iliency and node scale:team120+engineerspreviously built high-performance NICs,switches,routers,TPUs,graphics,host networking stacks 2024 ENFABRICA CORPORATION.ALL RIGHTS RESERVED.:productaccelerated compute fabric superNIC(ACF-S)1stchip codename millennium 8 Tbps bandwidth3.2Tbps Ethernet 5+Tbps 12

3、8 lanes PCIe 5/6ARM CPUACF-SSW Stack8 Tbps ACF-S card:what we are about 2024 ENFABRICA CORPORATION.ALL RIGHTS RESERVED.4:a systems perspective:scale-up supercomputing /mainframe,ccNUMAFully coherent memory system operating on a“large”problem by sharding computationWorker nodes synchronize state and

4、move memory closer using O(100ns)latency IPC transactionsCommunication protocols deeply embedded in the processor to enable“transparent”communication 2024 ENFABRICA CORPORATION.ALL RIGHTS RESERVED.5All blue links are IPC communicationCPUCPUCPUCPUCPUCPUCPUCPU:hyperscale cloud /the rise of scale-out c

5、omputingClient-server design,built for extreme,resilient application scalingAll communication uses retargetable,resilient,software managed RPCs(request-response)Workers and data pipelines are imminently reconfigurableDistributed,heterogenous compute nodes with high aggregate network throughputhigh t

6、olerance to latency(10s-1000s of microseconds)No shared-fate 2024 ENFABRICA CORPORATION.ALL RIGHTS RESERVED.6All green links are sharded RPC communicationLoad Balancer/RequestorSharded/ReplicatedWorkersSharded/ReplicatedWorkersCPUCPUCPUCPUCPUCPU:data center AI,ML systems /super,meet hyperModern infr

word格式文档无特别注明外均可编辑修改，预览文件经过压缩，下载原文更清晰！

三个皮匠报告文库所有资源均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

本文介绍了一种名为ACF-S的新型数据传输方法，旨在提高人工智能计算织物中的高性能数据移动。ACF-S由Enfabrica公司开发，其关键特性包括： 1. scale-up和scale-out的统一：ACF-S旨在将大规模计算（scale-up）与分布式计算（scale-out）结合起来，提供统一的解决方案。 2. 通信协议的集成：通信协议 deeply embedded in the processor，使得通信透明化。 3. 内存系统：采用fully coherent memory system，通过sharding computation实现大规模问题的处理。 4. 网络结构：提出了logically Rail Switched 2-Tier CLOS Network结构，以降低延迟和提高网络的弹性。 5. 性能提升：ACF-S能够显著提高GPU集群的性能，例如，在65,536个GPU的集群中，HFU（硬件FLOPs利用率）预计将高于典型的LLM MFU（模型FLOPs利用率）。 6. 硬件创新：ACF-S解决方案包括world’s first megaNIC chip，该芯片具有8-Tbps的acf-s速率，32 lanes x 112GbE，以及高容量的PCIe。 7. 软件与硬件的解耦：通过软件定义的传输和拥塞控制，ACF-S提供了适应工作负载和避免硬编码基础设施到当前模型的能力。 Enfabrica公司提出的ACF-S技术，旨在为AI计算提供高效、可扩展的数据传输解决方案，通过硬件和软件的创新，实现高性能计算与大规模分布式计算的有机结合。

"AI计算织物中的ACF-S技术是什么？" "如何通过ACF-S技术优化AI系统的性能？" "ACF-S技术在未来的AI计算领域有哪些应用前景？"

全行业研究报告分享下载平台

0731-84720580
商务合作：really158d
友链申请 (QQ)：1737380874

关于我们

更多

关于我们

三个皮匠报告微信公众号

三个皮匠报告微信小程序

扫码咨询网站充值下载问题

友情链接：

营销自动化亿欧智库微播易阿里妈妈

copyright@2008-2013 长沙景略智创信息技术有限公司版权所有网站备案/许可证号：湘B2-20190120 | 工信部备案号：湘ICP备17000430号-2 | 公安备案号：湘公网安备43010402001071号

客服

小程序

服务号

折叠