当前位置:首页 > 报告详情

UALink Scale-Up Pod 的管理和控制.pdf

上传人: 明**** 编号:1011682 2025-12-21 13页 821.53KB

1、Justin King,AMDArun Satyanarayana,GoogleManagement and Control of UALink Scale-Up PodsManagement and Control of UALink Scale-Up PodsJustin King,AMDArun Satyanarayana,GoogleHardware ManagementUALink connects Accelerators in a scale-up fabricLoad,store,and atomic operationsLow-latency,high bandwidthUA

2、L200 leverages ethernet for physical layer re-use cables,retimersUALink defines Data Link,Transport and Protocol layers above the physical layerUALink OverviewAccSwitchAccSystem Node 1System Node 0HBMHBMHBMHBMDDRDDRDDRDDRUALinkHostCXL/PCIe/XGMI/CHI c2c/Etc.HostUALink PodA UALink Pod consists of:Syst

3、em Nodes with a Host CPU and AcceleratorsSwitch Platforms with UALink Physical SwitchesUALink Pods are designed to scale up to 1024 acceleratorsWide variety of system designs is encouraged!UALink Switch Platform 3UALink SwitchUALink Switch Platform 2UALink SwitchUALink Switch Platform 1UALink Switch

4、UALink PodUALink System Node 2AccAccAccAccCPUCPUNICUALink System Node 3AccAccAccAccCPUCPUNICUALink System Node 1AccAccAccAccCPUCPUNICUALink Virtual PodsA Virtual Pod(vPod)is the unit of isolation and workload schedulingAt least one vPod is required for workload schedulingA Pod may be partitioned mul

5、tiple vPodsThe largest vPod is a full PodvPods are typically created to support multiple tenants and/or differential workloadsE.g.,Multiple models for inferencingvPods are isolated from one another via routing entries in each Physical SwitchUALink Switch Platform 3UALink SwitchUALink Switch Platform

6、 2UALink SwitchUALink Switch Platform 1UALink SwitchUALink PodUALink System Node 2AccAccAccAccCPUCPUNICUALink System Node 3AccAccAccAccCPUCPUNICUALink System Node 1AccAccAccAccCPUCPUNICVirtual Pod 1Virtual Pod 2Virtual Pod 3Centralized Control and ManagementPod Controller sets up and manages a UALin

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据报告的内容,全文主要内容概括如下: - **UALink概述**:UALink是一种用于连接加速器的高性能网络技术,支持负载、存储和原子操作,具有低延迟和高带宽特点。 - **UALink架构**:包括系统节点、交换平台和虚拟Pod(vPod)。系统节点包含CPU和加速器,交换平台包含物理交换机,vPod是隔离和调度工作负载的单位。 - **管理控制**:Pod控制器负责设置和管理Pod及其vPod,通过NMA和SMA进行本地代理通信。 - **网络管理**:Pod控制器通过NMA管理加速器,通过SMA管理交换机,使用gNMI和Yang模型进行通信。 - **接口和实现**:UALink-SAI提供交换机抽象接口,允许SMA与任何UALink交换机实现集成。 - **用户旅程**:包括Pod拓扑管理、端口控制、邻居配置、动态拓扑扩展、vPod管理和监控等。 - **社区参与**:鼓励加入UALink联盟,提供反馈,并参与相关OCP工作流。
加速器互联新纪元?" 多租户工作负载的解决方案?" 如何简化数据中心网络?"
客服
商务合作
小程序
服务号
折叠