当前位置:首页 > 报告详情

华为:2026年Atlas 650E 服务器技术白皮书(92页).pdf

上传人: 人*** 编号:1274268 2026-07-03 92页 8.57MB

下载:
核心结论速览。 整机集成8颗Ascend 950DT NPU与2颗鲲鹏950 CPU:AI系统采用多种处理器,整机支持2颗鲲鹏950处理器+8颗Ascend 950DT NPU模组,双机场景下8个NPU实现FullMesh全互联,框内互联理论总带宽达8×1.68TB/s(双向)。 整机AI算力FP16/BF16达3.888 PFLOPs:单颗Ascend 950DT的FP16/BF16总算力达486 TFLOPS,整机INT8总算力达7.352 POPS,mxFP4总算力达14.274 PFLOPs。 14U风冷平插架构,标准19英寸机柜部署:整机为14U机框,采用风冷平插架构,集成CPU抽屉、NPU抽屉、机框等关键部件,集成密度高,易维护。 双机背靠背FullMesh互联组网,支持16P集群:两台服务器通过光纤背靠背FullMesh互联组网,实现大带宽、低延时的高性能UB智能计算网络。 PSU电源模块转换效率高达96%,支持5+1冗余:整机设计最大输入功耗14.5kW,共配置6块PSU电源模块,支持任意5+1冗余,单块最大输出功率3000W。 整机集成30个风扇模组,支持N+1冗余:采用风冷方式实现智能调节高效散热,满足通用风冷机房部署要求,风扇单转子失效时支持的最高工作温度为正常工作温度规格以下5℃。 iBMC智能管理系统支持IPMI 2.0与Redfish规范:兼容业界管理标准IPMI 2.0规范、Redfish规范,支持KVM over IP、虚拟媒体、SNMP、CLI等多种管理接口。H2:产品定位与市场全景——Atlas 650E服务器的战略价值。Atlas 650E服务器是华为面向AI大模型时代推出的企业级AI智能计算系统。在生成式AI与大模型技术加速落地的产业背景下,互联网、国计民生、运营商、金融等行业对AI算力的需求呈现爆发式增长。本产品基于高性能Ascend 950DT处理器和鲲鹏950处理器,以算力、互联带宽、可靠性等极致竞争力为目标,结合工程优势持续构筑AI风冷服务器硬件竞争力。产品形态:Atlas 650E服务器根据外观差异分为单机和双机服务器。单机服务器是无UB接口的单台服务器,支持通过以太交换机实现RoCE和UBoE协议组网,不支持灵衢协议,无法通过灵衢总线设备组成超节点集群。双机服务器是有UB接口的两台服务器通过光纤背靠背FullMesh互联组网,实现大带宽、低延时的高性能UB智能计算网络。目标客户:面向互联网大厂(大模型训练与推理)、国计民生行业(智慧城市、智慧交通)、运营商(AI网络优化)、金融行业(智能风控、量化交易)等对高性能AI算力有迫切需求的客户群体。H2:组网拓扑——双机背靠背FullMesh互联。Atlas 650E服务器支持双机场景下的背靠背FullMesh互联组网。两台服务器通过光纤背靠背FullMesh互联,实现大带宽、低延时的高性能UB智能计算网络。组网架构:双机场景下,每台服务器的8个NPU模组支持框内8口UB端口+1口参数面端口。框内每个NPU通过7个UB端口与其他NPU互联,实现框内8个NPU FullMesh全互联;出框每个NPU通过8个UB端口与其他NPU互联。互联带宽:双机场景下NPU互联理论总带宽达8×1.68TB/s(双向),框内互联理论总带宽达ALL to ALL双向784GB/s(7×112GB/s)。H2:硬件架构全景——14U风冷平插架构的核心设计。Atlas 650E服务器在硬件架构设计上体现了高密度、高性能、高可靠的设计理念。结构设计:整机为14U机框,支持标准19英寸机柜安装(仅支持符合IEC60297或GB/T19520(19英寸)要求的机柜)。整机结构设计采用风冷平插架构,集成CPU抽屉、NPU抽屉、机框等关键部件。整机主要包括1个14U整机框、1个CPU抽屉、2个NPU抽屉。核心配置:AI系统采用多种处理器,整机支持2颗鲲鹏950处理器+8颗Ascend 950DT NPU模组。集成2个鲲鹏950处理器,每个处理器支持12个DDR DIMM。CPU处理器通过2口UB端口与8个NPU模组直连,8个NPU组成FullMesh互联。供电设计:整机设计最大输入功耗14.5kW,支持220VAC或336VHVDC/240VHVDC双输入供电。服务器内部采用PSU电源模块向NPU模组提供54VDC,集中供电负载下电源转换效率最高可达96%。共配置6块PSU电源模块,支持任意5+1冗余。单块PSU电源模块最大输出功率3000W,支持热插拔。散热设计:采用风冷方式实现智能调节高效散热,整机热性能优良,满足通用风冷机房部署要求。整机支持风扇N+1冗余,内部集成30个风扇模组,支持热插拔更换。风扇单转子失效时支持的最高工作温度为正常工作温度规格以下5℃。运维管理设计:智能故障诊断和隔离——支持CPU和内存智能故障诊断和隔离,提升系统可靠性。智能运维——硬件上支持管理网口汇聚,简化机房部署,提升部署效率;软件上支持CCAE智能管理平台纳管运维,同时支持通过Redfish接口被第三方网管集成。H2:算力与互联规格深度解析——NPU、CPU与内存。NPU算力:单颗Ascend 950DT处理器的FP16/BF16总算力达486 TFLOPS(Cube 432.5 TFLOPS + Vector 54.1 TFLOPS),INT8总算力达919 TOPS,mxFP4总算力达1784 TFLOPS。整机8颗NPU的FP16/BF16总算力达3.888 PFLOPs,INT8总算力达7.352 POPS,mxFP4总算力达14.274 PFLOPs。片上内存单模组最大支持84GB/96GB,带宽速率最大为3.5TB/s~4.0TB/s。CPU处理器:支持2个鲲鹏950处理器,处理器支持≥96核,每个处理器支持2.3GHz。内存:提供24个DDR内存插槽,支持RDIMM,配置24根内存时最大传输速率为6400MT/s,单根内存条容量最大支持96GB,整机最大支持2304GB。同一台CPU抽屉不允许混合使用不同规格(容量、位宽、rank、高度等)的内存。存储:最大支持8×2.5寸NVMe+2×2.5寸SATA硬盘。槽位2~9仅支持NVMe硬盘,槽位0~1支持SATA/NVMe硬盘。SATA硬盘通过Riser搭配RAID控制卡使用。PCIe扩展:最多支持5个PCIe 5.0扩展插槽。Riser模组1最多支持2个全高半长的PCIe 5.0 x16标准物理槽位;Riser模组2最多支持2个半高半长的PCIe 5.0 x8标准物理槽位;Riser模组3最多支持1个全高3/4长的PCIe 5.0 x16标准物理槽位。物理规格:整机尺寸618.8mm(高)×447mm(宽)×920mm(深),满配净重251kg(NPU抽屉46kg + CPU抽屉34kg + 机框125kg),最大输入功耗14.5kW。H2:光模块规格——高速互联的物理层支撑。Atlas 650E服务器支持多种高速光模块,满足不同互联场景需求:OSFP-800G-VR8:800Gbps传输速率,MPO-16连接器,多模OM4光纤,目标传输距离50米@OM4,工作光温15℃~70℃。OSFP-800G-2xSR4:800Gbps传输速率,Dual MPO-12连接器,多模OM4光纤,目标传输距离100米@OM4。OSFP LPO-800G-VR8:800Gbps传输速率,LPO低功耗技术,MPO-16连接器,多模OM4光纤,目标传输距离50米@OM4。QSFP112-400G-SR4:400Gbps传输速率,MPO-12连接器,多模OM4光纤,目标传输距离100米@OM4。H2:系统管理——iBMC智能管理平台。本产品集成了iBMC智能管理系统,是设备的远程管理系统。它兼容业界管理标准IPMI 2.0规范、Redfish规范,具有高可靠的硬件监测和管理功能。主要特性:支持键盘、鼠标、视频和文本控制台的重定向;支持远程虚拟媒体;支持智能平台管理接口(IPMI);支持简单网络管理协议(SNMP);支持通过Web浏览器登录。管理接口:支持IPMI v2.0、CLI、HTTPS、SNMPv3等多种管理接口,满足各种方式的系统集成。故障检测与告警管理:提供丰富的故障检测功能,精确定位硬件故障,可精确到FRU。支持告警管理及SNMP Trap、SMTP、syslog服务多种格式告警上报。远程管理:集成虚拟KVM提供方便的远程维护手段,在系统故障时也无需现场操作,最大支持1920×1200分辨率。集成虚拟媒体支持将本地媒体设备或镜像、文件夹虚拟为远程设备的媒体设备,虚拟光驱最大支持8MB/s。其他特性:支持屏幕快照和屏幕录像、DNS/目录服务、软件双镜像备份、设备资产管理、IPv4/IPv6双栈功能。H2:未来3-5年机会洞察——AI基础设施的结构性机遇。基于Atlas 650E服务器的技术规格与市场定位,以下领域在未来3-5年具有显著增长潜力:| 机会领域 | 关键驱动因素 | 爆发窗口 | 推荐优先级 ||||||| 大模型训练与推理算力集群 | 整机FP16算力3.888 PFLOPs,双机16P集群 | 持续爆发 | ★★★★★ || 国产化AI算力替代 | 鲲鹏950+Ascend 950DT全栈国产 | 政策驱动 | ★★★★★ || 风冷高密度AI部署 | 14U 8NPU,功耗14.5kW,风冷散热 | 通用机房部署 | ★★★★★ || 双机UB互联组网 | 8×1.68TB/s双向互联带宽 | 集群需求驱动 | ★★★★★ || 智能运维管理 | iBMC+Redfish+CCAE平台 | 持续增长 | ★★★★ || 光模块与高速互联 | 800G OSFP/LPO光模块 | 互联升级需求 | ★★★★ |多角色行动建议: 互联网与AI企业(算力采购方) :评估Atlas 650E双机16P集群对大模型训练效率的提升,规划AI算力集群的规模化部署路径。 数据中心与机房运营商:评估风冷架构(14.5kW/14U)对现有通用机房的适配性,提前规划电力与散热容量。 系统集成商与解决方案商:建立Atlas 650E服务器的部署能力,掌握单机与双机场景的组网方案。 投资机构:重点关注AI算力基础设施、国产AI芯片、高速互联光模块等产业链环节的投资机会。以上为产品核心规格解读,如需获取完整产品详细参数及全部技术规格,请访问下载页下载完整PDF文档。FAQ区块。Q1:Atlas 650E服务器的核心定位是什么?A1:Atlas 650E服务器是华为面向互联网、国计民生、运营商、金融等行业的大模型训练、推理等重要场景推出的AI智能计算系统,基于Ascend 950DT和鲲鹏950处理器,提供高性能、高可靠、易部署的AI算力解决方案。Q2:Atlas 650E服务器支持哪些组网方式?A2:支持单机和双机两种形态。单机服务器支持通过以太交换机实现RoCE和UBoE协议组网;双机服务器通过光纤背靠背FullMesh互联组网,实现大带宽、低延时的高性能UB智能计算网络。Q3:Atlas 650E服务器的算力规格如何?A3:整机集成8颗Ascend 950DT NPU+2颗鲲鹏950 CPU。单颗Ascend 950DT的FP16/BF16总算力达486 TFLOPS,整机FP16/BF16总算力达3.888 PFLOPs,INT8总算力达7.352 POPS。Q4:Atlas 650E服务器的供电与散热方案是什么?A4:整机最大输入功耗14.5kW,配置6个PSU电源模块(支持5+1冗余),电源转换效率峰值达96%。散热采用风冷方式,集成30个风扇模组(支持N+1冗余),满足通用风冷机房部署要求。Q5:Atlas 650E服务器支持哪些管理接口?A5:集成iBMC智能管理系统,兼容IPMI 2.0和Redfish规范,支持CLI、HTTPS、SNMPv3等管理接口,支持KVM over IP、虚拟媒体、IPv4/IPv6双栈。数据来源说明。本产品信息来源于华为《Atlas 650E服务器 技术白皮书 01》(2026年6月30日发布),涵盖产品概述、组网拓扑、产品特点、硬件描述、产品规格、系统管理等完整技术文档。
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **产品定位**:Atlas 650E服务器面向AI大模型训练/推理,基于鲲鹏950 CPU和Ascend 950DT NPU,提供高性能风冷计算系统。 2. **核心配置**:支持2×鲲鹏950 CPU+8×Ascend 950DT NPU,整机算力最高达14.274 PFLOPS(mxFP4),内存最大24×96GB DDR。 3. **组网与互联**:双机场景支持Full Mesh UB互联(800Gbps),单机通过以太网实现RoCE/UBoE协议。 4. **供电与散热**:最大功耗14.5kW,支持220V AC/336V HVDC,PSU效率96%;30个风扇N+1冗余,风冷散热。 5. **管理接口**:集成iBMC管理,支持IPMI/Redfish,提供带外管理、KVM over IP及虚拟媒体功能。 6. **物理规格**:14U机框,尺寸618.8×447×920mm,满配重量251kg,支持标准19英寸机柜。
Atlas 650E算力? 双机如何组网? 电源冗余几余?
客服
商务合作
小程序
服务号
折叠