当前位置:首页 > 报告详情

利用 OCI 构建 Zettascale AI 集群:与开放生态系统共同扩展迈向下一代 AI.pdf

上传人: 明**** 编号:1011759 2025-12-21 31页 8.70MB

1、Pradeep VincentSVP,Chief Technical ArchitectOracle Cloud InfrastructureBuilding zettascale next-gen AI clusters with OCIScaling Together with Open Ecosystem for Next-Generation AIIntroduction to OCIOracle Cloud Infrastructure(OCI)Evolution 20172018:OCI(Gen 2)2019-2020Exadata Cloud Service,RDMA,dedic

2、ated infrastructure2021Oracle Database Service for Azure&other domain racksOCI Engaged in the OCP ORv2 DC-SCM2023AI Infrastructure SurgeStarted adoption of OCP ORv32024Zettascale OCI Superclusters2025Several Gigawatt DC sites for next-gen AIORv3 OCI C3 racks Engagement across multiple workgroups and

3、 adoption 8Updated August 1st,2025CommercialGovernmentEU SovereignDedicated RegionOracle AlloyOracle DatabaseAzureOracle DatabaseGoogle CloudOracle DatabaseAWSPlannedAvailableOracle Cloud Infrastructure global footprint 200+live and planned regions1MexicoUnited StatesThe BahamasTrinidad&TobagoMorocc

4、oCanadaKenyaFranceIndiaUnited Arab EmiratesJapanMalaysiaThailandIrelandBangladeshSerbiaGhanaSouth KoreaIsraelOmanNetherlandsKuwaitBahrainHungaryGermanyUnited KingdomSwitzerlandQatarSaudi ArabiaItalySingaporeSwedenSpainChileSouth AfricaIndonesiaAustraliaNew ZealandColombiaBrazilRedefine Cloud Infrast

5、ructureRedefine Cloud AI InfrastructureSan Jose,CA1 GWPeak Connected Utility Load Unprecedented AI Infrastructure GrowthMany Gigawatts Millions of GPUsScaleSupercluster Scaling8x131,072 GPUs4x65,536 GPUs16,384 GPUs2x32,768 GPUs20202025Network Speed Growth2016202580 x Network cluster performance incr

6、ease400 Gbps800 Gbps200Gbps10 Gbps25 Gbps50Gbps100GbpsScale Why?Maximize Site-Wide Cluster PerformanceSpeed Speed SpeedSpeed Speed SpeedAnd Even More Speed.Speed Speed SpeedWhy?Faster Access to GPU Capacity Market LeadershipServer&DC Product Lifecyle:OpportunitiesProduct Ecosystem Plethora of Vendor

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《Data》标记内容,全文主要内容概括如下: 1. **OCI发展历程**:从2017-2018的Gen 2到2024年的Zettascale OCISuperclusters,Oracle Cloud Infrastructure (OCI)不断进化,支持全球200+地区。 2. **AI基础设施增长**:2023年AI基础设施激增,采用OCP ORv2 DC-SCM,2024年启动Zettascale OCISuperclusters,2025年计划在多个地区建立Gigawatt级数据中心。 3. **超级集群扩展**:2020-2025年,GPU集群规模从2x32,768增长到8x131,072,网络速度从10Gbps增长到400Gbps。 4. **性能优化**:通过提高集群性能、加快GPU容量市场访问速度、优化供应链和操作效率来提升速度。 5. **开放生态系统**:Oracle与NVIDIA合作,推动OCP-Aligned AI Fabrics,支持SAI、SUE-T等网络标准,并提议SPAI管理交换机外围设备。 6. **电力和电网挑战**:GPU集群导致负载振荡,Oracle提出超过500KW的DC电力设计,以管理负载振荡和实现遥测标准化。 7. **标准和规范**:Oracle参与AI数据中心基础设施标准制定,包括DC和电网电力设计规范、机架设计规范和网络规范。
"OCIS超级集群,速度突破极限?" "AI基础设施,Oracle如何引领潮流?" "Oracle云基础设施,未来已来!"
客服
商务合作
小程序
服务号
折叠