当前位置：首页 > 报告详情

王博-从CPU到NPU从对象到张量的编程范式转型.pdf

上传人：哆哆编号：631182 2025-04-19 PDF PDF 42页 22.72MB

该报告所属合集： 2025全球机器学习技术大会嘉宾演讲PPT合集

打包下载报告合集

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载报告到电脑，查找使用更方便

VIP专享文档

书签

分享

收藏

已收藏

版权投诉

/42

立即下载

《王博-从CPU到NPU从对象到张量的编程范式转型.pdf》由会员分享，可在线阅读，更多相关《王博-从CPU到NPU从对象到张量的编程范式转型.pdf（42页珍藏版）》请在三个皮匠报告上搜索。

1、ML-SummitML-SummitML-SummitML-SummitML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit软件设计与实现范式从对象到张量王博ML-SummitML-Summit从 Object 到 Tensor 的架构与实现模式软件设计与实现范式的变化基于 GPU/NPU 的软件技术栈计算架构的演进ML-SummitML-Summit01计算架构的演进ML-SummitML-SummitGPU 算力与能效比变化Single-threaded CPU vs.GPU performancehttps:/ in AI

2、inference energy consumption:Beyond the performance-vs-parameter laws of deep learninghttps:/ in Everywherehttps:/ AI RAN 为例https:/ Software 1.0 到 2.0https:/ EventFactoryValueObjectDomain Driven DesignML-SummitML-SummitSoftware 3.0？https:/ 3.0+Connor White https:/ 1.0Software 2.0Software 3.0Software

3、 4.0自长软件意图驱动软件数据驱动软件确定性软件ML-SummitML-SummitSystem Software EngineeringApplicationML-SummitML-Summit03基于 GPU/NPU 的软件技术栈ML-SummitML-SummitCUDA Platform StackIn the beginningCUDA:New Features and Beyondhttps:/ System View面向产品(竞争力)面向应用（复用）算子开发工程面向硬件(性能)面向研发(效率)模型开发、训练与应用模型推理与加速异构计算 SDK运行时 ptxTensorFlowN

4、vidia DynamoCUDA RuntimenvccNsight ToolsCUTLASScuBLAScuDNNPyTorchTVMXLAJARMegatronDeepSpeedOpenAI TritonNvidia Triton ServerTensorLLMTensorRTFastTransformerNCCLNVSHMEMDriversRDMAnvrtcML-SummitML-SummitFrom AI Framework to Operatorshttps:/ ProgramminghostdeviceML-SummitML-SummitSIMT：Auto SIMDML-Summi

5、tML-SummitSIMT：Easy for Beginner？SimpleMassiveAutomaticML-SummitML-SummitBut Copy,Sync,Schedule,Tile,CacheReduceMatmulML-SummitML-SummitThe complexity of operator developmentTensor Info（DataType、Shape、Format）Operator Type（Elemwise、Reduce、Matmul）Hardware Variants（Volta、Ampere、Blackwell）https:/ Stackh

6、ttps:/ Structure昇腾AI处理器:https:/ Stackhttps:/ in NPUhttps:/ Chttps:/ 融合优化ML-SummitML-SummitAutomatic Optimization by Compilerhttps:/tvm.apache.org/ML-SummitML-SummitPyTorch 2.0 with Tritonhttps:/pytorch.org/get-started/pytorch-2.0/https:/pytorch.org/get-started/pytorch-2.0/ML-Summ

word格式文档无特别注明外均可编辑修改，预览文件经过压缩，下载原文更清晰！

三个皮匠报告文库所有资源均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

本文主要探讨了软件设计与实现范式从对象到张量的演变，以及基于GPU/NPU的软件技术栈的计算架构演进。关键点如下： 1. 软件设计与实现范式变化：从Software 1.0到Software 2.0，再到Software 3.0和Software 4.0，体现了软件设计的自生长、意图驱动、数据驱动和确定性等特点。 2. 计算架构的演进：从单线程CPU到GPU，GPU/NPU的能效比变化，以及AI加速器架构的变革。 3. 基于GPU/NPU的软件技术栈：介绍了CUDA平台栈、AI系统视图、异构计算SDK运行时、Tensor Core AI性能里程碑等。 4. 从对象到张量的架构与实现模式：对象与张量的数据结构对比，以及根据数据规模和间隔紧凑性选择合适的实现方式。 5. 硬件驱动与软件库：包括NPU芯片驱动、协议库、通信库、算子编译器、媒体库等。 6. 图编译与优化框架：图编译与执行引擎、自动编译优化工具、观测分析工具等。 7. 推理服务与应用框架：包括LLM推理与加速框架、异构推理与加速框架、确定性资源调度框架等。综上所述，文章围绕软件设计与实现范式的演变、计算架构的演进以及基于GPU/NPU的软件技术栈展开，探讨了从对象到张量的架构与实现模式，并介绍了相关的硬件驱动、软件库、编译优化和应用框架。

"从对象到张量的架构演进" "GPU/NPU技术栈的软件实现" "软件设计与实现范式的未来趋势"

全行业研究报告分享下载平台

0731-84720580
商务合作：really158d
友链申请 (QQ)：1737380874

关于我们

更多

关于我们

三个皮匠报告微信公众号

三个皮匠报告微信小程序

扫码咨询网站充值下载问题

友情链接：

营销自动化亿欧智库微播易阿里妈妈

copyright@2008-2013 长沙景略智创信息技术有限公司版权所有网站备案/许可证号：湘B2-20190120 | 工信部备案号：湘ICP备17000430号-2 | 公安备案号：湘公网安备43010402001071号

客服

小程序

服务号

折叠