NVIDIA-徐添豪-大模型时代对基于GPU的软硬件系统设计的思考.pdf

编号:155828 PDF 34页 2.62MB 下载积分:VIP专享
下载报告请您先登录!

NVIDIA-徐添豪-大模型时代对基于GPU的软硬件系统设计的思考.pdf

1、大模型时代对基于大模型时代对基于GPUGPU的的软硬件系统设计的思考软硬件系统设计的思考徐添豪徐添豪 NVIDIANVIDIA消费互联网行业技术负责人消费互联网行业技术负责人个人简介个人简介 徐添豪,NVIDIA消费互联网行业解决方案架构师负责人,长期从事基于GPU的解决方案构建和落地工作,在GPU软硬件/CUDA/深度学习算法/工程及架构方面,有多年经验。近期主要从事生成式AI和大语言模型的工程加速相关工作。目录目录 Hardware and System Evolution for AI NVIDIAs Full-stack Ecosystem NeMo Framework for LLM

2、 What about Inference目录目录 Hardware and System Evolution for AI NVIDIAs Full-stack Ecosystem NeMo Framework for LLM What about InferenceGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU archi

3、tecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FLOPSGPU architecture and FL

4、OPSCollaboration via inter-GPU connection:Collaboration via inter-GPU connection:NVLinkNVLink and and NVSwitchNVSwitchBest-of-breed infrastructure for AI development built Best-of-breed infrastructure for AI development built on NVIDIA DGXon NVIDIA DGX目录目录 Hardware and System Evolution for AI NVIDIA

5、s Full-stack Ecosystem NeMo Framework for LLM What about InferenceNVIDIANVIDIA全栈全栈NVIDIANVIDIA全栈全栈NVIDIANVIDIA全栈全栈NVIDIANVIDIA全栈全栈目录目录 Hardware and System Evolution for AI NVIDIAs Full-stack Ecosystem NeMo Framework for LLM What about InferenceEstimating GPT3-175B training timeEstimating GPT3-175B t

6、raining timeTake 128*A800 node as an exampleEstimating GPT3-175B training timeEstimating GPT3-175B training timeTake 128*A800 node as an exampleTraining OptimizationTraining OptimizationTraining OptimizationTraining OptimizationTraining OptimizationTraining Op

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(NVIDIA-徐添豪-大模型时代对基于GPU的软硬件系统设计的思考.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠