报告预览

太极 Angel 助力生成式大模型高效落地-刘凯.pdf

编号：164025

PDF 30页 8.70MB 下载积分：VIP专享

下载报告请您先登录！

太极 Angel 助力生成式大模型高效落地-刘凯.pdf

1、腾讯Angel助力生成式大模型高效落地混元大模型推理负责人刘凯2019-至今2013 2016 电磁场GPU加速2017 2019 深度学习通用推理引擎2016 2017 Angel-HCF&Angel-SNIP首个工业落地的INT4&稀疏化混元大模型推理方向负责人 PowerPC系统软件开发目录生成式AI技术之部署挑战解析Angel-HCF助力生成式AI部署优化Angel-SNIP助力生成式AI无损压缩Angel助力混元大模型大规模落地应用生成式AI技术之部署挑战解析快速增长的模型规模快速增长的模型规模缓慢增长的设备能力缓慢增长的设备能力模型规模快速增长，12年提升1 1个量级个量级随着

2、MoE结构的提出，模型整体参数量突破万亿突破万亿 23年开始模型窗口长度不断加大，各大公司逐步开放至百百KMKM级别级别3232404080808080808080809696V100V100A100-40GA100-40G A100-80GA100-80GA800A800H100H100H800H800H20H20训练训练GPUGPU显存容量（显存容量（GBGB）125125312312312312312312990990990990148148V100V100A100-40GA100-40G A100-80GA100-80GA800A800H100H100H800H800H20H20训练训

3、练GPUGPU计算能力（计算能力（TFLOPSTFLOPS）900900152015202039203920392039343034303430343040964096V100V100A100-40GA100-40G A100-80GA100-80GA800A800H100H100H800H800H20H20训练训练GPUGPU显存带宽（显存带宽（GBGB）161624242424484848484848T4T4A10A10A30A30L20L20L40L40L40SL40S推理推理GPUGPU显存容量（显存容量（GBGB）6565125125165165120120181181362362T

4、4T4A10A10A30A30L20L20L40L40L40SL40S推理推理GPUGPU计算能力（计算能力（TFLOPSTFLOPS）300300600600933933864864864864864864T4T4A10A10A30A30L20L20L40L40L40SL40S推理推理GPUGPU显存带宽（显存带宽（GBGB）越发严格的禁令越发严格的禁令 GPU显存增长缓慢，停滞停滞在100G以下 GPU计算能力1代增长3 3倍左右倍左右显存带宽1代增长0.510.51倍倍训练卡：A100、H100、A800、H800全面禁售全面禁售推理卡：L40S、L40、A30全面禁售全面禁售中

5、国特供：H20、L20算力大幅削减，仅保留大幅削减，仅保留2030%2030%如何使用更差的卡来优化大模型的训练和推理效率在现有卡的基础上设计怎样的模型结构能在同等参数规模下获得更好的训练和推理性能如何充分发挥国产芯片能力来打造国产大模型周期周期体量体量收益收益模型训练模型训练13月千级别学术、社会正收益经济负收益模型推理模型推理半年数年千万级别学术、社会正收益经济正收益支撑太极Angel研发模型压缩组件压缩组件SNIP+SNIP+推理部署加速组件推理部署加速组件HCFHCF，保障腾讯混元大模型高便捷、高性能、低成本的落地应用太极太极Angel-HCF 太极太极Angel-SNIP An

6、gel-HCF之显存优化 Angel-HCF之计算优化 Angel-HCF之通信优化 Angel-HCF之调度优化Angel-HCF助力生成式AI部署优化模型权重：固定大小，模型参数量*数据类型激活空间：动态大小，输入规模*隐层规模GPU显存占用拆分大模型热+禁令影响下，如何在更小的卡上部署大模型大模型走向生产阶段，降低显存提升并发能有效降低成本超长文火热的当下，如何缓解激活空间显存的凸显 KV-Cache：动态大小，输入输出规模*隐层规模*层数腾讯混元的解法分布式存储PrefillPagedAttention一阶段优化一阶段优化二阶段优化二阶段优化升级Buffer全共享量化压缩权重

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（太极 Angel 助力生成式大模型高效落地-刘凯.pdf）为本站（张5G）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。