未知:使用虚拟化技术提升大模型推理性能实践分析报告(24页).pdf

当前位置:首页 > 报告详情
未知:使用虚拟化技术提升大模型推理性能实践分析报告(24页).pdf

上传人: AG 编号:608651 2024-01-01 24页 3.85MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了使用虚拟化技术提升大模型推理性能的实践。背景部分指出,随着数据爆发式增长、模型规模扩大和更新速度加快,对算力提出了新的挑战。异构计算架构的创新成为打破现有通用计算瓶颈、推动摩尔定律持续演进的关键。国内企业在算力设备方面取得进展,如海光信息、壁仞科技、燧原科技、摩尔线程等。 关键点包括:1) 虚拟化技术如GPU池化、动态调度感知异构资源、自动调整调度策略等,能提高AI推理资源利用率;2) 国产异构算力发展迅猛,例如海光DCU、天数智芯的BI芯片、寒武纪的思元370等;3) 从业人员和国产算力设备存在割裂,国产算力难以重复利用和闲置状况严重;4) 平台层面,模型推理缺乏统一标准,算子开发和交付效率低;5) 实践案例中,第四范式推理加速框架SLX LLM和推理加速卡SLX,能使大模型推理性能提升10倍,兼容主流大模型推理框架。 文章还提到了Project-HAMi,这是一个基于k8s的算力复用平台,通过虚拟化技术将小模型和大模型复用在一张GPU上,提升TCO指标。最后,感谢第四范式(北京)技术有限公司对本文的支持,并提供了他们的联系方式和地址。
"如何通过虚拟化技术提升AI模型推理性能?" "国产异构算力发展现状与未来趋势分析" "第四范式推理加速框架SLX LLM的实际应用案例分享"
客服
商务合作
小程序
服务号
折叠