1、ModelArts最佳实践(中国站)最佳实践(中国站)文档版本文档版本01发布日期发布日期2025-06-28华为云计算技术有限公司华为云计算技术有限公司 版权所有版权所有 华为云计算技术有限公司华为云计算技术有限公司 2025。保留一切权利。保留一切权利。非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。商标声明商标声明和其他华为商标均为华为技术有限公司的商标。本文档提及的其他所有商标或注册商标,由各自的所有人拥有。注意注意您购买的产品、服务或特性等应受华为云计算技术有限公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在
2、您的购买或使用范围之内。除非合同另有约定,华为云计算技术有限公司对本文档内容不做任何明示或暗示的声明或保证。由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。华为云计算技术有限公司华为云计算技术有限公司地址:贵州省贵安新区黔中大道交兴功路华为云数据中心 邮编:550029网址:https:/ 01(2025-06-28)版权所有 华为云计算技术有限公司i目目 录录1 ModelArts 最佳实践案例列表最佳实践案例列表.12 昇昇腾能力应用地图腾能力应用地图.83 DeepSeek 系列模型推理
3、应用系列模型推理应用.183.1 DeepSeek 蒸馏版模型基于 ModelArts Lite Server 适配 vLLM 的推理部署指导.183.2 基于 ModelArts Studio(MaaS)DeepSeek API 和 Dify 快速构建网站智能客服.203.3 基于 ModelArts Studio(MaaS)DeepSeek API 和 Cherry Studio 快速构建个人 AI 智能助手.263.4 基于 ModelArts Studio(MaaS)DeepSeek API 和 Cursor 快速构建代码编辑器.313.5 基于 ModelArts Studio(Ma
4、aS)DeepSeek API 和 Cline 快速构建 AI 编程助手.343.6 基于 ModelArts Studio(MaaS)DeepSeek API 和 RAGFlow 快速构建 AI 助理.393.7 基于 ModelArts Studio(MaaS)DeepSeek API 和 Deep Research 快速实现行业洞察.444 LLM 大语言模型推理大语言模型推理.514.1 在 ModelArts Studio(MaaS)基于 Qwen2-7B 模型实现新闻自动分类.514.2 主流开源大模型基于 Lite Server&Cluster 适配 Ascend-vLLM Py
5、Torch NPU 推理指导(6.5.905).604.2.1 Ascend-vLLM 介绍.604.2.2 支持模型列表.624.2.3 支持的推理特性.644.2.3.1 推理特性列表.644.2.3.2 Reasoning Outputs.654.2.3.3 CANN Graph.654.2.4 资源规划、准备环境.664.2.4.1 各模型支持的最小卡数和最大序列.664.2.4.2 准备资源环境.684.2.5 部署依赖包.684.2.5.1 部署依赖包版本说明.684.2.5.2 安装 KubeInfer.694.2.5.2.1 Cluster 安装 kubeinfer.694.2
6、.5.3 获取配套软件、基础镜像.704.2.6 Cluster 部署推理服务.714.2.6.1 部署准备.714.2.6.2 基于 K8s Deployment 单机部署推理服务.724.2.6.3 基于 KubeInfer 多机部署推理服务.744.2.7 Server 部署推理服务.75ModelArts最佳实践(中国站)目 录文档版本 01(2025-06-28)版权所有 华为云计算技术有限公司ii4.2.7.1 部署准备.764.2.7.2 基于 Docker 单机、多机部署.764.2.8 在线推理请求测试.794.2.8.1 LLM 推理请求测试.794.2.8.2 多模态模型