1、DeepSeekDeepSeek消费电子行业大模型新型应用最佳实践分享消费电子行业大模型新型应用最佳实践分享2022025 5.0303陈树荣陈树荣腾讯云智能商业化腾讯云智能商业化大模型产业生态图大模型产业生态图研发预训练模型的企业研发预训练模型的企业自研大模型结构的企业自研大模型结构的企业LEVEL LEVEL 3 3 基于模型基于模型SFTSFTLEVEL LEVEL 2 2 研发预训练模型研发预训练模型LEVEL 1LEVEL 1 研发模型结构研发模型结构不用训练,直接调不用训练,直接调用大模型用大模型APIAPI的的企业企业基于自己数据基于自己数据SFTSFT做自己模型的企业做自己模型
2、的企业基于开源或者基于国内预训练模型结基于开源或者基于国内预训练模型结合自己数据进行微调的企业合自己数据进行微调的企业大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业:大模型产业链上的生态,根据大模型生态上不同企业的定位,分成了四个等级的企业:LEVEL LEVEL 4 4 直接调用直接调用国内外大模型百花齐放国内外大模型百花齐放国内大厂国内大厂全球开源社区全球开源社区国内创业明星国内创业明星国外头部国外头部 DeepSeekDeepSeek 是是“深度求索深度求索”开发的一系列人工智能模型。开发的一系列人工智能模型。DeepSeekDeepSeek 通过持续的技术创
3、新通过持续的技术创新和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了和市场拓展,在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了广泛认可。广泛认可。其中:其中:DeepSeek-V3 DeepSeek-V3 是在是在14.814.8万亿高质量万亿高质量 token token 上完成预训练的一个强大的混合专家上完成预训练的一个强大的混合专家(MoE)(MoE)语言模型,拥有语言模型,拥有67106710亿参数亿参数(激活参数(激活参数370370亿)亿)。作为通用大语言模型,其在在知识类任。作为通用大语言模型,其在在知识类任务务(知识问答、内容生
4、成等知识问答、内容生成等)领域表现出色。领域表现出色。DeepSeek-R1 DeepSeek-R1 是基于是基于 DeepSeek-V3-Base DeepSeek-V3-Base 训练生成的训练生成的强化强化推理推理能力能力模型,在数学、代模型,在数学、代码生成和逻辑推断等复杂推理任务上表现优异。码生成和逻辑推断等复杂推理任务上表现优异。更低的研发成本更低的研发成本*更高效资源利用更高效资源利用$5.6M vs.OpenAIs$100M+使用2,000 GPUs,竞品使用 10,000+GPUs开源模型比肩头部闭源开源模型比肩头部闭源60%+指标优于优于Llama3.1 Claude-3.
5、5 GPT-4o 打破大模型技术壁垒打破大模型技术壁垒重挫美国科技公司股价,英伟达市值下跌5900亿人工智能的人工智能的Sputnik时刻时刻被美国及其盟友列入各种限制DeepSeek推动国产模型达到新的高度推动国产模型达到新的高度大大模型时代模型时代企业企业AIAI项目项目“烟囱式烟囱式”建设痛点越发严重建设痛点越发严重智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等智能化趋势下:多品牌多场景下的重复造车轮,导致模型算法和镜像等AIAI资产管理分散,无法沉淀复用和统一运用资产管理分散,无法沉淀复用和统一运用。底层统一底层统一上层统一上层统一中层异构中层异构AIAI项目的烟囱式建
6、设项目的烟囱式建设算力算力算力算力算力算力算法算法算法算法算法算法对外出入口对外出入口A A对外出入口对外出入口B B对外出入口对外出入口C C业务系统业务系统A A业务系统业务系统B B业务系统业务系统C C投资浪费投资浪费适应性差适应性差项目周期长项目周期长AIAI治理治理算力池算力池业务系统业务系统A A业务系统业务系统B B业务系统业务系统C C集约敏捷的集约敏捷的AIAI中台式建设中台式建设算法池(算法池(A/B/CA/B/C )应用模板(应用模板(A/B/CA/B/C )应用逻辑应用逻辑A A应用逻辑应用逻辑B B应用逻辑应用逻辑C C统一出入口统一出入口计算集群计算集群(H20H