1、请认真阅读文后免责条款请认真阅读文后免责条款传媒传媒报告日期:报告日期:2025 年年 02 月月 10 日日DeepSeek 重塑重塑 AI 产业格局,助力产业格局,助力 AI 端侧落地端侧落地AI 产业系列跟踪产业系列跟踪专题研究专题研究报告报告华龙证券研究所华龙证券研究所投资评级:投资评级:推荐推荐(维持维持)最近一年走势最近一年走势分析师:孙伯文执业证书编号:S0230523080004邮箱:相关阅读相关阅读智谱发布 Realtime、4V、Air 新模型,商业化应用场景持续拓宽传媒行业周报2025.01.20CES 2025 盛大开幕,“ARAI”应用改变移动办公范式传媒行业周报20
2、25.01.14AI+文化出海+IP 衍生,打开传媒成长新空间-传媒行业 2025 年年度投资策略报告2024.12.06摘要:摘要:DeepSeek-V3 和和 R1 模型凭借卓越的性能和创新的技术,迅速在模型凭借卓越的性能和创新的技术,迅速在全球全球 AI 领域崭露头角。领域崭露头角。2024 年 12 月 26 日,公司发布全新系列模型 DeepSeek-V3 并同步开源,DeepSeek-V3 为自研 MoE 模型,多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模 型,并 在 性 能 上 和 世 界 顶 尖 的 闭 源 模 型 GPT-4o 以 及Cl
3、aude-3.5-Sonnet 不分伯仲。2025 年 1 月 20 日,DeepSeek 发布了推理模型 DeepSeek-R1,该模型在后训练阶段大规模使用了强化学习技术,在仅仅使用极少标注数据的情况下,极大提升了模型推理能力,在数据、代码、自然语言推理等任务上,性能比肩OpenAI o1 正式版。DeepSeek-V3 技术创新技术创新:架构优化与训练效率提升架构优化与训练效率提升。DeepSeek-V3在继承 DeepSeek-V2 高效架构的基础上,通过创新的负载均衡策略和多标记预测(MTP)目标,进一步优化了模型性能。该模型率先采用无需辅助损失的负载均衡策略,有效降低了因负载均衡导
4、致的性能下降。同时,MTP 目标不仅提升了模型性能,还支持推理加速中的推测性解码。在预训练阶段,DeepSeek-V3 通过 FP8混合精度训练框架和算法、框架、硬件的协同设计,克服了跨节点 MoE 训练中的通信瓶颈,实现了计算与通信的高效重叠,显著提升了训练效率并降低了成本。最终,以仅 266.4 万 H800 GPU小时的经济成本完成了在 14.8 万亿标记上的预训练,成为目前最强的开源基础模型。在后训练阶段,DeepSeek-V3 通过知识蒸馏技术,将长链推理(CoT)模型的推理能力融入其中,显著提升了推理性能,同时保持了输出风格和长度的可控性。科技巨头纷纷接入科技巨头纷纷接入 Deep
5、Seek,推动全球推动全球 AI 生态发展生态发展。2025 年 1月 30 日,英伟达宣布 DeepSeek-R1 模型作为 NVIDIA NIM 微服务预览版上线,为企业提供了高效推理服务。紧接着,1 月 29 日,微软将 DeepSeek-R1 纳入 AzureAI Foundry 平台,支持企业通过无服务器端点访问该模型。此外,DeepSeek-R1 还上线了 GitHubModels,开发者可免费试用。2 月 1 日,硅基流动与华为云联合发布了基于昇腾云服务的 DeepSeek R1/V3 推理服务,凭借自研推理加速引擎,该服务在性能上与全球高端 GPU 部署模型相当,同时提供稳定、
6、生产级的服务能力,满足大规模商用需求,并依托华为云昇腾云服务的强大算力支持。投资投资建议建议:DeepSeek-V3/R1 的推出代表中国在全球 AI 领域的技证券研究报告证券研究报告行业研究报告行业研究报告请认真阅读文后免责条款术引领,极大地提振了全球 AI 产业的信心,为 AI 产业的长期增长提供了强大动力。借助 AI 算法,公司可以精准分析用户偏好,实现个性化内容推荐,进而提高用户参与度和留存率,增强其市场竞争力。同时,AI 能够根据企业的需求生成创意内容,如剧本创作、角色设计、故事背景等,为影视、动漫、游戏等领域提供丰富的创意灵感,推动行业内容的多元化发展。因此,维持传媒行业“推荐”评