1、分析师分析师联系人联系人郝艳辉郝艳辉登记编号:S1220524050002康百川康百川登记编号:S1220524060001张丰淇张丰淇登记编号:S1220524070002曹敦鑫曹敦鑫登记编号:S1220525020002朱壹朱壹超预期的开源程度与低成本属性超预期的开源程度与低成本属性解码解码DeepSeek开源周开源周海 外海 外 团 队团 队 行 业 深 度 报 告行 业 深 度 报 告证券研究报告|海外科技|2025年03月16日摘要摘要2DeepSeek开源周揭示开源周揭示V3/R1在单在单GPU计算速度计算速度、GPU间传输速度及间传输速度及GPU利用率方面的极致提效利用率方面的极
2、致提效。2025年2月24日至28日,DeepSeek通过连续五天的“开源周”活动,开源了Infra关键组件的代码库。具体而言,如果将模型训练和推理简化为计算和通信两大任务,FlashMLA和DeepGEMM主要专注于提升计算效率,即通过映射向量的降维以及运算位数的下降来减少计算过程中的缓存空间占用,从而提高单位GPU能实现的计算速度上限。DeepEP则面向通信任务,在MoE架构下采用NVSHMEM来适配频繁的小规模传输需求,提高GPU间通信速度上限。DualPipe和EPLB负责不同计算与通信子任务之间的灵活调度,通过流水线双向交错执行和热门专家复制等方法来避免子任务分配不当带来的GPU空置
3、。最后,3FS则是在正式进行计算和通信前,为数据的读取与准备工作提供支持,基于高速缓存与读取架构提升文件的随机读写效率。DeepSeek V3/R1推理架构在极致的工程优化下实现高吞吐和低时延推理架构在极致的工程优化下实现高吞吐和低时延,模型推理的理论利润率达到模型推理的理论利润率达到545%。开源周DAY6发布V3/R1推理系统的概览,用于将前五天开源的各项底层组件整理到推理流程中,通过在整个推理架构贯穿工程细节优化来实现高吞吐和低时延。基于所有Token(包括Web、App及API端)都按照R1的标准收费、仅考虑2美元/小时GPU租赁成本(未计入折旧、运维、能耗与租金等)的假设,公司称其模
4、型服务的理论利润率达到545%。DeepSeek超预期的开源程度与低成本属性为超预期的开源程度与低成本属性为AI应用与云服务兑现带来积极信号应用与云服务兑现带来积极信号。我们在2025年2月4日发布的报告从算力、应用及终端层面看DeepSeek R1的影响中指出,基于DeepSeek开源+低成本属性,AI产业在算力、应用和终端三个维度迎来实质性变革,港股AI资产也有望迎价值重估。通过这次开源周,我们更清晰地看到DeepSeek正在推动大模型算法向开源、低精度(FP8)、MoE三个方向演进,同时Infra层面的工程优化相对简单堆料更显重要。随着技术放开带动更多企业和开发者参与AI应用研发,我们继
5、续看好以上三条主线的长期空间,并且进一步强调算力与应用层的逻辑变化:1)DS开源的技术完全针对NV Hopper架构进行深度优化,技术迁移/国产适配需芯片厂商完善对FP8等特性的支持并相应优化推理侧解决方案;2)超出预期的“低成本”或为云平台算力服务创造更大需求与盈利空间;3)更大程度的开源为二次定制开发和应用创新提供足够自由度,企业有望充分发挥自身数据和行业know-how优势,龙头受益趋势更为确定。投资建议投资建议:在DS R1发布-腾讯元宝加速落地-阿里云投入超预期-Manus AI发布等多轮催化带动估值上修的背景下,港股有望开启以科技成长为主线的长线行情,我们看好后续行情的三个演绎方向
6、1)云服务云服务:阿里巴巴-W、商汤-W、金山云;2)通用应用通用应用:腾讯控股;3)细分场景应用细分场景应用:垂类软件板块,金蝶国际、金山软件、美图-W、迈富时、明源云;内容娱乐板块,快手-W、哔哩哔哩-W、网易-W、阅文集团。wUmYnNoRvNzQtOpRaQdNbRtRmMsQmRfQqQnOfQqRqP9PrRxOvPoNsMNZoOsR摘要摘要3阿里巴巴阿里巴巴-W:依托技术依托技术+生态生态+算力承接算力承接DS流量流量,发布发布QwQ-32B强化开源布局强化开源布局。DeepSeek R1的发布显著降低了大模型使用门槛,但其官网因算力资源有限难以承载流量高峰,导致需求外溢。“模