1、 DeepSeek 发布 NSA,马斯克旗下 XAI 发布GroK 3 Table_ReportDate2025 年 2 月 21 日 请阅读最后一页免责声明及信息披露 http:/ 2 证券研究报告 行业研究 行业事项点评 电子电子 投资评级投资评级 看好看好 上次评级上次评级 看好看好 莫文宇 电子行业首席分析师 执业编号:S1500522090001 邮 箱: 杨宇轩 电子行业分析师 执业编号:S1500525010001 信达证券股份有限公司 CINDA SECURITIES CO.,LTD 北 京 市 西 城 区 宣 武 门 西 大 街 甲127号 金 隅 大 厦B座 邮编:1000
2、31 DeepSeekDeepSeek 发布发布 NSANSA,马斯克旗下马斯克旗下 XAIXAI 发布发布GroK 3GroK 3 Table_ReportDate 2025 年 2 月 21 日 本期内容提要本期内容提要:Table_Summary DeepSeek 发布发布 NSA,创新性降低成本的同时保障了模型性能。,创新性降低成本的同时保障了模型性能。人工智能发展高度依赖海量数据和算力,DeepSeek 提出神经缩放增强(Neural Scaling Augmentation,NSA)技术,可通数据生成和模型优化的方法,为突破模型瓶颈提供全新的解决方案。NSA 引入了两个核心创新点:
3、(1)硬件对齐系统:优化块级稀疏注意力,使其充分利用Tensor Core 并优化内存访问,从而实现平衡的算术强度。(2)训练感知设计:通过高效算法和反向传播运算符实现稳定的端到端训练,使 NSA 能够同时支持高效推理与完整训练流程。在性能方面,尽管NSA 具有稀疏性,但在一般基准测试上 NSA 与全注意力基线表现相当。在长文本评估中,NSA 在 64k 上下文中的大海捞针测试中,在所有位置上都实现了完美的检索准确率,这表明其长文本处理方面具有良好的优势。在速度方面,随着上下文长度的增加,NSA 实现了越来越大的加速,在 64k 上下文长度下实现了 9.0 倍的前向加速和 6.0 倍的反向加速
4、。相比之下,随着解码长度的增加,NSA 在延迟方面表现出显著的减少,在 64k 上下文长度下实现了高达 11.6 倍的加速。马斯克旗下马斯克旗下 XAI 发布发布 GroK 3,性能有所提升。,性能有所提升。GroK 3/GroK 3-mini 在数学、科学、代码等性能上超过 GPT-4o、Claude 3.5 Sonnet、DeepSeek-R1 和 Gemini-2 Pro 等主流模型。此外,Grok 3 具备代理/智能体(Agent)功能,它不仅可以搜索网页,查找现有资料,还可以加以思考,从而返回正确的信息。据悉,Grok 3 在 10 万个 GPU 上进行训练,总训练时长达到 2 亿
5、GPU 小时,Grok 3 的计算资源是 Grok 2 的 10 倍。算力投入叠加算法创新,算力投入叠加算法创新,2025 年或为年或为 AI 商业化大年。商业化大年。我们认为,从目前看,中国团队的创新工作降低了模型训练和推理的成本,有望较大程度将 AI 商业化推向繁荣。目前全球越来越多的厂商加入了 AI 的竞争之中,模型迭代速度不断加快。从训练端看,除了对模型的性能要求更高之外,研发迭代的周期也要不断缩短,否则相关的研究可能变得一文不值。这可能在某种程度上加大训练算力的需求。从推理端市场看,从 DeepSeek 的广泛铺开可以看到推理算力需求正以肉眼可见的速度成长,而目前推理成本的迅速降低,
6、将有望推动复杂场景落地,AGI 之路更近一步。总体上 2025 年算力需求仍然有很大空间,叠加是英伟达 GB 系列产品放量之年,模型端的迅速进展有望推动端侧创新,算力硬件和各类应用有望共同繁荣,相关产业链值得重点关注。建议关注建议关注:【ODM】工业富联;【PCB】深南电路/生益科技/沪电股份/胜宏科技/生益电子/广合科技/景旺电子等;风险因素:风险因素:宏观经济下行风险;下游需求不及预期风险;中美贸易摩擦加剧风险。请阅读最后一页免责声明及信息披露 http:/ 3 Table_Introduction 研究团队简介研究团队简介 莫文宇,莫文宇,电子行业分析师,S1500522090001。毕