1、证券研究报告证券研究报告 行业周报行业周报 DeepSeek 开源周收官,具身智能商业开源周收官,具身智能商业化或将加速化或将加速 计算机行业周报(计算机行业周报(2025.2.242025.2.28)Table_Rating 增持(维持)增持(维持)able_Summary Table_Summary 市场回顾市场回顾 过去一周(2.24-2.28)上证综指下跌 1.72%,创业板指下跌 4.87%,沪深 300 指数下跌 2.22%,计算机(申万)指数下跌 7.82%,跑输上证综指6.10个百分点,跑输创业板指2.95个百分点,跑输沪深300指数 5.60 个百分点,位列全行业第 29 名
2、。周观点周观点 DeepSeek 开源周圆满收官,大模型军备竞赛火热开源周圆满收官,大模型军备竞赛火热。“DeepSeek 开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM 和 3FS 四个开源项目,以及DualPipe、EPLB 等代码库。首个开源的代码库为 FlashMLA,是DeepSeek 用于 Hopper GPU 的高效 MLA 解码内核,并针对可变长度序列进行优化,现已投入生产。DeepEP 是首个用于 MoE 模型训练和推理的开源EP通信库,专门用于提升大模型训练效率设计,当多个AI专家模型协同工作时,能高效协调
3、它们之间的通信,减少延迟和资源消耗,同时支持低精度计算,进一步节省算力。DeepGEMM 是一个优化矩阵乘法(AI 训练的核心计算)的工具。通过低精度计算提升速度,再用英伟达 CUDA 技术修正误差,既快又准,代码仅 300 行,安装简单,适合快速部署。DualPipe 主要用于解决流水线并行中的“等待时间”问题,EPLB 则用于自动平衡 GPU 负载。3FS(Fire-Flyer File System)系统则采用分布式文件系统,利用高速存储和网络技术,让数据读取速度达到每秒 6.6TB,适合海量数据训练。同时,DeepSeek 官方团队在 Github 和知乎给出了 DeepSeek-V3
4、/R1 推理系统的技术解读,通过优化吞吐和延迟,DeepSeek 理论上一天的总收入为$562,027,成本利润率 545%。我们认为,开源周提供的项目,从硬件性能压榨、模型训练优化到数据处理提速,覆盖 AI 开发的核心环节,将进一步促进 AI平权,加速 AI应用的爆发。大模型军备竞赛火热。(1)OpenAI:根据钛媒体,2 月 27 日,推出 GPT-4.5 模型(代号 Orion),是公司有史以来算力和数据规模最大、最佳的 AI 基座模型。通过扩展无监督学习,GPT-4.5 提高了识别模式、建立联系和产生创造性见解的能力,而无需推理,此外,GPT-4.5 计算效率比 GPT-4 提升了 1
5、0 倍以上,而价格层面,GPT-4.5 API 每 100 万 token输入 75 美元,输出价格为 150 美元,比 GPT-4o 的 2.5 美元上涨 30倍。(2)阿里:2 月 25 日,阿里通义千问团队推出 QwQ-Max-Preview深度思考模型,将在不久后开源。支持联网搜索,展现出超强的通用能力,可写影评、写代码、做数学题,并可胜任创意写作、游戏开发等开放性任务。(3)xAI:2 月 18 日,xAI 开发的 Grok-3 模型正式发布,Grok-3和 Grok-3 mini在多方面的测试得分上都超过或媲美Gemini 和 ChatGPT 等对手。同时,xAI 宣布推出名为 D
6、eepsearch 的Grok-3 智能搜索引擎。2 月 23 日,马斯克宣布,Grok 语音模式早期测试版现已在 Grok 应用程序上线。北京发布具身智能培育行动计划,具身智能商业化在即北京发布具身智能培育行动计划,具身智能商业化在即。2 月 28 日,Table_Industry 行业行业:计算机计算机 日期日期:shzqdatemark Table_Author 分析师分析师:吴婷婷吴婷婷 Tel:021-53686158 E-mail: SAC 编号编号:S0870523080001 Table_QuotePic 最最近近一年行业指数一年行业指数与沪深与沪深 300 比较比较 Tabl