1、 2025 年深度行业分析研究报告行业深度研究(深度 扫码获取更多服务 内容目录内容目录 一、AI 模型趋势:大小模型互补,预训练市场快速收敛,Scaling Law 新方向增强推理需求.3 1.1 预训练和现实数据触顶,后训练时代将开启新的 Scaling Law 方向.3 1.2 方向一:用推理代替思考.3 1.3 方向二:测试时训练.5 1.4 方向三:合成数据.6 1.5 方向四:模型量化逐渐失效.7 1.6 方向五:多模态融合模型发展空间大.7 二、AI 应用渗透率持续增长,落地场景多点开花.9 2.1 AI 应用活跃度持续增长,应用场景得到认可,进入快速获客期.9 2.2 AI 程
2、序员是确定性的强需求.11 2.3 AI 搜索是 25 年最有希望诞生超级 APP 的赛道.12 2.4 AI 为通用型和数据类 SaaS 平台打开增长空间.12 2.5 AI 眼镜是 AI 应用落地的最佳硬件,25 年将迎来发布潮和出货量大增.13 三、算力系统面临“木桶效应”挑战,供给端瓶颈或成主要矛盾.15 3.1 人工智能算力系统面临诸多挑战.15 3.2 单卡算力升级速率落后于模型迭代速率,Blackwell 延后预示系统摩尔进一步降速.15 3.3 数据中心电力消耗呈指数级增长,核电或成最优解决方案.18 四、大模型推理服务大规模部署,如何影响硬件市场?.20 4.1 大模型性能提
3、升,推动推理算力需求加速增长.20 4.2 服务器推理:内存墙难破,HBM 容量仍为竞争要点.21 4.3 端侧推理:单用户推理导致内存端高成本,端云结合将是未来趋势.21 五、AI 设备销量正在提升.23 5.1 AI 手机焦点在于旗舰机.23 5.2 AI PC 的竞争将会越发激烈.26 5.3 AI 设备产业链随着 AI 加入将迎来更新换代.29 六、智能驾驶&机器人行业正在摸索技术路径.31 6.1 智能驾驶:模块化方案与端到端方案之争.31 6.2 具身智能想要放量需要更实用的场景及更低的价格.31 一、AI 模型趋势:大小模型互补,预训练市场快速收敛,Scaling Law 新方向
4、增强推理需求 2024 年大模型厂商推出模型的速度仍在加快,大模型与小模型共存仍是解决模型能力上限和端侧推理的方案,各大模型厂商也会推出几 B 到 TB 级别的模型。随着大型模型训练成本的不断提升,且有更多像 Meta、Mixtral、阿里通义等公司的开源,模型预训练市场的玩家会快速缩小,针对特定任务的微调或者是 Agent 业务将会是更多中小模型厂商发展的重点。在当前算力和数据 Scaling Law 放缓的情况下,找到新的 Scaling Law 方向是明年模型发展的重点。1.11.1 预训练和现实数据触顶,后训练时代将开启新的预训练和现实数据触顶,后训练时代将开启新的 Scaling S
5、caling LawLaw 方向方向 从 24 年年初开始有论文提出模型能力提升速度随着参数规模的扩大而放缓,到 11 月份OpenAI 前首席科学家 Ilya 在公开场合表示简单地增加数据和计算能力来扩大当前模型规模的时代已经结束。但是,预训练的 scaling law 放缓不代表大模型发展速度和算力需求的放缓,就像是芯片 gate 的实际尺寸停滞在 20nm 并不影响等效 gate 密度达到目前的3nm,广义的摩尔定律甚至比 20 年前更快,大模型也需要找到具有更高的投入回报比的新方向。1.21.2 方向一:用推理代替思考方向一:用推理代替思考 OpenAI 于 2024 年 9 月 12
6、 日发布了新的 AI 模型系列 o1,这是 OpenAI 首个具有逻辑推理能力的模型系列,特别擅长处理复杂的推理任务,尤其是在科学、技术、工程和数学(STEM)领域的问题,在这些领域其评测分数都远远超过 GPT-4o。o1 模型将计算资源从大规模预训练数据集重新分配到训练和推理阶段,增强了复杂推理能力,在费用和成本上也进行了重分配,使用 o1-preview 的 API 相比于 GPT-4o 输入 tokens 价格是 GPT-4o 的 5 倍(每百万 tokens$15.00:$3.00),输出 tokens 差距 o1-preview 的价格是 GPT-4o 的 6倍(每百万 tokens