1、 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 计算机计算机 全球大模型将往何处去?全球大模型将往何处去?华泰研究华泰研究 计算机计算机 增持增持 (维持维持)研究员 谢春生谢春生 SAC No.S0570519080006 SFC No.BQZ938 +(86)21 2987 2036 联系人 袁泽世,袁泽世,PhD SAC No.S0570122080053 +(86)21 2897 2228 行业走势图行业走势图 资料来源:Wind,华泰研究 重点推荐重点推荐 股票名称股票名称 股票代码股票代码 目标价目标价 (当地币种当地币种)投资评级投资评级 微软(M
2、icrosoft)MSFT US 477.33 买入 奥多比(Adobe)ADBE US 613.45 买入 浪潮信息 000977 CH 50.67 买入 金山办公 688111 CH 354.50 买入 福昕软件 688095 CH 73.96 买入 泛微网络 603039 CH 41.97 买入 中科创达 300496 CH 62.65 买入 网宿科技 300017 CH 12.08 买入 资料来源:华泰研究预测 2024 年 7 月 01 日中国内地 深度研究深度研究 大模型头部格局基本确定,大模型头部格局基本确定,AI Agent 将加速将加速 AGI 进程进程 我们认为,海外闭源大
3、模型已经形成 OpenAI 为首,Google、Anthropic 等紧随的格局。在头部闭源模型之下,Meta 引领开源模型生态,开源闭源模型差距逐步缩小。为了适配端侧需求,小参数模型也在快速发展。国内看,模型百花齐放,但技术辨识度不高,23 年头部互联网厂商和科技企业进展较快,24 年以来初创公司开始发力长文本、MoE 等领域。展望后续,Scaling Law+Transformer 仍将长期有效,合成数据或逐渐成为关键数据来源。此外,AI Agent 能够极大提高现有模型的表现,是实现 AGI 的重要推力。大模型技术是 AI 浪潮的软件“基础设施”,建议持续关注相关进展。多模态多模态+长文
4、本长文本+MoE 已成共识,大模型与小模型路线并驾齐驱已成共识,大模型与小模型路线并驾齐驱 头部 GPT、Gemini、Claude 模型先后支持了多模态推理;Claude 较早实现了 200K 长文本,Gemini 将长文本推到 2M tokens;GPT-4、Mistral 展现了 MoE 架构的优势,Gemini 也在短期内更改为 MoE 架构。共识已经形成,国内大模型厂商均在跟进,Kimi 引领长文本趋势,MiniMax、阶跃星辰较早实践 MoE 模型。Mistral、微软、Meta、Google 的小模型性能不断突破,为端侧 AI 打下良好基础,成为与大模型并驾齐驱的另一条重要发展路
5、线。Scaling Law 未达边界,算力换智能仍然成立未达边界,算力换智能仍然成立 OpenAI 在 Scaling Law 论文中,从理论上预测了边界递减的存在。但实际上,OpenAI、Google 和 Anthropic 仍在践行大参数等于高智能的路线。清华唐杰教授在 24 年 2 月北京人工智能产业创新发展大会上指出,Scaling Law 尽头远未到来,算力换智能继续成立。在参数持续变大的情况下,训练数据的需求量进一步提升,据 Epoch 预测,2030 年到 2050 年,将耗尽低质量语言数据的库存,未来训练数据的缺乏将可能减缓机器学习模型的规模扩展。因此,合成数据或成为关键。AI
6、 Agent 是是 AGI 的关键范式,具身智能是大模型重要落地场景的关键范式,具身智能是大模型重要落地场景 AI Agent 能够自主、全流程、多步骤的执行任务,大幅延展了大模型的能力范围,被认为是实现 AGI 的关键范式。斯坦福大学吴恩达教授在 24 年 3 月的红杉美国 AI 峰会上指出,如果用户围绕 GPT-3.5 使用一个 Agent 工作流程,其实际表现甚至好于 GPT-4。并且 AI Agent 的能力能够充分受益于大模型的演进。此外,大模型与机器人具身智能的结合(如 OpenAI 与 Figure),也有望随着模型能力的迭代快速发展。我们认为,24 年 AI Agent 和具身