1、 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。1 证券研究报告 科技科技 多模态大模型和应用奇点将至多模态大模型和应用奇点将至 华泰研究华泰研究 科技科技 增持增持 (维持维持)计算机计算机 增持增持 (维持维持)谢春生谢春生 研究员 SAC No.S0570519080006 SFC No.BQZ938 +(86)21 2987 2036 袁泽世,袁泽世,PhD 研究员 SAC No.S0570524090001 +(86)21 2897 2228 行业走势图行业走势图 资料来源:Wind,华泰研究 重点推荐重点推荐 股票名称股票名称 股票代码股票代码 目标价目标价 (当地币
2、种当地币种)投资评级投资评级 沪电股份 002463 CH 48.50 买入 生益科技 600183 CH 33.50 买入 微软(Microsoft)MSFT US 564.57 买入 奥多比(Adobe)ADBE US 468.96 买入 金山办公 688111 CH 400.43 买入 福昕软件 688095 CH 92.92 买入 泛微网络 603039 CH 74.90 买入 鼎捷数智 300378 CH 50.40 买入 用友网络 600588 CH 20.40 买入 虹软科技 688088 CH 60.13 买入 网宿科技 300017 CH 15.37 买入 资料来源:华泰研究
3、预测 2025 年 7 月 09 日中国内地 深度研究深度研究 我们认为,多模态大模型和应用发展的奇点将至。判断依据包括:1)技术进步方面:原生多模态模型架构得到业界认可,OpenAI 和 Google 的原生多模态模型已经在性能、延时、部署上展现出了优势。2)商业化进展方面:全球维度看,除了最头部的 OpenAI 和 Anthropic 依靠模型“智能”实现商业化,相当一部分 AI 应用公司的商业化产品依赖多模态能力。国内维度看,国内公司在视频生成赛道已经实现了较成熟的全球化和商业化之路。与市场不同的观点在于,1)更早认识到原生多模态架构将成为主流;2)AI 商业化不能仅聚焦在二级公司,更要
4、关注全球维度一级公司的进展。多模态是大语言模型(多模态是大语言模型(LLM)发展的必然趋势)发展的必然趋势 借助 Scaling Law 和强化学习,LLM 已经在很多领域获得了超过普通人类的智能,但是其处理的核心信息仅是文本。为了拓展更广泛的使用场景,研究者将其他模态的能力“加入”到 LLM 中,多模态大型语言模型(MLLM)问世。架构上看,MLLM 可以分为模块化架构和原生架构,前者通常分别训练不同模态然后实现模块“拼接”,而后者则直接在全部模态数据上从头开始同步训练的模型。效果上看,原生 MLLM 在性能、延时、部署上均有优势,但是对算力和 Know-How 的需求较高,通常只有头部模型
5、大厂在做,OpenAI和 Google 领先。无论架构如何,MLLM 已经成为行业共识的必然趋势。从大模型到多模态:商业化的必由之路从大模型到多模态:商业化的必由之路 从全球 AI 公司的商业化进展看,无论是基于 LLM 的文本类产品,还是基于MLLM 的多模态产品,呈现出以下大趋势:1)海外商业化进展快于国内。2)全球维度,一级公司进展快于二级。3)整体多模态为主的产品商业化快于文本产品。4)Chatbot 为代表的文本类产品国内外商业化分歧明显,据非凡产研数据,截至 25 年 5 月,在海外能够实现 10 亿美金以上的 ARR(如OpenAI、Anthropic),而国内 Chatbot
6、还未实现很好的商业化。国内 AI产品年化收入超过 1 亿美金的有 3 家公司,分别为美图(1357 HK)、快手(1024 HK)和睿琪软件(非上市),其 AI 产品均为多模态产品。国内的视频生成是全球化、商业化最成熟的国内的视频生成是全球化、商业化最成熟的 AI 应用赛道应用赛道 主流的多模态产品,大致分为图像生成、视频生成和其他多模态交互三类。其中,国内厂商在视频生成赛道的全球化和商业化最成熟。1)模型/产品成熟:据 Artificial Analysis 数据,在文生视频、图生视频排行榜单上,字节Seedance 1.0 均为 Top 1,快手可灵(Kling)、MiniMax Hail