1、 识别风险,发现价值 请务必阅读末页的免责声明 1 1/1515 Table_Page 跟踪分析|计算机 证券研究报告 计算机行业计算机行业 GenAI 系列(九)系列(九)GPT-4o 图像生成模型优化,效果超预期图像生成模型优化,效果超预期 核心观点核心观点:事件:事件:根据根据 OpenAI 官网,官网,2025 年年 3 月月 25 日,日,OpenAI 推出推出 GPT-4o的图像生成功能,的图像生成功能,能够通过原生多模态模型生成准确逼真的图像,有望带来新的增长契机,但在商业落地过程中仍面临技术可用性(模型效果是否符合用户预期)与规模化盈利(需平衡成本与收益)双重挑战,因此技术价值
2、的最终锚点仍需回归商业验证。GPT-4o 的图像生成能力基于自回归模型而构建,整合多模态数据的图像生成能力基于自回归模型而构建,整合多模态数据+联联合训练学习跨模态关系,效果较佳。合训练学习跨模态关系,效果较佳。与基于扩散模型的 DALL E 不同,GPT-4o 的图像生成能力基于原生内置于 ChatGPT 中的自回归模型而构建,此外,原生整合了文本、图像、代码等多模态数据,采用端到端的架构进行联合训练,使模型能直接学习到文本描述与图像元素的对应关系等跨模态关联性。算力端,推理时间延算力端,推理时间延长长+调用量增加,反映投入仍具备可持续性。调用量增加,反映投入仍具备可持续性。虽未直接披露模型
3、训练成本,具体成本仍有待披露与评估,但 GPT-4o 模型图像生成功能的训练路径优化反映了大模型在预训练投入仍具备可持续性。由于 GPT-4o 模型所创建的图片更为详细精准,因此需要更长的渲染时间。但由于用户大量调用导致算力需求激增,生成速度明显变慢。Sam Altman 官方社媒账号称,由于用户的使用热情远超预期,ChatGPT 的图像生成能力需要暂时受到限制。尽管端到端的模型架构降低了系统复杂度,但生成前的推理时间延长,叠加生成效果改善带来的调用需求量增加,将带来更多的算力需求,同样反映了投入的可持续性。模型端,从模块化到原生多模态,模型统一化是未来趋势;期待国产模型端,从模块化到原生多模
4、态,模型统一化是未来趋势;期待国产模型对标。模型对标。GPT-4o 的图像生成不再依赖于独立的视觉编码器或扩散模型模块,而将图像生成内化为语言模型的原生能力,通过端到端架构实现文本、图像等模态的联合表征对齐,体现了模型融合的未来趋势。此外,多模态能力持续提升背景下,国产多模态模型进度较快,期待国内模型厂商的对标发布。应用端,从辅助工具升级为生产应用端,从辅助工具升级为生产力引擎,加速垂直领域价值落地。力引擎,加速垂直领域价值落地。GPT-4o 的图像生成功能效果较佳,从“美工”级别跃升至具备“半专业”级别,有望支撑在广告营销、影视制作等领域的成熟应用,使得AI 技术从辅助工具升级为生产力核心,
5、并加速垂直领域价值落地。多模态大模型革新正促进建立“算力需求增长、模型能力跃迁、应用多模态大模型革新正促进建立“算力需求增长、模型能力跃迁、应用场景渗透”的正向循环。场景渗透”的正向循环。建议关注三条投资主线:算力基建(寒武纪、紫光股份、浪潮信息、神州数码、宝信软件)、AI 工具/平台(第四范式、星环科技)、多模态 AI 应用(万兴科技、金山办公、福昕软件、光云科技、科大讯飞)。风险提示风险提示。内容版权风险;GenAI 应用落地不及预期;商业生态冲击。行业评级行业评级 买入买入 前次评级 买入 报告日期 2025-03-30 相对市场表现相对市场表现 分析师:分析师:刘雪峰 SAC 执证号:
6、S0260514030002 SFC CE No.BNX004 021-38003675 分析师:分析师:周源 SAC 执证号:S0260523040001 0755-23948351 请注意,周源并非香港证券及期货事务监察委员会的注册持牌人,不可在香港从事受监管活动。相关研究:相关研究:计算机行业:鸿蒙和网证为例、相关进展正验证前期的机会判断 2025-03-23 计算机行业 GenAI 系列(八):另辟蹊径,B 端 AI 应用宏图大展可期 2025-03-07 计算机行业 GenAI 系列(七):阿里云 AI 基建提速或成为“AI+云”产业二次加速的发令枪 2025-02-21 联系人:戴