1、多模态能力提升,多模态能力提升,应用生态加速应用生态加速 GPT-4-Turbo专题专题 西南证券研究发展中心 海外研究团队 王湘杰 2023年11月 2 核心观点 当前变化:GPT4-Turbo模型优化,GPTs生态加速繁荣。2023年11月7日,OpenAI通过开发者大会推出新产品:1)GPT4-Turbo:该模型通过增加上下文窗口以支持更长的工作流,同时具备视觉和语音等多模态能力,输入和输出的tokens价格大幅下降,从而帮助开发者以更低的价格获取更高的模型性能。2)GPTs:用户只需输入指令并提供外设的知识库即可创建专属GPT,应用开发门槛大幅降低,未来在收益计划的助力下,AI应用有望
2、迎来大爆发,形成全新的AI Agent生态。3)Assistant API:开发者可以通过函数调用、知识检索、代码解释器简化应用开发流程、实现效率提升。未来影响:算力&存力亟需扩容,AI应用潜力无限,垂类数据或成关键。1)算力端:OpenAI一系列新产品的推出成功打开新流量入口,更多的用户和开发者希望参与其中,巨大的流量对算力底座提出更高的要求;叠加图片等多模态生成所要求的tokens计算量远高于文本模态(根据OpenAI官网信息推算,在GPT-4-Turbo的Vision pricing calculator高保真度模式下,1张图片所产生的tokens数大约是1个单词的570或830倍),算
3、力供给亟需扩容。2)存力端:在算力提效到达一定瓶颈的情况下,AI芯片未来将逐步通过堆叠HBM的方式来提升性能,扩大单位算力的存储能力,HBM等存力需求将迎来暴增。3)应用端:类比移动互联网时代,AI时代的应用市场有望如同移动互联网时代具备无限潜力,GPTs数量将呈现非线性高速增长;此外,OpenAI的GPTs通过提供API,使得开发者只需喂给大模型更多的垂类数据即可打造垂类AI应用,同时使满足更多长尾需求成为可能。4)数据端:从OpenAI GPTs的Knowledge功能来看,专业知识与大模型通用能力的结合将成为未来的重中之重,私域数据库和专业数据库方向将会不断产生新热点、新需求,因此,如何
4、在合规前提下留存垂类数据并构建体系化数据库、以及保证知识产权的确权或成为未来的重要议题。投资建议:1)算力:把握云侧芯片龙头、端侧格局变化和大厂自研趋势;2)存力:建议关注高性能存储器芯片制造商;3)应用:建议关注以OpenAI和微软为代表的应用领军企业;4)数据:建议关注具备垂类优势和优质产权的数据提供商。相关标的:英伟达(NVDA.O)、超威半导体(AMD.O)、英特尔(INTC.O)、高通(QCOM.O)、微软(MSFT.O)等。风险提示:相关理论和技术发展不及预期风险;行业竞争加剧风险;应用生态发展不及预期风险等。1 CYfWvZqWeXvXsVlYuWyX8OaOaQtRqQpNtQ
5、iNoPnMiNoMmPbRqRoQxNsOxPuOmOqP 1 技术原理:图像理解+视觉生成持续发展,助力多模态能力提升 2.1 GPT-4 Turbo:多模态能力增强,使用成本降低 2.2 GPTs:加入Agents战场,与开发者共享收益 目 录 2.3 Assistant API:解决API开发者痛点,拓展OpenAI收入来源 1.1 图像理解能力提升:三大视觉学习方法 1.2 视觉生成:多模态内容理解和生成的闭环 3.1 算力&存力端:流量激增+多模态生成拉大算力缺口,同时带动存力需求 2 当前变化:GPT4-Turbo模型优化,GPTs生态加速繁荣 3 未来影响:算力&存力亟需扩容,
6、AI应用潜力无限,垂类数据或成关键 3.2 应用端:强化垂类属性&满足长尾需求,数量有望实现快速增长 3.3 数据端:专业数据或成关键,重视垂类数据留存及知识产权价值 2 1 技术原理:图像理解+视觉生成持续发展,助力多模态能力提升 章 节 小 结 技术原理 图像理解 标签监督 文本到图像(T2I)视觉生成 基于文本的图像编辑 CLIP 语言-图像编辑 HiCLIP STAIR 资料来源:西南证券 仅图像自监督 ImageBind 视频Q&A应用 对比学习 非对比学习 遮盖图像建模 3 资料来源:Efficient Self-supervised Vision Pretraining with