1、国海证券研究所请务必阅读正文后免责条款部分2024 年年 05 月月 16 日日行业研究行业研究评级:推荐评级:推荐(维持维持)研究所:证券分析师:刘熹STable_TitleGPT-4o、Gemini 新品接连发布,多模态技术新品接连发布,多模态技术奇点加速到来奇点加速到来计算机行业动态研究计算机行业动态研究最近一年走势行业相对表现2024/05/16表现1M3M12M计算机5.1%6.2%-25.0%沪深 3003.7%8.2%-8.5%相关报告计算机事件点评:运营商 AI 服务器订单超预期,国产化不断提速(推荐)*计算机*刘熹2024-04-22计算机行业动态研究:阶跃星辰发布 Step
2、-2 万亿参数模型,AI 应用+算力景气上行(推荐)*计算机*刘熹2024-03-26AI 算力月度跟踪(202403):NVIDIA B200 再创算力奇迹,液冷、光模块持续革新(推荐)*计算机*刘熹2024-03-24计算机行业事件点评:NVIDIA H20 或将与国产算力同步高增(推荐)*计算机*刘熹2024-03-03计算机行业月报:英伟达业绩再超预期,国产算力需求再扩大(推荐)*计算机*刘熹2024-02-28事件:事件:2024 年 5 月 14 日,OpenAI 在官网正式发布新旗舰模型在官网正式发布新旗舰模型 GPT-4o 多模多模态大模型态大模型,其中其中 o 代表的是代表的
3、是 omni,即即“全能全能”,GPT-4o 可以实时对音可以实时对音频频、视觉和文本进行推理视觉和文本进行推理,相较于相较于 GPT-4 Trubo 速度更快速度更快、价格更便宜价格更便宜。2024 年 5 月 15 日,2024 年谷歌 I/O 大会正式召开,会上谷歌将搜索业谷歌将搜索业务做了最彻底的务做了最彻底的 AI 改造,更新升级了改造,更新升级了 Gemini1.5Pro 版本,推版本,推出出Gemini1.5Flash 轻量化小模型轻量化小模型、生成视频模型生成视频模型 Veo、AI 智能体智能体 ProjectAstra,并展示了与,并展示了与 GPT-4o 相似的语音视觉交互
4、功能相似的语音视觉交互功能 Gemini Live。投资要点投资要点:GPT 持续迭代,持续迭代,GPT-4o 推动人机交互再上新台阶推动人机交互再上新台阶OpenAI 持续升级 GPT 版本,2023 年 3 月发布 GPT-4 在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023 年 11 月发布GPT-4Turbo,支持 125 万 tokens 的同时也在上下文等多个领域实现显著进步。本次发布 GPT-4o 带来各种能力升级:多模态交互,具有更优质的视频和音频理解以及图像生成能力:多模态交互,具有更优质的视频和音频理解以及图像生成能力:GPT-4o 能够接受文本、音频和视频的
5、任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。情绪感知情绪感知:GPT-4o 能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o 能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。毫秒级响应:毫秒级响应:GPT-4o 对音频输入的响应时间可以快到 232 毫秒,平均为 320 毫秒,这与人类在对话中的响应时间相近,此前 GPT-4 的语音响应约
6、5.4 秒。性能性能成本优势成本优势:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比 GPT-4 Turbo,GPT-4o 推理速度提升 2倍的同时,价格降低 50%。证券研究报告请务必阅读正文后免责条款部分2打造全新打造全新 GPT 语音助手且免费开放语音助手且免费开放,合作苹果微软加速端侧落地合作苹果微软加速端侧落地OpenAI 通过通过 GPT-4o 打造的语音版打造的语音版 ChatGPT 助手,当前已助手,当前已在在ChatGPT 中开放使用,同时模型中开放使用,同时模型 API