1、 2024 年深度行业分析研究报告 正文目录正文目录 核心观点.5 与市场观点的不同之处.5 AI Agent:通过通过 AGI 的核心基础的核心基础.6 AI Agent:LLM 推动推动 AI Agent 进入新阶段进入新阶段.8 智能助手到 Agent:由搜索匹配走向规划与交互式决策.8 分模块持续突破+系统性优化推动 AI Agent 能力提升.11 感知:模型端原生多模态推进,Agent 多模态感知能力可期.11 记忆:模型端上下文长度持续突破,向量外部存储与检索强化长期记忆.12 规划:关注 LLM 对于任务分解算法及反思提炼能力的改变.13 行动:工具使用能力为关键,具身智能为新
2、方向.13 多路径共同提升 Agent 整体智能化水平,有望逐步通向整体智能.14 路径一:模态丰富+具身智能+多 Agent 协同.15 路径二:通过提升整体性或利用工作流解决复杂问题.16 AI Agent 技术逐步落地,智能性仍有提升空间技术逐步落地,智能性仍有提升空间.18 AutoGPT:利用 LLM 逐步拆解任务,外挂插件提升能力.18 卡耐基梅隆 Agent:利用 LLM 强化信息获取及工具使用.20 Devin:利用 AI 实现自主编程.21 AI Agent:智能性仍有提升空间,关注 Agent Workflow.22 模型模型&MaaS 厂商:凭丰富工具厂商:凭丰富工具&实
3、践经验把握发展机遇实践经验把握发展机遇.24 MaaS 厂商侧重 2B 业务场景:2B 提供落地工具+2D 提供开发框架.24 2B:基于业务卡位,提供落地工具.24 2D:提供开发框架,卡位开发者场景.27 模型厂商落地:GPTs 通过配置实现定制化,打造 LLM 垂直领域助手.27 应用厂商:具备垂直数据与工程化优势,关注工作流卡位应用厂商:具备垂直数据与工程化优势,关注工作流卡位.29 与工作流结合,推动 Agent 落地以 Servicenow 为例.29 基于私有数据,打造智能应用以 Salesforce 为例.30 终端厂商:推动人机交互升级,率先实现终端厂商:推动人机交互升级,率
4、先实现 Agent 落地落地.32 总结:从总结:从 AI Agent 有望逐步通向有望逐步通向 AGI.34 相关公司梳理相关公司梳理.35 图表目录图表目录 图表 1:AI Native(AI 原生应用).6 图表 2:AI Agent:改变人机交互方式.6 图表 3:GPT-4o 已初步具备 Agent 能力.6 图表 4:AI Agent:下一代大模型的核心能力.7 图表 5:AI Agent:能力体现.7 图表 6:AI Agent:发展复盘.8 图表 7:语音助手&聊天机器人:技术架构.9 图表 8:AI Agent:技术框架.9 图表 9:冯 诺依曼结构.10 图表 10:AI
5、Agent:技术框架.10 图表 11:AI Agent:感知模块及落地路径.11 图表 12:Google Gemini:多模态融合.11 图表 13:OpenAI GPT4o:端到端多模态.11 图表 14:AI Agent:记忆模块及落地路径.12 图表 15:大模型支持上下文长度情况.12 图表 16:AI Agent:规划模块及落地路径.13 图表 17:AI Agent:行动模块及落地路径.14 图表 18:AGI 分级.14 图表 19:通用人工智能(AGI):研究进展.15 图表 20:AI Agent:三种应用场景.15 图表 21:Foundation Agent.16 图
6、表 22:Agent AI 系统概述.17 图表 23:Agent workflows:有效提升 Human Eval 测试表现.17 图表 24:AutoGPT:任务流程.18 图表 25:AutoGPT:程序示例.19 图表 26:AutoGPT:第一方插件.19 图表 27:AutoGPT:部分第三方插件.20 图表 28:Agent:系统框架.20 图表 29:Agent:文档搜索概述.21 图表 30:SWE 基准测试结果.22 图表 31:Devin:能力示例.22 图表 32:AI Agent:实践情况.23 图表 33:从自动化到智能化:AI Agent.23 图表 34:Ma