1、AI Agent业界进展与发展趋势张长旺 OPPO研究院目录AI Agent技术简史01AI Agent落地难题03AI Agent业界进展02AI Agent发展趋势04AI Agent技术简史01Artificial Intelligence:A Modern Approach,Stuart Russell and Peter Norvig(2003).We define AI as the study of agents that receive percepts from the environment and perform actions.Each such agent imple
2、ments a function that maps percept sequences to actions,and we cover different ways to represent these functions,such as production systems,reactive agents,real-time conditional planners,neural networks,and decision-theoretic systems.Agent技术简史:规则、强化学习、大模型3124通过反复试验学习,不断调整他们的政策以优化长期回报。Deep Q-network基
3、于LMM的智能体ChatGPT+图片语音条件-动作专家系统基于LLM的智能体ChatGPT|AutoGPT强化学习Agent大多模态模型Agent规则Agent大语言模型Agent严重依赖人工扩展性差通用性差难训练通用性差问题:规划推理能力弱可靠性差专业领域任务效果差AI Agent技术栈系统层应用层模型层硬件层Agent应用大语言模型:LLM/LMM信息检索模型:Embedding/Rank应用开发框架:LangChain/AutoGen/LlamaIndex/DifyGPU/TPU/CPU/NPUAI Agent业界进展02AI产品榜:对话助手、AI搜索、AI图像是热门应用OpenAI A
4、I Agent进展:实时多模态、工具生态、运行时推理优化2023.03.14对话能力全面提升GPT-42024.01.10支持处理图像GPT-4V2024.05.13实时处理声音、图像、文字GPT-4o2024.09.13运行时推理优化模型OpenAI o12022.11.30大语言模型对话助手ChatGPT2023.03.23使用插件工具ChatGPT Plugin2024.01.10支持用户定义简单智能体GPT Store2024.07.25检索增强生成搜索引擎SearchGPT0102030405060708Google AI Agent进展:实时多模态、长上下文、AI搜索2023.05
5、优化多语言、推理及编码能力PaLM 22024.01.17手机屏幕内容圈选搜索CircleToSearch2024.05.14实时多模态人工智能助手Project Astra2024.10.03视频理解搜索Video Search2023.03对标ChatGPT的大模型对话助手Bard2023.12原生多模态大模型Gemini2024.02.16长上下文Gemini 1.52024.05.14检索增强生成搜索总结AI Over view Search0102030405060708Microsoft AI Agent进展:生产力助手,开发框架,AIPC2023.02.07检索增强生成搜索New
6、Bing2023.05.16办公助手智能体Microsoft 365 Copilot2023.09.21类似ChatGPT的大模型对话助手(基于GPT,Dalle等)Microsoft Copilot2024.09.16自定义办公智能体Copilot agents2022.06.21代码写作助手Github Copilot2023.04开源智能体开发框架SemanticKernel2023.09开源多智能体应用开发框架AutoGen2024.05.20集成MS小语言模型助手OSCopilot+PC0102030405060708Apple AI Agen