1、大模型驱动的多智能体协同初探钱忱 清华大学演讲嘉宾钱忱清华大学 博士后清华大学软件学院博士,现于清华大学自然语言处理实验室(THUNLP)担任博士后,清华大学水木学者,主要研究方向为预训练模型、自主智能体、群体智能;合作导师为孙茂松和刘知远教授,曾在ACL、SIGIR、ICLR、AAAI、CIKM等人工智能、信息管理、软件工程等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。在群体智能方面,主持发布了大语言模型驱动的群体协作框架ChatDev、群体共学习范式Co-Learning、群体协同网络MacNet,面向任务完成和社会模拟的多智能体平台AgentVerse等。目 录CONTENTS
2、1.从大模型走向自主智能体2.大模型多智能体系统3.多智能体协同及演化4.智能体协同的缩放法则5.总结与展望从大模型走向自主智能体PART 01大模型驱动的自主智能体学习环境静态训练数据有限监督信号直接大模型为智能“灵魂”学习环境动态训练数据无限监督信号间接智能体为智能“载体”大模型驱动智能体智能体反馈大模型 基础大模型作为智能应用技术的内核,必须以自主智能体作为载体与动态环境进行交互,才能充分胜任动态复杂的智能应用,因此亟需发展大模型驱动的自主智能体技术人工智能将进入智能体时代2023 年 11 月 6 日,OpenAI在第一届开发者大会上正式提出构建自主智能体及相关生态的战略目标自主智能体
3、是OpenAI核心战略之一自主智能体相关研究在大模型带动下迅速成为人工智能研究必争之地,2023年自主智能体研究论文数量呈井喷趋势自主智能体相关研究爆发式增长现处于争夺自主智能体技术高地的重要战略窗口期目前自主智能体技术呈现百花齐放、多面竞争态势,我国与人工智能领域国际领先研发机构(OpenAI、微软、谷歌、Meta、斯坦福大学等)处于同一起跑线2年增长约100倍人类智能与人工智能 人工智能很可能即将走跟人类智能一样的发展路径人类智能人工智能脑容量小脑容量大工具使用群体协作小模型大模型智能体群体智能XAgent:大模型驱动的自主智能体框架 XAgent通过双循环机制协调决策制定和任务执行过程:
4、外循环规划、内循环执行 外循环处理任务的高级管理和分配,内循环专注每个子任务的低级执行和优化大模型多智能体系统PART 02多智能体系统的两种基本类型斯坦福SmallVille小镇:基于层次规划的智能体社会小镇,实现人类社群行为的可信模拟清华ChatDev数字团队:基于语言交互的智能体数字公司,实现群体协作式软件开发社会模拟型任务完成型Chen Qian,et al.ChatDev:Communicative Agents for Software Development.In ACL-2024.Park J S,et al.Generative agents:Interactive simu
5、lacra of human behavior.In UIST-2023.多智能体自主交互:任务解决新范式 群体协作实现多方优势互补、配合无间,提高解决问题的准确率 语言交互搭建沟通桥梁、缓解信息茧房,通过任务分工和协作执行处理复杂任务主智能体群体协作?!?-解决案复杂任务语模型多智能体系统核心研究框架 顺序型:各子组织间依次行动 互斥型:各子组织间选择性行动 并发型:各子组织间并行行动 无目标导向型:群体自由规划及行为执行(e.g.,社会模拟)目标导向型:制定群体特定目标以协同进行任务完成(e.g.,软件开发)行为关系:合作关系、竞争关系 组织行为:激励行为、团队凝聚力、劳动力多元化、资源竞
6、争、同龄人压力、群体懈怠、评价焦虑、情绪感染等任务目标组织管理社会组织行为路由 联盟结构:独立结构、层次化结构、中心化结构、全连接结构 组织规模:小规模、中规模、大规模多智能体协同及演化PART 03ChatDev 交互链进行编排 通过角色扮演交流实现智能体间的方案提议和决策研讨过程 交流链将复杂任务分解为由原子任务组成的“方案生产线”Chen Qian,et al.ChatDev:Communicative Agents for Software Development.In ACL-2024.CEOCPOCEOCTOCTOProgrammerProgrammerReviewerProgra