1、专家级专家级 Agent Agent 技术演进及应用技术演进及应用演讲人:梁家恩 博士 从通用到专业,跨越产业化门槛目录目录01020304学以致用学以致用大模型为学,智能体致用大模型为学,智能体致用专家级专家级 AgentAgent 技术架构技术架构通用为基,专业破局通用为基,专业破局实践出真知实践出真知跨越产业跨越产业化化门槛门槛展望未来展望未来认知与产业升级认知与产业升级01学以致用学以致用 大模型为学,智能体致用AGIAGI 进入“学以致用”阶段进入“学以致用”阶段AI agents are advanced AI systems designed to autonomouslyrea
2、son,plan,andexecutecomplex tasks based on high-level goals.1、Scaling Law 深化大模型提供“语义与推理”的可计算框架预训练(Pre-train)后训练(Post training)推理(Inference)2、多模态融合原生多模态语义对齐多模态3、推理与规划 加强基础层:CoT/ToT核心层:RLVR等框架层:Agent4、世界模型/具身智能大脑-小脑 分层协作端到端 VLA 模型仿真-现实 迁移LLMLLM大模型大模型(LLM)(LLM)是基础,也是成本投入,要真正创造价值,在于解决实际问题的智能体智能体(Agent)(A
3、gent)系统。从能力到价值深入场景,打造“大脑大脑(LLMLLM)+五官四肢”五官四肢”智能体智能体(Agent)(Agent)协同体系,解决实际问题,才能跨越产业化“最后一公里”。躬身入局,解决问题如何将通用 LLM能力,转化为专业领域高能力、高高能力、高可靠、可靠、低低成本成本的专家级智能体(Agent),是推动产业升级的关键。突破瓶颈,升级产业AGIAGI 从从“大大模型能力模型能力”走向走向“智能体系统智能体系统”竞争竞争智能体创造价值的核心挑战智能体创造价值的核心挑战1、实用,解决实际问题,引发效率质变,突破能力上限2、可靠,克服“幻觉”不合逻辑或时宜的“涌现”3、普惠,成本可控,
4、可规模化应用02专家级专家级 AgentAgent 技术架构技术架构 通用为基,专业破局2.2.智能体演进三模式智能体演进三模式全网通用数据通用任务微调数据后训练通用大模型(闭源/开源)预训练通用大模型(闭源/开源)行业优化智能体专业增强预训练行业优化大模型专业增强后训练专业智能体强化训练通用智能体智能体打造关键:1、完整技术能力2、优质数据闭环3、场景应用优化4、工程成本优化5、高效算力平台专业任务金标数据专业任务应用数据专业领域优质数据2.1 2.1 打造专业打造专业AgentAgent 模型模型后训练通用大模型(闭源/开源)预训练通用大模型(闭源/开源)行业优化智能体专业增强预训练行业优
5、化大模型专业增强微调训练专业智能体强化训练通用智能体需要在不同训练阶段注入不同知识需要在不同训练阶段注入不同知识训练阶段智能体强化训练增量预训练+微调训练数据域能力扩充丰富感知输入能力内化记忆能力增强工具调用能力强化任务规划能力1.专业任务金标数据2.专业任务应用数据1.专业领域优质数据2.专业任务金标数据1.专业任务金标数据2.专业任务应用数据1.专业任务金标数据2.专业任务应用数据2.1.1 2.1.1 专业基座增强:专业数据扩充专业基座增强:专业数据扩充+模态扩充模态扩充文本编码器视觉编码器对比损失普通分层注意力差分注意力QKT基于差分注意力的视觉文本模态对齐算法通用增量训练1.现有通用
6、基模,专业知识会被海量通用语料“稀释”,现有模型没有经过高质量专业数据训练2.现有基模基本是文本数据,部分多模态模型更多建模的是自然图像或者闲聊语音,对比专业领域比如医学影像、工程图纸、医学语音等存在明显的分布差异,所以现有的对齐策略不完全适用基于行业多模态数据特点,定制化增量训练策略和多模态对齐策略2.1.2 2.1.2 专业智能体强化训练:任务规划能力专业智能体强化训练:任务规划能力现有训练方案现有训练方案1.通用模型在数学、代码任务上追求形式逻辑上的绝对正确,而真实专业场景在过程中充满不确定性2.专业规划数据量少,知识密度高,现有算法样本学习效率低下,利用不够充分通过条件熵针对性强化专业