《周俊_从语言到推理:百灵大模型的 AGI 探索.pdf》由会员分享,可在线阅读,更多相关《周俊_从语言到推理:百灵大模型的 AGI 探索.pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、周俊蚂蚁集团副总裁Part 01.Part 01.Part 02.Part 02.Part 03.Part 03.从语言智能到智能体智能:大模型范式正在变化百灵的演进路径:从 Ling 到 Ring 到 Ming 的关键跃迁下一阶段的核心方向:Agent 与 Intelligence EfficiencyScalingScaling LawLaw 引领大模型演进至语言智能时代引领大模型演进至语言智能时代参数规模数据规模算力规模Scaling Law 带来可预期的能力提升知识容量提升语言理解增强内容生成提升真实世界提出了新的要求:模型不仅要会说,还要会完成任务真实世界提出了新的要求:模型不仅要会
2、说,还要会完成任务LanguageLanguage ModelModel ParadigmParadigmAgenticAgentic ParadigmParadigm用户提问模型生成回答输出结果用户目标理解任务推理与规划调用工具/执行动作获取反馈迭代修正完成任务闭环主要特征主要特征关注回答是否正确关注知识表达与语言流畅度以单轮生成和静态输出为主主要特征主要特征不止关注回答是否正确关注能否推理、决策、执行并形成闭环面向多步骤流程、工具调用与环境交互大模型从语言智能到推理智能再到智能体智能大模型从语言智能到推理智能再到智能体智能语言智能语言智能会理解、会表达、会生成内容面向知识问答与内容生成解决
3、“会不会说”的问题推理智能推理智能会分析、会规划、会多步求解面向复杂问题与结构化推理解决“会不会想”的问题会说会说会想会想会做会做智能体智能智能体智能会调用工具、会与环境交互、会完成任务面向真实流程与任务闭环解决“会不会做”的问题智能的本质是计算密度,智能的本质是计算密度,TokenToken消耗是计算密度的外在体现消耗是计算密度的外在体现AI 服务模式从“单次直觉”向“深度思考”与“迭代探索”范式转移。这种转移推动任务的计算密度提升,Token 消耗快速增长L4L4:InnovatorsInnovatorsL1L1:ChatbotsChatbots代表模型/系统:ChatGPT 3.5直觉检
4、索直觉检索:接收 Prompt-直接生成回答单次Token消耗:5002000L2L2:ReasonersReasoners代表模型/系统:OpenAI O1/O3慢思考慢思考:生成思维链,反复确认单次Token消耗:5k 50kL3L3:AgentsAgents代表模型/系统:Openclaw循环闭环循环闭环:拆解目标-调用工具-观察结果-迭代单次Token消耗:20k 200+k10 x 30 x chatbot50 x 100 x chatbotAGI 持续探索与协作,Token消耗不再按请求划分,而是沿“时间轴”异步、长周期进行代表模型/系统:暂无持续生命周期持续生命周期:长期记忆、复
5、杂环境交互、自主学习、反复探索智能程度不断提升L5L5:OrganizationsOrganizations单次Token消耗:1m 以上蚂蚁蚂蚁AGI RoadmapAGI Roadmap:在场景中打磨应用,探索智能上限在场景中打磨应用,探索智能上限人口红利减退、老龄化时代来临,数字生活服务平台将进入下一阶段基于互联网数据红利,利用生成式AI技术,产生类人信息智能用更多(好)Token、更低成本,打造更好智能,在场景中解决真实问题让更多人用起来,形成用户反馈、模型智能与应用能力提升的正循环信息AICyber DataLLM多模态知识压缩自然语言交互复杂推理决策强化学习音视频理解音视频生成文本
6、图片、音视频Real World Data具身AI视觉/听觉 空间理解 物体识别触觉通用服务机器人灵波科技灵波科技智能技能智能体复杂任务决策执行反馈/控制百灵百灵蚂蚁阿福蚂蚁阿福蚂小财蚂小财灵光灵光任务Token消耗低高百灵的思路:不是只做更强的模型,而且构建完整的智能能力体系百灵的思路:不是只做更强的模型,而且构建完整的智能能力体系LINGLING(Linguistics)RINGRING(Reasoning)MINGMING(Multimodal)Ling-2.5-1TLing-2.5-1T1T A63B混合线性架构万亿参数百万上下文即时模型即时模型Ring-2.5-1TRing-2.5-