《张立理_基于Skill构建规模化Agent任务.pdf》由会员分享,可在线阅读,更多相关《张立理_基于Skill构建规模化Agent任务.pdf(43页珍藏版)》请在三个皮匠报告上搜索。
1、SITS 2026基基于于 Skill 构建构建规模规模化化 Agent 任任务务从 Skill 设计原理到大规模任务工程化实践演演讲讲者者:张张立立理理SITS 2026本本次次分分享享的的四四个个主主题题Skill 是是什什么么为什么 Agent 需要 Skill?好好的的 Skill 怎怎么么做做Description 与 Body 各有哪些原则?评评测测驱驱动动迭代迭代如何量化 Skill 的质量?长长程程任任务务编排编排如何让 Agent 完成大规模任务?SITS 2026PART 01Skill 是什么是什么为什么 Agent 需要 Skill?SITS 2026Agent 不不缺
2、缺能能力力,缺缺的的是是知知道道该该怎怎么么做做即使通过 MCP 给了 Agent 工具调用能 力,它依然不知道该按什么流程、什么 顺序、什么标准去使用这些工具。大模型很聪明,但它有一个根本问题:没没有有你你的的私私域知域知识识和和专专属属能能力。力。你团队的代码规范是什么?Code Review 要看哪几个维度?创建 PPTX 应该遵循什么品牌样式?这些东西不在训练数据里,每次对话都重新教一遍,既低效又不稳定。SITS 2026一一个个 Skill 就就是是一一个个结结构构化化的的文文件夹件夹your-skill-name/SKILL.md#主入口 references#其它资源 scrip
3、ts assets命命名名规则规则文件夹名用 kebab-case:code-reviewCode Review入口文件必须精确命名为 SKILL.mdSITS 2026SKILL.md 由由两两部部分分组组成成:Description+Body-name:my-skill-namedescription:做什么。在用户说XXX时使用。核心能力包括 A、B、C。-#My Skill Name#Instructions具体的指令内容.两两个个必必填填字字段段:nameSkill 的唯一标识符,用于系统内部引用和管理。description激活判断的核心依据。它常驻于Agent 的系统提示词中,决
4、定 了在什么场景下会加载该 Skill。SITS 2026渐渐进进式式披露披露三三级级结结构:构:第第一一级级:description(常常驻驻索索引引)始终存在于系统提示词,作为激活判断的依据第第二二级级:SKILL.md 正正文文(按(按需需加加载)载)命中后才读取,包含核心指令和工作流程第第三三级级:references/和和 scripts/(执执行行时时调调用用)只在真正需要时才查阅或执行为什么要分级?Token 效率效率不把所有知识一股脑塞进上下文,避免信息过载,节省成本。注注意意力聚焦力聚焦模型在长上下文中注意力会衰减,分层保证每阶段只关注最 相关的信息,提高执行准确率。SITS
5、 2026Skill 的的工工作作原理原理1.用户输入2.Agent 与所有 Skill 的 description 做匹配3.工具调用:读取SKILL.md4.获得完整指令,开始执行任务5.按需读取references/或执行scripts/6.返回结果关键事实Skill 的激活本身会消耗 12 步工具调用。Description 写得准不准,直接影响 Token 消 耗和响应速度。Body 写得不好,自然执行效果不佳,浪费时间和金钱。SITS 2026PART 02好好的的 Skill 怎么做怎么做一个Skill 能不能用和好不好用,差距巨大。这个差距主要体现在两个地方:Descripti
6、on 决定什么时候用,Body 决定用起来效果如何。SITS 2026一一个个好好的的 Description 需需要要同同时时回回答答三三个个问题问题01 能能做做什什么么这个Skill 的核心价值是什么?示例:分析 Figma 设计稿并生成开 发交付文档02 核核心心能能力力具体包含哪些能力?示例:设计规范提取、组件文档生 成、标注导出03 激激活活条条件件用户说什么话时应该触发?示例:当用户上传.fig 文件或要求设计转代码交付时缺缺少少激激活活条条件件,Agent 不不知知道道什什么么时时候候该该用用;缺缺少少能能力力描描述述,Agent 无无法法判判断断是是否否匹匹配配。SITS 2