1、Harness、数据闭环与可扩展性尚卓燃 ASF Member,OceanBase 技术专家尚卓燃ASF Member,OceanBase 技术专家期关注数据基础设施、开源态与成式 AI 的结合。前在 OceanBase 关注数据库与智能应基础设施向,探索数据库原 Agent Harness、Agent Runtime 数据管理与智能体程实践。他也是 Agent Client Protocol(ACP)的早期贡献者,参与推进 Agent 与客端、具及运环境之间的开放协作协议建设。过去的技术实践覆盖云原数据仓库、GraphRAG 与模型应等向。曾多次在 ApacheCon Asia、PyCon
2、China、Rust China Conf 等技术会议分享开源基础设施、数据系统与 GenAI/Agent 程相关主题。录录01020304何为 Harness从 Tape 看数据闭环从 Bub 看可扩展性 AgentSeek:数据库原 Harness 当数据库开始承载 Agent 运过程何为 Harness0101Agent=Model+Harness,Harness 包含哪些必要的环节,是如何帮助到达的地的。什么是 Harness如果把模型作匹,那么 Harness 就是驾驭它抵达的地所需要的整套东西:缰绳、鞍、路线、反馈、记录和训练法。Agent=Model+Harness图源:http
3、s:/ 的常架构在 Agent 场景,模型本并不等于个可持续运的系统。真正让 Agent 能在团队和产品中稳定作的,是围绕模型构建的上下管理、具调、状态记录、运轨迹、调试回放、评测反馈和数据闭环。图源:https:/ 如何影响切Agent 产品中会形成个反馈循环。有的原语被发现,添加到 Harness 中,然后对应的轨迹在训练下代模型时使。随着这循环的重复,模型在其对应的 Harness中变得更加强。图源:https:/ 的碎化今天的 Agent Harness 看起来已经把上下、具、状态、轨迹、评测和训练串成了个闭环,但这个闭环背后其实是拼出来的:上下在套系统,状态在另套系统,trace 和
4、 observability 各分散,eval 和training data 也没有真正接上;到了数据层,很多团队还在件和数据库之间来回搬运、转换和对。数据闭环以 tape.systems 为例,了解在个统的建模式下,如何在上下、可观测性、训练数据、特定任务场景,达到闭环。0202Tape 的基本原语Tape 把 Agent 运过程建模成条可追加、可回放的事实流。Agent Session 看成条只能向前追加的纸带:Entry 记录真实交互,Anchor 标记可回溯节点,View 把段任务组织成业务窗,handoff 让上下可持续推进。图源:https:/tape.systems(2026.0
5、3)统上下与可观测性上下不再是临时状态,是从 Tape 中按需重建的视图。同份记录同时服务 prompt 构造 与 运观测具调、token、错误、handoff 都成为结构化轨迹可以追问:了哪些上下?为何得到这个结果?成本在哪?Harness 能够通过上下了解的为,也可以导出为可观测性看板。服务于评估与训练先沉淀可回放轨迹,才能形成可评估、可复的数据资产。成功、失败、重试和 review 都可转化为 eval/training 候选数据。所有都可以从 Tape 进标准化的导出,以构建数据集并转储到对象存储 or 件系统中。应对产场景Tape 不替代产基础设施,是记录 Agent 任务如何被执和
6、治理。如在个以 Pi Agent和 Tape 驱动的电商 Workflow 场景。Bee 将 Job/Cron/Workflow 映射为可追踪 TopicK8s/Argo 负责调度、隔离、权限和资源管理Tape 保留任务上下、执过程、失败原因和改进线索图源:https:/blog.scnace.me/post/tapexbee/应对产场景Tape 作为个灵活的上下建模案,提供了丰富的拓展能。在另个以 Topic 驱动的企业知识库问答场景。按业务建模扩展 Tape 命周期的 Hooks。Tape 不需要再额外维护套割裂的Memory 系统。图源:https