《A6--周礼--让 Agent 不再等待:基于 RocketMQ 的异步协作架构实战.pdf》由会员分享,可在线阅读,更多相关《A6--周礼--让 Agent 不再等待:基于 RocketMQ 的异步协作架构实战.pdf(34页珍藏版)》请在三个皮匠报告上搜索。
1、让 Agent 不再等待:基于 RocketMQ 的异步协作架构实战周礼 阿里云,高级技术专家01020304AI Agent 驱动的异步化新挑战LiteTopic:AI 场景的轻量事件载体基于RocketMQ的异步 Agent 会话网关RocketMQ LiteTopic 落地实践AI Agent 驱动的异步化新挑战Agent 开始探索异步化解决方案传统互联网应用和 AI 应用的对比AI 应用的特点传统应用事件驱动 vs AI 应用事件驱动异步事件驱动新特性RocketMQ演进方向:面向 AI AgentRocketMQ 演进方向LiteTopic:AI 场景的轻量事件载体传统消费模型:基于
2、Group的共享消费RocketMQ 4.0 队列分配Pull模型AI 应用的特点RocketMQ 5.0 无状态Pop模型LiteTopic 消费模型:差异化订阅LiteTopic 消费特点LiteTopic 消费模型实现能否复用现有方式,只是每个客户端使用独立的Group订阅多个Topic?不可行1.读请求数量急剧膨胀2.轮询导致的无效扫描增多,CPU开销增大3.无法支持独占订阅4.Topic要预先创建5.客户端与各自Group绑定,使用很不方便传统Group消费模型LiteTopic消费模型LiteTopic 订阅拉取模型海量差异化订阅模型消费端线程池非阻塞模型非阻塞消费线程池模型基于R
3、ocketMQ的异步 Agent 会话网关传统方案的瓶颈传统实现方案基于 LiteTopic 实现异步会话网关优化后的方案会话断连恢复多轮对话中断恢复RocketMQ LiteTopic 落地实践AI 场景下限流的需求与挑战当推理遇上差异化流量,传统限流还能扛住吗?AI 场景下的限流需求资源隔离 不同QoS的客户,相互隔离流量互不干扰 防止单一用户突发流量挤占他人资源动态订阅管理 用户、模型实时变化,消费者需动态调整细粒度限流 针对不同用户/模型限流,不影响其他维度平滑限流 不是粗暴拒绝,顺延到下个窗口,用户体验更优传统消费限流的局限性相互影响 单个用户的慢任务阻塞其他用户消息处理,无法物理隔
4、离吞吐受限 限流等待会 block 线程,影响整个系统吞吐量队列不足 需提前创建多个 Topic/队列(High/Mid/Low等),数量有限,粒度粗,难以支撑差异化AI 场景下限流的需求与挑战千人千面 弹性隔离 精准流控物理隔离为每个用户/会话创建独立 LiteTopic,实现用户级物理隔离,确保各用户间资源完全独立,彻底消除交叉干扰弹性创建LiteTopic 按需自动创建,支持百万级,适应不同业务场景下并发需求变化精准流控每个 LiteTopic 独立执行限流策略,支持业务按用户配置差异化阈值,真正实现千人千面的个性化流量治理消费挂起检测到用户请求超限时,优雅地请用户稍等片刻,既保护系统资
5、源,又保证用户体验代码示例与限流策略发送方/发送消息时设定 LiteTopicString topic=request-topic;String userId=user_10086;String userIdAndModel=user_10086qwen3;final Message message=provider.newMessageBuilder().setTopic(topic).setLiteTopic(userIdAndModel).setBody(body).build();producer.send(message);消费方/消费端精准限流if(rateLimiter.shou
6、ldLimit(liteTopic)return ConsumeResult.Suspend(Duration.ofMillis(200);Suspend 限流策略限流级别Suspend 时长适用场景轻度限流50 200 ms突发限流,平滑到下个窗口中度限流200 1000 ms明显降低消费速率重度限流1000 5000 ms接近暂停消费忙闲调度5min 8hrs批量任务闲时处理百炼网关异步事件工作流OpenClaw RocketMQ Channel传统 OpenClaw Channel人类用户IM 平台OpenClaw Agent通信的一端始终是人,交互方式是实时对话。覆盖 Telegram