1、MemFuse:构建 Agent 记忆与认知新范式薛明 Percena AI 创始人兼 CEOhttps:/ 智能体的黄金时代与“记忆”枷锁设计蓝图:向最强智能体(人类)学习业界巡礼:记忆方案的主流范式分析MemFuse:为智能体打造记忆核心未来蓝图:从记忆到认知架构06总结与 Q&APART ONEAI 智能体的黄金时代与“记忆”枷锁 科学研究:OpenAI 的 DeepResearch 正在自主进行科学文献的分析与推理;Google NotebookLM 让研究者能够直接与个人文档和知识库对话,快速提炼洞见并生成报告与 Podcast 音频播客;软件开发:Cursor/Windsurf 正
2、在成为我们身边的 AI 结对程序员;自主操作:Manus 这样的项目,让 Agent 能够像人一样操作电脑完成复杂任务;The Agent Era:智能体正在重塑世界当你跟编程助手交互了十几轮,终于把一个复杂需求的前因后果全部讲清楚的时候,你忽然发现它的智商好像下降了,会不停地犯一些初级错误,你预感到这可能是长上下文带来的副作用,这个时候你选择:1.重开一个新的 Session,一次性完整输入前面提到的所有需求细节;2.继续忍受降智的编程助手,因为不想重新输入所有需求细节;艰难的抉择:编程助手的尴尬时刻为何我们强大的AI Agent,表现得像只有七秒记忆的鱼?有限的上下文无状态的交互经验无法沉
3、淀智能体的“阿喀琉斯之踵”:记忆的枷锁我们该如何选择一条合适的技术路线1.核心问题 外部增强:为LLM打造可插拔的“外挂记忆系统”,成本可控、见效快;内部演进:依赖LLM自身的进化,挑战大、成本高;现阶段,“外部增强”是更务实的路径2.路线对比内部演进 vs 外部增强?3.选择与思考破局之路:我们如何构建“记忆核心”PART TWO设计蓝图:向最强智能体(人类)学习灵感之源:探寻人脑的记忆宫殿面对每日涌入的海量、多模态、动态变化的信息,我们的大脑是如何做到高效处理、长期存储、并实现秒级响应的?宏观架构:记忆分类与神经科学Source:https:/ Memory):毫秒级,感官缓冲;工作记忆(
4、Working Memory):秒/分钟级,位于前额叶皮层(Prefrontal Cortex),是我们的“思维草稿纸”;长期记忆(Long-term Memory):经由海马体(Hippocampus)的处理和巩固,最终存储于大脑皮层(Cerebral Cortex);语义记忆(Semantic):事实表。关于世界的事实,存储于新皮层(Neocortex)。例:深圳是中国的城市情景记忆(Episodic):日志流。关于个人经历,由海马体主导编码。例:我周五在深圳参加了技术大会1.外显记忆(Explicit Memory)-“我知道”程序性记忆(Procedural):可执行函数。关于运动技能
5、,主要涉及基底节(Basal Ganglia)和小脑(Cerebellum)。例:我是如何游泳的2.内隐记忆(Implicit Memory)-“我懂得”深度剖析:长期记忆的“数据模型”与关联性源自:海马体巩固机制&Baddeley&Hitch 工作记忆模型(1974)记忆需要被主动地遗忘、总结、提炼与巩固动态生命周期管理(Dynamic Lifecycle):源自:记忆类型关联&Craik&Lockhart 加工深度模型(1972)记忆的真正力量在于连接,在于从已知推导未知关联与推理能力(Associative&Reasoning):源自:人脑分层结构&Atkinson-Shiffrin 多
6、阶段模型(1968)不同类型和时效性的记忆应由不同机制处理分层与解耦(Hierarchical&Decoupled):设计启示:AI 记忆系统的“第一性原理”PART THREE业界巡礼:记忆方案的主流范式分析通往“记忆核心”的探索之路面对记忆挑战,行业内已经涌现出哪些主流的技术范式?它们在多大程度上接近了我们从人脑中得到的理想蓝图?01.全文/滑动窗口将对话历史直接拼接,或通过滑动窗口(Sliding Window)/滑动窗口+摘要(Summary)方式强行塞入 LLM 的上下文。实现简单,无外部依赖 违反“分层解耦”缺乏“动态管理”毫无“关联能力”AI Memory 的三种基础范式02.向