1、InteRecAgent交互式推荐智能体连德富 中国科大2023.11.16目录CONTENTS背景介绍方法框架实验验证未来展望目录CONTENTS背景介绍大语言模型 以GPT为代表的大语言模型展现了强智能性,其能力包括人机交互出色的人机对话智能性,如ChatGPT工具使用对工具用途的理解和准确使用,如使用搜索引擎和各类API推理能力通过推理,一步步解决复杂的问题,如思维链技术指令服从由于经过指令微调阶段,模型有很强的指令服从能力少样本学习通过少量的样本即可在新的任务有很好的效果大模型推荐范式 范式一:大模型直接推荐Prompt推荐数据微调构造包含任务指令、用户信息、物品信息的prompt,引
2、导LLM给出推荐结果利用推荐数据,构造文本类型的数据集,微调LLM使其具有推荐的能力prompt信息量受长度限制;高质量prompt构造难;高质量数据构造成本高;微调LLM训练成本高;Ive watched the following movies in the past in order:xxxxPlease rank these 20 movies by measuring the possibilities that I would like to watch next most,according to my watching history.Please think step by
3、step.The user has purchased these items:.Based on this information,is it likely that the user will interact with next?大模型推荐范式 范式二:大模型作为特征提取器用户文本特征物品文本特征交互文本特征文本总结稠密向量推荐模型LLM训练LLM 利用其世界知识帮助完善推荐数据中的文本特征,构造质量更高的文本特征LLM 利用其强大的文本建模能力将文本特征转换为稠密向量,输入到推荐模型大模型推荐范式 范式三:大模型+推荐工具LLM 利用其指令服从能力受prompt的引导去服从推荐任务LL
4、M 利用其推理能力和工具使用能力,理解工具的用途,规划工具的使用推荐工具根据 LLM 解析的输入产生推荐结果,反馈到 LLM 总结后输出召回工具排序工具查询工具解释工具用户解析工具调用Agent(智能体)An autonomous agent is a system situated within and a part of an environment that senses that environment and acts on it,over time,in pursuit of its own agenda and so as to effect what it senses in
5、the future.Franklin and Graesser(1997)智能体(Agent)驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性、主动性等特征的计算实体.机器人聊天智能体科学助手交互式推荐系统 传统推荐系统:系统根据用户的历史数据产生推荐,用户无法主动向系统反馈意图 交互式推荐系统:系统和用户进行双向的 交互(如对话等),从而产生推荐行为数据训练用户推荐系统推荐传统推荐系统行为数据训练用户推荐系统推荐反馈推荐反馈交互式推荐系统大语言模型&推荐大语言模型传统推荐系统 人机交互能力 用户意图解析 工具使用能力x 幻觉现象x 私有领域不可见x 信息滞后x 推荐精度差
6、 用户历史信息建模 推荐精度高 模型迭代快 更新成本低 领域内数据可见x 缺乏交互性x 无法处理显式用户意图交互式推荐智能体目录CONTENTS背景介绍方法框架InteRecAgent 整体框架 大语言模型 作为Agent的“大脑”,解析用户意图,与用户流畅对话 推荐工具 作为Agent的“工具”,针对用户进行个性化精准推荐 多个 辅助机制 设计以保障大语言模型和推荐工具更好的协作推荐工具分类查询(Query)查询平台物品相关信息用于处理用户的信息查询需求最新信息查询示例:“这个游戏多少钱?”“这部电影播放量多少?”召回(Retrieval)排序(Ranking)从物品中召回符合用户条件的物品