连德富_RecAgent_watermark.pdf

编号:155556 PDF 37页 1.84MB 下载积分:VIP专享
下载报告请您先登录!

连德富_RecAgent_watermark.pdf

1、InteRecAgent交互式推荐智能体连德富 中国科大2023.11.16目录CONTENTS背景介绍方法框架实验验证未来展望目录CONTENTS背景介绍大语言模型 以GPT为代表的大语言模型展现了强智能性,其能力包括人机交互出色的人机对话智能性,如ChatGPT工具使用对工具用途的理解和准确使用,如使用搜索引擎和各类API推理能力通过推理,一步步解决复杂的问题,如思维链技术指令服从由于经过指令微调阶段,模型有很强的指令服从能力少样本学习通过少量的样本即可在新的任务有很好的效果大模型推荐范式 范式一:大模型直接推荐Prompt推荐数据微调构造包含任务指令、用户信息、物品信息的prompt,引

2、导LLM给出推荐结果利用推荐数据,构造文本类型的数据集,微调LLM使其具有推荐的能力prompt信息量受长度限制;高质量prompt构造难;高质量数据构造成本高;微调LLM训练成本高;Ive watched the following movies in the past in order:xxxxPlease rank these 20 movies by measuring the possibilities that I would like to watch next most,according to my watching history.Please think step by

3、step.The user has purchased these items:.Based on this information,is it likely that the user will interact with next?大模型推荐范式 范式二:大模型作为特征提取器用户文本特征物品文本特征交互文本特征文本总结稠密向量推荐模型LLM训练LLM 利用其世界知识帮助完善推荐数据中的文本特征,构造质量更高的文本特征LLM 利用其强大的文本建模能力将文本特征转换为稠密向量,输入到推荐模型大模型推荐范式 范式三:大模型+推荐工具LLM 利用其指令服从能力受prompt的引导去服从推荐任务LL

4、M 利用其推理能力和工具使用能力,理解工具的用途,规划工具的使用推荐工具根据 LLM 解析的输入产生推荐结果,反馈到 LLM 总结后输出召回工具排序工具查询工具解释工具用户解析工具调用Agent(智能体)An autonomous agent is a system situated within and a part of an environment that senses that environment and acts on it,over time,in pursuit of its own agenda and so as to effect what it senses in

5、the future.Franklin and Graesser(1997)智能体(Agent)驻留在某一环境下,能持续自主地发挥作用,具备驻留性、反应性、社会性、主动性等特征的计算实体.机器人聊天智能体科学助手交互式推荐系统 传统推荐系统:系统根据用户的历史数据产生推荐,用户无法主动向系统反馈意图 交互式推荐系统:系统和用户进行双向的 交互(如对话等),从而产生推荐行为数据训练用户推荐系统推荐传统推荐系统行为数据训练用户推荐系统推荐反馈推荐反馈交互式推荐系统大语言模型&推荐大语言模型传统推荐系统 人机交互能力 用户意图解析 工具使用能力x 幻觉现象x 私有领域不可见x 信息滞后x 推荐精度差

6、 用户历史信息建模 推荐精度高 模型迭代快 更新成本低 领域内数据可见x 缺乏交互性x 无法处理显式用户意图交互式推荐智能体目录CONTENTS背景介绍方法框架InteRecAgent 整体框架 大语言模型 作为Agent的“大脑”,解析用户意图,与用户流畅对话 推荐工具 作为Agent的“工具”,针对用户进行个性化精准推荐 多个 辅助机制 设计以保障大语言模型和推荐工具更好的协作推荐工具分类查询(Query)查询平台物品相关信息用于处理用户的信息查询需求最新信息查询示例:“这个游戏多少钱?”“这部电影播放量多少?”召回(Retrieval)排序(Ranking)从物品中召回符合用户条件的物品

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(连德富_RecAgent_watermark.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠