1、演讲嘉宾:字节跳动 赵健博OmniUserOmniUser:基于大模型的用户理解新范式:基于大模型的用户理解新范式在抖音兴趣推荐系统的落地实践0 0自我介绍自我介绍0 1背景:抖音兴趣推荐背景:抖音兴趣推荐0 2方案:基于大模型的用户理解方案:基于大模型的用户理解0 3展望:用户理解展望:用户理解x x个性化推荐个性化推荐0 1 背景:抖音兴趣推荐背景:抖音兴趣推荐背景背景-抖音兴趣推荐抖音兴趣推荐抖音:成熟抖音:成熟/庞大庞大/体裁丰富体裁丰富/用户众多用户众多成熟:近10年庞大:x亿DAU*x亿item池体裁丰富:视频,图文,商品,游戏业务规则:复杂,理解成本高背景背景-抖音兴趣推荐抖音兴
2、趣推荐挑战:推荐系统偏差挑战:推荐系统偏差用户人群平台物品 用户偏差:用户冷启/行为稀疏/非主流,被抖音站内主流人群兴趣表征裹挟 物品偏差:高热、猎奇、泛娱乐内容天然受众更广、推荐通过率更高,对小众长尾内容分发不友好 曝光偏差:由于上述循环,导致用户和物品的偏差持续扩大 导向偏差:推荐策略/目标导向和上述内容存在强烈冲突背景背景-抖音兴趣推荐抖音兴趣推荐行为拟合日志信号静态标签历史刻画因果式理解:身份/兴趣/动机/心理/习惯.动态式画像:多模态/可信/下游灵活应用.未来式预测:泛化探索,预测潜在需求.语义理解年龄/性别/教育/职业/人生阶段/购买力水平兴趣点与强度用户心理/动机/意图.时空上下
3、文可拒识/可调准召/置信.挑战:精准全面的用户理解挑战:精准全面的用户理解推荐特征用户画像兴趣推理人群分析背景背景-抖音兴趣推荐抖音兴趣推荐挑战:推荐的准确性、多样性和可解释性需求挑战:推荐的准确性、多样性和可解释性需求核心挑战核心挑战问题背景问题背景基于内容理解的解决方案基于内容理解的解决方案准确性:精准匹配用户兴趣推荐系统需要解决“用户喜欢什么”的核心问题,但用户兴趣可能分散(如同时喜欢科技、旅行、美食),且新用户/新物品缺乏行为数据时(冷启动问题),传统协同过滤难以准确推荐。基于内容特征的兴趣建模基于内容特征的兴趣建模 提取物品的内容特征,构建“物品内容画像”。分析用户历史交互过的物品内
4、容特征,构建“用户兴趣画像”。通过特征匹配,直接推荐与用户兴趣画像高度匹配的物品多样性:避免信息茧房,拓展推荐边界协同过滤等方法易受用户历史行为局限,导致推荐结果同质化(如用户多次点击“搞笑视频”,系统持续推荐同类内容,形成“信息茧房”),用户体验单一。基于内容特征的扩展推荐基于内容特征的扩展推荐 在匹配用户核心兴趣的基础上,通过内容特征的语义关联或层次结构拓展推荐范围。通过控制推荐结果的特征覆盖度,避免所有推荐物品集中在单一特征维度,强制引入一定比例的关联特征物品。多样性与相关性的平衡多样性与相关性的平衡 可通过特征权重调节实现“精准而多元”的推荐可解释性:让推荐逻辑透明可信深度学习等黑盒模
5、型的推荐结果难以解释,用户可能疑惑“为什么推荐这个物品”,影响信任度(如医疗、金融等需要透明性的场景)。基于特征匹配的直观解释基于特征匹配的直观解释 推荐理由直接关联用户行为与物品内容特征,符合人类逻辑可追溯的特征路径可追溯的特征路径 推荐过程可拆解为清晰的特征匹配链条 这种可追溯性便于系统调试和用户反馈优化符合领域专业逻辑符合领域专业逻辑背景背景-抖音兴趣推荐抖音兴趣推荐抖音兴趣分布抖音兴趣分布萌宠搞笑美女热点新闻头部/高热/精美/大众(主流)秋景预告种菜分享小众打卡与生活相关/小众长尾/分享攻略(长尾)背景背景-抖音兴趣推荐抖音兴趣推荐什么是兴趣推荐?什么是兴趣推荐?-核心:满足差异化的用
6、户需求核心:满足差异化的用户需求媒体社交社区能力底层需求:1.精准用户理解(身份理解身份理解+兴趣理解兴趣理解)2.精准兴趣分发0 2 方案方案-基于大模型的用户理解基于大模型的用户理解方案方案-基于基于LLMLLM的用户理解框架的用户理解框架OmniUser方案方案-基于基于LLMLLM的用户理解框架的用户理解框架ProfileLLM用户身份画像(用户身份画像(User Profile Portrait)1.超长用户消费行为与多源用户信息 历史序列去噪与压缩2.画像场景真实标签难以获得,人工标注困难 大模型无监督范式3.超大闭集标签体系的多维画像 推理能力与指令跟随强化4.以自然语言的方式产