6-4 数据科学在用户兴趣分群上的探索与实践.pdf

编号:102503 PDF 16页 878.14KB 下载积分:VIP专享
下载报告请您先登录!

6-4 数据科学在用户兴趣分群上的探索与实践.pdf

1、数据科学在用户兴趣分群上的探索与实践陆祁 爱奇艺商业智能部总监|01数据科学 VS 用户兴趣分群02基于事实生成的用户兴趣标签03基于内容聚类的用户兴趣分群探索目录 CONTENT|数据科学VS 用户兴趣分群01|数据科学做点什么?|精密分析结合业务可解释性更强解决实际问题能力.用户兴趣(偏好)的计算|反应用户对某个主题、事物,不同程度的匹配价值和接受程度用户兴趣偏好运营推荐搜索广告中长期偏好短期偏好,即时意图基于事实生成的用户兴趣标签02|用户兴趣权重标签如何设计?|可比性问题同一用户的不同内容是否可比?不同用户的相同同内容是否可比?不同用户的不同同内容是否可比?加权权重的设计时间衰减对不同

2、主体衰减函数的设计内容、类型、明星、频道、时间、价格降权头部内容的影响起始值行为稀疏的用户。研究主题抽取多样用户行为计算用户兴趣偏好归一化得到0-1权重用户兴趣标签的验证与迭代|效果检验盲测用户问卷,检验排序性线上不同场景ABTEST明星偏好权重标签朱一龙 0.94,白宇 0.76.权重标签事实标签权重解释性每天全量decay不适合实时场景增加属性维度业务方灵活使用事实标签应用场景权重计算UDF用户兴趣结构化事实标签|明星偏好事实标签:白宇显式行为隐式行为情感表达主动关注主动传播消费行为观影剧集其他行为评分弹幕、评论(不)感兴趣关注预约、收藏只看他截图、截片段内容分享为内容购买会员内容点播周边

3、购买播放行为快进、后退、暂停、倍速站内/外搜索下载浏览 用户行为细分,更为准确捕获用户的内容向偏好基于内容聚类的用户兴趣分群探索03|常用圈层分类方式一基于用户属性少男/少女男青年/女青年中高龄常用圈层分类方式二基于内容属性都市甜宠武侠玄幻盗墓悬疑是否有其他的分类方式?兴趣圈层 兴趣圈层是喜欢看相同内容的用户群体 通过算法发现看似完全不同内容之间意想不到的关联性 应用场景 内容运营:为人工运营场景提供数据支持 内容供给规划:纯业务经验驱动转变为大数据驱动圈层聚类基本思想:两内容的用户相似度高,则面向同一圈层|用户圈层聚类系统:客观、精准定位目标人群 客观观影行为:以用户真实播放行为作依据 颗粒

4、度可控:圈层划分粒度可选择 数据获取便捷:算法自动聚类圈人戏剧A戏剧B只看戏剧A只看戏剧BA和B都看基于两个内容的用户重合度来定义内容相似度内容相似度计算|使用距离计算公式,计算任意两部内容专辑观影用户相似度A表示专辑A的观影用户,B表示专辑B的观影用户,All表示全部观影用户为Jaccard similarity,越大相似度越高rab=A BA B通过拟合上线时间间隔与相似度之间的关系,修正相似度计算两两内容用户重合度的基准值(期望),去除内容体量的影响使用频道观影覆盖率修正观影用户数,从而修正相似度优化1:内容体量优化2:内容上线时间间隔优化3:频道规模差异经典相似度计算方式在实际应用中会碰到多种问题内容聚类原理介绍|层次聚类图剪枝线:决定内容聚合颗粒度 每一个末端节点是一部内容 通过计算两两内容的用户相似度,将用户最相似的内容先聚在一起,依次向上聚集用户兴趣圈层示例喜欢以下电影和综艺的用户属于同一个兴趣圈层音乐竞演喜剧喜剧通过综合归纳这些内容内核、用户特征等,可以推测这些用户的核心诉求:追求经典、优质IP,内容形成一定价值体系,在娱乐的同时可以向他们输出观点、与他们产生火花碰撞以下内容与左侧部分内容有相同标签,却面向不同的兴趣圈层。用户诉求的差异通过兴趣圈层聚类得以体现,这是利用传统内容标签难以准确表达的。|非常感谢您的观看|

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(6-4 数据科学在用户兴趣分群上的探索与实践.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠