当前位置:首页 > 报告详情

AB实验中策略长期效果评估方案研究(1).pdf

上传人: 2*** 编号:144841 2023-10-28 42页 3.10MB

1、D Da at ta aF Fu un nS Su ummmmi it t#2 20 02 23 3A A/B B实实验验中中策策略略长长期期效效果果评评估估方方案案研研究究演讲人-温中卉-腾讯广告-数据科学家D a t a f u n 分享 演演讲讲人人介介绍绍温中卉,北京大学光华管理学院商业分析硕士,现在腾讯广告数据科学团队,负责从数据科学角度对广告系统各链路分析与优化,应用实验设计和因果推断等方法进行科学评估衡量D a t a f u n 分享实实验验长长短短期期效效应应产产生生原原因因工工业业界界探探究究策策略略长长期期效效果果的的方方案案业业务务场场景景目目录录 C CO ON NT

2、 TE EN NT TD a t a f u n 分享D Da at ta aF Fu un nS Su ummmmi it t#2 20 02 23 30 01 1实验长短期效应产生的原因D a t a f u n 分享 背背景景AB实验将用户随机分成两组,对照组(没有策略)v.s.实验组(上线策略),两组用户除了是否上线策略外都同质,对比两组实验差异获取策略效果受到实验时长限制等原因,往往只能检测到策略的短期影响或短期指标-需要实验人员通过短期的实验捕捉策略长期的效果,高效地评估策略,提升评估效率,避免有效策略的漏判等问题新的UI设计DAU1%三个月后是否仍有具有影响收入不显著三个月后是否

3、会显著新奇效应学习效应D a t a f u n 分享实实验验长长短短期期效效应应产产生生的的原原因因外外生生影影响响:市场达到供需均衡状态需要时间Gupta,Somit&Kohavi,Ron&Tang,Diane&Xu,Ya&Vermeer,Lukas.(2019).Top Challenges from the first Practical Online Controlled Experiments Summit.ACM SIGKDD Explorations Newsletter.21.20-35.10.1145/3331651.3331655.季节原因或周中周末原因突发事件 内内生生

4、影影响响:用户学习效应(user learning)Hohnhold,Henning,Deirdre OBrien,and Diane Tang.Focusing on the long-term:Its good for users and business.Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.2015.推荐系统个性化推荐(如精排,粗排召回模型演进)Munro,Evan&Jones,David&Brennan,Jennifer&Ne

5、let,Roland&Mirrokni,Vahab&Pouget-Abadie,Jean.(2023).Causal Estimation of User Learning in Personalized Systems.短期难以观察长期指标(如30天留存)Gmez-Uribe,Carlos&Hunt,Neil.(2015).The Netflix Recommender System.ACM Transactions on Management Information Systems.6.1-19.10.1145/2843948.新奇效应novelty effect或首要效应primacy

6、effectsSadeghi,Soheil&Gupta,Somit&Gramatovici,Stefan&Ai,Hao&Lu,Jiannan&Zhang,Ruhan.(2022).Novelty and Primacy:A Long-Term Estimator for Online Experiments.Technometrics.64.1-26.10.1080/00401706.2022.2124309.人群偏差,如活跃用户会更多受到策略影响Wang,Yu&Gupta,Somit&Lu,Jiannan&Mahmoudzadeh,Ali&Liu,Sophia.(2019).On heavy

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了在工业界评估策略长期效果的几种方法。首先,谷歌提出了一种可量化长期用户学习效应的实验方法,通过短期可测量的指标来预测长期收益。其次,谷歌还提出实验长短期的差异还受到个性化推荐效果的影响,即长期策略组的用户被推荐的广告会因为用户行为的变化而与短期组不一致。接着,文章介绍了选取可代表长期效果的短期代理指标,作为实验策略对北极星指标是否有显著影响的依据。此外,文章还介绍了将模型的预测值作为关注的长期效果的代理指标,划分为一系列时间窗的加和,根据上一阶段代理指标、本阶段策略、用户协变量,建立对该阶段代理指标与结果的预测等方法。最后,文章通过案例详细阐述了这些方法在实际业务场景中的应用。
如何评估策略长期效果? 用户学习效应对策略评估有何影响? 如何选择合适的短期代理指标?
客服
商务合作
小程序
服务号
折叠