《京东广告大模型技术探索与新型模型体系建设实践.pdf》由会员分享,可在线阅读,更多相关《京东广告大模型技术探索与新型模型体系建设实践.pdf(45页珍藏版)》请在三个皮匠报告上搜索。
1、京东告模型技术探索与新型模型体系建设实践演讲:张泽华京东/算法总监录010203告营销领域模型的近期发展和挑战成式模型助告算法代际突破成式算法程知识程实践总结与展望0102030401告营销领域模型的近期发展和挑战告营销领域模型近期发展技术范式:从模块化堆叠到成式重构 传统CTR模型瓶颈传统CTR预估模型因算术强度低、计算流碎化,法充分利新代GPU的算,MFU仅个位数,难以满告营销对效算的需求。成式预估范式转变2024年起,头部企业转向成式预估范式,通过Transformer架构将户为和商品特征转化为统Token序列,以GEMM主导计算流,使MFU提升30%以上,实现算效率质变。三阶段范式业演
2、进出PreTrain-PostTrain-Application三阶段范式,对内容空间与兴趣空间,先构建图内容基础表征,再通过图搜召回率等中间指标实现内容空间与点击兴趣空间的对,最后完成CTR预估。告营销领域模型近期发展应落地:AIGC 驱动营销全链路效率命1AIGC渗透现状AIGC已渗透53.1%告主的创意流程,视频制作超半数环节由AI完成,成为告创意产的重要量。2对营销的意义成式模型端到端接管创意全链路,使“预算快迭代”成为主流运营节奏,为个性化推荐提供低成本创意。对话式需求拆解模型以多轮对话将模糊需求拆成可计算属性,如“轻便跑步鞋”被解析为“运动场景+重量300g+防滑”,突破了静态标签
3、局限。兴趣漂移追踪通过时序建模捕捉兴趣漂移,从“科技政策”迁移“AI伦理”,使推荐结果随户意图演变动态调整,提升了推荐精准度。告营销领域模型近期发展程化趋势:基础设施与 Scaling Law 深度绑定推理延迟问题成式模型回归特性带来推理延迟,与告投放毫秒级要求冲突,成为程化落地的关键挑战。技术优化段业通过Flash Attention、定制CUDA Kernel等技术,将Token延迟压缩10ms内,撑线上并发。双扩张阶段多模态告模型进参数数据双扩张阶段,通过持续增加算、参数与数据,CTR提升仍呈稳定幂律关系。Scaling Law验证验证了Scaling Law在告场景的有效性,但需配套程
4、优化以避免边际收益递减,为后续推理效率议题埋下伏笔。告营销领域模型近期发展合规与伦理:平衡创新与险典型错误案例某告曾出现“花树上结果”类常识错误,暴露成模型缺乏世界知识的问题,损害品牌信任并可能触发合规处罚。内容治理措施业正建“AI成+精修”协作流程,把创意策划、事实校验、法律审查设为必过节点,以提升内容质量。过去年我们临了哪些新挑战从判别到成:推荐范式拐点已传统判别式多塔预估Scaling-Law驱动范式转移成式推荐序列成过去年我们临了哪些新挑战告业务Token化,常识与幻觉业务Token化改进Token与LLM内部表征对,Recall两位数提升。幻觉抑制通过知识图谱外接校验,虚构卖点率幅降
5、低。过去年我们临了哪些新挑战极低延迟与算供给实时性优化各种Attention优化、动态剪枝、算优化端到端从秒级降50ms,满告毫秒级竞价。模型MFU提升32%推理延迟降50ms02成式模型助告算法代际突破告成式模型业务模式变化从传统推荐系统升级为:“洞察-决策-执”三闭环,让算法决策业务可追溯。快 OneRec全量上线,统多场景百度 GRAB成式排序,突破瓶颈京东专模型聚焦告,深度定制户偏好不仅有临时起意,还有量价购物商品推荐融合快速+慢速决策的结果快速浏览兴趣深度对挑选洞察决策执数秒分钟级深度思考毫秒级结果展示商业化深区:注意售卖终结01成式AI重构告逻辑成式AI把告逻辑从卖注意改写为卖结果
6、,传统CPM模式遭遇挑战。Perplexity在2024Q4告收仅2万美元,揭示流量即收公式失效。02巨头探索困境传统平台和各流量,均临算成本飙升与站外流量下滑双重压,稀缺告位再难提价,业共识转向按成交、按效果分成。通模型为何难啃告ROI1知识缺通LLM缺乏业趋势、投放策略等垂类知识,法直接解决ROI优化、群定向等具体业务问题。2落地障碍通模型仅能给出正确但的建议,如提创意质量,难以被告主采纳,法满实时融合商品、户为与促销节奏的需求。3核问题对新品冷启动、客复购、促冲量等不同优化标,通模型缺乏可执的动作空间,难以满告主的多样化需求。GRAM:召排体成式模型1模型架构京东GRAM模型基于Reas