当前位置:首页 > 报告详情

AICon北京2025-京东-杨培军_final.pdf

上传人: Fl****zo 编号:724342 2025-07-01 33页 3.36MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了京东零售在大模型推理优化实践方面的探索和成果。关键点如下: 1. 大模型应用场景:驱动电商全链路深度变革,涉及AI生成内容、客服管理、仓储优化等多个方面。 2. 大模型应用挑战:面临输入输出多样性、硬件异构、性能与轻量化平衡等挑战。 3. 核心优化实践:通过自研大模型推理框架、多维并行、EPD分离、KV Cache Pool等技术,实现高性能、高吞吐、低时延的分布式推理系统。 4. 关键数据:模型参数量达6710亿,单次推理仅激活370亿参数,推理效率提升3倍;显存降低80%以上;资源节省约60%,大模型吞吐提升3X,推理成本节省约70%。 总结:京东零售通过大模型推理优化实践,实现了高性能、强扩展、高可用的分布式推理系统,为电商全链路深度变革提供技术支持。
"如何提升大模型推理效率?" "分布式架构在电商大模型中的应用?" "生成式推荐技术如何优化?"
客服
商务合作
小程序
服务号
折叠