当前位置:首页 > 报告详情

A1--周亚平--海量数据模型批量推理 —— 效率、稳定与跨平台调度的新策略.pdf

上传人: 可*** 编号:991624 2025-12-07 40页 4.90MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
全文主要探讨了大规模数据批量推理的探索与实践,重点关注高效自动化和智能解决方案。以下是关键点: 1. **挑战**:每日处理300-1000MB数据,超过1200个特征,模型复杂度高,NLP推理时间超过130小时,但端到端目标时间仅为1天。 2. **解决方案**:采用Krylov、Ray和Spark等批量推理解决方案,针对NLP和LightGBM模型进行优化。 3. **NLP推理**:使用Ray进行高效GPU资源管理,通过动态填充和调整超参数提高效率。 4. **LightGBM推理**:利用Spark的分布式执行能力,通过YARN高效管理CPU资源。 5. **工作流自动化**:实现工作流自动生成、一键部署和跨平台调度,显著提高效率。 6. **效果**:工作流上线时间从数周缩短到数小时,执行时间从数天缩短到不到1天。
挑战与突破" 实践与优化" 批量推理全解析"
客服
商务合作
小程序
服务号
折叠