当前位置:首页 > 报告详情

使用 UDF 扩展 MLOps 以并行重新训练 50k 每周模型.pdf

上传人: 张** 编号:167701 2024-06-15 29页 1.24MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了如何使用Pandas UDFs在Spark中并行化任意Pandas函数,以实现大规模机器学习模型的训练和推理。文章提出了三个扩展MLOps的技巧:从小处开始,等待轮到,保持整洁。文章还讨论了MLOps的局限性,包括批量处理与实时处理的区别,以及可能的解决方案或扩展。文章以data.ai为例,展示了如何使用Pandas UDFs在Spark中并行化任意Pandas函数,以实现大规模机器学习模型的训练和推理。
如何使用Pandas UDFs在Spark中并行化任意Pandas函数? 如何使用UDF在Spark中开发模型训练和推理? 如何避免Spark UDF中的内存溢出问题?
客服
商务合作
小程序
服务号
折叠