当前位置:首页 > 报告详情

王天庆-贝壳找房-多租户下的算力分配和调度实践.pdf

上传人: le****ng 编号:186912 2024-12-17 35页 7.64MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了贝壳找房在多租户环境下算力分配与调度优化的实践。王天庆,计算存储/容器引擎技术负责人,介绍了贝壳算力的发展、面临的挑战以及解决方案。关键点如下: 1. 贝壳算力的发展:统一存储底座、统一资源池调度、大模型流量调度等,旨在提供高效、可靠的基础设施。 2. 面临的挑战:算力资源四处分散、组织壁垒、混合多云跨地域成本意识等,导致算力分配不均、资源利用率低。 3. 解决方案: - 统一存储底座:基于JuiceFS能力,建立跨地域文件系统底座,提供数据缓存、镜像能力。 - 统一资源池调度:实现跨集群注册发现、流量调度,支持多种工作负载创建、更新、删除。 - 大模型流量调度:优化负载均衡策略,避免算力不均衡和算力饥饿问题,提高资源利用率。 4. 资源调度策略:常驻+弹性副本、资源出借、资源申请等,以满足不同场景的需求。 5. 基础设施变化:物理资源空闲时共享、引入超级节点、使用共享队列等,提高算力资源最大化利用。 6. 流量调度优化:异构调度、最小Prefill调度、缓存亲和性等策略,提高GPU资源吞吐和端到端性能。 综上,贝壳找房通过统一存储底座、统一资源池调度和大模型流量调度等优化实践,解决了多租户环境下算力分配与调度的问题,提高了资源利用率和工作效率。
"贝壳找房如何实现多租户算力分配与调度优化?" 贝壳算力发展中的挑战与解决方案" 贝壳跨云架构中的数据流转与调度策略"
客服
商务合作
小程序
服务号
折叠