1、美团资源管理和成本优化实践侯轩美团/基础软件研发中我介绍15年加美团,现为基础软件系统运营团队负责,负责容器云资源运营管理、故障运营管理、集群运维及具平台研发。曾负责Gravity流程平台、Eagle-ES搜索服务平台研发。录资源运营特点及现状降本增效挑战及思路资源运营在美团的实践总结思考资源运营特点及现状_资源运营是什么资源运营-基于动态校准的业 务 预 算 规 划 采 购 服 务器,将服务器效交付为虚拟资源,再根据业务优先级将虚拟资源合理分配给业务使。两个标:保供给,降成本。资源运营特点及现状_资源运营特点 供给层:产业链流程长,交付流程重、周期长、易受外界因素影响 资源保障压 运营精细程
2、度低 业务层:资源需求变化快,周期性低峰+热点事件凸增需求资源冗余浪费严重资源运营特点及现状_资源运营现状4000亿美元+29%32%浪费降本增效挑战及思路资源有浪费+业务有诉求 成本优化Flexera云计算报告 持续3年Top3挑战企业云计算降本增效挑战流程、相关多推进困难资源运营管理体系化、动化不,效率低持续运营权责不清晰、险、效慢、易流产1231降本增效挑战及思路_挑战企业云计算降本增效挑战流程、相关多推进困难资源运营管理体系化、动化不,效率低持续运营权责不清晰、险、效慢、易流产12332降本增效挑战及思路_策略FinOps:它定义了系列云成本管理原则和最佳实践,通过助财务团队、技术和业
3、务团队彼此合作,进数据驱动的资源保障和成本优化决策,帮助团队提升资源投产出。原则:中化驱动,多团队协作 实时报表、业务价值驱动决策 灵活运成本模型实施:成本洞察(可观测、成本分摊)成本优化(按需使、预留最)持续运营(持续优化、运营)降本增效挑战及思路_策略策略:基于公司业务特点结合FinOps思想进落地实践。如Crane是腾讯内部资源优化流程法和具的系统性输出,呈现了体系化成本优化案。成本展示(资源多维聚合与展示)成本分析(资源状态分析、浪费识别)成本优化(丰富的优化具、动/助实施)资源运营在美团的实践标:要保障资源供给、其次降低成本业务侧 业务形态多、战略变化快,需求突增是常态供给侧 重流程
4、,交付周期,易受外界影响:如贸易战、疫情、经济复苏等平台资源特点 主机体量、类型多:宿主机套餐70+,分散在多个系统资源交付形式:预算-采购-交付本质是计划经济形式不灵活供给侧业务侧平台侧业务特点资源运营在美团的实践资源成本可观测性差:资源够不够?有没有浪费?保障?优化?从下资源管理动化程度低,效率慢:资源交付按周计、节点替换靠,耗费量持续运营机制不完善,资源保障险:运动式、收益不持续业务痛点运营实践基于FinOps理念,结合内部实践经验建设资源运营管理能 资源保障:动交付提效率、需求预测识风险、分级保障ROI 成本优化:成本洞察、识别浪费、动优化、数据驱动持续运营美团资源运营思考_资源运营模
5、型基于资源供给和成本优化全链路沉淀“六层双位”资源运营管理模型预算层:业务预算和资源使分析,确保预算合理采购层:洞察交付险,合理规划服务器采购物理层:准交付管理,保障交付效率和质量虚拟层:运营整体资源Buffer位,管控物理机交付,保障业务配额供给效率和质量配额层:基于业务资源Buffer位、业务重要性和需求紧迫度合理分配资源实例层:基于资源画像、利率提升提供系统化成本优化案资源全命周期闭环、层间数据对等可校准、层内精细运营美团资源运营思考_资源流转流程 打通资源管理全命周期流程 供给保障和成本优化能闭环 平台整体资源Buffer 业务单元资源Buffer资源运营落地关键_资源运营体系能 基于
6、资源追踪、成本分摊建设资源全位可观测能 下上建设动交付、险识别能,提升资源交付效率和应急能,保障资源交付 上下逐层优化,层间协同降低服务器采购数量,优化成本 基于可控输指标运营,持续迭代运营指标资源运营落地关键_资源追踪&成本分摊 资源全命周期流转追踪:状态变更、状态停留时长及使合理性分析 成本与实体组织关联便于优化推进:引结算单元,建服务、结算单元和组织的对应关系,成本分摊到组织 精细计费,账单持多维下钻:秒级计费,账单可视化持多维下钻分析(组织、时间趋势、服务等)差异化成本分摊,真实反应资源占:基于收平衡,针对不同产品类型区分定价,反应真实成本资源追踪资源运营落地关键_资源追踪&成本分摊