1、国际化产品服务架构核心服务稳定性治理实践张宏博字节跳动 资深测试开发工程师目录01CONTENTS0203背景介绍整体方案链路识别&容灾演练&埋点质量04总结与展望背景介绍质量背景业务背景核心链路梳理不清晰保鲜机制不足,无法完成重点链路突破质量保障能力建设项分散,无整体视角统一规划各业务质量建设阶段和建设重点项各异,无法清晰说明稳定性现状底层核心服务,为上游所有业务场景提供基础能力,影响范围大业务场景多种多样,上下游请求链路复杂,涉及团队多角色多目录01CONTENTS0203背景介绍整体方案链路识别&容灾演练&埋点质量04总结与展望整体方案能力建设方案目录01CONTENTS0203背景介绍
2、整体方案链路识别&容灾演练&埋点质量04总结与展望核心链路识别和保鲜宗旨:保证核心链路识别准确度、避免业务重复操作降级演练痛点准确性和复用度差降级演练效率低RD需要进行降级演练和有效性验证,步骤繁琐,对人员熟练度要求高演练结束后需确保功能恢复,存在忘记回退到演练前状态情况演练过程中需要以多种方式校验有效性,多平台切换割裂业务自身维护的容灾降级预案繁多,每次演练的校验项复用性差因校验项过多导致存在漏校验风险,整个流程冗长较重各业务场景降级演练基本保持在半年一次的频率,频次低,存在风险降级演练自动化验证思路从业务实际降级场景出发基于演练平台触发事件实现业务和场景适配借助测试能力完成有效性验证切流演
3、练痛点效率低、场景多、时间长RD需要进行切流演练和有效性验证,步骤繁琐,对人员能力要求高机房切流演练按比例逐步切流校验、按比例切流恢复,验证场景 x N演练过程中需要以多种方式校验有效性,多平台切换割裂切流演练有效性需抓包确认,同时核心功能场景可用性需同步验证切流演练自动化验证思路突发场景下核心链路切流有效性成功命中切流比例埋点质量保障痛点埋点事件数量多,覆盖的埋点属性上百个埋点触发条件各异,同个埋点对应多种上报场景埋点属性值类型多,是否必传、枚举、范围、非空、频次质量发现问题阶段滞后,影响线上质量,月度为单位埋点测试依赖多个触发场景组合,测试成本高埋点质量保障整体思路在埋点生命周期,各角色需
4、相互配合,重点介绍QA侧能力建设事项埋点质量保障能力建设与业务QA配合,以日常功能版本回归为触发项,对精细化埋点校验提效积累埋点数据,分版本完成数据汇总和分析,监控识别发现问题机制保证核心埋点保鲜,前置感知埋点变化,保证Case有效性埋点版本Diff监控多种触发埋点上报场景作为数据源维护测试设备/账号池回归阶段埋点数据聚合分析版本维度Diff看板建设稳定性度量体系合作模式多角色、多团队相互配合为核心链路高可用性负责目录01CONTENTS0203背景介绍整体方案链路识别&容灾演练&埋点质量04总结与展望总结&规划Q&A扫码交流 共同进步感谢聆听关注公众号稳定性保障产品线:性能测试平台XRunn
5、er、全景-跨架构全栈可观测性平台UniEye、软件可靠性工程测试平台SRET自动化测试产品线:UI自动化测试平台ZRunner、API接口自动化测试平台ARunner、测试管理平台Runner Master、业务体验自动拨测平台BRunner、一体化智能测试设备、APM应用监控平台测评:验收测试、安全测评、产品登记测试、确认测试信创产品线:信创测评实验室、信创迁移大师、数据库迁移平台服务:兼容性测试、云真机、物联网硬件连通测试、IT设备租赁、性能压力测试、功能用例测试、用户体验拨测、缺陷探索测试、信创支撑、信创测试、APP竞品分析、数据采集服务、安全扫描、安全渗透测试、CMMI&敏捷咨询、T
6、MMI认证咨询、敏捷化成熟度认证咨询教育:产教融合、赛事合作、CNAS实验室、工信认证广州掌动智能科技有限公司数字化转型基础支撑软件核心技术领先者u成立于2006年,国家级专精特新“小巨人”企业u拥有发明专利、软件著作权 150 余项u省部级及行业科技进步奖 5 项u参与制定国家标准和团体标准 16 项u获得深圳市高新投广州产业投资基金、中小企业发展基金、广州金控、中新国际联合研究院等国有和知名社会资本战略投资u工业和信息化重点领域人才能力评价培训辅导支撑机构、广东省新一代信