1、构建智能化的测试环境数字孪生平台秦小凤中国银联秦小凤中国银联 智能化创新中心测试开发工程师目前主要负责测试工具体系规划及建设负责及参与接口自动化、安全服务、环境治理等等若干通用测试体系平台的建设负责及参与机构入网、若干核心系统专项测试平台的建设目录01CONTENTS0203背景解决方案数据源-数字孪生模型-应用赋能04成效总结05展望未来背景数据呈现关联性较弱:4000+主机、12000+用户、100W+进程等等庞大的数据,数据较为分散,在呈现上几乎各自为营,未形成完整的数字化拓扑网络,难以做到全面化、精细化的管理数据纳管的范围不足:在测试管理中,除物理资源外,紧密关联的业务数据如系统、模块
2、、人员等,是测试过程中极其重要且频繁依赖使用的数据,这类数据在传统管理中,与物理技术数据的联系不够密切,几乎没有系统参与到问题分析当中资源庞大但管理较弱向下操作环境欠缺:目前提供的监控、告警、预测等能力,基本都为对环境数据的采集,然后向上层应用输出,而缺乏利用资源统筹优势对环境做反向的指令操作,比如版本安装,智能插件注入等应用赋能场景不深:丰富的指标和链路未深层次发挥作用,仅仅提供监控告警等,未直接为最后的比如案例生成、数据库升级迁移、数据落标、接口校验等场景进行赋能,直接提升测试效率典型测试场景赋能有限新入环境纳管的成本较高:新入环境需要若干初始化配置,不够智能,耗时费力,严重影响了技术的快
3、速批量落地排错剖析智能化水平较低:对于一些重要对象,没有根据特点继续下钻深度分析,问题的复现和分析对人员能力要求较高可观测性的抽象程度不够:众多资源的呈现形式过于直接,没有根据测试人员的角度抽象出观测模型,既不符合测试人员的使用视角,也不利于为基于测试系统角度的上层平台提供环境支持若干支撑能力的不足目录CONTENTS02解决方案解决方案:定位 平台定位:承上启下的测试环境数字孪生 向下对接测试环境,整合资源,建立完整的、系统的测试环境数字观测模型 向上为其他工具平台开放赋能,协同治理,保障功能、性能、混沌、安全等各类场景的介入实施数字环境测试管理测试执行测试服务平台物理环境硬件操作系统软件应
4、用接口自动化App自动化页面自动化自动化测试自动化测试通用录制Agent清洗回放平台流量回放流量回放定制工具定制工具机构入网大数据测试清算集成通用工具通用工具Mock服务平台加解密服务数据库/文件比对性能剖析性能测试性能测试全链路生产压测平台混沌实验安全测试专项测试专项测试测 试 环 境 数 字 孪 生研发服务平台架构资产平台持续集成流水线数字环境测试管理测试执行解决方案:业务架构解决方案:测试环境数字孪生平台 数字孪生(Digital twin):NASA(美国国家航空航天局)、AFRL(美国空军研究实验室)、Michael Grieves 物理事物 虚拟数字模型 状态、行为、健康等可见 数
5、字映射 双向 全生命周期测试环境数字孪生:测试环境数字化-模型-应用赋能目录CONTENTS03数据源-数字孪生模型-应用赋能数据源 物理数据:测试环境直接获取的数据,比如节点资源、进程、网络、流量等 还原物理资源状态 逻辑数据:与系统业务、人员管理、研发测试生命周期等相关的逻辑概念数据 复合测试流程,贴合测试视角是否有故障,故障在哪里,可能的故障原因测试快速入口、呈现关心的环境、跳转相关的环境找谁联调、是否达到通过标准核心理念:无侵入获取双端应用数据业界常规实现:应用代码埋点、引入第三方SDK和Agent注入等方式,需要代码改造,侵入性较强,不同编程语言无法通用内核层分析方法:内核函数探测,
6、对应用无感,兼容虚机和容器,在链路追踪、定量分析等方面都更加通用和低耗 数据获取准则:无感,使用上、执行时间、资源消耗 还原真实执行的状态 采用linux内核动态跟踪技术,对各种架构应用无侵入、低开销、热拔插、低接入成本的数据收集数据源:进程 基于 proc 和对内存进程事件的监控,实现对进程状态变化的毫秒级同步,快速统计变化数据源:链路和流量 基于 Netlink 实时监测socket 链路变化 基于 SystemTap 无侵入采集流量,通过“魔数”识别应用通信协议,然后针对协议,尽可能获取有效信息(服务接口、跟踪标识等)经 Trace ID 机制整合计算分析后,提供在线可视化展示方案,供测