1、基于星火大模型的智能测试助手-AItest郝晓升科大讯飞郝晓升科大讯飞 高级系统测试工程师8年服务端开发测试经验,对接口测试、性能测试及分布式系统高可用测试有一定研究和实践。对大模型测试域提效有较为丰富的探索及实践,负责集团基于星火大模型底座的AItest测试域应用层工具建设,推动测试工具在集团内的推广落地,助力集团测试人员持续提效目录01CONTENTS0203AItest工具建设背景架构及功能介绍工具落地成效04后续规划及展望AItest工具建设背景大模型技术浪潮下,将大模型融入到软件工程生命周期中的各个环节,实现研测提效需求分析概要设计详细设计编码实现需求测试单元测试模块集成系统构建系统
2、部署集成测试系统测试验收测试测试设计概要设计说明书需求规格说明书详细设计说明书工程代码测试方案单元测试用例功能用例接口用例自动化脚本性能稳定性用例质量保障软件工程生命周期研发过程测试过程过程产物过程产物15%20%65%时间占比需求分析及研发测试过程约占软件工程生命周期80%时间,可将大模型应用到两个阶段,提升过程产物输出的效率,实现整体提效AItest工具建设背景实践场景教育课堂应用中心典型案例一典型案例二典型案例三典型案例四业务线验证价值点p 需求测试p 试点业务线1p 大模型提供15条需求疑问,结合业务上下文有价值疑问7条,采用率47%。可以在需求阶段直接给产品经理生成疑问帮助产品优化需
3、求实践场景业务线验证价值点p 功能测试用例设计p 试点业务线2p 大模型返回用例设计39条,无效用例5条,准确率34/39=87%。生成的用例还需要优化去补充其它场景实践场景业务线验证价值点实践场景业务线验证价值点p 接口测试脚本生成p 试点业务线3p 生成10条用例,可以直接执行成功5条,有5条需要人工介入调试,可以快速生成接口测试用例脚本,生成后只需要人工进行简单调试就可以运行。脚本效率提升50%p 自动化测试脚本生成p 试点业务线4p 大模型实现大部分用例从步骤描述到测试脚本的转化,转化后还需要人工介入调试。单个用例脚本编写耗时可以由2小时缩短到1小时,效率提升50%实践发现,大模型可在
4、需求测试、用例设计及自动化测试等方面发挥较大作用,辅助测试人员提升效率智能测试助手总体架构大模型底座通用模型代码模型多模态嵌入模型提词组装调度层模型选择知识库检索数据组装接口定义流量数据产品需求日志数据数据管理提词管理提词模板提词推荐自定义提词产品功能用例生成接口脚本生成UI自动化脚本生成问题排查数据运营数据埋点价值指标数据数据大盘运营分析报告依托星火大模型底座,将数据进行统一的调度、整合及编排,实现用例生成、自动化脚本生成等主要产品功能,并通过持续的价值指标数据采集及运营分析,为大模型的持续提升提供数据支撑AItest平台功能功能概述通过广泛的大模型测试实践,基于最佳实践案例进行了平台化能力
5、封装,实现了测试域提词的集中管理及个性化修改定制,打通并整合了多个平台能力,将AI能力与工具平台相结合,持续提升测试活动各个环节的效率2345从研发过程管理系统获取需求,对需求进行评审,可分钟级生成符合集团统一用例编写规范的功能测试用例,可便捷导入测试平台管理维护从接口管理服务获取单接口定义,可分钟级生成单接口测试用例及测试脚本,接口用例可导入到测试平台进行管理维护从接口管理服务获取多个接口定义,生成场景用例脚本,可导入测试平台进行管理维护对执行报错的用例进行日志分析,给出可能的原因,辅助测试人员定位问题对接提词平台更多测试能力,可对提词进行自定义修改保存,平台具备推荐优秀提词的能力,实现提词
6、的共享共建16可从研发过程管理平台及用例获取需求及用例,对用例进行评审及补充主要落地场景功能用例生成工具链需求测试功能用例生成用例评审使用大模型进行需求测试,提升需求质量需求描述缺失需求描述有歧义需求描述不清楚需求描述前后矛盾需求或设计多余需求无法验证需求补全使用大模型根据需求生成测试用例需求完善后,基于需求,并按照用例模板要求生成测试用例使用大模型进行用例评审基于原始需求及需求关联的测试用例,提出原有用例存在的问题,并在原有用例集的基础上进行用例补充,并导入测试平台以产品需求为引导,通过需求测试-用例生成-用例评审调用链,生成功能测试用例主要落地场景接口自动化脚本生成l当前平台主要针对HTT