1、AI赋能的自动化软件调试现状与未来谢晓园 武汉大学演讲嘉宾谢晓园武汉大学计算机学院教授 博士生导师武汉大学特色化示范性软件学院副院长武汉大学珞珈青年学者、国家自科基金委外国优秀青年学者研究基金获得者。主要研究方向为软件测试、软件缺陷定位与修复、程序分析与切片、智能软件工程等。曾解决了软件缺陷定位领域30年来的瓶颈难题,被软件工程顶级期刊IEEE TSE评为全球软件蜕变测试领域十大代表性研究者之一。发表CCF A类论文13篇,其中一作或通讯11篇。以第一及通讯作者连续两年获国际软件工程顶级会议(CCF A类)杰出论文奖。获计算机学会NASAC青年软件创新奖、大陆首个ACM SigEvo HUMI
2、ES奖、湖北省科技进步一等奖等学术奖励。担任SCI期刊编委、客座编辑,历任ICSE/MET蜕变测试研讨会PC Chair。担任包括CCF A类会议ASE、ICSE在内的多个国际会议PC members,以及包括CCF A类期刊TSE、TOSEM和ACM Computing Survey等在内的多个国际知名期刊审稿人。目 录CONTENTS1.背景2.AI模型驱动的软件调试3.AI赋能调试的未来4.总结与展望背 景PART 01背 景现代社会,软件无处不在背 景关键系统的软件缺陷将造成灾难性损失因自动驾驶软件缺陷,特斯拉在全球范围召回近36.3万辆汽车机载MCAS软件缺陷造成两起空难,共造成34
3、6人死亡权威机构发布报告称,2022 年软件缺陷问题使美国经济损失2.41万亿美元大规模车辆召回致命性航空事故巨额的经济损失bug2018-20192023.22022.12背 景高质量软件已成为经济社会发展的迫切需求高效的软件调试是构筑高质量软件的重要一环背 景发现软件程序错误判断导致程序错误的底层缺陷位置或原因(缺陷定位)对定位到的缺陷进行修复(程序自动修复)软件测试(Software Testing)软件调试(Software Debugging)复杂、关键背 景缺陷定位程序自动修复源数据提取及建模数据清洗特征集成与排序代码片段理解自然语言处理结果人类可理解化面临的普遍技术需求人类智能人
4、工智能并行能力差脑容量有限推理能力参差不齐难以有效完成调试任务高度并行扩容简单方便推理能力强大人工智能的优势与软件调试的需求高度契合请求完成请求完成人工智能为软件调试任务的解决提供了更高有效、更高可行方案背 景基于信息检索的缺陷定位IRFL错误信息描述堆栈轨迹代码片段其他缺陷报告信息语言模型/分类器等缺陷定位结果(文件、函数粒度等)基于程序频谱的缺陷定位SBFL二进制覆盖信息计数谱向量测试用例属性程序运行控制流风险值评估公式缺陷定位结果(语句粒度等)程序自动修复缺陷代码上下文需求文档领域知识程序规格说明基于搜索的方法候选程序补丁原环境下重新测试含错程序代码片段神经机器翻译 正确代码片段传统软件
5、调试任务迫切需要AI驱动AI模型驱动的软件调试PART 02研究现状概览2016年2021年第一季度AI与软件调试交叉领域研究热度AI赋能的自动化软件调试热度呈不断上升趋势该领域研究集中发表的国际期刊该领域研究集中发表的国际会议简 称全 名发文量简 称全 名发文量Yi Song,Xiaoyuan Xie and Baowen Xu.When Debugging Encounters Artificial Intelligence:State of the Art and Open Challenges.SCIENCE CHINA Information Sciences,2023,ISSN 1
6、674-733X,https:/doi.org/10.1007/s11432-022-3803-9.研究现状概览美国和中国在AI赋能软件调试研究领域处于领军地位累计发文量美国中国新加坡加拿大澳大利亚印度韩国卢森堡德国瑞典年份AI赋能软件调试研究活跃度排名前十的国家美中两国领域占有率年份领域占有率领域占有率=当年该国家在该领域发表的文章数当年该领域总文章数AI驱动的软件缺陷定位软件缺陷定位的核心任务失效行为(症状)缺陷根因(症结)表层执行底层代码中间状态用户感知软件系统异常的直接窗口软件系统错误运行结果的外在表达软件缺陷的最直接表现形态触发软件表层异常的根本因素软件缺陷定位任务的起点PIE模型证