当前位置:首页 > 报告详情

A1--陈永健--AI系统鲁棒性评测挑战与实践.pdf

上传人: 蓝*** 编号:1270023 2026-06-20 31页 4.98MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **AI系统鲁棒性定义**:ISO/IEC 24029-2定义为AI系统在各类环境下维持性能的能力,受任务复杂度、模型能力、数据质量等因素影响。 2. **评测关键技术**: - 构建20+语言现象的鲁棒性模式库(如同义转换、键入错误模拟)。 - 基于OpenAttack实现可控扰动,结合PDR(性能下降率)量化评估。 3. **华为实践**: - 通过天罗平台自动生成鲁棒性测评集,覆盖QA、文本摘要等场景。 - 支撑全球300+运营商客户,PDR指标实现全场景量化跟踪。 4. **挑战与方向**:需解决AI不确定性导致的统计偏差,优化测试断言设计。
**AI鲁棒性是什么?** **如何测试AI鲁棒性?** **鲁棒性评测有何价值?**
客服
商务合作
小程序
服务号
折叠