1、中国声纹识别产业发展白皮书(2023 年)中国声纹识别产业发展白皮书编委会2024 年 3 月编制声明本白皮书版权属于 中国声纹识别产业发展白皮书 编委会。文中部分数据来源于网络公开资料整理,转载、摘编或利用其它方式使用本白皮书文字或观点的,应注明来源。违反上述声明者,编者将追究其相关法律责任。编委会郑方 清华大学人工智能研究院听觉智能研究中心主任、得意音通创始人刘永东 中国语音产业联盟秘书长、国家工信安全中心人工智能所常务副所长洪青阳 厦门大学教授、天聪声云创始人金琴 中国人民大学教授艾斯卡尔艾木都拉 新疆大学教授、智能科学与技术学院(未来技术学院)副院长张超 清华大学助理教授张楚 IIFA
2、A 副理事长、一砂科技创始人李荪 中国信通院云大所人工智能部高级主管卜辉 语音之家创始人、希尔贝壳 CEO李蓝天 北京邮电大学副教授成舸 得意音通副总经理王钰 得意音通市场总监I目录面向应用需求的声纹识别技术创新 V一、环境篇 11.1 AI 安全和隐私监管日益加强 11.2 行为特征识别技术开始兴起 11.3 新的场景需求源源不断激发 21.4 无障碍环境建设立法实施 2二、技术篇 32.1 声纹识别算法研究进展 32.2 音频防伪算法研究进展 42.3 工程化难点及技术进展 5 2.3.1基于电话信道、实时音频流的声纹识别 5 2.3.2 提升超大规模声纹辨认性能 5 2.3.3 多模态多
3、任务联合识别 6 2.3.4 多说话人分离 62.4 前沿挑战及技术进展 72.5 研究型数据集建设 10 2.5.1声纹数据集建设过程 10 2.5.2 研究型声纹数据集建设现状 12 2.5.3 常用的研究型声纹数据集 132.6 相关赛事综述 13 2.6.1 CNSRC 2022 14 2.6.2 VoxSRC 2022 14 2.6.3 FFSVC 2022 14II 2.6.4 SASV 2022 15 2.6.5 CSSD 2022 15三、场景篇 173.1 从技术到场景 173.2 金融科技 193.3 公共安全 213.4 政务民生 22 3.4.1 政务场景 23 3.4
4、.2 民生场景 233.5 教育与医疗 24 3.5.1 教育考试场景 25 3.5.2 游戏防沉迷场景 25 3.5.3 智慧医疗场景 253.6 消费物联网 263.7 工业物联网 27四、产品篇 294.1 身份验证类 29 4.1.1“动态声纹密码”可信身份认证系统 30 4.1.2 声纹智能门锁 30 4.1.3“声纹+”门禁系统 314.2 音频分析类 31 4.2.1“声纹+”音频鉴伪平台 31 4.2.2 声纹鉴定工作站 32 4.2.3 智能听诊器 32 4.2.4 工业声纹检测系统 334.3 语音助手类 33III 4.3.1“一句话解决问题“金融级智能语音助手 33 4
5、.3.2 智能音箱语音助手 34 4.3.3 老人居家安全呼叫器 354.4 声纹采集类 35 4.4.1声纹采集终端 36五、标准篇 375.1 基础标准 375.2 应用标准 37 5.2.1 金融应用标准 37 5.2.2 公安应用标准 38 5.2.3 电信应用标准 38 5.2.4 平台应用标准 385.3 数据标准 385.4 评测标准 39六、行业篇 406.1 本领域专利情况 406.2 本领域投资事件 406.3 本领域人才需求 416.4 本领域市场预测 41七、后记 43主要参考文献 44V面向应用需求的声纹识别技术创新现在针对声纹识别的研究非常多,论文数量也在逐年增加,
6、可以说是百花齐放,这是一个非常好的事情。由于我接触产业相对比较多,过程中也发现一些问题,比如有的声纹系统上线之后,过一段时间就面临被下线,或者应用单位反映不满足业务要求等等,这些现象可能会对声纹的研究有一些打击,对声纹的发展也有一定的影响。我对这些问题进行了思索。我们语音界的老前辈,包括吴宗济先生等,把语音技术叫言语工程,顾名思义言语工程它的中心词是工程,也就是说我们的研究内容一定要面向应用,解决应用所面临的问题。当然一些基础的、理论方面的研究也很重要,这个研究积累需要更长的时间,像专委会的主任党建武教授,北大的吴玺宏教授,还有社科院李爱军教授等,在相关的领域做研究一做就是十年、二十年甚至超过