1、面面向向安安防防和和安安全全的的音音频频分分析析工工具具7月 2025白皮书2概述面向安防和安全的音频分析工具能够侦测声音模式,并突出实时音频中的异常声音。例如,分析可以识别尖叫声和喊叫声并向操作人员发送警报,操作人员随后可以检查是否需要派遣额外人员以防止事态升级和袭击。它还能侦测玻璃破碎,防止有人闯入。利用不同类型的传感器,比如振动和音频传感器(摄像机和麦克风),能够提高侦测结果的可靠性,提供更有助于行动决策的分析数据。AXIS Audio Analytics已集成在兼容的安讯士设备中。它能捕捉和侦测声音,但不保存原始音频流。这样就能够高效保护隐私安全,因为AXIS Audio Analyt
2、ics是基于前端运行,并且提供的是音频元数据。目录1引言42技术42.1侦测声音事件42.2捕捉并处理音频42.3基于前端或基于服务器的分析工具52.4元数据63AXIS Audio Analytics63.1隐私63.2用例73.2.1声音侦测与警报73.2.2与传感器相结合,进一步发掘监控系统的潜力103.2.3将输入提供到显示面板104法律限制115免责声明1141 1引引言言面向安防和安全的音频分析工具能够侦测声音模式,并突出实时音频中的异常声音。分析可以识别尖叫声、喊叫声和说话声以及侦测玻璃破碎声,并通过向操作人员发送通知提供早期警报。在与视频监控相结合的情况下,音频分析工具能够向操
3、作人员警告正在发生的潜在事件,并引导他们查看相关的摄像机画面。这可有助于提早侦测、快速干预,并且在许多情况下,有助于防止事态进一步升级。本白皮书介绍了音频分析工具可如何应用于安防和安全领域。我们讨论音频的捕捉和处理技术,并着重介绍实时前端分析,比如直接在摄像机或麦克风中进行的基于AI的声音分类。我们还展示前端的音频分析工具如何以多种不同的方式通过音频元数据来保护隐私安全。本白皮书不提供法律建议。在安装任何监控系统之前,您需要研究当地以及具体的应用场合适用哪些法律法规。系统所有者应负责确保符合当地法律、法规和建议。2 2技技术术2 2.1 1 侦侦测测声声音音事事件件一个声音事件即一个音频片段,
4、人类通常将其识别为某个特殊的概念,例如,尖叫或玻璃破碎的概念。这些类型的概念声音可以被侦测到并进行标记,如同在视频分析工具中侦测和标记对象类别一样。经过训练来识别声音模式的分析工具通常可以监听一系列特征,包括从分贝级别到随时间变化的不同频率上的能量。在侦测到特定声音模式后,系统可以通过视觉警报或通过触发报警的方式,向工作人员发送自动通知。如果使用基于AI的算法,则可以通过大量的数据来训练这些工具。例如,在以数千次的相应声音进行训练之后,算法能够可靠侦测人类尖叫声。2 2.2 2 捕捕捉捉并并处处理理音音频频音频分析工具使用所捕捉的音频数据,并分析相关的声音特征,从而生成非音频输出。捕捉音频基本
5、上意味着,对音频进行数字化处理,并使其可在软件中使用。其具体实现方式是,使用麦克风拾取空气中的声音振动,将这些模拟信号转换为数字信号,然后将这些信号传送到处理单元。如果所捕捉的音频未置于闪存、硬盘等永久存储介质上,那么便不会记录这些音频。在安讯士设备中,默认关闭音频的流传输和记录功能。在初始音频捕捉之后,需要对捕捉的信息进行预处理,以便再进行后续处理。不同的预处理可以同时或单独进行。5音频预处理1转换2实时前端分析3处理和编码以便进行流传输或存储如果使用安讯士设备,除非主动开启音频流传输功能,否则便不会对音频进行流传输或存储。转换。声音被提取并转换成(比如)视觉信息,以图形形式显示声谱。这个过
6、程不可逆:无法再通过声谱图获取原始声音。实时前端分析。如果在前端处理声音,可以使用声音分类器。这将得到描述声音特征的元数据。无法通过元数据再造原始声音。可以使用声音检测器来识别声音形式、声级或频率,并提供状态信息。它同样也无法还原原始声音。处理和编码。如要使用原始(未经转换或分析的)音频,通常需要执行某些处理和编码,由此对音频数据进行预处理,以供预期应用场合之用。这些应用场合涉及在前端存储音频数据、将数据流传送到外部客户端以供(在服务器或云端)进一步处理、或者外部存储。在拥有安讯士设备的情况下,您需要先主动开启音频流传输功能,出于隐私保护原因(音频隐私管控),此功能为默认关闭状态。2 2.3