为了克服在识别范围过大时会混入过多环境杂音,拉低检测灵敏度和识别精度等问题,该公司在新的技术中,将麦克风收集到的目标音与环境杂音分离开
可根据声音判断事件的技术不再是电影中的剧情了。通过NEC AI技术群(“NEC the WISE”)的“声音状况识别技术”可跨越障碍物和人群,实现新一代的
人工智能系统开发,并改良了大识别范围的灵敏度和精度问题。
NEC研究声音识别技术的时间相当长,为了克服在识别范围过大时会混入过多环境杂音,拉低检测灵敏度和识别精度等问题,该公司在新的技术中,将麦克风收集到的目标音与环境杂音分离开,使用从目标音中抽取细小构成音的构成音抽取技术与根据构成音的组合模式判断事件有无的事件判别技术,可以从需要辨别的若干事件中判断正在发生的状况。
通过“声音状况识别技术”可以监测公共设施、旅游景点等地的犯罪和事故,也可以实现对老年人的默默守护,总而言之可以在不同环境下高度感知危险状况。此外,NEC的验证实验也证实,此技术可以检测5倍于原来检测距离的声音。据透露,该技术可实现将原来在4m左右的检测距离扩大到20m,通过情景模拟演练,确认可以无缝覆盖监控摄像头的设置间隔。
声音辨识技术补强摄像头死角
近年来,作为安心,安全的举措,在摄像头难以拍摄的地点用声音来判断情况的技术不断开发改进。原来的技术是通过在不同环境下大量学习目标音,从而实现声音检测。然而,在大范围检测目标音时,因为混入很多环境杂音,对于远处发生的很小的目的音的检测精度下降,需要在各个环境下学习目标音等,因而难以导入未知环境成为课题。
而新的“声音状况识别技术”,可以从麦克风收集到的声音中将未知环境杂音分离,可以高精度的监测不受环境影响的构成音,并通过对构成音的组合模式来判断是否有事件发生,从而解决了过去面临的课题。
图1:声音状况识别技术概要。
提高灵敏度和降低误判率
新技术具有可高灵敏地检测细小声音的构成音抽取技术。例如,“玻璃碎了”这种情况发生的时候,因环境而异可能会发出“哐当”“啪”“嘭”等声音。而构成音抽取技术则可提前学习麦克风采集的声音,分成“哐”“当”“啪”“嘭”等不受环境影响的更细小的构成音,将不需要学习的声音划入环境杂音,从而在不受环境杂音影响的前提下抽取构成音。
另外,新的技术也提供了可判断发生事件性质的事件判别技术。事件判别技术可以将不受环境影响的构成音“哐”,“当”“啪”以及“嘭”等组合作为新的事件模式提前学习,通过构成音抽取技术高精度地抽取构成音,并进行比对,从而判断是否出现了目标事件。通过这种检测方法,即便是在大范围内也可以在存在各种杂音的环境下高敏感度地检测出微小的声音,且无需逐一学习在不同环境下的目标声音,因此可以轻易导入到未知的环境当中。
图2:构成音抽取技术、事件判别技术概要。