a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

依图在全球权威声纹识别竞赛中夺冠

近日,在国际声纹识别权威竞赛VoxSRC上,依图算法夺得第一,等错误率降到0.0098、大幅超越第二名。
资讯频道文章B

  近日,在国际声纹识别权威竞赛VoxSRC上,依图算法夺得第一,等错误率降到0.0098、大幅超越第二名。

  并且,依图团队(参赛队伍名为logicworld)在使用指定数据的情况下取得了优于其他团队使用不限数据得到的结果,表明依图声纹识别技术已达世界前沿水平。

(竞赛的任务是判断两段音频是出自同一个人还是两个不同的人,算法的输出结果用等错误率(Equal Error Rate,EER)来衡量,EER越小系统性能越好)

  0.0098的等错误率意味着什么?

  首先,日常生活应用基本能够满足,笔记本电脑和汽车的声纹锁功能越来越可靠,智能硬件上的虚拟助理将不会被他人用同样的关键词唤醒,成为真正属于你的个人助理。

  在社保远程身份验证、反电信诈骗等公共服务领域,精准的声纹识别技术也将更好地降本增效、服务民生,不需要再“居住异地,千里奔波”,更避免“九旬老人社保年审,家人抬着爬上三楼”。

  声纹识别拥有广阔的应用前景。不仅如此,将语音识别与声纹识别、语义理解相结合,就能知道 “是谁因为什么说了什么”,将大幅增强智能语音个性化服务,实现真正意义上的交互。

  VoxSRC是由英国牛津大学、韩国互联网巨头Naver、斯坦福国际研究院和麻省理工学院联合发起的全球声纹识别竞赛,被誉为“声纹识别界的ImageNet竞赛”。

  本次比赛采用的数据集基于开源数据集VoxCeleb,由牛津大学团队于 2017 年发布,后来逐渐扩充,现在是声纹识别领域规模最大、标注最完备的开源数据集之一。

  VoxCeleb来自YouTube名人采访视频,包含了7000多个来自不同种族、口音、职业和年龄的说话人,超过100万段的说话声,2000多小时的音频和视频,且基本都含有背景噪音、笑声、说话声重叠及其他杂音,非常考验算法的实战水平。同时,本次比赛测试数据不含标注,无法用来训练或调整系统,确保了结果的公正与公平。

  今年的VoxSRC吸引了来自海内外多支队伍参与,包括约翰霍普金斯大学、法国国家信息与自动化研究所、清华大学、中山大学等知名高校和研究机构,以及平安科技、NEC等大型企业。

  成立7年来,依图在视觉感知、自然语言处理、语音识别、智能决策等多技术领域发展,这次参赛VoxSRC是依图在语音领域的一次新尝试。

  未来,依图将在多算法领域持续投入,推进多模态技术融合、软硬件协同开发,将世界前沿的人工智能算法与行业场景深度结合,推动人工智能应用落地。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2020 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈