9 月 7 日,国际多通道语音分离和识别大赛(CHiME)组委会在微软海得拉巴研发中心揭晓了最新一届 CHiME-5 的比赛结果。科大讯飞团队包揽大赛四个项目的冠军,包括单麦克风阵列任务、分布式麦克风阵列任务(Rank A)和两种麦克风阵列对应的两个端到端的语音识别任务(Rank B)。
具体情况如下:
在本届比赛中,科大讯飞与中国科学技术大学杜俊教授、西北工业大学陈景东教授、佐治亚理工大学李锦辉教授等国内外知名专家团队再度携手。最终在单麦克风阵列任务、分布式麦克风阵列任务(Rank A)和两种麦克风阵列对应的两个端到端的语音识别任务(Rank B),共计四项任务中连续两届包揽所有项目冠军,并再次刷新各项目的最好成绩。
据介绍,本届大赛组委会通过采用 4 声道麦克风阵列对 20 个真实家庭的晚餐进行录音来形成比赛数据,用以考察和测试在家庭聚会等不同场景中自由交谈风格下的远场语音识别效果。整个赛事的难点主要包括多麦克风阵列的同步录音;对话风格非常自由、近乎随意;大量的语音交叠(Speech Overlap)以及远场混响和噪声干扰对录音的影响等。
作为国内语音识别领域的翘楚,科达讯飞从来就没人国人失望过。在2016 年首次参与第四届 CHiME 赛事时,科大讯飞就斩获全部三个项目的桂冠并大幅刷新了各项目的历史最好记录。
关于CHiME:
CHiME(Computational Hearing in Multisource Environments) 属于国际语音识别评测中的高难度比赛,始办于 2011 年,由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室等知名研究机构所发起。比赛的目的是希望学术界和工业界针对高噪声和混响等现象影响下的实际场景提出全新的语音识别解决方案,以进一步提升语音识别的实用性和普适性。
目前 CHiME 比赛已经举办五届。历届 CHiME 比赛的参赛队伍包括剑桥大学、卡内基梅隆大学、约翰霍普金斯大学、日本 NTT 等国际一流高校和研究机构,清华大学、中科院声学所、中科院自动化所、西北工业大学等国内顶尖院校和研究所也有参与。