a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

速记员要下岗了 微软最新语音识别系统比人还准

随着人工智能时代的到来,脑力劳动者也纷纷将被抢了饭碗,这次轮到了人工速记员要下岗了。
资讯频道文章B
  机器人的出现,已然造成了大批体力劳动者的失业,而随着人工智能时代的到来,脑力劳动者也纷纷将被抢了饭碗,这次轮到了人工速记员要下岗了。

  环顾现有的带语音识别能力的系统,无论是苹果的 Siri、亚马逊的 Alexa 还是微软的 Cortana,用户在使用起来多少还是经常想砸手机,因为它们经常擅自“自动纠正”用户话,可见要简单地做个好的“听写员”实在是不容易。

  然而,10月17日的时候,微软发布了一份名为《达到与人类具备同等交流对话水平》(Achieving Human Parity in Conversational Speech)的论文。该论文宣称,他们在语音识别上的技术已经高于专业的人工速记员了。

  为了能够进行比较,微软的研究人员找来了一段它们具有正确脚本的音频片段,并请来了一家第三方公司来进行语音转文本处理。这个第三方公司的操作方式分为两部分:一名誊写员边听音频边将内容打出来,而另一名则一边听音频一边修正第一人提供的文本。随后,根据和标准的正确文本对比,第三方公司的错误率分别是 5.9% 和 11.3%。

  而微软的识别系统,在经过 2000 小时对人类交谈素材的学习后,针对同一份音频材料进行了语音识别,错误率分别为 5.9% 和 11.1%,数量上来看,比人类对照组少了十来个错误。

  虽然这次测试的成绩不错,但毕竟处理的音频材料与真实生活场景的贴近性还是比较遥远。而微软的研究人员也表明,下一步会将该系统放在带有部分背景噪音的场景中,例如在派对或是在高速公路上行驶的汽车上。同时,人类对照组的可参考性也还需要考究。但无论如何,希望这次的针对语音识别的研究突破不会成为那种被报道一次之后就消失的信息。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2020 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈