a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

语音识别:用声音与世界联通

日前,美国杂志《麻省理工评论》将该系统列为2016年十大突破技术之一,并称百度在世界语音交互技术领域做出了突出贡献——将语音识别和自然语言理解相结合,为世界上最大的互联网市场创造了切实可用的语音接口。
资讯频道文章B

  “侬好”“雷猴”,我国地域广阔,汉语方言众多,但百度语音识别技术能准确识别上述方言的意思为“你好”,这是百度硅谷人工智能实验室推出的全新深度语音识别系统(Deep Speech2)的突出特点之一。日前,美国杂志《麻省理工评论》将该系统列为2016年十大突破技术之一,并称百度在世界语音交互技术领域做出了突出贡献——将语音识别和自然语言理解相结合,为世界上最大的互联网市场创造了切实可用的语音接口。

  早在2014年底,百度硅谷人工智能实验室即发布了第一代深度语音识别系统(Deep Speech),通过采集9000余人共计7000小时的语音会话片段,将这些片段与包含餐厅、地铁、火车等公共场所的背景噪音相结合,进而形成了10万小时左右的语音会话数据集,并通过端对端的深度学习技术对外界的声音和其他数据进行识别,从而大幅提升了嘈杂环境下的英语语音识别的准确率。

  一年后,该实验室针对语音识别技术再次取得突破性进展,研发出全新的第二代深度语音识别系统(Deep Speech2)。这一系统构建了“深度的神经网络”,能将声音与单个字或短语关联起来,同时基于数以百万计的转录语音,使得该系统在识别汉语语音方面要比人为识别更加准确。据了解,该技术能使语音识别相对错误率比现有技术降低15%以上,使汉语安静环境普通话语音识别的识别率接近97%。

  由于汉语拼音由声母和韵母共同组成,在移动产品终端上进行汉字拼写输入十分繁琐,因此我国是发展语音接口的理想市场。目前,百度深度语音识别系统已将用户从传统的拼写输入汉字发出指令中解放出来,实现了语音输入。同时,该技术也被应用在百度新闻APP中,用户可以下拉新闻列表呼出语音播报功能,富有磁性的男声就会开始朗读最新的新闻信息。

  据了解,截至2015年底,百度针对相关技术已提交中国专利申请500余件,通过《专利合作条约》(PCT)途径提交专利申请30余件,技术涉及语音识别、语音合成、声纹识别、声学信号处理等。同时,百度积极联手海尔、京东等公司联合发起成立了智能语音知识产权产业联盟,旨在通过组建专利池,引导和促进语音技术跨行业的实施和应用,推动语音相关产业的发展,同时降低国内企业的专利侵权风险。

  随着百度语音技术的不断进步和专利布局的愈发完善,语音识别技术将更广泛地运用于人们与各种设备的互动。不久的将来,语音识别技术将不再局限于几个预设的命令,用户将可以通过语音虚拟助理控制家中所有的智能电器,甚至实现与智能家居的对话交流。

参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈