a&s专业的自动化&安全生态服务平台
公众号
安全自动化

安全自动化

安防知识网

安防知识网

手机站
手机站

手机站

大安防供需平台
大安防供需平台

大安防供需平台

资讯频道横幅A1
首页 > 资讯 > 正文

携手英伟达:Mozilla发布新版Common Voice

Common Voice 是一项旨在通过众包的方式,来教授机器人如何像真人般讲话的项目。Mozilla 基金会在几年前发起的该项目,现已迎来与芯片巨头英伟达的最新合作。其旨在允许志愿者为世界上最大的开放式通用语音数据集贡献一份力,从而推动语音合成与识别技术的发展。
资讯频道文章B

    Common Voice 是一项旨在通过众包的方式,来教授机器人如何像真人般讲话的项目。Mozilla 基金会在几年前发起的该项目,现已迎来与芯片巨头英伟达的最新合作。其旨在允许志愿者为世界上最大的开放式通用语音数据集贡献一份力,从而推动语音合成与识别技术的发展。

  随着新版公共语音数据集的发布,可知 Common Voice 语料库已拥有超过 13000 小时的众包语音数据。

  与上一版相比,其新增了 4622 小时的内容,并且迎来了对 16 种语言的支持,包括:

  巴萨语、斯洛伐克语、北库尔德语、保加利亚语、哈萨克语、巴什基尔语、加利西亚语、维吾尔语、亚美尼亚语、白俄罗斯语、乌尔都语、瓜拉尼语、塞尔维亚语、乌兹别克语、阿塞拜疆语、以及豪萨语。

  目前 Common Voice 已经收集了 76 种语言的公共语音数据库,以及超过 18.2 万份独特的声音,贡献者社区在过去六个月内迎来了 25% 的增长。

  语音时长 13905 小时,较上一版本增加了 4622 小时。排名前五的语言分别为英语(2630 小时)、基尼亚卢旺达语(2260 小时)、德语(1040 小时)、加泰罗尼亚语(920 小时)、以及世界语(840 小时)。

  增长百分比最高的是泰语(从 12 小时到 250 小时、增长近 20 倍),卢干达语(从 8 小时到 80 小时、增长 9 倍),世界语(从 100 小时到 840 小时、增长超 7 倍),泰米尔语(从 24 小时到 220 小时、增长超 8 倍)。

  感兴趣的朋友,可移步至 Common Voice 官网(传送门),为这个公共语音数据集贡献自己的一份力量。或者前往GitHub存储库,获取特定的元数据集和使用说明。

  最后,作为 Mozilla 与 NVIDIA 的一个合作项目,相关训练模型也可通过Nvidia NeMo免费获得,后者是该公司打造的用于构建语音识别和对话模型的工具包。


参与评论
回复:
0/300
文明上网理性发言,评论区仅供其表达个人看法,并不表明a&s观点。
0
关于我们

a&s是国际知名展览公司——德国法兰克福展览集团旗下专业的自动化&安全生态服务平台,为智慧安防、智慧生活、智能交通、智能建筑、IT通讯&网络等从业者提供市场分析、技术资讯、方案评估、行业预测等,为读者搭建专业的行业交流平台。

免责声明:本站所使用的字体和图片文字等素材部分来源于互联网共享平台。如使用任何字体和图片文字有冒犯其版权所有方的,皆为无意。如您是字体厂商、图片文字厂商等版权方,且不允许本站使用您的字体和图片文字等素材,请联系我们,本站核实后将立即删除!任何版权方从未通知联系本站管理者停止使用,并索要赔偿或上诉法院的,均视为新型网络碰瓷及敲诈勒索,将不予任何的法律和经济赔偿!敬请谅解!
© 2020 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法兰克福展览(深圳)有限公司版权所有 粤ICP备12072668号 粤公网安备 44030402000264号
用户
反馈