科技巨头:布局已实、用户尚虚
自2011年苹果开发第一个智能语音助手Siri之后,Google、微软、亚马逊、百度、Facebook陆续加入阵营,这些智能助手各自嫁接在智能移动设备终端上。以构建生态为目标,各巨头纷纷向第三方开放者开放其技术平台。Google与亚马逊还有自己的智能音箱设备,抢占家居场景。以亚马逊2014年推出Echo为最早。而亚马逊和微软则有结合智能电视一起使用的机顶盒或游戏机设备。
智能音箱为典型的家居场景终端,根据海外近期的消费者调查,亚马逊Echo、和Google Home的用户期望用途最主要的是播放音乐、音频读物,其次是智能家居控制管理和游戏娱乐。
综合看来,亚马逊在智能语音上的平台化布局最为成熟。根据调查机构CIRP的报告, 截至2016.11月,亚马逊推出的Echo系列智能音箱产品在美累计销量已突破510万台。根据Voice.ai提供的相关数据,自2016年6月以来在Alexa上新增的语音服务应用从1000个左右迅速增长到7000个。虽然数量庞大,但许多应用少人问津,其中仅有不到1/3的应用有一个用户反馈。
作为美国最大的电子书零售商,亚马逊有天然优势销售音频读物。随着Alexa和Echo的用户增长,亚马逊于2016下半年开始力推音频读物与播客,9月亚马逊将音频读物和播客服务加入到了Prime会员权益中。
目前,亚马逊Alexa APP Store内占比最多的三类是新闻类应用、在线游戏、教育参考等。
然而目前在国内并没有亚马逊Alexa和Echo,也没有中文语音版。中国的开发者尚在期待成熟的中文生态平台。鉴于亚马逊对中国市场过去表现出的“延时”但未放弃的态度,或许普通消费者可以期待若干年后欢迎Alexa到中国,但对开发者来说恐怕就等不起了。还是来看一下中国智能语音的本土情况吧。
技术解决方案:新老玩家趋势演变
目前在国内,除了百度度秘及其技术开放平台外,提供智能语音技术解决方案的公司主要有:科大讯飞、思必驰、云知声、三角兽、极限元、捷通华声、出门问问、海知智能,等。从成立时间来看,其中有已经上市的老玩家也有成立不久的新玩家。其背后不乏来自阿里、谷歌的资金支持,创始人里也有从微软、百度智能语音领域出来的核心技术人员。
就目前看来,国内拥有智能语音技术的玩家目前大多以开展2B业务为主,少数开发有2C的智能终端。各个玩家大多横跨多个行业提供解决方案,虽然实际服务的领域每家各有不同的势力范围,但从战略上来说,各家的焦点都比较模糊。从新老玩家的战略定位上的差异,以及老玩家近几年的业务变化情况来看,智能语音技术解决方案提供方的发展呈现了一下几个趋势:
1.行业的延伸。服务行业从电信、银行、政务领域延伸到医疗、教育、硬件终端领域。
2.从自动客服处理、语音合成服务开始试着向沟通商务、客户激励更高级的价值诉求升级。
3.从定制化开发模式开始转向平台式的互联网架构。一种是通过开发硬件设备来做平台;另一种将解决方案本身平台化的,例如成立时间最晚的两家公司海知智能、三角兽都有这样的规划。
终端设备:延伸或升级
在语音智能终端方面,我们可以分两类来看。智能语音设备目前从应用场景与使用形式上可分为几类:手机配件,例如智能耳机;可穿戴延伸,例如可语音控制的智能手表;车载延伸,例如语音控制车载导航等;家电升级,如智能音箱、语音控制智能电视、机顶盒;独立形式,这里指那些以智能语音为主要形式开发的全新硬件产品,智能语音教育产品、智能玩具等。
各类智能语音设备产品中,一部分以开发平台化产品,意图占领一定场景下终端入口的产品,如车载场景、家居场景。另一部分,在一些垂直服务领域的智能语音硬件产品也有部分尝试,如儿童教育类智能硬件、酒店服务咨询机器人,等等。这部分产品以锁定某一特定人群的特定需求为目标。
因大多数终端设备都是原有设备的延伸或升级,而语音操控只涉及人机界面交互体验,本质上并不提供新的服务或产品,竞争主要在各大消费数码品牌间展开。部分智能语音技术解决方案提供方因有其技术优势,也将产业触角延伸到硬件设备上。其中,较受关注的是以中国的Amazon Echo为定位的科大讯飞的智能音箱系列产品。不过或许就像如今再难找到不能上网的电视机一样,未来配上语音操控也将成为数码产品、车载系统的功能标配。
由于音箱、耳麦与音频播放最为紧密,使用语音操控的智能音箱与智能耳麦成为这一领域最具代表性的硬件终端。科大讯飞、小米、联想、海尔都已陆续推出了通过语音控制的智能音箱产品,恐怕他们的意图都不是卖产品而是做生态。
从智能音箱的发布方来看,大致分为几类:消费数码强势品牌、智能语音技术解决方案提供方、传统音频设备商、数码音频服务应用、其他智能硬件初创公司。
事实上,较早进入市场的是一些期望抓住新一波热点的智能硬件初创公司,然而这类开发者无论是技术实力、产品运营经验还是产业链资源都较为有限,往往容易沦为探路先驱;而其他几类发布方借用自身特定优势,如已建立起的强势品牌效应、已积累的粉丝群等,随后推出的智能音箱市场表现往往会更好。
Strategy Analytics的最新数据称,2016年智能音箱全球出货量达到590万台,预测有望在2022年达到10倍增长。
作为手机配件的耳麦顺利成长的成为各手机品牌延伸推出虚拟语音助理的载体。目前,Apple在2016年分别推出了配有智能语音助理的升级后的Earpod有线版耳机和高端无线版Airpod;Sony也于2016年9月发布了Xperia Ear蓝牙智能耳机。然而似乎尝鲜者使用后对语音助手耳机的体验好评度较低。另一家开发智能耳机的名为Vinci的创业公司2017年初完成了数千万元A轮融资,在2015年,Vinci曾获得数千万人民币的preA,千万天使轮投资,目前产品正在以129美元预售。
服务应用层:有待挖掘
就2B的应用领域来看,从功能上分主要是三类:智能客服、语音识别、语音合成。
智能客服领域目前主要涉及电信、金融、政务等客服呼叫量密集的行业。在有能力提供智能语音技术解决方案的公司中,有很大一部分提供呼叫中心智能客服解决方案,如科大讯飞、云知声、捷通华声。除此之外,还有定位聚焦在智能客服领域的其他创业公司。
语音识别和语音合成主要处理语音与文本之间的互转。所涉及领域通常在语音数据密集但又有电子化存档需求的行业,如法院、医疗、教育、媒体。以医疗行业为例,近几年医疗行业正在进行数字化升级,个人医疗记录电子化的数据处理需求比以往有所增强,智能语音解决方案提供方纷纷开始涉足医疗行业,外科医生、放射科医生、牙科医生在手术等一些情况下不便手写病情,在将噪麦克风与语音识别技术的帮助下,来提升病情记录的效率。
就2C的应用场景来看,可以分为车载场景、家居场景、其他移动场景,这三类场景下有一些通用的应用领域,也有部分有场景特殊性的应用领域。见下图。
就目前来看,已有的以音频服务为主要服务内容的APP与“听”场景天然匹配,首先登陆了智能语音2C领域,如音乐、音频读物、播客类的APP,其中包括喜马拉雅FM、酷狗音乐、得到APP等都已进入各类智能语音终端。
总体上来说,国内2C应用目前还处在“新瓶装旧酒”的状态,一部分切合度较高的既有移动APP转化成语音操控模式即可进入这一市场。而更紧密围绕智能语音交互,充分利用其交互体验的其他创新服务和产品还非常少。
把握智能语音交互体验的核心特性,结合场景特性、人群特性等因素,笔者认为可以从以下5个不同视角来挖掘可创新或升级的应用领域:
1、既有音频内容服务。也就是目前加载在智能语音设备终端上最多的应用。
2、可转音频的资讯服务。对许多资讯类服务来说,原本可能是文本形式,但能够比较容易的转化为语音模式。尤其是一些快捷查询类资讯,例如天气查询、交通查询等。
3、基于可穿戴设备的服务。可穿戴设备原本是为移动场景所设计,加载在上面的服务对便捷性都有较高的要求,且可穿戴设备往往操控界面有限,如能转化成语音模式将有可能带来更好的体验。
4、备忘记录预约类服务。在个人日程管理领域,也是移动应用APP兴起时最早繁荣的领域之一,以往主要依靠文本输入,在一些特定环境下,文本输入不便可采用语音输入模式。事实上,这类应用很多都有语音输入插件,但既往的产品设计模式并未考虑语音操控管理的便捷性,或需要一些升级优化。
5、面向文本交互不便的人群。除了在驾驶状态、做家务时、某些工作场合等场景下,双手被占用,文本交互不便。儿童、老人、其他障碍人群,也有可能对文本交互模式的使用不适应,这类群体特别需要语音控制模式。