五年后重新谈论搜索之后的技术时,机器学习成为谷歌接下来产品必备的技能,并且谷歌已经宣布将开放这一能力,原因是其需要大量的数据使得机器更加智能。
机器学习不止是用于优化减少垃圾邮件以及YouTube的视频推荐,如今最能代表这项技术的产品就是Google Photos。发布6个月后,用户已经上传了500亿照片。这样大量的数据以使得谷歌可以自动帮助用户组织和管理图片,而且更加人性化的搜索图片和分享。
周二,Google Photos产品经理Chris Perry在日本向媒体展示了Google Photos是如何识别出十几年前父子在峡谷的合影,而这张照片并未被人工添加任何标签。与传统照片管理依靠特定标签不同,谷歌虽然也同样会根据关键词进行搜索,但是对于图片的识别技术已经发生了根本的改变。
Chris Perry展示了如何利用神经网络识别一张图片,而不是使用信息点匹配的方式,原因是后者只能识别静物。这项被称为“神经网络”的项目包括26个层次的识别,而每个层次识别的内容并不相同。简单来说,谷歌可以从像素、线条和形状分别进行对图片的识别,最终告诉用户这是什么。
不过,这里存在着一个难以突破的困境。机器可以通过已经上传的多张图片识别出他们相同的特点,并知道这是同一类事务,但无法将这些事务与人的认知相联系。举个例子,机器识别一张猫的照片,并知道这是一只喵喵叫的猫,但是它却无法告诉用户这是一只“猫”。
面对大千世界的海量数据,在实际中是无法有专门的人对每个事物进行标定。推特和Pinterest通过五年的时间实现了这个方式,而Instagram用了两年半的时间。
然而,谷歌的做法就是利用每一个人的搜索,以此代替专门的人工添加,这是自7、8年前语音团队开始切入机器学习后开始的。2、3年前谷歌开始大规模投资这项技术,
如今,谷歌向外界开放其机器学习系统TensorFlow,Alphabet执行主席Eric SchMIDt表示,这将不断扩大网络,组成更大的知识基础,获得更多回馈,进而有更多发现。
当你看到被白雪遮盖了部分的路标,你可以大致猜测出这个图片是什么以及背后的含义。谷歌认为,机器也应该可以同样做到。为此,谷歌将机器学习引入旗下的产品。谷歌高级研究科学家Greg Corrado告诉腾讯科技,“机器学习已成为谷歌搜索第三大重要技术”。
在Greg Corrado看来,人工智能是机器响应环境,而机器学习是可以根据经验进行学习。谷歌真正感兴趣的是这两者的交集部分。“我们预测机器可以预测不断重复同一工作”,然后使其对工作处理的更好。
机器学习的基础实际上包括三个重要的部分。首先,需要找到“Model(模型)”,这就是在输入和输出中间的一个转换公式,也就是“机器学习”中的“机器”;其次,需要为这个公式找到固定的“参数”,这是需要机器进行学习,并不断修正;最后,需要一个“学习”的软件,知道如何调整参数、降低错误。
不过,对机器的调整速度非常缓慢,这需要机器对至少上千万,甚至达到10亿G的案例进行学习。这也是,机器学习与人类学习的最大差别,前者需要大量数据作为“助推器”。
尽管并未对外公布是否该技术引入谷歌眼镜等硬件产品,但谷歌母公司Alphabet执行主席Eric SchMIDt证实,目前有一百多个团队在用机器学习技术,其中包括Youtube核谷歌搜索等。
谷歌披露,机器学习提高了对Gmail垃圾邮件的识别率,以及对语音转换文字的识别率提高了20%。
谷歌在上周曾发布了自动回复邮件的功能。当用户收到新的邮件后,深度学习系统可以判断是否需要简单地回复。如果需要回复,系统会进入第二个判断,即如何对邮件进行回复。这样的判断与识别垃圾邮件类似。
事实上,机器学习的未来并不只是谷歌搜索所引发的业务。如果计算机视觉比人更好,那么就应该让机器来开车;机器对X光片的识别或许比人能够的出更精准的判断,而对时间顺序发生事情的判断对医疗诊断异常重要。
Eric Schmidt表示,如果选择创业,会进入医疗领域,因为这个领域的规模和机会。“我预测,会有很多的医疗机构可以利用我们的技术做正确的事情”。
对于目前的开放策略,Greg Corrado称,机器学习需要鼓励大家从不同的角度研究,即使在谷歌内部也有不同的方法,而学术界和不同的企业之间有很大的差异,谷歌也正在与Facebook和百度合作。而此次开源更可以为创业公司、学生,以及粉丝爱好者打开机器学习的入口。