你可能每天都在使用计算机视觉系统,甚至感受不到它的存在。你有没有使用过Snapchat上提供的最新滤镜?这就是计算机视觉的产物。你有没有使用iPhone上的人脸解锁功能?这也是计算机视觉的体现。你有没有使用手机将自己的工资转到指定的银行卡当中,并直接从银行账户内提取现金?没错,这还是计算机视觉的应用。
我们所知的计算机视觉技术正处于发展的临界点。由于行业范围内的开发工作以及深度学习算法与图形处理器的快速进步,我们正迎来一系列十年前难以想象的成果。
这项技术的一部分成果早在几年之前就已经存在,但过去一年的几项重大发展令计算机视觉达到了新的高度。更强大的传感器、大量标记图像、易于使用的深度学习软件再加上不断改进的处理器,共同将此前只能由少数几家巨头级科技企业掌握的计算机视觉交付给普罗大众。
亚马逊公司发布的Rekognition服务将计算机视觉功能推广至每一位开发人员手中。微软为其OneDrive以及SharePoint提供新的AI服务。谷歌照片也借此让我们的回忆变得可供搜索。
看起来,未来似乎就在当下。
充满无限可能的世界
在2018年,我们看到一系列雄心勃勃的计算机视觉项目先后涌现,这意味着该项技术的应用效果终于赶上了开发人员长久以来的期望。这同时也意味着开发定制化计算机视觉应用将很快变得成本低廉、极具可行性。
举例来说,ModiFace允许用户利用智能手机进行化妆。Topology公司则让用户能够通过手机试戴各款眼镜。MTailor使用类似的技术为您定制牛仔裤与衬衫。除了时尚行业之外,Pottery Barin允许用户查看新家具摆在家中的样子,Hover则允许用户将家居照片转换为尺寸准确的3D模型。
这些项目虽然不像自动驾驶汽车或者无人杂货店那么复杂,但同样预示着现有计算机视觉产品有望在未来几年中得到大规模普及:一旦小型企业有能力开发出针对大众群体的计算机视觉产品,此项技术则将快速渗透至我们生活中的几乎每个角落。
计算机视觉为何值得关注?
计算机视觉与其它人工智能技术有所不同。首先,对于大多数组织而言,计算机视觉是一项全新的功能,而非像预测分析那样只是对原有解决方案的一种渐进式改善。
此外,计算机视觉还能够以无障碍方式改善人类的感知能力。当这些算法从图像当中推断出信息时,其并不像其它人工智能方案那样是在对本质上充满不确定性的未来做出预测;相反,它们只是在判断关于图像或图像集中当前内容的分类真相。这意味着计算机视觉将随着时间推移而变得愈发准确,直到其达到甚至超越人类的图像识别能力。
最后,计算机视觉能够以远超其它AI工具的速度收集训练数据。大数据集的主要成本体现在训练数据的收集层面,但计算机视觉只需要由人类对图片及视频内容进行准确标记——这项工作的难度明显很低。正因为如此,近年来计算机视觉技术的采用率才得到迅猛提升。
2019年之后的计算机视觉前景
虽然我们已经开始在消费级产品当中看到计算机视觉技术,但其中大部分方案将继续面向特定行业中的特定用途。举例来说,CCC Information Services正在帮助汽车保险公司利用热图识别车辆损坏情况——该热图能够高亮显示出损坏程度最高的位置。
这类计算机视觉产品可能不够惊艳,但最重要的是这些新的应用方式意味着开发人员能够更轻松地判断信息是有效还是无效——如此一来,我们才能一步步迈向智慧城市这类规模极为庞大的项目。
亚马逊、微软以及谷歌在2018年展示的最新突破性进展也成为推动计算机视觉迎来发展转折点的催化剂。产品设计师与人工智能工程师已经开始研究利用计算机视觉与增强现实技术建立新型解决方案。硬件制造商正在改进组件性能并提高成本效益,从而确保该项技术在实际表现与使用门槛方面皆有所改善。
在不久的未来,计算机视觉领域最重要的创新成果应该体现在训练数据层面。目前,人类仍需要以手动方式标记图像内容以训练计算机视觉AI。(大家可能填写过网页表单,其中要求您从网格当中选择一些图像来指示像店面或者汽车这类常见的对象。在执行这些操作时,您实际上已经在为计算机视觉项目创建标记数据。)
不过随着技术的进步,人工智能将最终实现自我训练,这将进一步简化流程并加快模型的改进速度。
计算机视觉市场规模的增长速度几乎与能力提升保持同步:预计到2025年,市场总量将达到262亿美元,即年均复合增长率超过30%。人工智能代表着未来,而计算机视觉则是人工智能最为有力的表现形式。很快,计算机视觉应用将随处可见——以至于大家甚至不会注意到它的存在。