前言:不同于技术的单点突破,人工智能作为一项赋能型技术,技术本身的演化是一方面,但落到实际行业领域中,仍然需要综合考虑场景的适用性、应用成本以及技术的泛化能力等问题。面对丰富且零碎的行业场景,如何推进AI的赋能作用,这是一个关键问题。本次我们有幸邀请到海康威视高级副总裁、研究院院长浦世亮先生参与到a&s系列访谈中,访谈内容涵盖了浦院长对AI落地应用的现状、遭遇的瓶颈问题、AI赋能方式以及未来的趋势预判等全方位的观点分享。
Q:a&s总经理、总编辑 关玉娟
A:海康威视高级副总裁、研究院院长浦世亮
Q:您如何看待近年来人工智能在安防领域的落地应用现状?
A:这一轮人工智能热潮发展至今已有四五年的时间,对于安防产业而言,人工智能并不是新鲜的技术诉求,因为在很久以前行业就被这样的需求所驱动,视频监控从“看得清”到“看得懂”,需求一直存在,因为这是用技防去替代人防的一个核心能力。但很久以来产业仍处于一种技术与用户需求或方案需求之间存在巨大鸿沟的状态。
在深度学习出现之前,人工智能在安防领域的应用十分受限,没有办法大规模推广,基本只有车牌识别的应用相对成熟,因为它的应用场景相对规范。人脸识别虽然应用需求广泛,但由于场景的复杂性,极大地限制了人脸识别的大规模普及应用。
然而这一轮人工智能技术的发展,使得现有的人工智能尤其在计算机视觉领域的性能实现了极大的突破,所以我们现在会更泛化的去看待安防领域的人工智能。它并不仅仅局限在安全管理上,视频监控其实更多是一种视觉传感器的角色,有了AI加持之后,它可以提取更丰富的数据信息,把物理世界进行数字化转化,然后为包括安防和更多其他实体经济的行业领域赋能。
Q:当前阶段,人工智能的实际效能和用户真实需求之间大概契合到了什么程度?
A: 当下人工智能虽然泛化能力提升了很多,但仍然处于有监督学习的阶段,自主学习技术还不成熟,致使现阶段的人工智能更多只适用于受任务限制和场景约束的场景。
以智慧城市这个大的应用领域为例,智慧城市中所有的问题无法用一套统一的算法去解决,而是要辅以具体任务和场景进行约束,比如具体的交通违法处理、智慧停车等场景,在详细地了解了场景的实用需求之后,通过充分的数据采集、样本训练,针对场景开发的AI算法才能实现更好的效能和作用。
现阶段,人工智能主流的应用方式是基于监督学习,用海量数据驱动算法。半监督学习或自主学习是学术界的研究热点,但在行业领域,目前仍是弱人工智能的应用。
Q:弱人工智能这几年提升比较明显的技术点以及应用最为成熟的细分场景主要有哪些?
A:人工智能已成熟落地应用的行业领域其实非常多,比如智慧社区,仅就小区物业而言,人工智能便可应用于社区安全管理、消防管理、人员/车辆管理、高空抛物、垃圾清运等系列环节的管理;在商超零售领域,基于AI技术的商品防损、货架盘点、智能零售货柜等细分需求也多达几十种。另外在金融、教育、司法、医疗等众多行业领域,AI的应用需求相当广泛,且以碎片化的形式存在。
“场景”和“碎片化”是人工智能产业应用中的两大关键词,不论是“AI+行业”还是“行业+AI”,它背后其实体现的是两种技术思路和商业思路,前者是利用AI去颠覆行业,后者则是通过AI来为行业赋能。由于AI应用场景相当碎片化,其中需要大量的行业应用知识和领域知识,所以真正能够发展得比较好的应该是“行业+AI”,即把AI作为一种工具去赋能这个行业的用户,然后基于用户所掌握的行业应用知识,来完成技术的效能转化。
2017年,国务院在最新一代人工智能发展规划中称,到2030年中国人工智能产业竞争力将达到国际领先水平,人工智能核心产业规模超过1万亿元,带动相关产业规模超过10万亿元。这个数字看起来非常遥远,但真正进入到行业中去了解,10万亿产业规模其实未来可期。
这也引出了海康威视对于人工智能业务的未来战略,面对如此丰富和零碎的行业场景,相比于用项目式的方式一个个去帮用户解决问题,平台式的赋能方式更能够促进万众创新和群智的涌现。怎样才能使数量众多的传统产业用户受益于人工智能技术的发展?我们将算法、产品、云服务等提炼成一套通用、灵活又方便调用的体系来完成对人工智能的集成,通过这种方式将技术分享出去,让“天下没有难做的AI”。AI开放平台为用户提供了人工智能技术平台和应用工具,基于平台的能力,用户可以自己操作、便捷快速的满足AI应用需求。
Q:人工智能落地应用面临的主要瓶颈问题有哪些?
A:当下AI开放平台品类繁多,并不是说随便给用户一套平台工具,用户就可以上手用,其中仍存在着一些瓶颈:
第一是数据瓶颈。人工智能由海量的数据来进行驱动,首先要保证数据的体量规模,其次数据要是被人为标定监督过的。作为平台提供商,首要任务是帮助用户突破数据瓶颈。
第二是算法瓶颈。当前阶段的AI算法人才资源仍比较稀缺,用人成本高昂。但人工智能技术研发,算法人才是关键,算法团队的组建是必不可少且需要长期高成本投入的环节,对于大量传统企业而言,这也是一个极大的考验。
第三是计算资源和训练资源。人工智能算法训练必须基于相关的并行训练系统,通过海量数据的导入进行算法训练,期间还需要做各种调试,这对并行训练系统的性能水平有很高的要求,这种计算资源和训练资源也是一个显著的瓶颈。
第四是产品端的瓶颈。现在大量的人工智能系统应用主推的是云端方案,并不是因为云端方案应用效能最好或是成本最低,而是因为云端方案对于硬件产品的要求相对最低,因为大量的用户(集成商)甚至AI初创企业,并不具备硬件产品资源,在没有更多方案可供选择的时候,云端方案或许并非最优解但是是时下的选择。
最后是系统,要有完整的人工智能解决方案,系统集成与应用开发资源投入是很大的,这也是一个瓶颈。
只有突破了这五大瓶颈,我们才能真正的落实AI在实体行业中的赋能作用,而这也是海康威视决定构建AI开放平台的主要目的。
Q:海康威视AI开放平台如何实现这五大瓶颈的突破?
A:首先是数据瓶颈的突破。在学术界,ImageNet数据集的推出对于人工智能的学术研究具有强大的推动力,但在工业界和实体行业,还没有出现适用的数据集来助推行业人工智能的发展。至此,我们希望能够做实体行业的领域模型。可以预想,未来物理世界所感知到的信息都可以用各种领域模型去描述,当然,这种领域模型和最终的应用场景之间还是会有一点差距,但我们有一种技术叫迁移学习。在相关领域模型基础之上,系统神经网络已经对某类场景有较强的感知能力,通过少量的用户自我数据,再通过迁移学习方法便可以在这个模型上很好地进行算法训练。
通过系列测试实验,在很多领域上我们已有的领域模型基本可达80%甚至更高的检测精度,用户只需要提供少量的场景数据,精度可提升到95%以上,对于用户而言,这是一个0到1的突破。这是海康威视AI开放平台解决数据问题的第一点。
第二点,我们用了大量诸如图像三维建模这一类虚拟现实技术构建了一个虚拟数据生产引擎,主要是帮助那些数据量少、数据获取难的行业解决数据样本采集难的问题。比如商超零售领域货架补货环节,传统的做法是上新货后人工从各个角度、各种摆放位置拍摄做数据采集,但这个工作量很大,每上一次新货或换一个位置,用户需要重复操作很久。但通过虚拟数据生产引擎系统,用户只需拍少量几张图片上传,系统便可自动生成各种角度、各种大小、各种摆放位置的货品图片,这种方式可以进一步的帮助用户突破数据瓶颈。
其次是在算法层面的突破。以前人工智能算法训练首先要设计神经网络模型框架,然后人工调参,但现在我们可以通过机器自动完成建模,在这个过程中,通过庞大的计算力完成各种模型结构的自动调整、测试和训练,这正是当下学术界热门的网络架构自动搜索技术方向。海康在这方面投入了重大资源,相关技术能力已经上线到我们的AI开放平台,这项能力的推出,将极大地简化算法训练、算法生成的技术门槛。
与此同时,海康还推出了一种自动编译工具,可以帮助用户在平台上进行很好的算法优化。边缘智能的当下,由于受功耗和成本的限制,很多边缘类产品往往只能在一些计算资源和内存资源比较受控的计算平台上运行,如何在这些平台上做算法优化是一项强大的考验。通过自动编译工具可以把各种优化方法做成软件工具,让用户随取随用,无需再另外投入资源去做工具开发。
第三在计算资源方面,我们已经在萤石云上开放了海康内部的并行训练系统,可以让用户共享我们的计算资源,基于高性能并行训练系统,更好的辅助算法训练。
最后在产品层面,海康开放了整个前后端的基础产品,包括操作系统,可以帮助没有产品资源的用户乃至AI创业公司能够基于海康的一系列硬件产品去实现他们自己的算法,自建自己的智能产品。
通过上述这一系列从数据、算法、计算资源到硬件产品瓶颈的突破和能力的开放,海康威视希望可以真正帮助实体行业的合作伙伴贯彻AI能力的落地应用。
Q:从用户角度而言,用户该如何共享海康AI开放平台的这一系列能力?
A:举个最直接的例子:比如一家连锁商店的老板需要通过AI技术检测商铺门口是否堆有垃圾,但商户本身没有任何技术能力。这种情况下,只需要商户注册成为海康AI开放平台的合作伙伴,在线上传几十张自己拍摄的店门口的垃圾图片,并通过平台上的标定工具标定垃圾信息,同时选定摄像机,将标定后的垃圾数据进行算法训练后关联到选定摄像机,商户即可自行给普通的摄像机DIY出可实现垃圾堆叠检测的AI能力,整个过程只需20分钟左右。
我们的意愿,一是让任何没有算法基础但有行业经验的用户能够DIY出端到端的AI系统解决方案的能力,二是让有算法能力但没有硬件产品的AI创业者能够基于海康的软硬件实现他们自己算法能力的输出。
人工智能产业拥有如此庞大的经济体量和市场潜力,一定会有越来越多的企业和人才加入到这个产业当中,我们希望能够通过我们的开放平台,为更多有不同需求的企业、团队及个人解决AI落地的困境。
自2017年开始上线,目前海康AI开放平台已经面向环保、餐饮、制药、物流、零售等全行业开放,积累了丰富的实用案例。
Q:平台开放一年多来,您的感受和总结是什么?
A:我们认为这是AI赋能实体行业的一条非常正确的道路。当然这个过程中也经历过曲折,包括前期需要花时间对用户及市场进行教育,让社会和行业对于AI有更为客观理性的了解。同时,在没有先例可以借鉴的行业市场,一门心思扎进来探索这条路是否正确,这也是一个忐忑的过程,好在我们已经摸清楚了方向,并且坚信这是一条非常正确的路。
在面向全行业推出AI开放平台的过程中,通过各类合作伙伴的不断加入及反馈,带来各类数据的接入、标注,算法及需求也在持续丰富,整个开放平台的AI算法、编译工具、神经网络模型,软硬件产品等也都在不断演进升级,在开放平台这个庞大的载体之上,供需双方之间可以构成一个互为驱动力的良性循环。
Q:海康AI开放平台可为用户提供数据、算法、训练资源及产品等一系列服务,这其中的商业模式如何设计,用户需要为哪些服务付费?
A:实际上我们没有过多就模式而模式。AI开放平台的宗旨,就是能帮助用户落地AI能力,解决实际问题。把用户服务好了,平台自然能够实现商业价值。
目前平台的SDK都是免费的,用户只需要在AI开放平台上注册成为海康威视的合作伙伴就可以享受免费SDK支持。另外,我们已经开放了并行训练系统给到合作伙伴,因此,用户也可以免费调用我们开放平台的训练资源。
我们正在思考更多样的合作形态,比如辅助合作伙伴共建某些行业领域的算法模型产品、建立算法商店等等,这些我们也正在尝试中。通过我们的努力,用户获得的收益会更大。
目前涉及到付费的服务,主要针对那些需要调用我们的云平台做一定规模或比较高频数据分析的用户,因为这个过程有大量计算资源和能耗的成本,还有就是如果要把算法部署到我们的边缘硬件产品,产品是需要收费的。
Q:要真正展开应用,数据融合必不可少,推进物信融合在当前阶段是否仍存在难点?
A:物联网和信息网,这两张网之间确实仍然存在信息孤岛的问题,与此同时,信息维度和数据维度都还不够,导致相关应用无法很好的展开。我们也看到了这个问题,所以希望通过AI Cloud物信融合数据架构能够很好地促进物信两网之间的数据融合。
AI Cloud架构中设有数据资源池和计算资源池。数据资源池主要起到数据治理和数据汇聚的作用,可以将物联网和信息网的数据放到资源池进行治理和汇聚。
物联网本身是非结构化的信息,未经处理很难和信息网上结构化的信息进行融合,所以首先需要通过人工智能技术对物联网中视频信息进行结构化处理,结构化后的物联网数据再和信息网数据进行融合,便可以碰撞出非常多的应用。
比如交通行业,传统模式中的交通管理很多是基于浮动车和地感线圈检测来实现,但这种数据采集方式由于频率关系可能并没有十分精准,如果利用路面广泛覆盖的摄像头进行车辆动线数据的采集,基于摄像头7*24小时且覆盖面广的特性,则能够极大的完善数据的丰富性。如果再基于这些丰富的视频数据和雷达、微波等信息进行融合,便可以实现在各种天气、光照条件下对于路面过车情况的精准判断,更好地辅助交通管理。
Q:这一套下来,可以看出海康已经能够解决AI落地应用的很多重要瓶颈问题,接下来,你们的重点研究方向会是什么?
A:首先第一点,公司当下及未来依旧会深耕人工智能核心技术。人工智能还有很多需要解决的问题,比如如何加强人工智能的自主学习能力,让AI从感知智能上升到认知智能?或者是如何在摄像机上去做更多维度的感知信息的融合,将视频“视觉”能力进一步优化等,这些都是我们在人工智能领域将会继续研究的方向。
另外,从视频感知,到智能物联,再到物信融合,当下的海康威视已经从安防公司变成视觉公司继而成长为一家大数据公司,在整个数据服务里面,如何基于多维度的信息去构建数据认知的能力,让系统能够实现自我决策和判断,这个过程中,无论是技术研发还是业务探索都任重道远。
未来,我们将主要专注于在这两方面持续发力。
Q:从您的经验来看,您如何预估未来几年人工智能技术和应用的发展态势?
A:基于人工智能场景化和碎片化的特点,它的发展将会是一个渗透的过程,发展速度会很快,但可能会相对线性一点,不过随着AI开放平台价值的涌现,人工智能的线性发展,将呈现更多维度的发展方向,预计未来3-5年,人工智能技术的普及和落地应用的成熟度都将升级到一个全新的阶段。
Q:籍由这次访谈,您最想传达出什么样的讯息?
A:任何技术的发展都会带来生产力的提升,而最终能否让每个人受益并不是取决于技术本身,而是取决于技术共享的方式。
从我的角度来说,AI的确是未来一个巨大的技术应用趋势,将会对我们的产业和经济带来巨大的推动力。如果希望技术能够更快的发展,让更多的人和产业从中受益,那么它一定是一个可以开放共享、生态共建的模式。海康威视正好拥有这样能力开放的资源和基础,同时,我们也非常愿意去开放共享我们的能力,也希望联合产业生态一起去共同推进人工智能赋能百业的价值实现。
编后语:
过去几年时间里,人工智能在行业领域的落地应用进展并没有想象中的顺利,用户苦于技术无法更好的契合实际应用需求,投入产出不成正比,而厂商则困扰于场景的过于碎片化,导致AI泛化能力不够。究其原因,一是人工智能依旧弱人工智能的技术阶段,二是由于所有的人工智能应用还是场景化、碎片化的应用,无法形成合力。
对于相当冗长的人工智能产业链而言,算法、产品、算力、数据、行业经验等资源大都掌握在不同企业手中,而要促进产业的共同发展,开放的心态和开放的AI能力平台已然成为必须。进入到物联网时代,只有利用智能产业链的多方链条,相互协同,共同助推人工智能在实体行业领域的发展及应用,才能真正让人工智能技术像电力技术和信息技术一样,无处不在,赋能全行业。