「2018中国人工智能安防峰会」虽然已经结束了一段时间,但众多AI+安防界重量嘉宾登台发表演讲,让人受益匪浅。本文,笔者对阿里达摩院机器智能技术实验室副主任华先胜的演讲进行了要点整理,以最精华的观点,供行业人士参考。
华先胜,北京大学应用数学博士、IEEE Fellow、ACM2015年度杰出科学家、MIT TR全球35位35岁以下的杰出青年创新人物,曾担任ACM Multimedia等大会程序委员会主席,是视觉识别和搜索领域的国际级权威学者。于2016年7月加入阿里人工智能研究机构iDST科学家团队,带领视觉计算团队的研发工作。
阿里达摩院机器智能技术实验室副主任华先胜
演讲要点整理:
从人工智能的角度以及从人工智能从业多年的技术人员的角度来看安防问题,能带来一些新的思考。以下结合阿里团队近两年与交警、公安一起摸爬滚打出来的技术点、应用场景和系统的感悟,希望给大家带来新的启示。
两年前阿里提出“城市大脑”市场几乎无人问津,但现在市场却有更多的企业在标榜自己是做城市大脑的。阿里之所以提出这一概念是看到AI技术的发展、算力的提升和数据超大规模的汇聚,于是诞生了能否为城市安装一个大脑,去挖掘城市的价值的想法,它的实质是不断进展的AI技术和逐步增长的强大的计算能力,挖掘城市里面大量的异构数据的不可替代的价值。这个价值可以体现在数据智能助力城市管理与服务,全面、实时、全面的优化和干预,带来的便捷和灵活。往上提一个层次就是城市管理领域、服务领域的突破和产业发展领域的突破,再往上提一层便是城市的安全管理。
现在城市的管理是怎样的?也许从事安防的我们都很清楚:
第一点是盲人摸象,虽然我们有很多单点、局部的交通和安防的感知点,但却存在较多损坏的设备,虽然覆盖最大量视频监控点,投入大量的财力去建设视频的摄像头,但这部分的资源远远没有真正利用起来,现在更多的是集中在交通处罚、事后断案的阶段,摄像头的价值远远不止这些;
第二点是灯下黑,早期建设的摄像头并没有智能功能,就算从今天看智能摄像头也仅仅是小部分,而且智能也是有限的。当前如何利用这些摄像头把它的效能发挥出来,仅仅依靠人工基本无法实现;
第三点是雾里看花,所有的设备是单点,无法发现一些现象和问题背后的真实原因。
在这样的背景下,阿里希望能把城市各种各样的数据聚合起来,发掘它的价值,尤其是视频的数据。但从这个项目提出后,不管是公司内部还是外部,面临着大量的挑战,直至今天依然存在。总结起来,挑战可以归整为三个部分,一是投入,我们需要处理整个城市几万路、几十万路的视频,不管是计算、带宽的投入,还是算法及研发的投入,二是价值,我们能从这些数据中挖掘出什么价值,是锦上添花还是需要我们自身去创造需求,三是与传统讲的视频监控、智慧城市又什么不一样,差别在哪里。
通过对城市数据(GPS、线圈、公交、微波等)的感知,从而进行决策优化、预测,最后进行干预或预防,实现整个城市级别的全局智能,阿里把这样一套系统叫做城市的大脑。目是以交通和安全两个领域为重要的应用场景,当然未来可能还会在其它的领域进行探索,如环保、能源、土地使用等等领域都会汇集到这个大的领域里来,甚至是规划都会汇集到这个大脑里面来。
在感知层上,城市的感知经历了无感无知(想知道发生了什么,需要向别人了解)、感而不知(城市摄像头需要大量人工操作)、感而略知(摄像头拥有智能功能)等阶段,今天城市管理者希望城市要做到感而全面知、感而全量知、感而实时知。
随着算力的提成,我们不仅能实现对道路情况的全面感知,还能实现对人、车灯进行全面的感知,甚至也要在质量很差的视频中,算法做到高精度、高速度、高性能地感知。平时车流正常通行的时候,数据是大量的,异常的数据是较少的,我们为正常的事情建模,异常的事情进来的时候,它就会有明显的反应。
在杭州城市大脑中,以下案例值得分享给大家,例如机器交警巡逻,当前城市的摄像头主要有两大类,一是枪机二是球机,后者往往没有多少智能功能,阿里的工作就是要让大量的球机变得智能,不管是交通违法还是交通事故,都可以通过它进行监控,通过实时监控,能让城市管理者可以快速预测到城市异常状况。
这个工作有一个特点,就是充分利用城市既有的监控设施发挥它最大的效率,不需要再安装一个摄像机,不管你的视频的质量怎么样,阿里都可以解决问题。可能很多做摄像机的厂商会不愿意看到这样的技术出现,但确实我们是做到了。
在杭州城市大脑的实践中,阿里在不增加外场设备,不改变现有链路的情况下,通过视觉云上的计算,使得设备的能力得到很大的提升。现在阿里也在做AI芯片的线上测试,会进一步减少计算的消耗,提升更高的处理能力。
刚才讲的是感知层。再往后就是搜索和挖掘,这是实时进行处理的。我们在互联网上找东西可以通过搜索引擎来找,如果城市的管理者要找城市发生的事情,可以通过城市的搜索引擎来找,我们把城市里看到的人、车、路、物、事等全部放到搜索引擎里去。
做这件事情有两大挑战,第一个挑战是系统的挑战,也就是说要去索引那么大量的数据,怎么能够让索引的搜索足够快,但这是阿里擅长的。第二个是用什么方式去描述我们关心的这些对象,关心的那个车和那些东西,当然也可以用结构化的信息来做,这个车是什么颜色、什么牌子,这个人是男是女等等。今天阿里可以用特征的方式来识别,它是一串数字,这串数字就代替了你所关心的这辆车、这个人的特征,阿里通过这个特征进行目标的索引和检索。怎么样找这个合适的特征,怎么样把一个图片,一个目标变成一个特征,这是核心的课题,这里面有很多的方法,阿里可以通过学习的方法,通过神经网络、目标函数的设计,可以逼迫神经网络收敛到我们想要去的地方,从而使它表达出我们想要表达的方法。
接下来是预测,虽然我们无法预测某个个体的行为,但是我们可以预测整体的趋势,我们在苏州做了这样的实验,预测车流在20分钟、30分钟后的变化。
今天的GPS导航,其实是没有帮你做车流预测的,它仅仅是根据当前的车流给你选择一个最优路线,所以经常会走着走着它给你建议不同的路线,因为交通状况在变化。但如果我们有预测,GPS的路径规划就可以做得更好,如果时间更长的话,还可以进行更好的干预。这里面我们用深度学习的方法预测下一时刻的交通状况,这在苏州得到了很好的预测。
城市大脑的不同之处,第一是用大量异构城市数据中通过大规模计算和AI,挖掘其不可替代的价值。第二,城市大脑是在做人的智能不能完全的事情,因为它的复杂度、计算量已经没有办法用人力来完成,比如说红绿灯的配置、众多球机的检测无法通过人力完成,我们要通过城市大脑完成人不能完成的事情。我们经常讲人工智能有的地方是超越人的,有的地方是远远不如人的,但在这个地方它是超越人的。第三,城市大脑还希望将来能成为一个城市的基础设施,就像水电煤一样。
深度学习、数据、计算能力使得AI有了发展,这个发展使得我们思考能不能为城市建造一个大脑,挖掘城市的价值,改变这个城市,改变我们在城市里的生活方式。由于这个城市的环境、城市的平台是非常独特的,它的数据的量、计算的需求,问题的复杂性、它对价值挖掘需求的量和迫切性使得城市可以成为一个平台,或者说城市大脑可以成为一个平台,去孵化更多的技术,有更多的创新在这个平台上能够发掘出来,使得一些科研的技术、实验室的技术在这个平台上得到锤炼,得到扎扎实实的实现。这也是为什么城市大脑会被科技部选为首批四个国家人工智能开放创新平台之一的原因。
(本文为笔者根据现场速记整理,如有错漏,以官方媒体报道的为准)