传统监控系统能实时再现本地或远程视频画面,使安保人员能进行实时监视。借助实时再现监控系统还能实时记录监控图像,这样极大地方便了事后追溯回放查看,为案例分析提供了有力的证据。
固然,图像监控系统是安防系统中最常用也是最重要的系统,但不管是实时监视和回放查看都无法将对“人”的分析和处理,比如身份识别辨认,自动完成,而都是通过人工肉眼的方式来完成,区别只是在于实时还是事后。除了密码口令、IC卡外,真正的对人的识别目前只有通过生物识别技术来完成,而长期以来的生物识别技术如DNA识别、指纹识别、掌形识别、虹膜识别等,都似乎和监控系统是完全不沾边的,原因很简单:目前的监控系统根本无法支持对这些生物特征的采集。因此生物识别技术和监控系统似乎从来就没有交叉的可能,监控系统似乎也从没奢望过识别人的身份。但随着一种新的生物识别技术——人脸识别技术的出现,这一切都有了可能,并且迅速成为现实。
实时人脸监控的原理\r\n人脸识别的基本原理是对数字图像中的人脸进行分析和处理,提取出人脸特征信息,建立人脸模板,并与实时采集的人脸进行识别对比。监控系统中的数字视频是由一帧一帧的数字图像组成,因此只需事先存储监控对象的照片,同时将实时的数字视频作为输入交给后台服务器上的人脸识别系统,即可进行实时的人脸识别和监控。而人脸识别系统处理过程如下:
1、人脸检测:按照设定的窗口大小对画面进行地毯式的扫描,并根据像素的灰度分布与人脸拓补结构进行模式匹配,看画面中是否有人脸,有几个人脸。
2、人脸定位:发现画面中有人脸出现后,立即对每一张人脸按照双眼瞳孔位置进行定位,位置信息通过瞳孔所对应的象素的二维坐标数据表示。
3、人脸捕捉:定位每张人脸之后,按照算法约定的标准尺寸大小将人脸部分从原有画面中切割下来,得到一张张类似于数码证件照片那样的人脸图片,后续的分析处理以人脸为单位在这些人脸图片上进行。
4、人脸分析:对每张人脸图片进行特征分析和提取,根据像素灰度等信息定位特征点并计算相应的特征数值信息(不同的人脸识别算法处理方式各有不同),最终得到的是表示该人脸具有的特征的一组数据,即人脸模板。
5、人脸比对:事先存储在系统数据库中的监控对象的人脸照片(即黑名单),在导入的时候往往已经进行了上述分析处理,生成了对应的人脸模板。将每一张现场采集到的人脸的模板与黑名单中所有的人脸模板进行比对运算,以得出与每个黑名单人员之间的匹配程度,当与任何一人的匹配程度满足了设定的报警门槛(如相似程度在70%以上),系统立即进行报警提示,并给出匹配双方的照片以供值班人员参考。
实时人脸监控的难点
人脸识别技术是最近几年才出现的全新科技,但是人脸监控直到现在才得以实现,除了人脸识别技术自身需要不断发展和成熟之外,可以说,在人脸识别技术的所有应用中,实时监控是实现难度最大的。到目前为止,基本成熟的人脸识别技术有很多,但是真正能做到实时监控的,却凤毛麟角。
之所以困难,主要有两个原因,一要求实时,即要求处理速度非常之快;二是配合,被监控人员不会主动等着采集他的人脸信息。再从技术角度细分,实时人脸监控实现的难点有如下几点:[nextpage]
1、动态人脸检测:不同于人脸门禁等人员主动配合的应用,而人脸监控是人员在不知情不配合、以各种步行或跑动的速度经过画面。很明显,对动态人脸进行检测和采集,要远远难于捕捉静态人脸;
2、多人脸检测:大部分监控场合,人员也不会像门禁系统那样,一个一个地按顺序走过来让你识别,保证每次只需采集和处理一张人脸。而人脸监控是面对处理人脸,可能同时出现在同一个实时监控画面中的人脸可能有多个。同时采集到多张移动中的人脸而不影响处理速度,显然难度大幅攀升;
3、多角度人脸检测:另一个和主动配合式应用不同的是,任何被监控黑名单不会直盯着摄像机让你逮个正脸,摄像机的安装高度也普遍高于身高,加上监控对象出现的时候可能在低头沉思,可能在东张西望,可能在看书打手机,还可能在扭头后别人说话,因此系统能捕捉到的人脸将会从各个不同的角度,而且与数据库中黑名单照片的角度不同。此外,人员的面部还可能会被帽子、手机,以及前面的行人遮挡。在这种情况下进行准确识别,难度自然远远大过主动配合时的正脸;
4、实时速度要求:实时监控,就是要求在黑名单人员出现的时候立即报警;
5、工作量惊人:那么这一瞬间到底要完成多少工作呢?不妨以5万人的监控黑名单为例进行粗略计算。假设只有一路监控摄像机,每秒钟25帧,每帧画面里只出现一张人脸,假设系统进行人脸采集的速度只有每秒20帧,那么每秒钟将有20张人脸需要逐一被分析提取特征,然后这20个人脸模板的每一个都要和5万个黑名单人脸进行逐一对比,如有匹配则进行报警。所有这些工作都需要在一秒钟内完成,即:20次人脸检测定位和特征提取,以及20×5万=100万次人脸比对。而实际情况是每一帧画面的人脸数量远不止一个、监控摄像机也不止一路,每增加一个人脸每多一路摄像机,上面统计的工作量都要翻一倍。实现的难度和对识别技术的要求显而易见;
6、人脸变化因素不可控:此外人脸变化因素在监控应用中完全难以控制,进一步增加处理难度。如现场人员出现时的表情变化、佩戴眼镜、现场的光线条件与黑名单照片的光线差别很大(光线是对人脸识别影响最大的因素),以及黑名单照片的图片质量,以及年龄跨度人脸变化等等,统统都会对识别带来非常大的影响。
所以说,实时人脸监控是人脸识别技术最难的一种应用,是实现难度的集大成者。一般来讲,为了保证整个系统的响应速度,实时人脸监控系统都分成采集和搜索两大部分。采集服务器与搜索服务器之间通过网络进行通讯。
采集服务器\r\n直接与监控摄像机相连,需要对每秒25帧的视频画面不停地进行多人脸检测定位和捕捉处理。一个采集服务器可以同时接收1-4路甚至更多的摄像机视频输入。采集服务器对每帧实时视频图像进行分析处理后,将采集得到的一张张人脸图片通过网络送给搜索服务器。
搜索服务器每接到一张人脸图片,立即对其进行分析并提取人脸特征,得到人脸模板,然后与黑名单人脸进行快速的逐一比对,如有匹配的立即发出报警信息。摄像机的数量、摄像机的帧速、现场的人流密度、黑名单的大小,都决定了搜索服务器的在一秒之内要完成的工作量,视具体应用情况及服务器性能不同,可以配备多台搜索服务器进行并行处理,以保证实时的响应速度。[nextpage]
与现有监控系统进行集成,主要是如何提供实时视频的输入输出接口。因此从理论上讲任何能够将现场画面的数字图像传送给识别系统的方式均为可行。如:模拟摄像机的模拟视频线可直接接到采集服务器的视频采集卡;如是网络摄像机则给出视频URL地址,如是监控系统软件则给出的数字视频流或者数字图片,等等。之后的事情就是人脸监控系统完成采集处理和识别报警。
如之前所述,实时人脸监控面临的难度很大,而且有很多不可控的因素,虽然速度要求可以通过算法效率和诸多辅助途径加以保证,但是会导致很多非常不理想甚至极端的情况导致无法准确识别,如:现场人脸完全被遮挡,现场光线过暗无法看清人脸,画面中人脸过小信息不足,黑名单照片年代过久或者图片质量过差,等等。因此不可能像门禁类应用那样作过高的标准的量化要求,而只能在一定的特定条件下讨论系统的性能指标。在如表1所述的正常情况下,一个好的实时人脸识别系统应当能实现超过95%的识别报警率,同时误报率在10%以下:
光线条件 没有过强的背光曝光侧光,面部部位基本清晰可辨\r\n人脸角度 上下左右30度以内的角度,双眼均可见\r\n人脸分辨率 双眼瞳孔之间距离不少于90像素\r\n图片质量 压缩比小于15:1,8位灰度\r\n时间跨度 尽量提供近期照片,早期照片不可有过大的相貌变化\r\n佩戴眼镜 保证双眼可见可辨,墨镜略有影响\r\n遮挡物 帽沿、头发等没有遮挡眼鼻颧骨等重要特征部位\r\n典型应用及其延伸\r\n实时人脸监控最典型的应用当属通道式的实时黑名单布控,因为通道及出入口型的场合,人流集中且具有方向性,在正对人流方向的适当位置安装摄像机很容易采集到理想角度的人脸。
适合实时人脸监控应用的典型的通道出入口及类似场所有:\r\n·机场柜台、安检通道、人行电梯通道、登机口等;\r\n·机场、车站、港口、地铁的验票通道和出入口;\r\n·海关过境通道、公路卡口;\r\n·体育场馆、宾馆酒店、娱乐场所的电梯、出入口;\r\n·银行大厅入口、银行柜台、ATM自助取款机。\r\n实时监控按照报警提示的模式还可以分为正向报警和逆向报警,前者只对与监控名单匹配的对象报警,而后者只对不在名单上的人报警。此外按照监控对象的不同还可以分为黑名单监控和白名单监控,前者主要针对罪犯和危险分子,后者则可用于VIP会员及其他需要针对性提高服务质量的尊贵用户。
应用局限性及前景\r\n由于生物识别和视频监控本来是独立发展的毫无关联的应用技术,彼此发展过程中并没有事先为与对方结合做专门的准备。因此在结合过程中必然存在一些不够理想的环节,应用中也存在一定的局限性和限制,现列举如下:[nextpage]
1、视频图像的格式。视频监控中的一个重要关键词就是“压缩”,为了尽量节省录像空间和提高传输速度,必须以牺牲图像质量为代价。而人脸识别是基于图像中隐含的信息进行分析处理,图像质量越高效果越好。因此这就形成了一个矛盾,目前监控系统很多通行的视频格式(如H.264)的分辨率和压缩比大多都会影响人脸识别发挥最佳性能。
2、监控场所和方式。最理想的应用方式当然是天罗地网式的所有摄像机全部应用实时人脸监控,并且监控所有存在的黑名单(如全国近40万人的追逃数据库)。但是一来很多摄像机的位置和角度和焦距都很难采集到合适角度和大小的人脸,二来很多黑名单人员在一些场合出现的几率几乎为零,全部监控会浪费资源而且降低效率,此外,很多现有的黑名单照片本身的质量基本上不足以用于人脸识别,因此有针对性地选择监控场所和监控对象进行重点布控才是最佳应用方式。
3、监控系统的规模。首先,从工作量上看,如上所述,实时人脸监控工作量非常之大,5万人10路监控的系统就已经属于大系统之列,需要配置大量的服务器进行采集和搜索处理才能满足实时要求。因此很多试图一个系统支持几百上千路摄像机进行实时监控的设想本身有欠斟酌;其次,目前的远程监控网络的传输带宽和速度都是针对经过压缩后的视频图像和码率进行配置的,如果按照满足人脸识别要求的高清晰画面去传输,路数一多网络延迟和塞车本身就是一个巨大的瓶颈。
人脸识别技术和监控系统的这一结合,如上文所述,两个互无干系的技术和应用偶然走到一起,谁都没有事先为对方留有支持的余地,而且又都不大可能去为对方改变,因为彼此发展的方向本来不同,对方又不足以构成自己的全部。因此人脸识别和视频监控就像两个不平行的直线,在这一点相交后仍然会继续前行互相偏离。人脸识别技术确实是有待成熟和完善,会越来越精确,但是基于普通二维数字图像的人脸识别技术已经走到极致,全世界关注的新方向是视频监控设备无法支持也不会刻意去支持的三维人脸取像和建模,此外三维识别将意味着更大的数据量和运算量。
所以说人脸识别技术是会进一步成熟和改善,但是这个进程却基本上不会改善上面提到的那些应用限制。实时人脸监控的应用时机就是现在,等待无益,不然这次前无古人后无来者的科技结合就会被奢侈的浪费。当然,在目前的基础上如何更好的对两者进行无缝集成,还是需要人脸识别和视频监控业界共同努力,让这支高科技之花借着“平安城市”的监控大潮精彩绽放。