近日,依图科技在ReID领域取得新突破,刷新全球三大权威数据集当前最优成绩,算法性能达到业界迄今最高标准。值得一提的是,考虑到算法对比的公平性,依图的算法结果是在不利用时空信息,不进行重排再优化(Re-ranking)等限制下取得的。
在行人重识别技术领域,首位命中率(Rank-1 Accuracy)和平均精度均值(Mean Average Precision,mAP)是业内公认的衡量算法水平的核心指标。在三大ReID公认数据集Market1501、DukeMTMC-ReID、CUHK03上,依图将衡量算法性能的两大关键指标“首位命中率”(Rank-1 Accuracy)及“平均精度均值”(Mean Average Precision,mAP)的六项数据全部提升,刷新世界记录,充分显示了技术实力,进一步稳固了中国AI在该任务下的领跑地位。
一、 什么是ReID?
行人重识别(ReID,也称“行人再识别”),是指在多摄像设备网络下对行人进行检索,利用步态动作、身体特征等更为全面的信息来识别人物,无论单独使用还是与人脸识别相结合,都能发挥更大的应用价值。特别是当摄像头无法抓拍到清晰的人脸时,行人重识别技术就发挥着非常重要的作用。
然而,由于ReID需要从不同摄像机拍摄的图像或视频中找出同一个人物,而这些摄像机所覆盖的范围彼此并不重叠,导致缺乏连贯的信息,而且不同画面中人物的姿态、行为甚至外观(比如: 正身、侧身、背身)会发生较大变化,不同时间、场景的光照、背景和遮挡物各不相同(背景中常还有体型、衣着相似的其他人物干扰),摄像机的分辨率也有高有低,人物在画面中出现的位置有远有进,这些都对ReID技术提出了极大的挑战。
二、技术攻坚:深度优化ReID算法框架,AutoML取代人工算法调优
需要指出,首位命中率高,意味着算法能够在众多图像中准确找出最容易识别或者匹配的那张,并不能反应模型的真实能力,尤其是应对复杂场景的表现;而mAP值越高,说明系统的实用性越好,既能查得全也能查得准,能够较好地应对多遮挡、光线暗、画面模糊等情况。因此,评价ReID算法性能时需要结合mAP值,它反映的是系统的综合检索性能。
依图科技凭借自身工程与研发实力,深度优化了ReID算法框架,显著提升了算法效率,通过结合AutoML等前沿技术,进一步创新性地实现了模型参数的自动搜索与迭代,突破了依赖算法研究员手工设计与调优的传统算法开发流程,在降低人力成本的同时,使得算法的泛化性能更强。
三、同时突破算法+算力,加速ReID商业化落地加速
依图研发人员表示,这次刷榜只是一次尝试,依图在工业界实战落地的ReID项目,其规模与问题的复杂程度已经远超三大数据集,可以说,学术界现有ReID基准已经无法体现工业界算法的最高水平。
举个例子, Market-1501在清华大学内采集,行人(ID)基本上是穿短袖、短裤和裙装的亚洲人,DukeMTMC-reID在杜克大学内采集,ID主要是身着冬季服饰的欧美人,这些在特定场景,特定时间段采集的数据往往与真实世界中的图像分布不一致。在真实场景下ReID算法需要做到在跨时间段、跨场景、跨不同成像质量的图像采集设备下进行高精度的快速识别,数据分布远远与问题复杂程度远远大于现有的学术数据集。
这些现实因素导致了现有ReID学术界数据集无法有效模拟或者还原实际真实情况。因此,基于现有ReID数据集的基准具有很大的局限性,依图研究人员表示,业界需要更好的ReID数据集,也需要更全面的算法衡量数据集,至少对于商业化落地的算法是如此。
实战场景下的ReID任务,不仅对算法提出更高要求,也需要更高效的芯片提供强大的算力支持,二者缺少任意一个,都会影响ReID的实际应用价值。目前看来,依图是当下同时具备算法和算力能力的公司。依图在2017年投入云端AI芯片QuestCore™(求索)的研发,并于2019年5月“发布即商用”。QuestCore™是全球首颗云端视觉AI芯片,提供强大算力,单路摄像头功耗不到1W。
在ReID实战应用中,依图研发人员针对本次提出的算法做了进一步优化, 依托依图自研AI芯片, 在仅凭穿着、体态特征的条件下,已能将ReID做到2017年~2018年人脸识别的精度。自研AI芯片QuestCore™加上世界级算法的创新融合,不仅突破了算力和算法的应用瓶颈,同时也为ReID的实战应用带来无限想象空间。
在智能城市领域,ReID技术能通过轨迹还原功能,快速筛查可疑人员并进一步锁定出行区域,进而做到精准预防和打击。例如,在疫情期间,人员戴口罩或者脸部遮挡的情况下,如何控制传染源四处流动就成为防控疫情的重要内容。ReID技术依靠行人的整体姿态来做检索,通过分析行人的穿着和体态,可将排查的时间由数天缩短到数秒,有效助力疫情防控。
应用到智能园区和智能交通领域,ReID可对于陌生人等可疑人员进行全方位刻画,有效保障园区安全;在人流密集的超市、园区等大型公共场所,ReID能够帮助实现不慎走失的儿童、老人的迅速查找;在地铁站、机场等交通枢纽区域,ReID技术可以配合人脸、局部的动作和姿态进行快速识别,大幅提升人员过检速度。
由于道路车流量的不断增加、交通状况日趋繁杂,交通违章、交通事故和阻塞等现象频频发生,ReID有助于在道路、车辆和驾驶员之间建立快速的智能通信联系,形成人、车、道路的完整调动闭环,精准感知交通路口各个方向的车辆数量、流量和密度,为交警决策提供准确依据;在无人驾驶领域,ReID可有效对车辆、行人、障碍物、道路以及交通信号灯和交通标识进行感知,构建真正智能的交通体系,带给人们更加安全、便捷的出行体验。
不难想象,未来该技术还将不断解锁在智能城市、智能社区、智能零售等更多场景和规模下的实战落地。
世界级ReID算法,加上自研AI芯片,业界期待的下一个计算机视觉领域“杀手级应用”已然到来。