各行各业热衷于导入AI技术来解决企业自身问题,并且鼓吹边缘计算的重要性—低延迟及快速反应。对于视频的AI边缘计算来说,摄像机扮演着重要的角色,可以算是AI视频边缘计算的「现在进行式」以及「未来完成式」。
处理视频的3种AI系统架构
一般用来处理视频的AI系统架构有三种,分别为:(1)边缘计算AI摄像机,(2)近缘多路AI计算主机,(3)机房集中式多路AI计算主机。第一种的边缘计算AI摄像机,是指IP摄像机SoC芯片内建AI神经网络处理器NPU(Neural Processing Unit),除了可运行IP摄像机本身该有的功能,还能执行AI识别、可程序化任务,独立作业触发报警或连动后续的自动化工作。
传统AI识别系统是通过AI计算主机,包含「近缘多路」或「机房集中式多路」AI计算主机,近缘(near-edge)架构是为了快速反应识别后的结果,所以会安装在靠近IP摄像机的近端高带宽环境,比如交通执法用的电信箱内。当然也有舍近求远,将所有路口IP摄像机通过5G或光纤收拢在集中式多路AI计算主机进行计算及识别的作法。(参见图1)
就效率来说,近缘架构仍然是较理想的作法,如果能把既有的摄像机用来扩充边缘计算AI功能,就更加便捷。「既有摄像机扩充AI功能」会是需求与趋势,不过,就像当年也能扩充IP网络功能的模拟摄像机一样,最后仍会被IP摄像机直接取代。
图1、常见AI视频系统架构图
边缘计算AI摄像机的3大优势
1、低耗能、低维运成本
AI计算主机有哪些弊端?视频译码及运维成本太高。传统的AI识别系统是这样运作的:IP摄像机耗费计算资源将视频编码后,继续耗费带宽资源把数据传给AI计算主机,AI计算主机接手耗费资源产生YUV或JPEG照片给AI硬件计算单元(NPU)进行AI识别(inference),视频分辨率越大,识别的物种就越多,对于显示适配器上的计算能量要求也更高,耗电量十分惊人。
一台AI计算主机,有500W~700W的耗电是很常见的。试想:当今市售最好的显卡可以进行几路的4K / H.264视频识别?更遑论压缩率更高的H.265了。相较于AI主机还要浪费资源译码后才能识别,边缘计算AI摄像机在源头就提供YUV的照片内存地址,让NPU直接进行识别,整体系统架构更简洁,运维的电力成本低,不占用带宽,系统建设成本于是更经济。(参见图2)
图2、AI计算主机与AI摄像机的计算架构差异
2、低延迟:最大优点!
AI计算主机还有个致命缺点,就是一系列的计算延迟,包含视频译码延迟、AI识别延迟、物种追踪算法及行为侦测延迟等。视频译码的部分,以H.264压缩格式为例,会有2~3帧的解码成像延迟,导致行为侦测后的警报发报会延时到200~300毫秒(ms)以后。
识别的延迟呢?AI主机进行10次识别,整体延迟会达到639毫秒,而这还没有加上4K串流在网络传送时需要的时间。边缘计算AI摄像机不会有那么高的整体延迟,以4K / 30帧的边缘计算摄像机为例,1秒可以支持10次识别,约100毫秒后可以触发禁区侦测的警报。(参见表1)
表1、AI计算主机与AI摄像机的比较
3、摄像机成为AI载具,用户可自行训练AI模型、保障隐私问题
此外,企业在导入AI时,常会碰到需求单位与研发人员在领域知识(Domain know how)上有认知差异,在销售时容易造成误会或冲突。就算企业内部已实现完整的认知框架,面对客户的需求可能又是另一个问题,比如医疗或国防之类的单位,会因隐私议题无法提供数据集来训练,AI模型就很难准确。
AI的应用是五花八门的,永远都会有新的对象要识别。让摄像机成为AI载具,用户可以自己进行AI数据集的训练,就不会有隐私权问题。以利凌提供的Self+AI YOLO转换云来说,可以把用户自训的AI模型封装成固件,并以AES256加密,自己的模型永远不会外漏。
封装完的固件要装在哪里?当然就是前端AI摄像机了。例如利凌提供的整体前端识别架构,可以通过HTTP / HTTPs与后端通信,藉由开源于Github的Python及C# SDK来串接后端应用,任何工程师只要熟悉Python及C#环境,皆可立即引用及开发。(参见图3)
图3、AI摄像机如何与后端系统运作整合
AI边缘计算摄像机常见的应用
近年来,边缘计算AI摄像机已可加载多个AI模型、同时识别不同物种。比较热门且迫切的是车牌识别,多国车牌识别已可在100公里时速的双车道进行,停车场出入口自动化更是已经被广泛套用的场景,因为通过摄像机就能直接连动接口设备,比如空位指引及收费机等,完全不必再经过PC,干净又利落。(参见图4)
图4、AI摄像机可同时支持车厂、车种、多国车牌、行为侦测及车牌颜色侦测
而在公共场域,识别遗失物及遗留物也是AI边缘计算摄像机的看家本领之一。另一个有趣且实用的场域是工地,AI边缘计算摄像机的识别结果可以用操作数来做逻辑判断,比如通过「同时存在多种对象(AND)」的逻辑来做工地门禁,安全帽、防护镜、安全背心要同时佩戴完整才会开门;相反的,「缺少任何一样物种 (NAND)」则是可以触发警报。(参见图5)
图5、AI摄像机工地安全栅门警示或自动化应用
在智能产线的应用方面,只要提供摄像机商品的内容物模型,比如配件包、主机、使用手册、遥控器等,就能进行产线自动化或缺件警示。AI PTZ球型追踪摄像机更被应用在船舶追踪,来厘清船只碰撞时的肇责,或是违规停车及并排停车的车牌识别,这些应用都不需再使用耗电量较大的AI识别主机。
(本文转自中国台湾智慧安防网,有删减)