霍尼韦尔(中国)有限公司解决方案顾问 王洪波
国际视频编解码技术标准发展历程
当前视频的应用涵盖了各个领域,包括ICT、互联网、移动互联网、广电、安防等。制定视频编解码标准的国际组织主要有两个:ITU-T和ISO/IEC。ITU-T推荐委员会制定的大多数标准都是为实时视频通信应用的,例如H.261、H.262、H.263和H.264;ISO/IEC的MPEG标准大多是为视频存储、广播视频和视频流应用而制定的标准,包括MPEG-1、MPEG-2和MPEG-4等。两个标准化委员会组织在独立地致力于不同的标准的制定的同时,联合发展了H.262/MPEG-2和H.264/AVC。
MPEG全称是Moving Pictures Experts Group,它是“动态图象专家组”的英文缩写,该专家组成立于1988年,致力于运动图像及其伴音的压缩编码标准化工作。
MPEG-1
MPEG-1是MPEG组织制定的第一个视频和音频有损压缩标准。视频压缩算法于1990年定义完成。1992年底,MPEG-1正式被批准成为国际标准。MPEG-1标准用于数字存储体上动态图像及音频的存储与检索,其数码率为1.5Mb/s。MPEG-1是为CD光碟介质定制的的视频和音频压缩格式。
MPEG-2
MPEG-2制定于1994年,设计目标是高级工业标准的图象质量以及更高的传输率, MPEG-2专门针对数字电视而开发。MPEG-2所能提供的传输率在3-10Mbps间, 其在NTSC制式下的分辨率可达720×486,MPEG-2也可提供并能够提供广播级的视像和CD级的音质。目前MPEG2标准则用于广播电视和DVD等。
MPEG-4
与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4的制定初衷主要针对视频会议、可视电话超低比特率压缩(小于64Kb/s)的需求。MPEG-4与MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具体压缩算法,它是针对数字电视、交互式图像应用、交互式多媒体等整合及压缩技术的需求而制定的国际标准。MPEG -4标准将众多的多媒体应用集成于一个完整的框架内,旨在为多媒体通信及应用环境提供标准的算法及工具,从而建立起一种能被多媒体传输、存储、检索等应用领域普遍采用的统一数据格式。
H.261
H.261是ITU-T 编制的第一个主流视频压缩标准。它主要针对视频会议应用,是为支持 40kpbs~2Mbps 的 ISDN 网络而设计的,主要针对实时编码和解码设计,压缩和解压缩的信号延时不超过150ms,码率px64kbps(p=1~30)。H.261 支持 352×288 (CIF) 及 176×144 (QCIF) 分辨率。
H.263
H.263是ITU-T制定的甚低码率的图像编码国际标准,它一方面以H.261为基础,以混合编码为核心,其基本原理框图和H.261十分相似,原始数据和码流组织也相似;另一方面,H.263也吸收了MPEG等其它一些国际标准中有效、合理的部分,如:半像素精度的运动估计、PB帧预测等,使它性能优于H.261。
H264/AVC
作为第三代视频压缩技术,H264集中了以往标准的优点,并吸收了以往标准制定中积累的经验,H.264/AVC 在压缩效率方面取得了巨大突破,和H.263和MPEG-4 相比可节省50%的码率,降低传输带宽和存储容量。而且H.264创造性的采用了多参考帧、多块类型、整数变换、帧内预测等新的压缩技术,使用了更精细的分象素运动矢量(1/4、1/8)和新一代的环路滤波器,使得压缩性能大大提高,系统更加完善。
H.265
H.265旨在在有限带宽下传输更高质量的网络视频,仅需原先的一半带宽即可播放相同质量的视频。H.265标准也同时支持4K (4096×2160) 和8K (8192×4320) 超高清视频。除了在编解码效率上的提升外,在对网络的适应性方面H.265也有显著提升,可很好运行在互联网、移动互联网等网络环境。
H.265是ITU-T继H.264之后所制定的新的视频编码标准。H.265标准围绕着现有的H.264,保留原来的某些技术,同时对一些相关的技术加以改进。新技术使用先进的技术用以改善码流、编码质量、延时和算法复杂度之间的关系,达到最优化设置。
我国视频编解码技术标准发展历程
AVS
AVS是我国具备自主知识产权的第二代信源编码标准,是我国数字音视频编解码技术标准工作组制定《信息技术 先进音视频编码》系列标准的简称,其包括系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试等支撑标准。AVS编码效率比MPEG-2高2、3倍,与H.264相当,而且技术方案简洁,硬件实现复杂度低,达到了第二代标准的最高水平。AVS的主要创新在于提出了一批具体的优化技术,在较低的复杂度下实现了与国际标准相当的技术性能,有效地避开了用国际标准背后的大量复杂专利。AVS采用混合编码框架,包括变换、量化、嫡编码、帧内预测、帧间预测、环路滤波等技术模块,这是主流的技术路线。
SVAC
《安全防范监控数字视音频编解码技术标准》(简称SVAC,Surveillance Video and Audio Coding)。SVAC标准是第一个旨在解决安全防范监控行业独特要求的技术标准,并具备以下的特性。
高安全性:SVAC标准规定了加密和认证接口及数据格式,保证数据的安全性、完整性、非否认性。密码不是编到视频信息里,提取时需要输入认证数据,既保证格式的统一,便于互联互通,也保留足够的扩展灵活性。
感兴趣 (ROI) 区域编码:图像分为若干个ROI (感兴趣) 区域和一个背景区域,对ROI区域采用低压缩比,对非ROI区域采用高压缩比,降低带宽。
可伸缩性视频解码(SVC):对视频数据分层编码,满足不同传输网络宽带和数据存储的需求,普通编码传输有主码流、子码流,而且主、子码流分别传输,占用带宽较大,SVAC传输只有一类码流,对码流分层就可获得不同分辨率的图片信息。
视频编解码技术在安防行业的应用
安防行业的主流视频编解码技术有如下几种:
MJPEG
MJPEG全名为"Motion Joint Photo graphic Experts Group",是一种视频编码格式,中文名称翻译为“技术即运动静止图像(或逐帧)压缩技术”。MJPEG广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。但M-JPEG只对帧内的空间冗余进行压缩。不对帧间的时间冗余进行压缩,故压缩效率不高。
早期安防行业采用过MJPEG编解码技术。
MPEG-4
在早期安防行业对视频分辨率要求不高的情况下,MPEG-4曾经得到广泛的应用。
H.264
目前安防行业普遍采用的是H.264,H.264是一种高压缩编解码算法,具有速度快、信息损失小、成像质量高、视频流对带宽占用率低等特点;其最大的优势是具有很高的数据压缩比,在同等图像质量的条件下,H.264的压缩比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。
SVAC
SVAC作为由中星微电子和公安部第一研究所共同建立的我国安防行业编解码技术规范,通过政府行政命令已经在广东、河北、山西等省强制推广使用,但SVAC标准产品在源代码和核心芯片的成本比H.264要高。
H.265
随着视频分辨率越来越高,如何通过高压缩比来降低传输带宽和存储容量成为行业首要考虑的因素,因此从去年开始越来越多的厂商推出了支持H.265的IPCam,伴随着H.265产业链的更加成熟,H.265会取代H.264成为安防行业最主流的编解码技术标准。
视频编解码技术在安防行业的发展趋势
视频编码技术的发展趋势一方面会继续以混合编码为框架,研究如何进一步提高压缩特性;随着3D应用在安防行业的普及,3D编解码技术也将是发展方向之一,向可伸缩编码、多视点编码、智能、提高压缩性能等分支方向发展。
可伸缩编码技术(Sca1able Video Coding,SVC)
可伸缩编码技术将视频编解码框架转变为更多考虑网络适应性和灵活性的编解码框架。
可伸缩视频编码因为具有时域、空域和质量等多方面的灵活性,尤其是适合需要实现双码流或多码流的安防行业。在安防行业,基本要求双码流,网络或本地存储高分辨率、高帧率的大码流,实时浏览采用低分辨率的小码流;甚至是三码流,一路高清码流用于存储、一路用于有线侧实时浏览,一路实时流用于手机浏览。常规的方案是编码2次或3次,这样会大幅增加DSP的计算工作量。而采用SVC技术将只需编码一次。
多视点编码技术
多视点视频是一种新型的具有立体感知和交互操作功能的视频技术,它由一组平行、会聚相机阵列拍摄得到视频信号。2001年,MPEG成立了3DAV工作组,其首要任务就是定义3D音视频领域的范围和应用场景,制定多视点编码技术的标准。
随着3D GIS地图、多视角的3D立体视频画面、基于3D场景的多摄像头联动在安防行业的应用,多视点编码技术将会在安防行业得到越来越多的应用。
而在视频监控类的应用中,多视点视频编码技术有助于实现多视角立体监控,多摄像头联动等应用。
智能化
将H.265等编解码技术与智能视频分析技术结合,提高编码压缩性能并降低码率,提供基于视频内容的编码是未来视频编解码技术在安防行业的重要发展方向。
智能视频分析是通过过滤掉图像中无用的或干扰信息,并自动分析和抽取视频源中的关键的有用信息,通过对视频画面的背景和对象,也就是物体特征进行提取,正确识别出不同物体及其运动轨迹规律,它可以明确地区分出人、车或其它物体,然后对对象按照用户设置的规则进行分析。
结合智能视频分析技术和编码技术,可以对视频内的对象进行分类,对各感兴趣的区域采用不同的编码策略,也就是感兴趣区域编码。对需要做智能分析的区域采用
能够根据智能分析的结果对干兴趣区域采用低压缩比以获取较好的图像,对如背景灯其他的非感兴趣区域采用高压缩比,节省传输带宽和存储容量。譬如,当视频画面中需要做智能分析的区域没有运动的人、车等对象时,可以采用高压缩比;当智能分析算法对运动的人、车对象进行分析时,采用低压缩比。通过整合视频编解码技术和智能视频分析技术,实现编解码技术与安防业务结合是将来的发展方向。
高压缩性能
随着分辨率的越来越高,新的视频编解码技术应该提升压缩性能,能够实现对高分辨率视频采用高压缩性能的编解码技术,实现更低传输带宽、降低存储容量的需求,大幅的降低投资。
结语
视频编解码技术是不断的随着业务的发展而不断的与时俱进,将来视频编解码技术将朝着3D编解码、更加智能、更高压缩性能发展。