文/苏雪冰
随着多媒体信息技术和网络通信技术的迅猛发展,数字视频技术的应用领域不断拓宽,IPTV、立体电影和自由视频等多样化新型视频服务业务的不断涌现,视频编码已成为数字电视、网络视频和移动多媒体等信息产业的基础核心技术之一,在安防、教育、广电、传媒等领域具有广阔的应用前景。
国际上制定视频编码标准的两大组织分别是ITU-T与ISO/IEC,ITU-T制定的标准主要适用于电视电话、会议电视等,包括:H.261/3/4等;ISO/IEC主要制定关于活动图像的编码标准,包括:MPEG-1/2/4,应用于广播电视、DVD、因特网上的流媒体等。目前,在安防行业中MPEG-4正逐渐淡出人们的视线,虽然H.264依然是目前视频编解码标准的主流,但是新一代编码标准H.265凭借更高的压缩效率正趋向逐步替代H.264,成为未来安防行业乃至整个音视频行业编解码技术的主力军;另外,中国自主研发的安防音视频编解码标准SVAC,提高了整体监控系统的安全性,但源于相关产业链的尚未成熟,目前还未有较大规模的应用,未来的市场具体应用情况会为我们作进一步的检验。
视频编解码原理及应用分析
视频为什么要编码?目的是为了压缩。由于未经压缩的视频源常伴有海量数据的产生,以期通过扩大存储器容量、增加通信干线的传输速率来进行每帧图像的全部数据的存储或传输是不现实的。多媒体声音、视频等信源数据之间有极强的相关性,存在大量的冗余信息,如:时间冗余、空间冗余、视觉冗余等,视频编码技术就是在保证视觉效果的前提下尽可能的提取有效信息,去除视频作用不大的冗余信息来减少视频数据率,通过压缩的形式进行声音、视频的数字传输和存储,而如何实现高效的压缩则是视频编码领域长期存在的挑战性问题。
视频编码主要由以下几个处理阶段组成:预测-变换-量化-熵编码,如:预测阶段会有空间、时间冗余的检测、帧类运动的检测、帧间检测等;变换包括空间变换,DTP变换等;量化包括视觉冗余、图像质量提高、压缩比等。不同的视频编解码标准从时间差、技术发展上可以得知,其实是在继承预测变换混合视频编码框架的基础上,对预测、变换、量化、熵编码等技术细节上做出优化与改进,其区别可能体现在图像分辨力的定义、预测精度、包括搜索范围、量化、补强等参数上的差异。
H.264
H.264/AVC标准是ITU-T和ISO/IEC联合开发的新一代数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10部分---AVC。与以往的国际编码标准一样,H.264采用传统的基于块的混合编码框架,将输入的图像分成若干个大小为16x16的编码块,即宏块;利用相邻像素进行帧内预测或者前面参考图像进行帧间预测,分别去除空域冗余和时域冗余,将原始编码块与预测块相减得到预测残差;之后对预测残差进行频域DCT变换得到变换系数并量化;最后利用熵编码进行二进制编码,最大限度地去除量化后数据间的符号统计冗余。H.264其核心部分是在视频编码层采用了多项先进编码技术,如:多模式的空域帧内预测、更小尺寸的帧间预测、可变动运动估计、1/4像素精度运动估计补偿、整数DCT变换、基于内容的熵编码以及自适应去块效应滤波等,并且利用率失真优化进行运动估计矢量和预测模式选择,提高视频编码的率失真性能。
与MPEG-4等以往的编解码标准相比,H.264最具价值的部分无疑是更高的数据压缩比、更友好的网络适应性。在不同分辨率、码率下,H.264都能提供较高的视频质量;在同等的视频质量条件下,H.264的数据压缩比相较于DVD系统中使用的MPEG-2高2-3倍,比MPEG-4高1.5-2倍,因此在网络传输过程中所需的宽带就更少;另外,采用“网络友善”的结构和语法,使其更有利于网络传输;其灵活性的增强也为不同的开发商提供了互联互通的通用平台,这些对于有大量视频传输及存储需求的网络视频监控系统来说都是非常重要的,也是其成为目前视频编解码标准主流的奠基石。
H.265
随着超高清技术、云存储等技术的快速发展,尽管网络带宽和存储能力得到迅速提升,但是也未能真正满足海量视频数据对传输和存储产生新的要求。在ITU-T与ISO/IEC联合协作小组再次通力合作下制定的新一代高效视频编码国际标准H.265/HEVC,提高了视频压缩效率、传输友好特性、网络适应性以及加强并行处理能力等,其突出的核心竞争力如下:
1、 在图像分块以及运动补偿、变换块方面,支持更大尺寸和更多种类。H.264中每个宏块的固定大小都是16x16像素,而H.265的编码单位采用更大的编码单元,可以从8x8到64x64进行选择,其目的在于减少高清数字视频的宏块个数,相当于对图像进行了有重点的编码,降低了整体码率;
2、 帧内/帧间预测模式、运动矢量预测模式和变换模式更加多样。使用新的运动矢量预测方式,区别于H.264基于空间域的运动矢量预测方式,H.265扩充更多方向的帧内预测,同时将预测块的集合由原来的空间域扩展到时间域及空时混合域,通过率失真准则计算后选择最佳的预测块,以获得更高的压缩比、更低的传输带宽;
3、 更高的分辨率定义可以支持高达4K和8K分辨率的视频图像,视频帧率也从30fps向60fps、120fps甚至240fps的超高帧率提升;
4、 增加环内采样自适应偏移SAO,通过对重建图像的分类,对每一类图像像素值加减一个偏移,达到减少失真的目的,从而提高压缩率,减少码流。数据表明,采用SAO后,平均可以减少2%~6%的码流,而编码器和解码器的性能消耗仅仅增加了约2%;
5、 考虑到芯片趋向从单核向多核并行化方向发展,引入Tile、Entropy slice、WPP等并行运算思路,更好地支持并行运算,以提高编码解码效率。
有反复测试数据表明,在相同的图象质量下,相比于H.264,通过H.265编码的视频大小将减少大约39-44%;在码率减少51-74%的情况下,H.265编码视频的质量还能与H.264编码视频近似甚至更好。
尽管H.265涵盖了H.264的所有应用范围,能够较好的解决当前视频高清化、网络化发展所带来的带宽、存储、显示的难题,但是它的推广、普及并非能一蹴而就。浙江大华技术股份有限公司产品经理杨阳分析:“H.265属于新技术,需要专门的芯片来支持,目前为止还需要更多的芯片厂家支持该协议;另外,还涉及到授权费问题,如果商用化就必须缴纳相应的授权费用,目前还未制定出未来将会如何收费。”
SVAC
目前主流推广的视音频编码国际标准基本都针对广播电视和大众娱乐方面的应用,在安防领域具有很大的不适应性。我国公安部第一研究所和中星微公司牵头制定了SVAC标准,旨在解决当前安防监控领域存在的由于信源编码标准不统一导致的难以互联互通、核心技术匮乏和信息安全隐患等问题,创新性地提出了多项针对安防监控领域应用的视音频编解码特殊要求和实现手段,如:感兴趣区域的变质量编码、可伸缩视频编码以及支持安防监控专用信息、支持数据安全保护等8大技术创新(如下)。
1、支持高精度视频数据,在高动态范围场景提供更多图像细节,减少编解码环节的图像信息损失;
2、采用帧内4x4预测与变换、上下文自适应二进制算术编码(CABAC)等技术提高编码效率,在获得更好图像质量的同时也能获得更高的编码效率;
3、支持感兴趣区域(ROI)变质量编码,在网络带宽或存储空间有限的情况下,对图像中指定区域的编码参数调整,保证该区域比图像中其他区域有更好的解码重建图像质量,提供更符合监控需要的高质量视频编码;
4、支持可伸缩视频编码(SVC),即多种分辨率视频图像同时编码,根据传输带宽和存储空间动态切换编码码流,满足不同传输网络带宽和数据存储环境的需求;
5、支持代数码书激励线性预测(ACELP)和变换音频编码(TAC)切换的双核音频编码,保证对语音和环境(背景)声音均有较好的编码效果;
6、支持声音识别特征参数编码,避免编码失真对语音识别和声纹识别的影响;
7、支持监控专用信息,在编码视(音)频码流中嵌入包括绝对时间、智能分析结果、报警信息在内的监控专用信息,信息格式符合国家标准GB/T 25724-2010(SVAC)的规定,便于视音频内容的有效管理和综合利用;
8、支持码流加密和密钥认证,对编码视(音)频码流进行加密和认证,保护编码数据的安全性、完整性和非否认性。
对于SVAC未来的竞争,杭州海康威视数字技术股份有限公司高级算法经理武晓阳为我们分析道:
在技术上,SVAC跟H.264和AVS属于同一代标准。2013年,H.265标准已经颁布,作为国际标准,在业界呼声很高,而且编码性能也领先H.264,用一半的码流达到与H.264相同的编码质量,而且充分考虑了面向多核处理的并行技术。
在功能上,SVAC具有的行业特色功能: ROI、SVC、监控专用信息、加密认证等,通过对H.264、H.265编码策略的优化以及设计有效封装传输层方案也能够满足。其实,监控行业现有大量基于H.264的产品和方案,都是采用这样的方式满足视频监控的需要。
在产业链上面,支持H.264的编解码平台很多,产业链成熟,成本较低。就是刚出来的H.265,国内外很多厂家也纷纷公布支持计划,可以预见接下来一两年会有很多平台出现。对于SVAC,很多平台厂家仍还在观望,没有推出可行的方案。
面对这些竞争压力,SVAC要胜出,需要加快技术发展,推出更有竞争力的标准;同时采取更加开放政策,比如充分公开标准细节、公开标准的参考代码、提供一致性测试码流、明细知识产权政策等,以吸引更多厂家进来,合力打造SVAC发展的生态系统。
芯片迎来挑战
编解码的实现是依靠半导体芯片技术,它具有硬变硬解的能力,通过芯片编码、解码,来提高产品的性价比。霍尼韦尔(中国)有限公司解决方案顾问王洪波解析道,SVAC目前遇到的难点其实并不是在技术层面,更多的是在市场。不同于H.264这类国际标准,SVAC的产业链尚不成熟,由于采用的是中星微电子独有的技术,目前只有这家公司能够提供支持SVAC的芯片,其他厂商仍在观察SVAC在国内的推广力度,并没有在芯片的设计上去深入的和中星微电子合作,而是在芯片的兼容性上尽量去匹配SVAC编解码格式的需要。另外,被誉为下一代视频压缩标准主流规范的H.265,其革命性变化所带来更好的压缩比、图像质量、更低的带宽及存储空间等优势,是以算法的复杂度大增为代价的,算法越复杂,导致的直接需求是视频编码芯片、解码芯片等硬件处理能力的更高要求,因此只有芯片处理能力的增强,算法复杂性对应用的影响因素越来越小,新一代更高效的编解码技术才能在行业中真正的得以展现。
总结
经过三十年多的发展演变,视频编码技术得到了深入的研究和发展,视频编码技术日新月异,视频编码国际标准也在不断的推陈出新。H.265的推出为监控行业带来了诸多积极的影响,包括:加速高清普及,推进超高清4K的发展;降低存储和传输成本,影响安防行业整个解决方案;随着码率降低和传输带宽增加,特别是无线带宽增加,监控应用场景更多,扩展到移动端,逐渐进入民用消费者等;而重在视频监控行业的垂直发展,力求专业的国内强推的标准规范SVAC,提高了系统的安全性,摆脱国外相关标准目前存在的各种专利陷阱,也会在国内视频监控领域得到广泛的发展。究竟谁更能助力安防行业呢,让我们一起翘盼吧!