专注SIP通讯产品与方案

安防视频监控系统图像压缩的国际标准

目前,图像压缩标准化工作主要由国际标准化组织(ISO)和国际电联(ITU-T)在努力推进。此外还有一些大的计算机及通信设备公司也在进行这一方面的工作,以使不同制造厂家的设备可以互相兼容。

随着计算机和网络技术的进展,通信数字化、综合化的进展,为了使数字图像信息的交流畅通无阻,不少相当接近的数字图像编码国际标准或方案已陆续制定出来了。如对于静止二值图像,ISO有JBIG压缩编码标准,ITU-T有对应的T.82标准;对静止彩色图像,ISO有JPEG标准,ITU-T有对应的T.81标准;对于不同速率的彩色视频图像,ITU-T有H.261标准,ISO有MPEG-1和MPEG-2标准;对于用于多媒体通信的极低码率的图像压缩,1TU-T有H.263标准(<28.8kbps)和最新推出的H.264标准,ISO则制定有相应的MPEG-4标准,并在MPEG-4和H.264标准中,采用了一些图像压缩编码的新方法。除上述的国际标准外,还有一些大公司制定的标准,如飞利浦公司和索尼公司于1986年4月公布了,CD-I(Compact Disk-Interctive)多媒体光盘交互系统和相应的CD-ROM的文件格式等。下面就简介一下几种常用的标准。

一、JPEG(T.81)静止图像与MJPEG运动图像编码标准

JPEG是联合专家组的简称,成立于1986年年底。JPEG选择了DCT变换编码的方法作为其标准的骨架。在1991年3月,公布了ISO/TECDIS10918号建议草案(ITU-TT.81):“连续色调静止图像的数字压缩编码”,即JPEG标准。JPEG标准规定了基本系统和扩展系统两部分,符合JPEG标准的编/解码器至少要满足基本系统的指标。在基本系统中,每幅图像被分解为相邻的8x8图像块。对每个图像块采用离散余弦变换(DCT)。然后用一个非均匀量化器(其量化步长对不同频率位置的DCT系数不同)来量化变换系数,减少可能出现的电平的个数。由于人的视觉系统在高频区对失真不敏感,所以在这些频率位置上可以用较大的量化步长,以获得较大的压缩而儿乎没有视觉质量的下降。量化后的DCT系数再经之字形扫描方式(Zig-Zag)成一维符号序列,对其中的非零幅值和零游程长度再进行Huffman编码,分配较长的码字给那些出现概率较小的符号。

显然,图像的解码过程和编码器相反。通过对一系列各种不同特征的图像实行JPEG算法,可得到不同平均速率的图像质量。如一幅典型的数字彩色图像为512W80像素,每个像素24bit,共占据737280B的存储空间。如将其压缩到1比特/像素,压缩比为24:1,则存储空间减少到30720B,传输时间也由分减少为2.8s。

JPEG标准是一种帧内编码技术,它只考虑图像的空间冗余度,比较适用于静止图像。对于视频序列,它的每一帧都不是一个独立的过程,因而帧内DCT的压缩能力就比不上把空间和时间冗余度都除去的帧间技术。帧间编码技术可在相当低的比特率时取得与帧内DCT相同的图像质量。此外,还有新的静态图像压缩标准。如JPEG-LS,其编码效率比早先的JPEG提高约29%,某些情况下可达到80%o于2000年完成的JPEG-2000是具有更高效率的静止图像压缩标准,其编码变换采用小波变换,它已代替原有的JPEG标准。

MJPEG(Motion JPEG)编码压缩技术是基于JPEG静态视频压缩而发展起来的,其主要特点是基本不考虑视频流中不同帧之间的变化,只单独对某一帧进行压缩。基于该技术的视频卡主要完成数字视频捕获功能,在后台则由CPU或专门的JPEG芯片完成压缩工作。

MJPEG编码压缩技术可获取清晰度很高的视频图像,并可灵活地设置每路视频清晰度与压缩帧数。但在保证每路都是高清晰度的情况下,受处理速度所限而无法完成实时压缩,并有很强的丢帧现象。同时由于没有考虑到帧间变化,造成大量冗余信息被重复存储,因而单帧视频的占用空间较大,目前最好也只能做到3k/帧,一般都要8~20k/帧。实际上,即使是丢帧录像,也将耗费大量的硬盘空间。这样,在摄像机较多的电视监控系统中,它一个月的录像存储量就十分惊人,甚至远远超过采用MPEG-1的实时录像产品。

二、MPEG图像编码标准

MPEG是运动图像专家组(Moving Picture Experts Group)的缩写,它是国际标准化组织(ISO)和国际电工技术委员会(IEC)的一个联合委员会。MPEG主要有MPEG-1,MPEG-2,MPEG-4、MPEG-7等。

(1)MPEG-1的视频编码标准。MPEG-1标准为工业级标准而设计,于1992年制定。它包括三个部分:视频、音频、同步和多路复用的系统。MPEG-1引入了双向运动补偿,它包括图像序列(GOP)层、图像(帧)层、条层、宏块层和块层等。双向运动补偿形成较低的比特率而图像质量牺牲很少。在给定比特率的情况下,MPEG-1的图像质量要胜过ITU-T的H.261标准。

MPEG-1可适用于不同带宽的设备,如CD-ROM,Video-CD.CD-i等,它可针对SIF标准分辨率(PAL制为352x288)的图像进行压缩,其传输速率为1.5Mbps(最低192kbps),每秒播放30帧,并具有激光唱盘CD的音质。在1.2Mbps时,编码的视频图像的质量是良好的,相当于VHS水平。MPEG-1的编码速率最高可达4~5Mbps,但随着速率的提高,其解码后的图像质量有所降低。

在实时压缩、每帧数据量,以及处理速度上,MPEG-1比MJPEG有显著地提高。如在PAL制式下,MPEG-1可满足多路(16路)25帧/s的压缩速度,在500kbps压缩码流(352x288)下,每帧大小仅为2kB。其主要的限制参数为:每行最大像素为720;每幅图像最大行数为576;每秒最大帧数为30,每幅图像最大的宏块数为9900,最高比特串为1.86Mbps,最大解码器缓存容量为376832比特。可以预见,所有和MPEG-1标准兼容的解码器,都能够解由限制参数所产生的二进制比特流。MPEG-1与MJPEG的致命弱点是硬盘耗费量大,且不能同时满足保安与实时录像场合的需要。

(2)MPEG-2的视频编码标准。它于1994年制定,其基本算法也是运动补偿的预测和带有DCT的帧间内插编码,输入信号为典型的CCIR501或相当的数字视频信号。它和MPEG-1的主要差别在于对隔行视频的处理方式上。如用于场数据的DCT在某些地方比用于帧数据的DCT的质量可能有所改进。由此可见,对于场/帧运动补偿和场/帧DCT进行选择(自适应和非自适应)在MPEG-2中成为改进图像质量的一个关键性的措施。MPEG-2具有广阔的应用场合,如电子新闻采集,光盘、数字VTR图像存储,ATM或其他网络的图像库业务,陆地和卫星电视广播的传输,遥感、遥测和遥控图像传输等。

MPEG-2标准还提供图像等级选择编码方式,这种方式对提供多种清晰度图像业务是非常有用的。MPEG-2所能提供的传输率为3~lOMbps间,它旨在最优化ITU-R601推荐的分辨率,即光度信号为720x480个像素,色差信号为360x480个像素。MPEG-2能提供广播级的视像和CD级的音质,其音频编码可提供左中右及两个环绕声道,以及一个加重低音声道和多达7个伴音声道。此外,还可提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量以及带宽的要求。

值得提出注意的是,MPEG-2既可在逐行扫描模式下,也可在隔行扫描模式下运行。但实际中我们将看到MPEG-2也有运行于高速率下的模式,这是因为它是高清晰度电视所衍生的标准。

(3)MPEG-4编码。1998年11月,MPEG委员会颁布了MPEG-4标准(ISO/IEC14496)。该标准对交互式多媒体的多种应用提供支持,同时,它将进一步促使通信、消费电子和计算机三项技术领域的融合。现代安防视频监控系统设备剖析与解读

MPEG-4标准由下面6个主要部分构成。

①多媒体传送整体框架(Deliveries Multimedia Integration Framework,DMIF):它主要用于解决交互网络中、广播环境下及磁盘存储应用中多媒体应用的操作问题,通过传输多路合成比特信息,来建立客户端和服务器端的连接与传输。

②数据平面:为了使基本流和AV对象(Audiovisual Objects)在同一场景中出现,引用了对象描述(OD)和流图桌面(SMT)的概念。桌面把每一个流与一个CAT(Channel Association Tag)相连,CAT可实现该流的顺利传输。

③缓冲区管理和实时识别:MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效的管理,可以更好地利用有限的缓冲区空间。

④音频编码:不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

⑤视频编码:与音频编码类似,MPEG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括二维、三维动画和人面部表情动画等。

⑥场景描述:MPEG-4提供了一系列工具,用于组成场景中的一组对象。并且,提供•些必要的合成信息组成场景描述,用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。

与MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务及远程监控。MPEG-4是第一个使用户由被动变为主动(不再只是观看,允许加入其中,即有交互性)的动态图像标准,它的另一个特点是其综合性。从根源上说,MPEG-4试图将自然物体与人造物体相融合(视觉效果意义上的)。它的设计目标还有更广的适应性和更灵活的可扩展性,可以利用很窄的带宽,通过帧重建技术,压缩和传输数据,从而以最少的数据获得最佳的图像质量,广泛应用于数字电视、动态图像、实时多媒体监控、移动多媒体通信、互联网、Intemet/Intranet上的视频流与可视游戏、DVD上的交互多媒体应用等方面。

MPEG-4采用小波变换(Wavelettransform)技术使压缩比可达70:1,压缩复杂度约为JPEG的3倍。2003年5月,MPEG在对H.26L压缩算法修改的基础上,将该技术规范纳入到MPEG-4的标准中,作为MPEG-4PartlO发布,即MPEG-4的第三版(MPEG-4AVC).目前,MPEG4采用ObjectBased方式解压缩,压缩比指标远远优于以上几种压缩方式,压缩倍数为450倍(静态图像可达800倍),分辨率输入可从320x240到1280X1024,这是同质量的MPEG1和-MJEPG的10多倍。

MPEG4使用图层(Layer)方式,能够智能化选择影像的不同之处,可根据图像内容,将其中的对象(人物、物体、背景)分离出来,分别进行压缩。从而使图文件容量大幅缩减,加速音/视频的传输,这不仅仅大大提高了压缩比,也使图像探测的功能和准确性更充分地体现出来。

(4)MPEG-7编码标准。该标准于2001年初完成并公布。MPEG-7的主要目标是指定-系列的标准描述符来描述各种媒体信息(不仅指静态或动态的图像,也包括3D模型、图形、语音等),这种描述与多媒体信息的内容有关,便于用户进行基于内容和对象的视听信息的搜索与查询。因此,MPEG-7并不是一种压缩编码方法,而是一个多媒体内容描述接口。因为继MPEG-4之后,要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索,MPEG-7就是针对这个矛盾的解决方案。这种标准力求能快速且有效地搜索出用户所需的不同类型的多媒体影像资料。显然,MPEG-7不仅用于多媒体信息的检索,更能广泛地用于其他与多媒体信息内容管理相关的领域,它将会在教育、数字图书馆、新闻、导游信息、娱乐等各方面发挥巨大的作用。

现在,又由MPEG-7发展到MPEG-21,目前已开始启动。MPEG-21的主要目标是规定数字节目的网上实时交换协议等。

MPEG-1的出现,使VCD取代了录像带;MPEG-2的出现,使数字电视逐步取代模拟电视;MPEG-4的出现,使多媒体系统的交互性和灵活性大为增强;MPEG-7的出现,将带我们进入一个互动多媒体的网络时代。