专注SIP通讯产品与方案

安防视频监控系统常用的压缩编码方法

数字视频图像是最重要的信息媒体之一,它具有直观、生动和内涵丰富的特点。但是,由于数字图像的数据量非常之大,这给图像的存储、传送和处理都带来很大困难。解决这一问题最常用的方法是进行数字图像压缩编码,在保证图像质量的前提下,最大限度地降低图像的数据量,以减少数据存储量,节约传送和处理的时间。

能够进行图像压缩的机理主要来自两个方面:一是图像信号中存在着大量的统计冗余(如频谱冗余、空间冗余、时间冗余等)可供压缩,这种冗余度在解码之后可无失真地恢复;二是利用人眼的视觉生理冗余,如人眼对色彩的高频分量没有对亮度的高频分量敏感,对图像高频(细节)处的噪声不敏感等,在不被主观视觉察觉的容艰内,通过减少信号的精度,以一定的客观失真换取数据压缩。

最基本的图像压缩编码方法有统计编码、预测编码、变换编码,以后又出现了子带编码、分形编码、小波变换编码等。这里仅对这些压缩编码技术进行概述。

一、统计编码

统计编码是根据像素灰度值出现概率的分布特性而进行的压缩编码,或根据各个信号源符号出现的概率不同而进行的概率匹配编码。它在不引起任何失真的前提下,可以将传输每一信源符号所需的平均码长降至最低。统计编码是识别一个给定的码流中出现频率最高的比特和字节模式,利用比原始比特更少的比特来对其编码。也就是频率越低的模式,其编码位数越多,频率越高的模式编码位数越少。

统计编码是无损压缩(即无失真压缩),通常可分为两大类。

(1)模式替换。是常用于文本信息的编码。对多次出现的字符,即常见词用一个字符替代,如将出现“Communication”的地方用“C”替代,“Netwok”用“N”替换。

(2)Huffman编码。是一种常见的统计编码。对给定的数据流,计算每个字节的出现频率。根据频率表,运用Huffman算法可确定分配给每个字符的最小位数,然后给出一个最优的编码,代码字传入代码簿。Huffman编码适用于压缩静态和动态图像。根据参数,可对几个或一组图像构造出一个新的代码簿。在运动图像中,可重新计算一个或一系列帧的代码簿。在所有情况下,都必须将代码簿从源端传到目标端才能进行译码。它的优点是能很好地与代编码符号的概率分布匹配,使平均码长达到最短;但其硬件实现较为复杂;编码要求确知信源的统计特性,即各信源符号的出现概率,否则编码效率要明显下降。

二、差分或预测编码

预测编码就是用己经编码传送的像素,预测实际要传送的像素。即从实际要传送的像素值中减去预测的像素值,传送它们的差值,因而也称为差分编码。显然,传送差值比传送原图像值所需的比特率要低。因为图像各像素间存在着强烈的相关性,采用预测编码可减少像素间的相关性,提高传输效率、压缩比特率。差分编码特别适用于其连续值与零值差别很大而彼此之间差异不大的信号。因此,码非常适用于运动图像信号(它仅传送图像的差异)或音频信号。预测编码有无损预测与有损预测之分。实际中由于预测值的确定方法不同,各种预测技术也就有所差别。

差分编码技术有3大类:DPCM、6调制和ADPCM。DPCM(差分脉冲编码调制),是一种实用的有损预测编码技术,也是最早的一种数字图像压缩技术,其原理是当前的像素可由它邻近的像素值预测而得,也就是说,其冗余度可由邻近的像素来确定。据此,再对当前的像素和预测像素的差值进行量化、编码。考虑到在高性能和复杂性之间的折中,通常用于帧内预测(二维预测)的邻近像素的个数并不多.(不超过4个),使用更多的像素并不能获得预测性能的显著改进。对于帧间预测(三维预测),一般只用相邻帧的对应像素进行预测。图像的相关性越大,其预测误差越小,取得的压缩比也越大。DPCM相对说来是一种比较容易实现的压缩方法,但在较低速率时其压缩能力一般不如下面的变换编码好。

三、变换编码

预测编码是直接在空域对图像进行压缩处理的,而变换编码相当于在频域进行压缩处理。变换编码的基本原理是通过正交函数把图像从空间域转换为能量比较集中的变换域,然后对变换系数进行量化和编码,从而达到缩减数码率的目的。因此,变换编码也称正交变换编码。对于大多数自然界图像变换得到的变换域的系数,有些值很小,这些系数可较粗地量化,或甚至完全忽略掉而只产生很小的失真。虽然失真很小,但信息仍有损失,因而变换编码是有损压缩编码方法。变换编码是一种源编码方法,而源编码要考虑被压缩信号的性质,特別是它有赖于音频、静态图像和动态图像的特征。

在变换编码时,初始数据要从初始空间或时间域进行数学变换,变换为一个更适于压缩的抽象域。该过程是可逆的,即使用反变换可恢复原始数据。变换编码法中要选择一个最佳的变换,以便对特定数据实现最优的压缩,此处就要考虑数据的性质。其思想是:经过变换后,使信息中最重要的部分(即包含最大“能量”的最重要的系数)易于识别,并可能成组出现。变换编码特別适合于图像的压缩,常用的数学变换是离散余弦变换(DCT)。

四、子带编码

子带编码利用带通滤波器组把信号分解为若干个频带内的分量之和,通过等效于单边带调幅的调制过程,将各K带搬移到零频率附近,以得到低通表示后,再以奈奎斯特速率对各子带输出取样,并对取样值进行通常的数字编码。在接收端,将各子带信号解码,并重新调制回其原始位置,再将所有子带输出相加,就可得到接近于原始信号的恢复波形。

把信号分为子带后进行编码有如下优点。

•通过频率分解,可以去除信号频率相关性,减少冗余度。

•由于能量在不同频带分布的不同,可以采用不同长度的码字对各不同频带内的信号进行编码。

•由于量化在各子带内单独进行,因此量化噪声被限制在各子带内,可以防止能量较小频带内信号受其他频带内量化噪声的干扰和影响。

实践证明,在相同失真条件下,子带编码将比全频带编码有较低的比特率。

五、分形压缩编码

其基本思想是,传统的绘置直线和圆的几何与自然界几何形状不相像,可用一种称为分形的几何来描述自然界,在不同地点、不同范围和不同角度下,重复出各种不规则的变化,用所谓的分形的变换对同一分形的不同出现,分别进行刻画。

分形图像压缩是寻求一幅图像中的一组分形,由这组分形重构或描述原整幅图像。一旦这组分形找到后,只保留这组分形就可以很好地复原原图,从而达到数据压缩的目的。这是由于这些分形具有自相似性和尺度变化无限性等特点决定的。因此,分形图像压缩的关键在于寻找到这一组分形,即分形图像压缩理论基础中的迭代函数系统(IFS)。找到IFS的方法有两个:一是基于图像的自相似性,直接计算迭代函数系统各收缩仿射变换的系数;二是把图像分割成较小的物体,然后从迭代函数系统库中查找这些小物体所对应的迭代函数系统。

分形图像压缩是一种利用图像的自相似性,来减少图像冗余度的新型压缩编码技术,其优点如下。

•有很高的压缩比,对一般图像,当压缩比在20倍以上时,仍有较好的保真度。对于某些自相似性强的图像,压缩比可达上百倍。

•解码图像与分辨率无关,可任意高于或低于原图像的分辨率进行解码,当要解码成高分辨率的图像时,引入的细节会和整个图像大致和谐一致,比像素复制或插值方法得到的图像看起来更自然(这种缩放能力也可应用于图像增强)。

•图像解码速度快,靠专用硬件已能达到每秒几帧的图像重建速度。但图像编码时间过长,实时性差,从而阻碍了该方法在实际中的应用。

六、小波变换编码

小波变换WT(Wavelet Transfonn)就是把信号展开成一序列称为小波的基函数集,它是一种表达在时域和频域都有限的信号的新方法。这种变换对于小范围内的瞬态信号的频谱分析是非常有效的。由于小波变换的多分辨率特性非常适于图像压缩,因而可产生许多很有意义的编码器。小波分析以其良好的局部性特征为数字图像压缩编码带来了新的工具,使得这一领域充满了生机。

小波的图像分解思想是属于子带分解的一个特例,它是完备的、正交的,且多分辨率的分解。在空间域里,小波分解将信号分解为不同层次分解运算的同时,形成了频率域中的多层次分解。在频率域中的每个层次上,高频分量与低频分量的分布与原数据中频率分布的方向有关。利用小波变换对图像进行压缩的原理与子带编码方法一样,是将原图像信号分解成不同的频率区域,持续的压缩编码方法根据人的视觉、图像的统计、细节和结构等特性,对不同的频率区域采取不同的压缩编码手段,从而使数据量减少。

利用小波变换进行图像压缩,一般采用离散小波变换编码的方法。图像压缩中所用的离散正交小波,一般是由滤波函数构造的。对于给定的数字信号矩阵,将其分解为一个高通的和一个低通的子信号,且两者是相互正交的。在必要时,可以递归地对每一个子信号分下去,一直到需要的带宽为止,然后进行分析和运算。

在图像编码领域中,小波变换编码技术是一个新兴的图像编码方法。一方面,小波编码拥有传统编码的优点;另一方面,小波变换多分辨率的变换特性,提供了利用人眼视觉特性的良好机制。因此,小波图像编码在较高压缩比的图像编码领域中被非常看好。

目前,小波变换的图像压缩编码有扩展零树编码、零树与游程相结合的编码、多项式近似分形编码、多小波变换图像编码等。

七、低码率图像编码新技术

图像编码的另一个研究重点就是极低码率的图像压缩,其传输码率低于64kbps,应用范围将更为广泛,如PSTN网上的电视电话、多媒体电子信箱、移动的可视通信、电子报纸、交互多媒体数据库、可视游戏、远程医疗,以及聋哑人的辅助通信等。近来出现的一些新的编码方法大多是针对极低码率的图像编码的,如在多媒体可视电话中,它要求把图像压缩后能在现有的公共电话网上传输,压缩比可达到上千倍,其难度极大。对于一般的电视图像,要达到如此高的压缩比,同时又保证一定的观赏质量是难以办到的。对于典型的电视电话图像,其图像内容相对简单,动作幅度不大,这些都是在极低码率图像编码中可以利用的条件。

目前极低码率的图像编码的研究大致分为两个方向。

(1)波形基编码(Wave-From-Based Coding):波形基编码的出发点是图像各像素亮度和色差信号的波形,利用其各种内部统计特性进行压缩编码。

(2)知识基编码(Knowledge-Based Coding):知识基(有时也称为模型基)编码是从一种新的角度进行编码的方法,它把图像看成三维物体在二维平面上的投影。编码的第一步是建立物体的模型,然后通过对输入图像和模型的分析得出模型的各种参数(几何、色彩、运动等),再对参数进行编码传输,解码端则由图像综合法恢复图像。因此,这种方法又称为分析、综合编码。这种编码方法,比前者更多地利用了图像的先验知识,它用参数(而不是像素的电平)进行编码传输,因此可以获得更高的压缩比。