专注SIP通讯产品与方案

数字化三步骤二

释放双眼,带上耳机,听听看~!
00:00

00:00
 实际上,对产生64kbit/s模拟语音的模拟信号进行了两次数字化。PAM样值首先通过量化过程被转化为一串的0或1,接着它们又被转化为适合于在数字长途通信链路上进行传输的形式。也有可能先量化后再使用调制解调器在一条模拟链路上发送数字化语音,不过这种情况非常少见,在此不予考虑。其实,64kbit/s PCM语音就是为在DS-0数字链路上传输而开发的,所以没有必要费周折地去用模拟链路传送数字信号。DS-0代表数字信号的第0级,它是所有数字化语音复用系统的基本组成部分。
pcm量化
       正是量化步骤真正产生了脉冲编码调制(PCM)的“码字”--即用PCM的多种0、1组合来表达模拟的PAM样值。量化步骤对PAM样值进行数字化编码,完成了整个数字化过程中真正的A/D转换。
       每个PAM样值都会产生一申0、1组合,0、1组合可用来表示一个给定的PAM样值。如果每秒产生8000个PAM样值,那么用来表示一个PAM样值的比特就必须在125s(1/8000s)内发出。这意味着,如果每个PAM样值都用16比特来表示,则数字信道中的速率就是128kbit/s(16x8000)。显然,64kbit/s PCM语音工作在64kbit/s,于是每一个PAM样值得用8比特来表示。8是2的幕,8比特组成了一个字节,而早期被用于语音量化的DSP是8比特处理器,它每次可以处理一个字节,恰好是个PAM样值。
       不过,让我们考虑一下用3比特来表示PAM样值的情况,如图2-7所示。用于对PAM样值进行编码的数字化“等级”应该覆盖所有的模拟,值,既然每个样值有3比特,那么在整PAM样值区间内就只有8个等级,在图中,没有给出PAM样值,但为简明起见,给出了输入模拟波型。请注意,纵轴上的值并非按数值大小顺序排列,这样做是有目的的。最好使相邻的两个等级之间只有一个比特位上的值有所不同,这样,传输链路上的单个比特错误只会在接收器里产生一个等级的误差,考虑到每个PCM码字仅代表一秒的1/8000,对PCM语音的影响并不显著。因此在量化时,PAM样值与PCM字之间没有从大到小的一一对应关系。
       这幅图的要点并不是要展示量化等级的安排方法。其真实意图是想说明:尽管PAM样值大小不同,但仍可能产生同样的PCM码字。由于表示PCM码字的比特数有限,由它来划分的量化等级也是有限的,自然就产生了这一结果。如图所示,所有落在同一个量化区间内的样值都得用该等级中心处的PCM值来表示。
       这样,量化过程必然会在PAM样值序列中引入一些失真或误差。这种误差被称为量化噪声。通过增加等级数目可以减小量化噪声,但是这增加了每个PAM样值所需的比特数。而且,传输同样的信息还需增加链路的速率。不过,只要量化噪声被限制在一定范围内,数字语音的质量还是可以接受的。对64kbit/s PCM语音来说,仅用8比特来代表PAM样值就可以了。
对PCM样值进行量化
图7  对PCM样值进行量化
       你可能会觉得这是一种嘲弄:以尼金斯特速率进行抽样以求精确复制出模拟波形,由于A/D步骤中引入了量化噪声,结果在链路的接收端无,法准确复制出模拟波形。这种差错是从模拟信号(连续信号)到数字信号(离散信号)格式变换产生的结果。以增加比特数为代价,可以把量化噪声减到最小程度,却不能把它完全消除。
       在讨论语音数字化编码之前,关于这个数字化的最后一个步骤,还需指出:语音数字化的对象并不是任意波形,而是表示语音的模拟波形。实际上,人的语音由低幅清音和高幅浊音构成,在这之间的成分并不多。根据这一特点,可以采用一些方法尽量减小语音量化误差。PCM语音数字化系统采用了一个名为“压扩”的过程来达到这一目的。
       压扩是指先在数字化过程中对语音的一部分进行压缩,然后在接收器中再把这些语音扩展。如图2-7所示,对PAM样值进行等间隔量化的问题是:对实际语音进行量化时,低幅声音分配到的量化等级太少,而高幅声音分配到的量化等级又过多。高幅语音的抗噪声能力比低幅语音的强,量化误差对高幅语音的影响不大,于是,不妨把它的量化等级减少一些。压扩通过给高幅音设置较少的量化等级,同时给低幅声音设置较多的量化等级来解决了这个问题。
       压扩的原理理解起来很容易。压扩把幅度范围分成有大有小的区间,而不是等问隔划分,这,原理如图2-8所示。为简明起见,编码等级按数字大小顺序排列。图的左部为没有采用压扩的量化等级,幅度和量化编码之间呈线性相等关系。图的右部则展示了在同等区域内压扩(压缩/扩展)的工作原理。图中示出了六个压扩区域,现在,低幅部分有更多的编码等级,而高幅部分的等级较少,这正是我们所期望的结果。
压扩幅度
       请注意在图2-8中的非等间隔划分的方法是,首先把整个区域取中点,一分为二;再把所生成的低幅区域一分为二,不断下去,直到形成了多个的量化区间为止。实际上,压扩方法远比这简单的“一半又一半”地划分区间的规则复杂,但也并非神秘莫测。当今有两种主要的压扩方法,它们是A-律和mu-律(有时也用希腊字母写作:-律)压扩。A-压扩律在国际上应用很广,世界上大多数国家都采用这种压扩律。Mu-压扩律(亦被称为μ=256的压扩)主要用于北美。换句话说,A-律用于E-载波中而mu-律用于T-载波中,它们不过是区分这两种普遍应用的复用体制的两个名字而已。
       最普遍的语音压扩方式是,在纵轴的两则各设有8个区间,这样,对正、负幅度来说都有8个区间。这8个压扩区域都用3比特表示。还有个比特被用来表示极性(+或-),这样共有4比特。这4个比特就可以决定PAM样值落入了这16个区域中的哪一个,然而.64kbit/s PCM语音最后是用8比特来表示每个PAM脉冲,而不是4比特。实际上,每个压扩区域再平均分成16个等级,其余的4比特就是表示属于哪·个等级的。这样共有8比特以形成整个的8比特PCM字,完整的8比特PCM码字结构如图2-9所示。
8比特PCM码字
图9  8比特PCM码字
       A-律和mu-律压扩都产生8比特PCM码字,不过它们不能互用。这样,一个A-律编码器就不能与一个mu-律解码器一起使用。所有的编码/解码器要么都是A-律,要么都是mu-律,如果一个是A-律而另一个就不能是mu-律的。好在从一种压扩形式转换到另一种压扩形式比较简单,就跟查表一样。在过去,通常是把数字语音重新转换为模拟信号后再用另种压扩形式重新编码,实际上这要比直接在A-律和mu-律之间转换要来得迅速和经济。
       现在,仍然存在关于A-律或mu-律压扩谁“更好”的争论。实际上,人的语音不仅有高幅和低幅之分,而且男士和女士的声音也有很大差异。些语言不仅依赖于声音,还依赖音高的不同来判定词义。哪一种压扩方法可以更好地分辨各人间的差异仍在不断探讨。但是两种方法工作得都很好,在可预见的将来,在北美将继续采用mu-律,而在其他地方仍然采用,A-律。