专注SIP通讯产品与方案

网络电话编码结构原理

结构原理
  G.728、G.729和G.723.1都属于同一类声码器,称之为线性预测合成分析(I.PAS-LinearPredicfionAnalysis-by-Synthesis)编码器,其原理结构如图4.1所示。
LPAS声码器的原理结构
 
  激励生成器产生的激励信号经线性预测器后得到重构的话音信号s(1),线性预测器模拟声道特性,加强激励信号的某些频率域,减弱另一些频率域,体现了话音的短时相关性。激励信号则体现了话音的长时相关性,输入线性预测器的激励信号是量化后的增益和基音信号。由于卧化误差的影响,重构信号和输入信号s(1)之间必然存在有限的差值e(1),称之为残差信号(residualsignal),最小化过程的日的就是调整激励信号,使残差的方差为最小,由此构成确定激励信号的闭环回路。为了减小量化比特,提高编码效率,激励生成器输出的是残差信号估值,而不是原信号估值。从频域上来说,最小化过程使激励信号晕化噪声的能量集中在预测滤波器的低谷部分,从而使雇化噪声呈现平坦的类似白噪声的功率频谱。
  经过最小化过程确定的激励信号星化值就是声码器的输出,接收端的解码器根据此信号和同样的线性预测器恢复原来的话音伈号(实际上图4.1.1难框部分所示闭环回路的下半部分就是解码器的结构,因此该结构的编码器己内含解码器。在话音编码中,常称编码过程为语音分析,它的功能是将话音转换为适于计算机存储和网络中传输的数字形式;称解码过程为语音合成,它的功能是将数字形式的话音数据重新转换为可供人类使用的信号形式。按这样的术语来解释,反馈回路中的线性预测器是用来重建信号的,又称为预测合成器,整个编码器是通过内含的语音合成来完成语音分析过程的,所以称之为合成分析器。
  由于声道的形状和大小是随音素而变化的,因此预测合成器是一个线性时变系统,其滤波器系数需定期更新。因此,LPAS的闭环回路实际上包含两层反馈控制。内层是线性预测滤波器的自适应控制,其过程和ADPCM相同,系数更新周期为一个帧长,典型值为10~30ms。外层是激励信号的优化,由于基音周期小于帧长,因此其更新周期较短,典型值为5~lOms。LPAS的关键技术是如何确定和量化激励信号。
  残差激励信号的量化有多种方法,它是不同LPAS系统的主要差别所在。一种广为使用的方法称之为多脉冲激励(MPE-multi-pulseexcitation)编码,该方法用于比特率为lOkbit/s左右的话音编码器,其复杂度适中,有良好的话音质量。与此类似的一种方法称为规则脉冲激励(RPE-egularpulseexcitation)编码,该方法限定激励脉冲的位置,复杂度较低,其比特率及质量和多脉冲编码类似。近年来得到广泛使用的方法是码本激励线性预测(CELP-Code-excitedlinearPrediction)编码,该方法采用矢量量化技术,用予定义的码本(codebook)激励替代脉冲激励,码本中的每一个向量对应一个量化信号,编码信息转化为码本索引。这种方法具有很高的编码效率,但是复杂度也很高,由于近年来高速DSP的出现才使这种方法成为实用,并以此为基础演绎出多种低比特率声码器标准。