专注SIP通讯产品与方案

G.723.1电话带宽的声码器

G.723.1性能特点
        G.723.1是双速率I.PAS声码器,低速率的编码比特率为5.3khit/s;高速率为6.3khit/s,线性预测也采用前馈型前向自适应,并使用预视。帧长30ms,分为4个子帧。即每个子帧含60个抽样信号,予视7.5ms。
        ITU-T/制订G.723.1标准的主要应用目标是低比特率可视电话,要求比特率低于9.6khit/s,后来提出的候选方案都在5.0-6.8khit/s范围内,因此决定采用6.3khit/s,后来为了增加灵活性又增加了5.3khit/s速率。根据帧长和预视长度估计其单向系统时延为97.Sms。实际上该时延值是根据应用要求反推得到的。在可视电话中视频帧长为200ms,话音时延应与之适配。考虑到话音可能包含一次编码汇接,因此其单向时延应不大于IOOms,并由此确定了帧长。
        G.723.1为多信道操作提供全工和半工传输能力,这在综合处理数字信号的多媒体系统中是非常有用的。在语音通信领域,音频质量要比那些由更好的鲁棒性多媒体数字信号编码器提供如G.711等的方式低。也许正是因为这些,G.723.1标准被其它互联网用户语音传输协议做取代。
        和G.729相比,线性预测和激励生成的基本原理相同,其主要区别是6.3kbit/s模式固定码本激励信号的空间划分有所不同。G.729是将子帧空间划分为4个子集,在每个子集中确定l个脉冲激励,称之为代数码本激励(ACEIP),5.3kbit/s模式与之基本相同。6.3kbit/s模式是将子帧空间划分为奇偶2个子集,然后在其中一个子集的任意位置确定固定数量的脉冲激励,称之为多脉冲最大似然量化器(MP-MLQ),对应的搜索方法称为顺序多脉冲搜索法。另一点差别是基音预测方法。G.729采用的是自适应码本法,候选码本矢量直接输入加权合成滤波器,由此搜索确定最佳矢量。G.723.1采用的是基音预测滤波器法,最佳码本矢量经由独立的预测滤波器搜索确定。另外,G.723.1帧长较长,比特率自然可以降低,其代价是时延加大。复杂度则介于G.729和G.729A之间。话音质量和G.729相仿。
G.723.1编码器
G.723.1编码器结构如图4.11所示:
  图中输入信号y[n]为16bit线性PCM信号,其它型式的输入信号必须经过适当转换处理。成帧器采集240个抽样信号组成帧信号S[n],经高通滤波器后形成编码器实际处理的帧信号x[n]。x[n]划分成60个抽样信号一组(子帧),供后续处理。
  线性预测编码(LPC)分析对每一子帧输入信号进行自相关系数计算,经递推得出10阶线性预测滤波器Ai(Z)的系数厄jf。最后一个子帧滤波器AiZ)的系数转换成线谱对(LSP)系数,去除直流分量后,采用3段分割矢量量化,每段码本索引为8bit,总共为24bit,发往接收方。
G.723.1解码器
  G.723.1解码器结构如图4.12所示:
G.723.1解码器结构
  解码按帧进行。首先解码量化的LPC索引,建立LPC合成滤波器A(z)。  对每一子帧,解码接收到的自适应码本激励和固定码本激励,其和e[n]输入合成滤波器。自适应后置滤波器包括基音后置处理器和共振峰后置滤波器。
  前者为长时相关滤波,置于合成滤波器之前,按子帧执行,用于改善合成话音质量。后者为短时相关滤波,置于合成滤波器之后。定标单元恢复原信号能量。其定标值为:
定标单元标值
  然后据此值及上一子帧的比例因子,组合生成本子帧的比例因子:
组合生成本子帧的比例因子
  此外,和G.729一样,解码器也设有帧丢失处理功能。如果发现帧丢失,解码器由正常解码方式转为帧丢失屏蔽方式,通过以前数据和内插操作生成替代话音帧。