语音压缩和对抑制无话

更新时间:2022-06-16
释放双眼,带上耳机,听听看~!
00:00

00:00
语音压缩
语音压缩
       数字语音总是源自具有64kbit/s速率的PCM语音流,这将引起一些问题。解决它最简单的方法是对PCM语音流进行某种形式的压缩。尽管通常用“语音压缩”表示这一处理,但是它并不是指压缩语音本身,而是指压缩64kbit/s的PCM语音流。今天可将语音压缩到13khit/s,甚至于8kbit/s。可以通过以下两种方法实现语音压缩:第一种,开发新的芯片组将模拟语音直接转化成上述速率。第二种方法,把64kbit/s的PCM语音流作为第二阶段语音数字化的输入处理对象,这次数字化的输出就是较低速率的语音了。第二种方法不要求全新的模数转化芯片,仅仅是增加一些对64kbit/s速率的PCM语音流进行压缩的芯片。
       注意,语音压缩本身不能自动产生突发式语音。8kbit/s的语音仍然是固定比特速率的。要想把语音变为突发式的,就必须将谈话中不说话的部分去除。
无话部分抑制
       无话部分抑制是指将谈话中不说话的部分去除。引起没有语音的主要原因是谈话中,总有·方处于玲听状态,也有小部分无语音是由句与句、短语与短语之间的停顿引起的。总之,在一个双向的64kbit/s速率的PCM语音流交谈中,有60%并没有实际语音。
语音激活识别
       抑制无话部分面对的最大问题是:说话的人在一段沉默之后,如何识别他将于何时再开始说话。为什么这会成为一个困难呢?这是因为谈话方总有些背景噪声的影响,根据无话部分抑制的概念,周围的背景噪声不应被分组化,也不应被发送,系统应该只对真正的语音进行处理,所以必需把背景噪声和真正的语音区分开来。其中的技巧在于可靠地识别出说话人的音量级别远远高于背景噪声的,从而判断出他又开始说话了。比背景噪声高的声音也可能是噪声的突然爆发(比如敲击声)。这就是“语音激活识别”(简称VAD)问题。
      如果语音激活识别的级别设置得太低,那么玲听的一方会突然听到敲击声、车鸣声等等外界与谈话无关的声音。如果语音激活识别的级别设置得太高了,那么谈话人再次开始的谈话将被剪辑掉一部分,刚开始的声音因为较低而不被分组化和发送。因为语音分组化的处理是实时的,所以当设置级别过高的VAD进程意识到交谈的人已经开始说话时,已经来不及获取最初的语音了。
voip
       当对VoIP分组进行了语音压缩和对抑制无话部分进行处理之后,就可以使它与其他分组一起在64kbit/s的链路上传输了。但这样做,我们将很难将链路上的VoIP分组传输和文件传输、电子邮件传输区别开来。
 

下一篇

SBC是什么-企业为什么需要SB以及应用场景

通信百科

SBC是什么-企业为什么需要SB以及应用场景

sbc一种NAT穿透的方式。SBC可确保VoIP 安全,又可提供媒体代理服务器的套件。SBC架构于IMS网络之上,可作为IMS网络的SIP和RTSP的 Proxy Server,所有的SIP与RTSP讯息都会透过SBC来处理,SBC更具备N... ...

相关内容

光通信技术(应用前景和发展趋势)

光通信技术(应用前景和发展趋势)

随着科技的不断发展,光通信技术已经成为现代通信领域的重要组成部分。光通信技术利用......

通信系统集成

2023-12-01

工厂无线广播系统(如何提高生产效率和员工安全)

工厂无线广播系统(如何提高生产效率和员工安全)

随着工业生产的不断发展,工厂的生产效率和员工安全已经成为每个工厂管理者必须考虑的......

通信系统集成

2023-11-29

无线对讲机原理(如何实现无线语音通信)

无线对讲机原理(如何实现无线语音通信)

无线对讲机是一种无线通信设备,可以实现人与人之间的语音通信。它广泛应用于工业、公......

通信系统集成

2023-11-27