文本阅读:
第12章用于传输的语音编码481
始采样信号相比,比特率得到了很大的缩减。例如,存有6bt采样点(40
的
帧可以用40bit传输各个系数,并用5bit传输比例因子。实际中,可以对这个简单的编解码器进行很多改进,提高它的效率和性能。
在线性预测语音编解码器中,语音信号被分解成频谱包络和一个残差信号。在一些设中,频谱包络用线性预测(LP)系数(或反射系数)表示。在另一些设计中,信号用线谱频率(Line Spectral Frequenc|es,LSFs)表示。LPC编码器的残差误差或差信号)可以用
多种方法表
编解码器使用的是一种脉冲串和噪声表示,ADPCM使用的是一种波形表示。CELP编解码器使用的是一种码本表示,而参数编解码器使用的是一种参数表示。参数编解码器用谐波波形或正弦波形表示LPC残差信号。具体地,残差信号用参数形式传输,比如通过各个正弦谐波的频谱幅度。残差信号中的相位信息不被传输。对于解码器的选择取决应用和比特率
本质上,LPC语音编解码器把人类声道系统建模成一端有蜂鸣器的管腔。更具体地,这个模型让声门振动与声道响应进行卷积。声带和声带之间的空当(即声门)产生了这个嗡鸣声,其特征通过响度和音高上的变化表现出来。声道中的喉与嘴被建模成一个管腔,它产生了共振,也就是共振峰。这个管腔模型对于元音工作得很好,但对于鼻音就要差一些。通过增加一个分支来表示鼻腔可以改善这个模型,但这增加了计算复杂度。实际中,鼻音可以通过残差信号来考虑,如下文所述
在LPC中
被分解成两个成分:一套LP系数和一个预测误差(残差)信号。残差信号用脉冲串
或噪声(清音)建模,两者可以根据清浊音判决进行切换。分析滤波器利用这些LP系数产生预测误差信号。分析滤波器具有与声道响应近似相反的特征,预测误差信号扮演了声门振动的角色
图129A
为
编码器。它使用了四个元件和一个声源滤波器来分析语音信号。
所有分析都是在被分段成帧的采样数据上进行的。线性预测估计出频谱包络中的各个共振峰并使用反向滤波从信号中移除它们的影响,留下一个残差信号。这个编码器随后估计出音高周期和残差的增益。通过使用诸如帧中谐波结构的显著性、时域波形过零点数量(浊音语音的过零点数量通常要比清音少)或是一帧中的能量(浊音具有较高的能量)等信息把这一帧归类为清音或浊音。各个共振峰、残差信号和其他信息用数值表示出来,这些数值可以被存储或传输
图129B所示为一个LPC解码器。它把编码过程反转过来并合成出音
解码
器使用残差形成一个声源
随后用共振峰对这个声源进行滤波,从而产生出语音信号因此这个操作过程与人类语音系统的原始模型类似。清浊音标志输入指明了这一帧应该按浊音对待还是按清音对待。在按浊音对待时,激励信号是周期性的,各个脉冲按合适的音高周