文本阅读:
第10章低比特率编码:理论与评价367
纯音度。这些模型将在第11章讨论。
在一些纯音度模型中,当一个信号具有很强的局部极大纯音成分时,它们会被检测出来并被取出进行单独编码。这将令整体的频谱变得平坦,从而提高后续的霍夫曼编码的效率因为一个码本中所需的平均比特数会随着最大值幅度的变大而上升。这种效率的提高取决于音频信号的属性。一些模型会进一步辨别多频遮蔽音的谐波结构。当有两个多频遮蔽音具相同的功率时,谐波结构较强的那个遮蔽音将产生较低的遮蔽门限当数据在一个倾向于出错的传输信道中传输,并且要在输出合成滤波器组之前施加错误隐藏时,在解码器中对纯音和非纯音成分的鉴别也是很重要的。丢失的纯音成分可以用预测值替代。比如,在预测时可以使用FR滤波器对信号进行全极点建模,并使用一个自相关函数采用 Levinson-Durbin算法产生各个系数。研究指出,在频率较低的子带中进行隐藏要比在较高的子带中进行隐藏更为重要。被一个频谱包络恰当整形的噪声可以成功地替代丢失的非纯音部分。
10.6感觉编码的基本原理
何低比特率编码系统的目的都是要降低比特率,它是采样频率与字长的乘积。这可以通过降低采样频率来实现,不过,奈奎斯特定理指出,这会令高频音频带宽相应地降低。另条途径是统一地减少字长,不过,这样做每减少1bit,音频信号的动态范围就减少6dB因此会增加宽带量化噪声。如同我们已经看到的,更进步的方式是运用心理声学。感觉编解码器保持采样频率不变,但有选择地减少字长。字长缩减是以信号所处状态为基础动态完成的。具体地,通过考虑遮蔽和其他因素使得最终量化噪声的增加变得尽可能地不可闻。量化噪声的声级以及由于截断字长而引起的与之相关的失真都允许增长,只要它能被音频信号遮蔽即可。例
个编解码器能以2bi采样点的平均比特率传输一个音频信号,若使用M编码,这将对应一个12dB的信噪比--这是非常差的结果。但通过运用心理声学,编解码器可以让本底噪声变得几乎听不见
感觉编解码器对输入信号的频率和幅度内容进行分析。编码器移除音频信号中不相关统计上冗余的部分。从理论上说,虽然这种方法是有损的,但听众将不会听出解码以后的信号在音质上的劣化。实现相当大的数据压缩是可能的。例如,感觉编解码器可以把一个声道的比特率从768kbit/s降至128kbit/s;16bit/采样点的字长可以降至平均267bit/采样点,数据量可以缩减大约83%。表102列出了针对48kHz和44.1kHz单声道信号的多种压缩比率以及所得的比特率。一段经过感觉编码的录音,在采用保守水平的数据缩减时,能产生与传统录音相匹敌的声音质量,因为数据是按照一种智能得多的方式被编码的,并且其实很简单,因为我