364数字音频技术(第6版
虽然一个被遮蔽信号在声学上是客观存在的,但它在人的感知上确实是不存在的。这上去可能很极端,但听觉遮蔽确实与视觉遮蔽一样是真实存在的。把你的手放在这页书上。
能透过你的手看到这页书么?听觉遮蔽也是这样实际存在的10.5心理声学模型
理声学模型对人类的听觉系统进行仿真并分析频谱数据,从而确定如何对音频信号进编码,以使量化噪声变得尽可能地不可闻。大多数模型都会为各个临界频带计算遮蔽门限,以确
好可闻的噪声水平。换句话说,这些模型通过对每一帧数据进行这类分析,确定每个临界频带内能允许有多少编码噪声。因此,最大信号电平与最小遮蔽门限之间的差异(信号-遮蔽比)决定了每个频带的比特分配。在对遮蔽曲线建模时有一个重要的基本要素就是确定信号的相对纯音度,因为这将影响
投射出的遮蔽曲线的特性。任何模型都必须是时对齐的,这样才能让模型的结果与正确的音频数据帧相一致。这会导致滤波器的延时,并且需要对当前数据块的分析输出进行居中处理
在大多数编解码器中,比特分配的目标是令总的噪声-遮蔽比在整个帧中被降到最低。
被分配的比特数不能超过这一帧在一个给定比特率下的可用比特数。每个子带的噪声-遮蔽比可用下式计算
NMR= SMR-SNR
SNR是遮蔽音与由一个量化级建立的本底噪声之间的差,用于量化的比特数越多,S的值就越大。SMR是遮蔽音与一个临界频带内遮蔽门限最小值之间的差。更具体地,这恰当的遮蔽门限是一个临界频带内的整体遮蔽门限(也被称为恰好可闻失真【Just-Noticeable Distortion】或JND)。SMR决定了量化所需的比特数。如果一个信号低于门限,则该信号不会被编码。NMR是量化噪声级与噪声达到可闻时声级之间的差。这种关系如图10.11所在一个临界频带内,与SMR相比,SNR越大,量化噪声的可闻度越低。如果SNR