文本阅读:
454数字音频技术(第6版
在编码器中,前问自适应模型使用迭代速率控制循环来决定模型中的各个参数,这些参数指明了各个遮蔽音距遮蔽轮廓线的偏置。后向自适应模型使用这些参数和被量化的频谱包络信息估计出遮蔽门限。这个感觉模型的各个参数和一个可以调整遮蔽门限的可选项前向自应增量比特分配将被传送给解码器
编码器的比特分配增量参数可以用于升级编码器的功能。未来的编码器可以使用两个感觉模型,一个是原始版本,另
改进版本,并且编码器可以传送对遮蔽声级的调整特分配程序根据遮蔽准则来分析音频信号的频谱包络,从而确定分配给每个底数的比特数。理想情况下,计算出的比特分配能让被量化后底数的SNR≥SMR。这里没有预先分配的底数或指数比特,分配是从一个比特池中在全局上对所有声道进行的。这个程序与参数感觉模型相互作用,估计出可闻和不可闻的频谱成分。为50个非均匀带宽(大约1.6个倍频程)
的频带计算这些被估计出的噪声声级门限。每个底数的比特分配由一个查找表确定,这个查找表以两个数值之差为基础,其中一个数值为输入信号精细颗粒的统一频率尺度的功
率谱密度,另一个数值为沿一个有带的粗略颗粒的频率尺度估计出的噪声声级门限。这个程序把解码后的频谱包络看作信号的功率谱密度。这个信号实际上被卷积了,即用表示这个双斜率扩散函数的两个R滤波器与一个经过简化的表示人耳遮蔽响应的扩散函数相卷积。
散函数用两条遮蔽曲线来近似:一条是快速衰减的向上曲线,一条是慢速衰减的向上曲线但它在声级上被向下偏置。这两条曲线被称为快泄漏和慢泄漏。卷积从最低频率的功率谱密度开始进行。每个新的功率谱密度与当前的泄漏值相比较,并判断它是否是显著的,这将每个频带产生一个预测的遮蔽值。扩散函数的形状通过四个参数被传递给解码器。
这条预测出来的曲线与一个听觉门限相比较,两者中的较大值用在每个频而产
生出一条全局遮蔽曲线。从原始的未分带的功率谱密度中减去所得的预测遮蔽曲线,就能确定每个变换系数的SNR值。这些SMR值用于对每个系数的底数进行从0~16biit的量化。对所有低精度的各个量化等级(3、5、7、11、15个量化级)使用奇对称量化(底数范围被奇数个量化台阶分割,各台阶在宽度上是相等,并且关于零点对称分布),而对所有其他量化等级
2个量化级到65536个量化级)则使用偶对称量化(第一个台阶要比其他台阶短50%,而最后
阶则比其他台阶长50%
从一个公用的比特池中迭代地取出比特用于所有声道。为了使用这个可用比特率,要底数量化进行调整。声道间掩蔽的效果是相对轻微的。为了在频率分辨率相对较低的低频区中使可闻量化噪声最小化,要对各个系数的噪声进行分析,并在需要的地方迭代地加入比特以降低噪声。量化后的底数被缩放并加入偏置。作为可选项,当零比特被分配给底数时可以施加减性抖动。可以使用一个伪随机数字发生器。用一个模式比特指示何时使用抖动,并为解码器的减性抖动电路提供同步。此外,高频定位信息中的载波部分被移除,并用对包络的