文本阅读:
第11章低比特率编码:编解码器的设计439比例因子频带的宽度被限制在32个系数以内,除了最后一个比例因子频带以外。对于长块有49个比例因子频带。各比例因子频带能以1.5dB为增量进行独立的放大。这会产生噪声整形,因为被放大的各个系数具有更大的数值,会在量化以后产生一个更高的SNR。由于在解码器里必须进行反放大,因此要在比特流中传输各个比例因子。设计者们应该注意到例因子的极性定义在MPEG-2AAC和MPEG-1/2层Ⅲ中是相反的(在AAC中较大的比例因子值表示较大的
而在层Ⅲ中则正好相反
对于被量化的频谱、比例因子和方向信息使用霍夫曼编码。有12个霍夫曼码本可以用于编码两个一组或四个一组的经过量化的频谱数值。两个码本用于编码每个最大值,每个码本代表
同的概率函数。有
特池用来适应瞬时的可变比特率,允许比特在相继的多个块中分布,以求在限定平均比特率的约束下获得更高效的编码。一帧的输出由各频谱数和各控制参数组成。比特流语法定义了一个用于原始音频数据的底层,并定义用
音频播放数据的较高层。在解码器中,通过把预测误差与预测值相加得到当前的频谱成分在编码器中一样,各个系数由先前的数值计算得来,不再需要额外的信息。
11.9.3AAC时域噪声整形
的频谱可预测度支配着最优编码策略。比如,考虑一个带有平台时间包络的稳态正弦波和一根单
是一个冲激,是频谱上最不平坦的。这个正弦最容易在频域中直接编码,或是在时域中使用线性预测进行编码。相反,考虑一个瞬态脉冲信号,它由一个时域中的脉冲构成,并具有平坦的功率谱。这个脉冲是很难直接在频域中编码的,也很难在时域中用预测方式编码。
过,这个脉冲可以直接在时域中被最优编码,或是在频域中使用线性预测进行编码。
在AAC编解码器中,使用预测编码分析每个块中的各个系数。瞬态信号将产生更为均匀的频谱并能鉴别出各个瞬态信号,还能更有效地作为残差信号被编码。在对瞬态信号编码时通过对MDCT得到的频谱数据进行分析,可以使用时域噪声整形(Temporal Noise Shaping TNS)控制每个窗内量化噪声的时域形状,从而实现感觉噪声整形。通过利用时域和频域之的对偶性,TNS提供了得到改进的预测编码。当使用预测编码对时域信号进行编码时,输出信号中量化噪声的功率谱密度将受到输入信号功率谱密度的整形。相反地,当一个频域号被预测编码时,输出信号中量化噪声的时域形状将遵循输入信号的时域形状具体地,TNS改变了量化噪声的时域形状,令其跟随瞬态信号的时域包络,因此就把噪声隐藏在瞬态信号之下。这可以克服预回声等问题。如前所述,它是通过对频谱信号进行线性预测编码而实现的。例如,使用开环差分脉冲编码调制(Differential Pulse-Code DPCM)对频谱数值进行编码。在解码器中进行相应的DPCM解产生输出信号。在解码过
程中,TNS用前向预测残差(预测误差)替
谱系数。在AAC主描述文件
了预