数字音频技术(第6版) 449


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 449
前一篇:数字音频技术(第6版) 448 下一篇:数字音频技术(第6版) 450
文本阅读:
  422数字音频技术(第6版)
  层Ⅲ具有较高的频率分辨率,但这也决定了较低的时间分辨率。在整个窗长内散布的量化误差会产生预回声。因此,在心理声学模型的指引下,MDCT窗尺寸可以在频率或时间分辨率之间切换,这需要进行门丁限计算;其架构如图119所示。对稳态信号使用一个长的对称窗,1152个采样点的长度在48kHz采样频率下对应的是24ms。对于32个子带中的每个子带每36个采样点的变换产生18个频谱系数,因此总共有576个系数。这提供了稳态信号所需的4166Hz(24000/576)的良好频谱分辨率,代价是无法满足瞬态信号所需的时间分辨率子带31
  MDCT
  MDCI
  数字音频
  32子带
  窗
  变换
  出
  号(PCM
  滤波器
  频谱
  MDCT
  换
  窗选择(长窗
  块控制
  长-短窗
  理声学模型
  短窗,短-长窗
  图11.9:对于MPEG-1层Ⅲ编码器中使用的 MDCT变换,可以选择长块和短块。长窗、短窗以及两种过渡窗都有使用
  乍为另一种选择,当出现瞬态信号时,就使用一个长度为长窗1/3的短对称窗。当采样频率为48kHz时,时间分辨率为4ms。三个短窗替换一个长窗,从而让一帧中的采样点数量保持一致。这种模式在每个子带中产生6个系数,总共32×6=192个系数。可以为每个子带单独切换窗长度。因为切换并不是瞬时的,所以从长窗切换到短窗时要使用一个非对称开始窗,而在切换回来时使用一个非对称停止窗。这确保了混叠对消。图1出了这四种
  窗类型以及一个典型的窗序列。有三种块模式。在两种模式中,所有32个子带的输出都通过相等块长度的MDCT进行处理。混合模式在低频提供了频率分辨率而在高频提供了时间分辨率。在瞬态信号中,两个最低的子带使用长块,上方30个子带使用短块。在编码器的输出上使用霍夫曼编码以进一步降低比特率
  层Ⅲ解码器进行霍夫曼解码,并解码出比特分配信息。各个系数被施以一个反变换,32个子带在合成滤波器中被合并输出为一个宽带信号。每18个频谱值进行1次MDCT反变换MDCT),总共进行32次,从而把576个频谱数值变换成长度为32的18个相继频谱。这些频谱通过执行18次多相合成滤波器组而被转换到时域。这个多相滤波器组包含了一个频率映射操作(比如矩阵乘法)和一个512系数的FR滤波器