数字音频技术(第6版) 398


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 398
前一篇:数字音频技术(第6版) 397 下一篇:数字音频技术(第6版) 399
文本阅读:
  第10章低比特率编码:理论与评价371
  巴普蒂斯·约瑟夫·傅里叶(Jean Baptiste Joseph首先建立了时间和频率之间的这种
  关系。时域信号中的变化也会表现为其频域频谱中的变化。例如,一个慢变化信号将会低频频谱成分表现出来。因此,如果对一系列以时间为基础的采样点进行变换,则该信的频谱内容可以在这段时间上被确定。类似地,可以通过反变换把频谱表示转换回时域,从而得到基于时间的各采样点。有多种数学变换可用来把时域信号变换到频域并反变换回来例如,快速傅里叶变换(Fast fourier transform,FFT)可以给出一个频谱,其频点数量为时域采样点数量的一半。比如,假设以48kHz的采样频率获取了480个采样点。在这10ms的时以在最低100Hz最高24kHz的一个频谱上得到240个频点,这个频谱所表示的时间为10ms,各频点之间的间隔为100Hz。此外,还会生成一个直流频点。
  10.7.1子带编码
  子带编码是由贝尔实验室于20世纪80年代早期首先开发的,随后的很多后续工作则是在80年代后期于欧洲完成的。时域上相继的各个采样点组成了多个块,用以表示宽带信号在
  简短的时间段内对这些块进行收集,并在其上施数字滤波器组。这个分析滤波
  器组把信号分割成多个(可能多至32个)频带受限的通道,用以近似人耳的临界频带响应。
  这个滤波器组必须提供非常锐利的截止特性(可能要达到100dB/倍频程)以模仿临界频带响应,并把量化噪声限制在该带宽之内。只有数字滤波器能实现这一结果。此外,被处理的块长度(理想情况是小于2ms-4ms)必须足够使量化噪声不超过人耳的时域遮蔽
  限。对每个子带中的各个采样点进行分析,并与理声学模型进行比较。编解码器在
  每个子带中基于该子带的遮蔽门限对各个采样点进行自适应量化。理想情况下,这个滤波器组产生的各个子带的宽度应该与最狭窄的临界频带宽度相对应。这就能精确地进行心理声学建模。不过,大多数滤波器组产生的都是均匀间隔的子带,不能实现这一目标,这指出了由于最窄临界频带与最宽临界频带在带宽上的巨大差异而造成的困难,每个子带都会或多或少地分配到一些比特,用于对该子带内的各采样点进行编码,各个子带的编码是独立的。量化噪声在一个子带内可以被提高。不过,当信号被重建时子带内的量化噪声将被限制在该子带内,理想情况是它被该子带内的音频信号遮蔽,如图0.13所示。在含有一个信号的子带中
  其他情况下会成为干扰的量化噪声级现在也是
  以容忍的,因为量化噪声被信号遮蔽了。不包含可闻信号的各个子带被量化为零。用心理声学模型和对信号本身的分析来决定比特分配,对于每个新数据块中的每个子带都要重新进行这些操作的计算。各个采样点根据信号与噪声的可闻度进行动态量化。编解码器中使用的理声学模型和比特分配算法在设计上有着极大的灵活性,而这些编解码器在其他方面都是兼的。解码器使用这些被量化的数据重新形成每个块中的各个采样点,一个合成滤波器组把