数字音频技术(第6版) 482


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 482
前一篇:数字音频技术(第6版) 481 下一篇:数字音频技术(第6版) 483
文本阅读:
  第11章低比特率编码:编解码器的设计455编码来替代,高频多声道载波内容可以被整合到一个耦合声道中1124AC-3多声道编码
  AC-3编码的标志之一就是它能够把一组多声道高效率地编码成一个单一的低速率比特流。为了实现更好的比特效率,编码器可以在一些挑选出来的频率上使用声道耦合和重矩阵编码,同时保持听感上的空间准确度。声道耦合基于强度立体声编码,它把两个或多个声道的高频内容合并成一个耦合声道。这个合并后的耦合声道与耦合坐标以及每个声道的原始信号与耦合后声道两者之间量化后的功率谱之比一起被传送出去,用于解码并重建出原始的能量包络。在低比特率下,当信号的情况超过了该比特率时,可以进行耦合。耦合考虑了人耳听觉对高频方向性的局限,能够在不降低音频带宽的条件下高效(但可能并非透明)地对个多声道信号进行编码。在3kHz以上,人耳不能分辨出高频波形精细的时域结构,而是依赖于这个声音能量的包络。换句话说,在高频部分,我们对相位是不敏感的,仅仅对幅度敏感。方向性由包络的耳间时间延时决定,也由基于头部遮蔽的感知到的频率响应决定。结果人耳不能独立地检测出两个在频率上相近的高频声音的方向。
  耦合能获得显著的比特率缩减。如同史蒂夫·弗农指出的那样,给定临界频带分辨率后,只要
  临界频带中的总体信号能量是正确的,就不需要为各个独立的频率槽进行精确地高频底数幅度编码。因为85%的变换系数都高于3kHz,所以在高频的各个频带中出现大量的误差是可以接受的。
  AC-3编解码器可以在高频对各声道进行耦合,操作时需要仔细小心以避免公用声道中的相位对消。这个耦合策略完全由编码器决定。一个频带中原始信号的功率与每个频带中参与耦合的声道功率之比被编码成每个独立声道的耦合坐标。对参与耦合的声道的编码与对声道的编码一样,都使用了包含指数和底数的频谱包络形式。频率低于某一特定耦合频率能的范围为3kHz-20kHz,典型的是使用10kHz)时被编码成独立声道合频率
  时被编码成耦合坐标。当耦合频率为10kHz时,指数和底数的数据率几乎减半。每个耦声道中有一半的指数和底数被丢弃。只有参与耦合声道的指数和底数以及比例因子才被传输图11.23A所示为三个声道进行声道耦合的例子。相位是经过调整的,目的是在把各个声道加总在一起时防止出现对消。单声道的耦合后声道是把高于耦合频率的输入耦合声道频谱系数
  起来。各个输入声道及耦合后声道中每个临界频带内的信号能量被计算出来,用于确定耦合坐标比例因子。每个耦合后声道的每个频带内的能量除以参与耦合声道的每个相应频带中的能量。因此这些比例因子表示了解码器为重建出具有原始能量的频带,需要对参耦合的声道中的频带进行多大程度的缩放。比例因子的动态范围可以从-132~+18dB,分辨率在0.28-0.53dB之间。可以使用1~18个频带,典型情况是使用14个频带。在解码中