数字音频技术(第6版) 443


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 443
前一篇:数字音频技术(第6版) 442 下一篇:数字音频技术(第6版) 444
文本阅读:
  416数字音频技术(第6版)
  编码器分析每个子带中的能量,确定哪个子带包含可闻信息。本例中这个层1编码器没有使用FFT侧链或心理声学模型。该算法计算出每个子带在8ms时间段(12采样点)内的平均功率。各个子带中以及临近子带中的遮蔽声级被估算出来。最终使用的是最小的门限声级。计算岀每个子带中的峰值功率级并与遮蔽声级相比较。为每个子带计算出SMR值(最大信号与遮蔽门限之差),并用它来确定为某一子带()分配的比特数N,从而使N≥(SMR-1.76)/6.02。为了在一个给定比特率之内对信号进行最优编码可以采用比特池。被量化的数值形成一个底数,它的可能范围为2-15因此,编
  码字的这部分可实现的最大分辨率为92dB。在实际中,除了信号强度以外,底数值也会受到波形图样变化率和可用数据容量的影响。无论如何,每个采样点周期都要计算新的底数值。
  音频样本经过归一化(缩放)以实现对量化器动态范围的最佳利用。具体地,6bit的指数形成了一个比例因子,它由
  中信号的最大绝对幅度决定。这个比例因子扮演了个乘数的角色,它能对各采样点的增益进行最优调整以便于量化。这个比例因子的范围
  -118~+6dB,步长为-2dB。因为音频信号与采样频率相比是慢变化的,所以遮蔽门限和比例因子在每个12采样点构成的组中只需要计算一次,从而形成一个帧(12采样点每子带x
  2子带=384采样点)。对于每个子带,12个采样点的绝对峰值与一个比例因子表进行比较选用其中最接近(次高)的常数。其他采样点值用这个因子进行归一化,在解码期间这个因子作为乘数用以计算出正确的子带信号声级。
  这里使用了一种浮点表示方式。一个字段包含了一个6bit的定长指数,另一个字段包含了
  5bit的变长底数。每个12子带采样点块都具有不同的底数长度和数值,但共享数。详细说明一个底数长度的分配信息被置于每帧内的一个4bt字段中。由于在子带内表示每个采样点的总比特数是一个常数,因此这个分配信息(与指数一样)也是每采样点仅传送一次。当一个子带不被编码时就传送一个空分配值,在这种情况下,该子带既没有传送指数值也没有传送底数值。15bit的底数将产dB的最大信噪比。6bit指
  数能传送64种数值。不过,全为1的图样是不使用的,另外还取值被作为参考数值。
  因此有62个数值,每个表示2dB的步进台阶,理想情况下总共有124dB。这个参考数值用来把这个范围分成两个部分,
  部分从0
  8dB,另一个部分从0~+6dB。6dB的裕量空间是必需的,因为单个子带内的成分可能具有比宽带复合音频信号高6dB的峰值幅度因此,在本例中宽带动态范围等效于19bit的线性编码。
  完整的帧包含同步信息、样本比特、比例因子、比特分配信息和控制比特采
  样频率信息、加重等)。一帧中的总比特数(两个声道384采样点,时长8ms,采样频率1z)为3072。这将产生384kbit/s的比特率。在加入了纠错和检错码以及调制以后,传输