数字音频技术(第6版) 443

文本阅读：
　　416数字音频技术（第6版）
　　编码器分析每个子带中的能量，确定哪个子带包含可闻信息。本例中这个层1编码器没有使用FFT侧链或心理声学模型。该算法计算出每个子带在8ms时间段（12采样点）内的平均功率。各个子带中以及临近子带中的遮蔽声级被估算出来。最终使用的是最小的门限声级。计算岀每个子带中的峰值功率级并与遮蔽声级相比较。为每个子带计算出SMR值（最大信号与遮蔽门限之差），并用它来确定为某一子带（）分配的比特数N，从而使N≥（SMR-1.76）/6.02。为了在一个给定比特率之内对信号进行最优编码可以采用比特池。被量化的数值形成一个底数，它的可能范围为2-15因此，编
　　码字的这部分可实现的最大分辨率为92dB。在实际中，除了信号强度以外，底数值也会受到波形图样变化率和可用数据容量的影响。无论如何，每个采样点周期都要计算新的底数值。
　　音频样本经过归一化（缩放）以实现对量化器动态范围的最佳利用。具体地，6bit的指数形成了一个比例因子，它由
　　中信号的最大绝对幅度决定。这个比例因子扮演了个乘数的角色，它能对各采样点的增益进行最优调整以便于量化。这个比例因子的范围
　　-118~+6dB，步长为-2dB。因为音频信号与采样频率相比是慢变化的，所以遮蔽门限和比例因子在每个12采样点构成的组中只需要计算一次，从而形成一个帧（12采样点每子带x
　　2子带=384采样点）。对于每个子带，12个采样点的绝对峰值与一个比例因子表进行比较选用其中最接近（次高）的常数。其他采样点值用这个因子进行归一化，在解码期间这个因子作为乘数用以计算出正确的子带信号声级。
　　这里使用了一种浮点表示方式。一个字段包含了一个6bit的定长指数，另一个字段包含了
　　5bit的变长底数。每个12子带采样点块都具有不同的底数长度和数值，但共享数。详细说明一个底数长度的分配信息被置于每帧内的一个4bt字段中。由于在子带内表示每个采样点的总比特数是一个常数，因此这个分配信息（与指数一样）也是每采样点仅传送一次。当一个子带不被编码时就传送一个空分配值，在这种情况下，该子带既没有传送指数值也没有传送底数值。15bit的底数将产dB的最大信噪比。6bit指
　　数能传送64种数值。不过，全为1的图样是不使用的，另外还取值被作为参考数值。
　　因此有62个数值，每个表示2dB的步进台阶，理想情况下总共有124dB。这个参考数值用来把这个范围分成两个部分，
　　部分从0
　　8dB，另一个部分从0~+6dB。6dB的裕量空间是必需的，因为单个子带内的成分可能具有比宽带复合音频信号高6dB的峰值幅度因此，在本例中宽带动态范围等效于19bit的线性编码。
　　完整的帧包含同步信息、样本比特、比例因子、比特分配信息和控制比特采
　　样频率信息、加重等）。一帧中的总比特数（两个声道384采样点，时长8ms，采样频率1z）为3072。这将产生384kbit/s的比特率。在加入了纠错和检错码以及调制以后，传输