文本阅读:
404数字音频技术(第6版
点编号
00000000011000010000
111101111010000
0111010000
表10.4:来自于一个20bit音频文件的12个采样点,显示了有限的动态范围和分辨率。在本例中,可以使用简单的数据压缩技术让文件尺寸减少60%。(Craven和 Gerzon,1996在实际中,可以使用约有500个采样点的块尺寸,并把描述信息放置在每个块的头文件中。块长度可以根据信号的情况不断变化。一般地,因为瞬态信号会激发出更高的MSB,所以更长的块将不会对块中各个短暂的静音区间进行压缩。较短的块将会有相对更大的头文件开销。这种简单的监察对于具有柔和乐段的音乐来说可能会获得成功,但对于较响的、动态范围被高度压缩的音乐来说就不会成功了。并且,在这两种情况中峰值数据速率都不会被压缩。在一些情形中,一个数据块中可能含有几个音频峰值。相对来说只有少数高幅度采样点需要较长的字长,而所有其他采样点都只需要较短的字长。霍夫曼编码(也许使用一个查找表)可以用来克服这一点。常见的低幅度采样点将用短码字编码,而较不常见的高幅度采样点将用更长的码字编码。为了进一步改善性能,可以建立多个码字查找表并基于当前块中的数值分布进行码表的选择。音频波形在幅度上的统计特性往往会遵循拉普拉斯分布,与一个简单的字长缩减方案相比,恰当的霍夫曼码表可以让比特率降低1.5bt/样本/声道预测策略可以产生更大的编码效率。在前例中
16bt的数字有如下十进制取值
57,+97,+102,+79,+35,-18,-67,-97,-102,-79,-35和+18。相继采样点之间的差为+30,+5,-23,-44,-53,-49,-30,-5,+23,+44和+53。编码器可以传输第一个数值
+67,然后传输后续各个采样点之间差值,因为各个差值比采样点值本身要较短的
长(7bit而非8bit)。这种编码可以用一种简单的预测编码-解码策略实现,如图10.27所其中符号z表示一个采样点的延时。如果数值+67先前已经输入进来,并且下一个输入值为7,则数值+67用来作为对当前采样点的预测值,预测误差变为+30,并且该预测误差被传输。