数字音频技术(第6版) 380


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 380
前一篇:数字音频技术(第6版) 379 下一篇:数字音频技术(第6版) 381
文本阅读:
  第10章低比特率编码:理论与评价353
  耳朵-大脑擅长使用不同的方法来确定不同声源的空间位置。当声音从一侧产生时,人耳与大脑会利用诸如强度差、波形复杂度和时间延时等线索来确定声源是从哪个方向产生的。当两只箱产生了相等的声音时,人耳与大脑不会认为声音是来自于左和右两个声源,而是把声音解释成来自于位于两个声源中间的一个位置。因为两只耳朵接收到的信息相同,所以声音被顽固地解码成来自于正前方。类似地,立体声不过就是两个不同的单声道而已。其余的都仅仅是错理声学在复杂度上可能没有界限。比如,考虑图10.2A所示的乐音。通过耳机向右耳和左耳播放一个音阶。大多数听者将会听到如图102B所示的模式,音高序列是正确的被听成了反向进行的两条不同的旋律。高音似乎来自右耳,低音似乎来自左耳。当调换了耳机的左右声道以后,先前播放低乐音的声道现在听上去播放的是高乐音,反过来也是。其他听者可能会认为低音在右耳,高音在左耳,不管耳机是如何佩戴的。令人好奇的是,右利手听者往往会认为高音在右侧、低音在左侧;左利手(俗称"左撇子")则往往不这样认为还有其他听者可能只听到高音,但却很少甚至没有听到低音。在这种情况下,大多数右利手听者能听出所有乐音,但只有一半的左撇子能听出所有的乐音LR LRR L R
  右耳
  耳
  图10.2:当一系列两通道的乐音呈现给一个听者时,对声音的感知可能是与用右手或左手的习惯有关的。(A)
  现给听者的乐音。(B)最通常被感知到的错觉。(Deets人耳仅能从一个音频信号中感知到一部分信息,被感知到的这部分就是感觉熵只有1.5bit每采样点那么低。熵较小的信号可以被有效地缩减;熵较大的信号则不能被有效地缩减。基于这个原因,编解码器应该输出一个可变的比特率,即当信息很贫乏时比特率低而当信息很丰富时比特率高。输出是可变的,因为虽然信号的采样率是恒定的,但波形中的熵却不是恒定的。使用心理声学可以把信号中不相关的部分移除,这就是所谓的数据压缩原始信号不可能被精确重建。数据压缩系统减少了熵,通过对感觉熵进行建模,就可以仅移除不相关的信息
  压缩就可以是不可闻的。感觉音乐编解码器不会试图对音乐的声源进建模(对于音乐编码来说这是一项困难或是不可实现的任务)取而代之的乐信