数字音频技术(第6版) 378


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 378
前一篇:数字音频技术(第6版) 377 下一篇:数字音频技术(第6版) 379
文本阅读:
  第10章低比特率编码:理论与评价351
  脑的这两个半区松散地对大脑的功能进行了划分。这里有一些重叠,但从耳朵到大脑半球的主要连接是交叉的,右耳被连接到左半脑,左耳被连接到右半脑。左半脑处理大多数语音(语言)信息,因此,理论上右耳对口头文字的感知更好。另一方面,右颞叶主要负责处理旋律性(非语言)信息。因此,我们可以用左耳更好地感知旋律,程师们对音频事件的物理测量很熟悉,但心理声学还必须考虑对感知的测量。强度是对幅度大小的一个客观的物理测量。响度是由物理学家乔治·海因里希·巴克豪森(Georg nrich Barkhausen)首先引入的,它是对与强度和频率均有关的幅度大小在感知上的描述。
  响度不能依靠经验测量,而是要由听者的判断来决定。响度可以用被称为"方(phon)"的度级来表示。1方是一个等响的1kHz乐音的强度,用 dB SPL表示。响度也可以用"宋
  (Sone)"表示,它描述的是响度比。1宋对应的是1kHz的正弦纯音在40 dB SPL时的响度。
  个2宋的响度对应的是50 dB SPL。类似地,用宋表示的响度的任何翻倍都导致声压级(SPL上10dB的提升。例如,响度比为64宋对应的是100dBSP耳可以适应很宽的动态范围。位于120 dB sPl处的痛阈所具有的声强度是位于0dB处的听觉门限所具有的声强度的1000000000000倍。人耳的灵敏度是卓越的,在3kHz限声音对耳膜造成的位移仅
  氢原子直径的1/10。为了表达上的方便,很显然在处理人耳这种极宽的动态范围时要使用对数尺度的分贝。人耳也是非常迅捷的,在听到一个最大响度的声音的500ms内,人耳能够灵敏到听见一个临界门限声音。因此,虽然人眼对于不的光强度只能进行很慢速的调节,并且在任何时候只能处理一个有限范围内的光,但人耳在其全频带中都能进行几乎是即刻的操作。并且,人眼可以感知到大约1/605的光的中断人耳则能检测到
  00s的中断
  虽然人耳的动态范围很
  其灵敏度是与频率有关的。最大的灵敏度出现在1kHz而相对较低的灵敏度出现在低频和高频。这要归因于压强传输函数,它是中耳构造本身固有的一个部分。通过测试可以得到如罗宾逊-丹森(Robinson-Dadson)曲线那样的等响曲线,如图10.1所示。每条等响曲线都描述了在听感上具有相同响度的一个频率范围。最低的等响曲线描述的是最低可闻域,即一个具有普通听觉能力的人在可闻频带范围内的各处所能感知到的最小声压级。例如
  刚刚可闻的30Hz乐音要比一个刚刚可闻的4kHz乐音响60dB。这种响应会随着声压级的变化而变化,声音越响,等响曲线响应就越平坦。等响曲线以方为单位,测量
  等响曲线的SPL。
  频率是一种直接的度量。音高则是一种主观的、感觉的度量。音高是一种复杂的特性它基于频率以及波形和强度等其他物理量。例如,如果一个200Hz的正弦波一开始声音柔然后又更响一些,那么大多数听者都会认为那个更响的声音具有较低的音高。事实为了维持听者对低频的一个恒定音高的主观估计,在频率上可能需要10%的增长。另一方面