文本阅读:
354数字音频技术(第6版
依照接收器-人耳-进行调整,使用心理声学模型来鉴别音频信号中不相关和冗余的内容。相反
语音编解码器使用了声源(即人的声道)模型,用以估计语音的各种特征这将在第12章介绍
传统上,音频系统的设计者们会使用各种客观参数作为他们的设计目标--平坦的频率响应、最小的可测量噪声等。感觉编解码器的设计者们认识到最终的接收方是人的听觉系统在心理声学的引导下,他们使用了人耳自身的性能作为设计的准则。毕竟,任何对音乐的体验,不管是通过模拟还是数字方式进行创建、传输和重现,都纯粹是主观的10.3人耳的生理机能与临界频带
人耳使用了机械过程和神经过程的一套复杂的组合来完成它的任务。具体地,人耳把声能转换成机械能,并最终转换成电脉冲发送给大脑,在大脑那里感知出声音中所包含的信息。人耳生理构造的简图如图10.3所示。外耳收集声音,其固有的褶皱有助于我们对方向性进行估定。耳道会在3kHz~4kHz附近产生共鸣,因此在这个频率范围内会有额外的敏感性,这个频率范围对于
的清晰度是很关键的。耳膜把声能转换成机械能,它在大约120
dB SPL时达到最大偏移量,在此之上耳膜就会曲解波形。中耳内的3块耳骨--俗称为锤骨砧骨和镫骨(这是人体内最小的3块骨头),提供了阻抗匹配,使空气中的声音能够有效地传入充满液体的内耳。前庭管并不影响听觉,但它是运动检测系统的一部分,提供平衡感盘绕成圈的基膜对声音的幅度和频率进行检测,这些振动被转换成电脉冲并作为神经信息着一束神经纤维传送给大脑。大脑对这
激的周期和沿基膜出现最大兴奋的点进行解码
以决定频率,在这个刺激周围的局部区域内的活动被忽略。
前庭管
耳蜗液
耳道
砧骨
基膜
听觉神经
耳蜗(为了图
说明而将其展开
中耳
内耳
10.3:人耳生理构造简图。为了图示更为清晰,盘绕成圈的耳蜗和基膜被拉直了