数字音频技术(第6版) 501


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 501
前一篇:数字音频技术(第6版) 500 下一篇:数字音频技术(第6版) 502
文本阅读:
  474数字音频技术(第6版
  124声源一滤波器模型
  很多语音编解码器中使用的声源-滤波器模型都对人类声道进行了一种近似,因此能产生类似语音声音的信号。这种设计方法也导致了使用这样-一个模型的语音编解码器在音乐信号上只能生相对很差的性能。声源-滤波器模型基于这样的观测事实:声道在功能上就像一个时变滤波器,它在频谱上对不同的语音声音进行塑形。不同的语音编解码器使用的声源-滤波器模型方法可能是相似的,但这些编解码器在如何创建以及如何编码传输这些语音参数上各不相同。
  声带是人类语音的一个最基础重要的声源,它被建模成一个在频谱上平坦的激励信号构成语音声音的各个音位是这个声源激励信号被声道滤波器在频谱上整形的结果。用于浊音(比如元音)的激励信号是周期性的。这个信号的特点是具有规则分布的多个谐波(在时域上的脉冲串)用于摩擦音(比如
  s"和"sh")的激励信号类似于高斯白噪声。用于浊摩擦音(比如"v"和"z")的激励信号同时包含噪声和谐波。
  12.5通道、共振峰和正弦编解码器
  1939年问世的通道声码器(Channe| coder)是最早的语音编解码器之一(语音编解码器有时候也被称为声码器或人声编码器)它证明了语音能够以多个频率成分的形式被高效传输。图124A所示为一个通道声码器的分析编码器。对输入的语音信号一次只考察一帧(例如10~30ms),这帧信号被多个固定的带通滤波器分割成多个频带。例如,一种设计可能使用在0-4kHz范围内非线性分布的20个频带。在频率较低处频带也较窄。对每个子带通道中的能量幅度进行估计,并以一个较低的采样频率输出。并且,每帧都标以浊音或清音对于被标以浊音的帧,还要估计出它的音高周期。因此输出的是两类信号:幅度信号和激励参数。幅度信号可以按对数规律量化,或是(比如)使用 ADPCM编码对相邻频带之间的对数差进行量化。清音帧的激励参数可以用指示该状态的信号比特来表示。浊音帧被标记为浊音,并且使用(比如)8bt字对音高周期进行量化图124B所示为一个通道声码器的合成解码器。各个激励参数用于确定激励信号的类型。比如,从白噪声生成清音帧。从经过音高调整的谐波激励生成浊音帧。这些声源被施加到每个通道上,并对它们在这些子带的每个子带中的幅度进行缩放。把这些子带加起来就产生了语音输出。由联合语音研究机构(Joint Speech Research Ur RU)开发的版本
  是现代语音声码器的一个例子。它使用了19个子带,对相邻子带间的差值进行编码,工作在24kbit/