数字音频技术(第6版) 503


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 503
前一篇:数字音频技术(第6版) 502 下一篇:数字音频技术(第6版) 504
文本阅读:
  476数字音频技术(第6版)
  共振峰语音编解码器是另一类语音声码器,它改进了通道声码器的效率。共振峰声码器并不是对
  频带中所有的频谱信息进行编码,而是仅对那些最显著最有意义的部分进行编码。对于浊音来说,人类声道有一些自然的共振频率,它们被称为共振峰。这些共振峰表现为频谱包络上的一些极大值。一般来说,在3kHz以下有三个显著的谱峰。图125A所示为共振峰声码器的分析编码器。编码器逐帧地鉴别出各个共振峰。这是通过共振峰跟踪来完成的,也就是说通过在频谱包络中寻找各个峰值来完成。编码器随后对共振峰的频率和幅度进行编码。与通道声码器一样,清浊音标记和音高参数也要传送图12.5B所示为共振峰声码器的合成解码器。激励信号是基于清浊音标记和音高参数生成的,并用于对共振峰的幅度信息进行缩放。这就是输送给可调带通滤波器的输入这些滤波器运用共振峰频率信息进行了调谐,并且它们的输出被加到了共振峰跟
  踪中遇到的困难--比如当各个谱峰与各共振峰不相关时,会导致糟糕的性能。因此在语音编码中的应用相比,共振峰声码器更广泛地应用于语音合成中(此时各共振峰是已知的)
  正弦语音编解码器使用正弦模型对语音进行编码。在这个编解码器中,激励信号由各个正弦成分的和构成,这些正弦成分的幅度、频率和相位可以被改变,以适应这个源如,对清音语音要使用具有随机相位的多个正弦成分。对于浊音语音,需要使用同相的具有谐波关系的多个正弦成分,并把它们放置在音高频率的各个整倍数处对输入给编码器
  的语音信号施加一个傅里叶变换,其输出可以确定信号中的各个谱峰。并且也要获得清浊音标志和音高信息。幅度被进一步变换到倒谱域进行编码。在解码器中,通过一个反变换把倒谱、清浊音标志和音高参数恢复成正弦参数,然后使用这些正弦的幅度、频率和相位来合成出语音输出。
  各个共振峰的频率
  频谱分析
  峰提取
  各个共振峰的幅度
  音高估
  高
  清浊音判决
  清浊音标记