数字音频技术(第6版) 514


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 514
前一篇:数字音频技术(第6版) 513 下一篇:数字音频技术(第6版) 515
文本阅读:
  第12章用于传输的语音编码48
  CELP解码器可以被看成
  成器,它使用了一种语音合成技术来输出语音
  1211B所示为一个基本的CELP解码器。这个解码器接收量化后的激励参数和LPC参数。增益音高和音高延时信息用于共振峰滤波器。表示声道的各个LPC系数用于重建线性预测滤波器码本使用传送过来的索引代码找到相应的激励残差,并用这些信号去激励共振峰滤波器。共振峰滤波器的输出被运用到线性预测合成滤波器上,产生输出的合成语音信号。这要通过使用各个过往采样点的线性组合预测输入信号来完成。与任何预测一样,这里有一个预测误差线性预测力图提供最准确的预测系数并因此令误差信号最小。莱文森-德宾算法可以用来进计算,同时还要采用其他技术确保滤波器是稳定的。
  128.2CELP码本
  像CELP这些线性预测编码器要生成一个残差信号。如果该信号在解码器中作为激励信号使用,则语音输出将与原始的加窗语音完全一样。不过,此时的比特率将高得让人无法承受。因此,这个残差信号会以更低的比特率编码,被编码的残差信号越接近原始残差信号编解码器的性能就越好。CELP编解码器使用了多个码本,用以提供高的语音质量,同时维持比特率。
  CELP编码器包含的码本是由预先计算出来的各个激励所构成的表格,每个激励都有一个辨识索引码字。编码分析器对残差信号与码本表格中的各项进行比较,选择最为匹配的项。它应该提供最低的量
  差,因此能从听感上改善编码。随后编码器就可以高效地只发送代表激励表项的索引1代码。这个系统之所以高效是因为只有一个码字以及一些辅助信息被传送出去
  在一个大型码本中对所有表项进行测试需要相当可观的计算量和时间。CELP设计中的很多工作都用来让这一计算负荷最小化。例如,在构建码本时就让它的结构具有更高的计算效率。并且也要对码字进行改变以降低其计算复杂度。例如,码字可以与CELP滤波器进行卷积重叠码本在计算和存储需求方面是高效的,这种码本不是分开存储各个码字,而是可以把所有表项存储一个阵列中,让每个码字值与下一个码字值重叠。
  般来说,单级码本的尺寸范围可以从256(8bit)-4096(12bit)个表项。至少从理论上说,码本如果大到足以容纳所有可能的残差信号的话,编解码器的性能是可以得到提升的。
  但是,码本越大,搜索操作所需的计算量和时间就越多,确定一个索引所需码就越长。具
  体地,码本必须要为每个话音音高准备一个单独的代码让码本大得效率低下。使用统计
  方法生成(训练)码本可以改善搜索。例如,经常使用LBG聚类算法(由 Linde、Buzo和命名)来生成码本。这种算法以一套码本矢量开始分配训练矢量,并以被分配的训练矢量为基