「数字音频技术(第6版)」 返回上级

  • 数字音频技术(第6版) 511 数字音频技术(第6版) 511
      484数字音频技术(第6版)   等很多软件包中的语音编解码器。CELP的流行有一部分原因是它能在一定范围的比特率下都工作得很好,比如从48kbit/s16kbit/s(G.728   CELP算法是基于线性预测的。它主要通过在编码器和解码器中保存用于不同激励信号的多个码本来改进   简言之,编码器对输入信号进行分析,在其码本中找到一个相应的激励信号,并输出一个作为标定的索引1代码。解码器使用...
  • 数字音频技术(第6版) 512 数字音频技术(第6版) 512
      第12章用于传输的语音编码485   显然,因为使用了一个码本,所以只有有限数量的可能残差解码器包含一个增益级   用于对残差信号进行缩放,还包含一个长时预测滤波器和一个短时预测滤波器。长时预测滤器包含了各个过往激励的经过时间平移的版本   了一个自适应码本的角色。从原始语音   信号中减去合成出来的信号,所得差值被施加到一个感觉加权滤波器上。重复进行这一系列操作,直到算法确定出能够生成最小残...
  • 数字音频技术(第6版) 513 数字音频技术(第6版) 513
      486数字音频技术(第6版)   的逆。这就降低了各个频谱谱峰的影响,较大的谱峰对误差信号和参数估计的影响将不成比例。   图1211A所示为一个经过简化的CEP编码器。合成分析过程以线性预测分析生成的一套初始编码参数开始,从而确定声道系统的冲激响应。码本激励生成器和线性预测合成滤波器构成了个本地解码器。它们输出一个合成后的语音信号,随后从原始语音输入信号中减去该信号。这差形成了一个误差信号,...
  • 数字音频技术(第6版) 514 数字音频技术(第6版) 514
      第12章用于传输的语音编码48   CELP解码器可以被看成   成器,它使用了一种语音合成技术来输出语音   1211B所示为一个基本的CELP解码器。这个解码器接收量化后的激励参数和LPC参数。增益音高和音高延时信息用于共振峰滤波器。表示声道的各个LPC系数用于重建线性预测滤波器码本使用传送过来的索引代码找到相应的激励残差,并用这些信号去激励共振峰滤波器。共振峰滤波器的输出被运用到线性预测...
  • 数字音频技术(第6版) 515 数字音频技术(第6版) 515
      488数字音频技术(第6版)   础重新计算码本中的各个矢量。这个过程会一直重复,直到量化噪声被最小化通过使用两个小码本代替一个大码本可以让CELP算法避免使用大码本所遇到的问题。   具体地,可以如图12.12所示那样使用固定码本和自适应码本。固定(新)码本由算法设者设置,它包含了表示残差信号的一个音高周期所需的各个表项。它生成的信号分量是无法先前各帧推导出来的,这些成分本质上是任意和随机的...
  • 数字音频技术(第6版) 516 数字音频技术(第6版) 516
      第12章用于传输的语音编码489   参数提取   音频输入   马本比较   出   编码   本   代码输入   码本恢复   音频输出   码本   图12.13:矢量量化(VQ)对一组元素之间的参数关系进行分析,对整组进行编码要比对具体元素进行编码更有效率。VQ在CELP和其他编解码器中得到了使用。(A)Q编码器。(B)VQ解码器1284CELP编解码器的一些例子   如前所述,有多...
  • 数字音频技术(第6版) 517 数字音频技术(第6版) 517
      490数字音频技术(第6版   传输的比特流还包含一个或多个嵌套的较低速率比特流,它们可以被提取出来并解码。在很多情况中,嵌套的增强比特流以及它们所导致的更高的比特率可以用于改善核心层比特流的声音质量。例如,嵌套层可以减少编码人造声或是允许更高的采样频率以实现更宽的音频带宽可伸缩编码器包含有多个增强编码器,并在这些增强编码器内部还嵌有一个核心编码器缩编码器输出一个多层数据结构,例如,一个三层比...
  • 数字音频技术(第6版) 518 数字音频技术(第6版) 518
      第12章用于传输的语音编码491   的多路复接音频数据来传输,并且每个复接层都被置于不同的实时协议(Real time pr RTP)包中。这样,差异化服务就能区分出各个层。   G.729.1与MPEG4可伸缩编解码器很多语音编码器中都使用了可伸缩功能。TUTG.729.1|P语音(Voice over IP)编解码器就是可伸缩编解码器的一个例子。它在比特率、带宽和复杂度上都是可伸缩的。G...
  • 数字音频技术(第6版) 519 数字音频技术(第6版) 519
      492数字音频技术(第6版)   个窄带增强层(38个CELP比特和2个FEC比特),使用了级联的CELP参数和信号分类信息层3(14   是一个宽带扩展层(33个 TDBWE比特利比特),带有时域带宽扩展参   数和相位信息。层4层12(高于14kbt/s)是宽带扩展层(带有DAC比特和5个FEC   比特的TDAC1,此后的TDAC2~TDAC9带有40个TDAC比特),带有时域混叠消除参...
  • 数字音频技术(第6版) 520 数字音频技术(第6版) 520
      第12章用于传输的语音编码493   G.7291编解码器的最大延时为489375ms,这其中有40ms源自TDAC加窗。在其他模中延时有所降低。例如,可以实现25ms的延时。计算复杂度根据比特率而变化。在32kbi/s下编码器/解码器的总体复杂度为每秒358加权百万次操对窄带干净语音的聆听评测表明,在8kb/s时G.729.1的平均主观评价分(Mean Opinion Score,MoS)要...