文本阅读:
614数字音频技术(第6版)
Profle)提供了使用SAOL并由乐谱驱动的合成(下文将述)波表合成以及一个能在甚低特率下生成语音的文本
接口。语音描述文件(Speech Profile)
提供了一种甚低比特率的参数语音编码器--谐波矢量激励编码(Harmonic vector excitati Coding,HVXC),还提供了一个CELP窄带/宽带语音编码器。可伸缩描述文件(Scalable Profile)是语音描述文件与合成描述文件的一个超集,为互联网和窄带音频数字广播(
ADB)等网络提供可伸缩的语音与音乐编码。比特率范围从6kbit/s~24kbit/s,带宽在3.5kHz~9kHz之间。主描述文件(Ma e)是其他三个
描述文件的一个超集,提供了用于自然音频编码与合成音频编码的各种工具。MPEG-4音频编码器的一般结构如图15.7所示。可以使用三种通用类型的编码。参数编码模型对于低比特率的语音信号和低比特率的具有丰富谐波的独奏乐器的音乐信号是很有用的。CELP编码使用了一个声道模型用于语音编码,并使用了量化噪声的频谱包络,它能跟踪音频信号的频谱包络。还可以使用类似在MPEG-1和MPEG-2AAC中的时频编码。
参数
音
输出
预处理
分离
编码核
复接
流
信号分析
时频
编码朽
图15.7:MPEG-4音频编码器使用三种一般类型的编码算法参数式的谐波矢量激励编码(H∨XC)支持比特率在2kbi kbt/s的语音编码,其
推荐的工作比特率为2kbit/s-4kbit/s,而CELP编码的工作比特率为4k
24kbit/。在
可变比特率模式中,可以实现大约1.2kbit/s的平均比特率。HVXC编解码器允许用户改变速度和
CELP编解码器需要通过使用一个效果器工具才能支持可变的速度。在HVXC编中,浊音段落用线性预测编码(LPC)残差信号的谐波频谱幅度表示,清音部分则由一个矢量激励编码
tor eXcitation Coding,WXC)算法表示。在CELP编码中,可以使用8kHz和6kHz两个采样频率来分别支持窄带语音和宽带语音。CELP采用了两种不同的激励模式:多脉冲激励(MultiPulse Excitation,MPE)和规则脉冲激励(Regular Pulse Excitation,RPE)。支持窄带模式(8kHz采样频率)和宽带模式(16kHz采样频率)。合成编码被称为合成-自然混合编码(Synthetic-Natura|-Hybrid-Coding,SNHC)。表15.5所示为MPEG-4的一些音频编