文本阅读:
468数字音频技术(第6版
成年男性、成年女性和儿丿童的语音声音具有非常不同的特点。并且,不同的语言也呈现出不同的编码需求。在一个次要的程度上,语音编解码器应该能传送非语音信号,比如双音多频(Dua Multi-Frequency,DTMF)信令音和音乐。虽然对输出信号的保真度并没有期待,但它应该能供名义上的音质
音编解码器至少应该能够在不产生过度烦人的人造声的情况下传送音乐语音编解码器应该允许较低的算法复杂度,这直接影响着功耗和成本。一般来说,各种合成一分析技术在计算量上是更为密集的,因此对它们的设计要特别小心。其他功能(比如回波消除和带宽增强)也会增加复杂度。从具体实现的角度说,一个语音编解码器应该是可实现的,并能提供良好的性能,同时具有较低的计算复杂度和较低的内存容量要求。
语音解码器引入的延时应该是最小限度的。所有编解码器都会引|入一个时间延时,这是信号从进入编码器到从解码器输出所用的时间。在传输路径上会出现这种延时,因为在编和解码过程中要进行算法信号处理(和CPU处理)一个实时运行的编解码器必须把这个编码吞吐延时降至最低限度。对于语音通信来说,40ms的编码延时被认为是可以接受的。低延时编解码器在运行时的延时可以低于5ms。不过,外部的通信网络会给任何信号传输添力额外的延时。编码器中的数据缓存是延时的一个主要贡献者。任何基于帧的算法都会招致有限的延时。语音编解码器对输入采样点构成的帧进行操作,例如160~240个采样点(2030ms)可以在进行编码之前被累积起来。在大多数编解码器设计中,更大的处理延时能实现更多的比特率缩减。后向自适应编解码器有一个本身固有的延时,这个延时是基于激励帧的尺寸的,延时可能在1~5ms之间。前向自适应编解码器也有一个本身固有的延时,它是基于短时预测器的帧尺寸和内插的,延时可能在50~100ms之间。在语音邮件之类的非实时用中,编码延时并不是什么重要的问题。
编解码器
够尽可能多地容许传输信道引1入的各种错误,这些错误会导致喀哒声或砰声。前向错误纠正技术能提供强大的错误保护,但会需要显著的冗余和相应更高的比特率纠错编码也会引入开销数据和额外的延时。
很多移动语音传输系统都使用非均等错误保护(Unequal Error Protection P)把传输
比特错误所造成的影响降到最低。对于重要性高的数据给予更广泛的纠错,对重要性低的数据则很少甚至不进行纠正。可伸缩系统(在后文中描述)可以很容易地实现这种方式,因为数据的等级架构已经进行了优先级设置,核心数据被保护,而增强层数据则可能未受保有时侯,聆听测试可以用于确定数据类型对误差的敏感性。
图12.1所示为一个语音编码系统。它包含与前面章节介绍的音乐编码系统相同的基本构建模块。例如,编码器在功能上包含低通滤波器、采样保持电路和模拟-数字转换器。类似地,解码器包含数字一模拟转换器和输岀低通滤波器。在历史上,电话系统已经提供狭窄的音频带宽,它从300-3400Hz,并使用了8kHz的采样频率。这能实现良好的可懂度