数字音频技术(第6版) 644

文本阅读：
　　第15章电信与互联网音频617
　　的描述（比如对多个流进行混音和为音频场景添加效果等）也可以传送。
　　与其他内容一样，MPEG-4中的音频是在一种面向对象的基础上定义的。一个音频对象可以被定义为任何可闻的语义实体，比如一个人或多个人的声音，或者一件乐器或多件乐器的声音等。音频对象可以是单声道或多声道录音，多个音频对象可以编组或混音在一起音频对象可以是一个以上的音频信号，例如
　　多声道MPEG-2音频比特流可以被编码
　　成一个对象
　　MPEG-4也定义了各种音频构成功能。这能描述音频对象的各个方面，比如同步、路由混音、音调控制、采样速率转换、混响、空间定位、镶边、滤波、压缩、限制、动态范围控制以及其他各种特征
　　MPEG-4的结构音频（Structured audio）工具用于解码输入数据并产生输出声音。解码使用了一种名为结构音频乐队语言（Structured Audio Orchestra Language，SAOL，与单发音相同）的合成语言。这是一种使用MPEG-4进行音乐合成与效果后期处理的信号处理语言。SAOL与 Music v音乐合成语言类似，它基于多个振荡器模型之间的相互用。SAOL定义了一个由多件"乐器（Instrument）"组成的"乐队（Orchestra）"，这器"是从比特流中下载的，而不是固定在解码器中的乐器可以是一个信号处理原语
　　的硬件或软件网络，能对具体的声音进行仿真，比如那些自然原声乐器的声音。下载比特中的"乐谱（Score）"或"手稿（Script）"用于控制这个合成。一份乐谱就是各种命令的一套按时间排序的集合，它在具体的各个时刻调用不同的乐器，从而产生一段音乐演奏或音响效果
　　结构音频采样库格式（Structured Audio Sample Bank Format，SASBF）描述的是一种存储了各种具体乐器声音的波表，它能以非常低的数据速率进行重放。乐谱描述被下载到一种名为结构音频乐谱语
　　uctured Audio Score language，SASL）的语能创建新的声音
　　并能包含额外的控制信息来修改现有的声音。作为另一种选择，M|D|也可以用来控制队。"波表库格式"也得到了标准化，因此用于波表合成的声音样本以及简单的处理（比如滤波器、混响和合唱效果）也是可以下载的
　　PEG-4定义了一种描述各种合成方法的信号处理语并没有把某一种合成方法作
　　为标准。因此，任何合成方法都可以被包含在比特流中。不过，由于这种是被标准
　　的，因此所有遵从MPEG-4的合成音乐在每个MPEG-4解码器上的声音听起来都是一样的EG-4也定义了一种文本-语音转换功能。文本被转换成一串语音符号，并从一个数据库中提取出相应的合成单元，随后这些单元被连接起来，合成为输出语音。这个系统也能从原始语音中利用原始语调（比如音高轮廓线和音素存续时间）合成语音，能合成出语音与面部动画相配合，通过使用文本和嘴唇形状信息让语音与影片同步，并能改变速度、音量以及