-
数字音频技术(第6版) 641
614数字音频技术(第6版) Profle)提供了使用SAOL并由乐谱驱动的合成(下文将述)波表合成以及一个能在甚低特率下生成语音的文本 接口。语音描述文件(Speech Profile) 提供了一种甚低比特率的参数语音编码器谐波矢量激励编码(Harmonic vector excitati Coding,HVXC),还提供了一个CELP窄带/宽带语音编码器。可伸缩描述文件(Sca...
-
数字音频技术(第6版) 642
第15章电信与互联网音频615 码工具 码激励线性预测(Code Excited Linear Pred谐波矢量激励编码(Harmonic Vect HVXC 口 变比特率H 静音压缩 PEG2AAC主描述文 AAC低复杂度 描述文件 MPEG2AAC可伸缩采样速率(Scalable Sampling Rate,SsR)描述文件时( )描述文件 通用...
-
数字音频技术(第6版) 643
616数字音频技术(第6版) 复,直到产生所有的增强层。解码器可以使用基层来产生基本的音频质量,或是加入后续的增强层来改善音频质量。可伸缩性用于改善信噪比或带宽,也能让单声道变为立体声。虽然MPEG4在可伸缩性上施加了一些限制,但还是可以实现很多编码配置。例如,可以让变换域加权的互交织矢量量化(TwinVO)和AAC编解码器都用于基层和增强层编码,也以让wnvQ或CELP编解码器用于基层编...
-
数字音频技术(第6版) 644
第15章电信与互联网音频617 的描述(比如对多个流进行混音和为音频场景添加效果等)也可以传送。 与其他内容一样,MPEG4中的音频是在一种面向对象的基础上定义的。一个音频对象可以被定义为任何可闻的语义实体,比如一个人或多个人的声音,或者一件乐器或多件乐器的声音等。音频对象可以是单声道或多声道录音,多个音频对象可以编组或混音在一起音频对象可以是一个以上的音频信号,例如 多声道MPE...
-
数字音频技术(第6版) 645
618数字音频技术(第6版 说话者的性别和年龄。此 支持不同的语言。TTS的数据速率从200bi些可能的应用包括人工说书人、在虚拟现实应用中作为各种化身的语音合成器、朗读报纸以及基于语音的互联网等。 可伸缩性意味着一个单一的音频比特流可以根据听者的互联网连接速度解码成各种不的带宽。一个音频比特流可以包含多个不同比特率的数据流。这个信号是以最低比特率编码的,然后编码信号与原始信号之间...
-
数字音频技术(第6版) 646
第15章电信与互联网音频619 输入时间信号 预处理 感觉模型 时域噪声整形 (长时预测 度/耦 特流 预 格式化 频比特流 感觉噪声替代 中间/两侧 片的算术编码 量化与编码选 图15.9:MPEG4通用音频编码器的框图,它带有对三种量化及编码表方法的选择。数据通路用粗实线标出制信号用细实线标出。
-
数字音频技术(第6版) 647
620数字音频技术(第6版) 版本2也提供了低延时(LD)的音乐和语音音频编码(AACLD)。LD在实时双向通信是很有用的,在这种情况下,低等待时间至关重要;在48kHz时总的延时从1294ms降低到20ms。不过,编码效率会适度降低,一般来说,与AAC主描述文件相比会有大约8kb/s每声道的差距。用另一种方式来看,LD编码的性能与64kbit/s每声道的MPEG1/2层Ⅲ编码相当。 ...
-
数字音频技术(第6版) 648
第15章电信与互联网音频621 版本2允许在AAC中用比特分片的算术编码(BitSic metic Coding,BSAC)作为 替代,这种编码有时候也被称为比特平面编码。BSAC在48kbit/s64kbit/s每声道的高比特率下性能最优,而在低比特率下的比特效率较低。BSAC用算术编码替代了对量化后频谱系数进行的霍夫曼编码,从而提供了小步长的可伸缩性。编码使用的是一种有符号幅度格式...
-
数字音频技术(第6版) 649
622数字音频技术(第6版 如果只对这些比特平面中的一部分进行解码则会得到有损的重建(但也要优于仅进行AAC核解码 1564MPEG4编码工具 MPEG4标准包含了先前的一些MPEG音频标准。具体地,在MPEG4中,MPEG2AAC用于高质量音频编码。如前所述,MPEG4为MPEG2AAC加入了一些专门工具,用以实现更高效的编码。当比特率低于48kbi/s时,感觉噪声替代(Perc...
-
数字音频技术(第6版) 650
第15章电信与互联网音频623 整形。最后对各个子矢量进行矢量量化。通过对码本索引选择的最优化使量化失真被降至最低。TNS和LTP工具也可以与 Twin VO一起使用。 MPEG4音频无损编码(Audio Lossless Coding,ALS)工具允许对分辨率高至24bit和采样频率高至192kHz的音频信号进行压缩和比特级准确的重建。它使用前向自适应线性预如莱文森德宾(Levins...