文本阅读:
620数字音频技术(第6版)
版本2也提供了低延时(LD)的音乐和语音音频编码(AAC-LD)。LD在实时双向通信是很有用的,在这种情况下,低等待时间至关重要;在48kHz时总的延时从1294ms降低到20ms。不过,编码效率会适度降低,一般来说,与AAC主描述文件相比会有大约8kb/s每声道的差距。用另一种方式来看,LD编码的性能与64kbit/s每声道的MPEG-1/2层Ⅲ编码相当。
在LD编码中,帧长从1024采样点减至512采样点,或从960采样点减至480采样点,滤波器组窗尺寸也被减半。不允许进行窗切换,用于块切换的超前缓冲区也被取消。不过,为尽可能降低瞬态信号引起的预回声人造声,可以使用TNS与窗型自适应。对于瞬使
用低交叠的窗来替代用于非瞬态信号的正弦窗。比特池的使用受到了限制,甚至被完全取消。
采样频率最高允许到48kHz。
版本2定
种名为"谐波与独立谱线加噪声(Harmonic and| ndividual Lines plu Noise,HlLN)"的编码工具。HN是一种参数编码技术,它使用各种声源模型来编码音频号。图15.10所示为编码器。各个音频采样点帧先被加窗并相互交叠;在采样频率为16kHz时,帧长的典型值为32ms。音频信号被分解成各个独立正弦,输出的是各个正弦参数以及一个残差
各个成分的声源模型的参数被估计出来;这些正弦参数被分成谐波成分和正弦成分,而残差信号则按照一个噪声成分进行估计。为了编码效率,具有相同基频的正弦被编组成一个单一的具有谐波的乐音,而其他正弦则会被单独处理。例如使用一个全极点LPC合成滤波器的频率响应进行频谱建模,用它来表示谐波乐音和噪声成分的频谱包
成分要进行感觉量化;为了降低比特率,只有听觉上最重要的成分才被编码。H|LN用于甚低比特率,其典型码率为4kbit/s-16kbit/s,并支持可伸缩比特率使用H|LN编码后,解码端可以无需专门的效果器就能改变播放速度或音高。HILN可以与H∨XC语音编解码器联合使用。
参数编码
量化】
编组成
谐波成分
特流
音频
独立正弦
特流复接·输出
的提取
噪声
量化
R参数提取
MPEG-4标准的版本2规定
N参数音频编码器,它使用
声源模型用于音频信号的编码