数字音频技术(第6版) 650


分类:相关阅读 / 「数字音频技术(第6版)」

数字音频技术(第6版) 650
前一篇:数字音频技术(第6版) 649 下一篇:数字音频技术(第6版) 651
文本阅读:
  第15章电信与互联网音频623
  整形。最后对各个子矢量进行矢量量化。通过对码本索引选择的最优化使量化失真被降至最低。TNS和LTP工具也可以与 Twin VO一起使用。
  MPEG-4音频无损编码(Audio Lossless Coding,ALS)工具允许对分辨率高至24bit和采样频率高至192kHz的音频信号进行压缩和比特级准确的重建。它使用前向自适应线性预如莱文森-德宾(Levinson-Durbin)自相关算法。编码器对自适应预测器系数进预测和量化,并使用量化后的预测器系数计算预测残差。这个残差再通过几种不同的莱斯ce)编码或其他编码变种中的一种进行熵编码。编码后的残差与各种边信息(比如码索预测器系数、CRCC校验和等)合并在一起,形成压缩后的比特流。解码器对熵编码后的残差进行解码,并使用预测器系数计算出无损的重建信号互联网流传输媒体联盟(Internet Streaming e,|SMA)已经定义了一种传输
  协议用于对MPEG-4内容进行流传输。该协议基于RTSP和SDP进行客户端-服务器的握手通信,并用RTP数据包进行数据传输。MP4和XMT文件用于实现编创工具与MPEG-4服务器之间的互用性。MPEG-4内容可以通过多种不同的方式传输,比如通过互联网的RTP/UDP、
  通过MPEG-2的传输流、通过ATM或是通过DAB。F| exMux是MPEG-4定义的一种复接工具它使用了建议标准H.23中定义的各种元素
  157MPEG-7标准
  标准名为"多媒体内容描述接口(Multimedia Content Descripti的目标与MPEG的那些描述压缩和传输方法的标准非常不同。MPEG-7提供了标准化的分析和描述方法用于刻画多媒体内容的特征。例如,它允许对大量数据中的多媒体内容进行更高效的识别、比较和搜索。|SO/EC15938标准对MPEG-7进行了描述,版本1于2001年最终定稿。
  标准中设计了很多搜索引擎,通过使用数据库管理技术在网络上查找文本和图片。不过些内容主要通过注释性的基于文本的元数据来识别,这些元数据描述了作品的一些外在方面,比如关键字、标题、作者或作曲者、创作年代等。这些元数据的创建通常都是手动完成的且基于文本的描述可能并不足以描述这个文件的所有方面。
  MPEG-7描述了多媒体中更内在的各种特征,并允许基于内容的检索。在音频的情况中MPEG-7提供了分析音频波形的方法,也提供了手动及自动提取基于内容的信息的方法,这些信息可以用来对信号进行描述和分类。这些描述符有时被称为特征矢量或指纹。从一个音频文件中获取这些描述符的过程被称为音频特征提取或音频指纹提取。
  件中可
  提取出各种不同的描述符。这些描述符可以包括调号、配器、旋律以及从内容本身得来的其他参数。