-
数字音频技术(第6版) 631
604数字音频技术(第6版 音频文件存档 指纹分析 音频文件元数据 训练模式 识别模式 未知的音频文件 纹分 指纹匹配 音频文件识别 图15.5:一个音频指纹系统能在两种模式下工作。训练模式用来积累一个指纹数据库。识别模式用于鉴别未知的音频文 能生成这个音频文件的指纹,并与存储在数据库中的指纹相匹配单的文件名可以很容易被改变,从而使文件的身份被模糊,...
-
数字音频技术(第6版) 632
第15章电信与互联网音频605 化对数据库的索引和搜索。当找到一个匹配结果时,要参照限来衡量这个匹配结果的 成活力,从而确定正确识别的似然度。MPEG7标准中规定了多种方法,用以实现音频指纹和其他相关功能。这些内容将在后文中介绍 15.5音频的流传输 当文件的尺寸被大幅降低。以至于接收它的速度已经快到可以直接播放时,这个文件就以进行流传输。在这种应用中,当接收信号的存储缓冲区被...
-
数字音频技术(第6版) 633
606数字音频技术(第6版) 按比例地分配每个连接的带宽,并不考虑实际需要多少带宽。因此,经过了高度压缩的文件能被分配了过多的带宽,使得效率变得低下。除了TCP以外还有另一种选择,就是用户数据报协议(User Datagram Protocol,UDP)。这是一个更简单的包传输它没有提供纠错 或验证。客户端必须为一个丢失的包发出请求,而不是自动接收到这个包。这有助于获得更好的吞吐量。R...
-
数字音频技术(第6版) 634
第15章电信与互联网音频607 Format,ASF)原生文件格式编码的。通过使用 Direct show AP的开放结构,媒体播放器(Med|a以支持各种文件类型,包括MP3、WAV Dl、QuickTime和MPEG,并支持使用MPEG4v.3进行视频流传输。此外,媒体播放器会自动检查输入流所用的编解码器版本并根据需要下载编解码器的新版本。所支持的媒体内容从3kbit/s的音频到6...
-
数字音频技术(第6版) 635
608数字音频技术(第6版) 以使用较大的网络数据包。这有助于提高效率,但避免了在解码音频中出现较大的空隙,因为一个丢包会在几秒的时间内产生多个小空隙,而不是产生一个单一的大空隙。随后的内插过程使用过去和未来的数据来估计丢失的内容,因此能够掩盖小的音频空隙。总体上,G2音乐编解码器能处理10~15的数据包丢失,同时让音频质量的下降维持在最低程理想情况下,编解码器既要提供较宽的频率响应,也要...
-
数字音频技术(第6版) 636
第15章电信与互联网音频609 与音频的流传输效果相比,这种方法更适合视频的流传为了能给不同的连接速率服务,可以创建多个音频文件,并让服务器传送最合适的比特率。如果这个带宽协商过程不是动态的,则服务器就无法根据用户在数据吞吐量上的变 (由于拥塞或数据包丢失)来进行调整。有了 Surestream,多个比特率不同的流可以同时编码,且合并成一个单一文件。此外,服务器可以检测带宽的变化,并在...
-
数字音频技术(第6版) 637
610数字音频技术(第6版 高效率方法。资源保留协议(Resource Reservation Protocol,RSVP)与RTP或RTSP一同工作对网路资源进行保留,以确保一个具体的端到端的服务质量。这样,音乐分发系统就能有效地把音乐发布给各个消费者 RealSystem G2支持两种类型的|P组播:返回通道(backchannel)和可伸缩(scalable返回通道组播使用了Re...
-
数字音频技术(第6版) 638
15章电信与互联网音频611 电影、文本、图形、面部动画、网页或是一个虚拟世界。场景描述提供场景中各个对 象之间的时间与空间关系。MPEG4把重点放在了甚低比特率以及编码比特流的可伸缩性」样就能在互联网和其他网络上工作。MPEG4也支持高质量的音频和视频,支持有线、无线传输和数字广播等应用。MPEG4促进了基于内容的多媒体交互性。它具体说明了如何把自然的与合成的(由计算机生成的)音频和...
-
数字音频技术(第6版) 639
612数字音频技术(第6版 在接收端,数据流被解复接、解压缩,并根据场景描述进行组合,然后呈现在用户面前。 并且,因为这些对象都是独立表示的,所以用户可以分别操作每个对象。与这些对象相伴的景描述对这些对象在呈现时的时空同步与行为进行了描述(这些对象在这个场景中是如何组合的)MPEG4也支持对知识产权的管理,并能对其进行受控的访问。与很多其他标准样,MPEG4提供了标准化的技术规格以实现...
-
数字音频技术(第6版) 640
第15章电信与互联网音频613 用户所看到的场景就是它们被编创时的样子;不过,编创者可以允许用户与这个场景进行互动。例如,用户可以在场景中行走游览,并改变视点和聆听点;他可以在场景中把各个对象拖拽到不同的位置上;他可以通过点击某一具体的对象来触发一系列事件还可以听到一声虚拟的电话铃声并接听电话,从而建立起双向交流。MPEG4使用"传输多媒体集成框架(D Multimedia ...