数字音频技术(第6版) 686

文本阅读：
　　第16章数字广播与电视659
　　的敏感度具有一个动态范围，并且这个动态范围不是线性的。例如，我们的视觉敏感度对于绿色阴影很好，但对于红色和蓝色则比较差。而另一方面，我们对亮度和色彩上常渐进的变化很敏感。
　　音频工程师习惯于使用频率这一概念，即一段时间内波形周期的数量。空间上的频率描述了视觉信息的变化速率，但并不是以时间作为参考的。（一幅图片随时间的变化被称为时频率。）人眼在对比度方面的敏感度峰值在空间频率上大约为5周期/度，并在100周期/
　　度附近衰落为0，此时由于细节过小而无法被人眼感知。前者对应的是在1m距离上观察的物体；后者对应的则是同等距离上观察
　　的物体。（用周期/度而
　　没有使用周期/米，是因为空间分辨率取决于一个物体与人眼的距离有多面的
　　对比度可以用水平和垂直空间频率来描述。并且，因为人眼是一个低通滤波器，较高的空间频率可以被成功地量化，从而实现数据压缩。
　　人眼能够感知到大约1000个等级的灰度，这需要10bt来量化。在实际中，8bit通常经足够了。亮度（Brightness，Luminance）使用了视网膜中的一套受体，色度（Chrominance则使用三套受体。色度的峰值敏感度变化发生在1周期/度，并在大约12周期/度处衰落为0。显然，因为人眼的色彩分辨率较低，所以色度可以用较少的比特来编码视频数据压缩充分利用
　　时间上相邻的各个像素之间在空间与时间上的相关性。具有很高熵值的高度随机化图片是更难压缩的。大多数图片都包含有能够被准确预测的冗余。视频编码利用了各个独立帧内的冗余，也利用了一系列帧之间的冗余。在每种情况中都要运用心理视觉原理来充分利用人类视觉系统中的各种局限性；换句话说就是要采用视觉感觉编码。例如，MPEG视频编码中的空间编码方面就类似并基于静态图中所采用的联合图像专家组
　　holographic Experts Group，JPEG）编码。这类编码使用一个变换把一幅静态图像转换成它的各个成分空间频率。这能促进不相关细节的除，也能促进对剩余数值的量化。时间编码把一系列图片减少为若干关键帧，随后仅描述其他帧与这些关键帧之间的差别即可。例如，一段"发言者持续特写"的视频中播音员在播报新闻，那么在很多帧之间都仅有很小的区别，而一段充满了汽车追逐的场面则可能存在大量的差别。即使如此，每一帧中有一些部分在下一帧中仅仅是移动个新的位置上。视频编解码器充分利用了视频的这些特点来移除冗余，同时保留关键的信息
　　编
　　视频节目需要大量的数据。传统的模拟复合视频NTSC信号的带宽为4.2
　　MHz。为了对这个信号进行数字化，奈奎斯特定理要求采样频率为这个带宽的两倍，即8.4MHz。若每个采样点为8bit，则得到67.2Mbit/s。因为一幅彩色图像包含红蓝三种成分，因此这个数据速率要乘以3，得到201.6Mbit/s。一张650MB的CD只能