文本阅读:
第10章低比特率编码:理论与评价399
之内。环境噪声水平不应超过NR15(20dBa-25dBA
3276标准详细规定了一个房屋面积大于40m2同时容积小于300m3的听音室。房间的长宽高比例和混响时间遵循BS.1116-1规格。此外,三维比例应该有多于±5%的差别。使用粉红噪声按1/3倍频程响应测得的房间响应要遵循一条标准的轮廓线。
10.12.3聆听测试的统计评估
马克·吐温和其他人都曾说过:"有三种类型的谎言:谎言,该死的谎言,还有统计学"。
为了有意义并且不产生误导,对聆听测试的结果所进行的解释必须要经过审慎的考虑。例在一个ABX测试中,如果一位听者能在16条序列中正确鉴别出12个参考信号,那么他是否已经注意到了一个可闻的区别?统计分析为我们提供了答案,或者至少是对此的一种解释。在这种情况下,因为测试是一个抽样,我们要用概率来定义我们获得的结果。因此,抽样空
】越大,获得的结果就越可靠。我们关注的中心是结果的显著性。如果所得结果是显著的就要归因于可闻的差别,否
因于偶然。在一个ABX测试中,16次中只有8确分数则表明这个听者听不出区别,这个分数可能靠猜测获得的。12/16的分数可以表明个可闻区别,但也可能是出于偶然。为了彻底明白这我们可以定义一个零假设H6用
来表示由于偶然导致的结果,并用另一个假设H41表示由于可闻差别导致的结果。显著性水表示由于偶然而获得某一分数的概率。显著性判据a′是挑选出的a可以接受的门限。如果a≤a,则我们认为这个概率足够高,可以接受"得分是由于一个可闻的差别"这一假设的选择是任意的,但通常都使用005这个值。使用下式z=(C-0.5-np1)/【np1(1-p1其中z为标准正态偏离,C为正确响应的数量,n为样本容量,p1为正确响应在仅由偶然起的全体数量中所占的比例(在一次ABX测试中p1=0.5我们可以看出,对于12/16这一得分,z=1.75。因此二项式分0038的显著
性水平。完全仅仅由于偶然(而非由于可闻差别)而得到12/16这么高的分数的可能性为38%。
换句话说,有38%的可能性是听者没有听出差别。不过,由于a
我们也可以定义一些参数来描述"错误地接受一个假设"这种风险的特性。类型1错误风险(通常也被记为a')是"当一个零假设确实为真时拒绝了该假的风险。它的值由显
著性判据确定。如果a′=0.05,则我们在接受显著性结果时将有5%的时间是错误的。类型2错误风险B定义的是"当零假设为假时接受了该假设"的风险。类型2风险以下列因素为