文本阅读:
第10章低比特率编码:理论与评价395
是B,对于每次试验,这种分配被做成了伪随机的形式。听者必须鉴别出X是A还是B。这种测试回答了听者能否听出A和B之间的区别这一问题。ABX测试不能用来得出"没有区别这样的结论,相反,它能展示出可以被听到的区别。对于短小的音乐例子(可能是15~20s)
可以反复地聆听,从而鉴别出各种人造声。对参加ABX测试的每个受试者进行独立分析并有多少受试者听出了区别,这是有用的。
还可以用其他聆听测试来评估编码收益,或是在丧失透明音质之前能够让比特率缩减多少。还有一些测试被设计用来测量相对透明度。这显然是一项更困难的任务。如果两低损失编解码器都呈现出可闻的噪声和人造声
有依靠人的主观感觉才能确定哪
编解码器是更可取的。并且,不同的听者可能会在这一"两害相权取其轻"的选择具有不同的偏好。例如
听者可能更不喜欢带宽的缩减,而另外一个听者则更受量化噪声的困扰
主观聆听测试可以使用TU-R建议标准BS.1116-1。这套方法涉及音频素材的选择、还放系统的性能、听音环境、对听者经验的评估、打分标准和数据分析的方法。例如,为了揭出各种人造声,使用能给被测算法带来压力的音频素材是很重要的。并且,由于不同的算法会以不同的方式响应,因此需要多种素材,包括那些专门针对每种编解码器进行压力测试的素材。挑选出来的音乐必须能够对编解码器的各种已知弱点进行测试,从而揭示出各种缺陷。
一般来说,具有瞬态信号、复杂乐音、并且在人耳最敏感的区域(1kHz~5kHz)内具有丰富内容的音乐是有用的。经常会使用一些特别具有挑战性的例子,比如钟琴、响板、三角铁键琴、小手鼓、语音、小号和贝斯等
批判性聆听测试必须采用双盲方式,即测试者和听音者都不知道各个选段的身份。比如激励、隐藏参考源、双盲"测试中,呈现给听者的是一个已知的未经编码的参考信号A以及两个未知的B和C信号。每个激励信号都是一个10-155长的录音片段。
未知信号中的一个与已知的参考信号完全一样,另一个则是待测的被编码信号。这种分配是随机进行的,并且每次测试都会改变。听者必须参照已知的参考信号为这两段未知信号打分。
听者可以反复聆听任何一个激励信号。测试要反复进行,并且要使用不同的激励信号。可以使用耳机或音响,有时候一种回放方式比另外一种回放方式更能揭示问题。为了获得更致的结果,在一次特定的测试中,回放音量应该是固定的。图10.24给出了用于打分的分级标准。这个5档的缺陷等级标准由国际无线电咨询委员会(nternational Radio Consultative Committee,CcR)制定,通常用于各种感觉编码算法的主观评价。多组有经验的听者对他们在编解码器算法中听到的缺陷进行打分,打分时按照41点的带有分类的连续分级标
准给分,分值从50(透明)~1.0(非常恼人的缺陷