|
一个平均主观值MOS是4或更高,被认为是比较好的语音质量,而若平均主观值MOS低于3.6,则大部分接听者不能满意这个语音质量。虽然平均主观测试准确有效,但是,这个主观方法存在的最大问题就是,在现实中,让一组人接听语音和评价语音的质量实现起来是非常困难和昂贵的,因此人们在不断的探索能进行客观测量的方法。
现在许多客观的测量方法已经出现并被应用,诸如,PSQM /PSQM+感知通话质量测量[2],PESQ感知评估通话质量测量[3],PAMS(英国电信)感知分析测量等。PSQM和PAMS测量方法都需要发送一个语音参考信号通过电话网络,在网络的另一端采用数字信号处理的方式比较样本信号和接收到的信号,进而估算出网络的语音质量。PESQ结合了PSQM和PAMS的优势,针对VoIP和混合的端到端应用作了改进,并针对MOS和MOS-LQ计算方法做了修改。最开始这些方法被用于测量编码算法,后来也逐渐应用到VoIP网络系统的测量中,著名的测量仪器生产厂商Agilent的语音质量测量仪器VQT即是代怼4送猓斜匾赋觯骄鞴壑礛OS是广泛认同的语音质量标准,因此,无论采用何种方法所有测量方法都必须对应它们的结果对应到最终的平均主观值MOS,以上各种方法均可以最终以MOS值表示。
4 E-model测量方法的提出
以上介绍的测量方法在实验室能够很好地应用于分析个别设备的问题,例如,利用PSQM和PESQ分析话机的质量。但是这些测量方法不适用于在数据网络上分析语音质量,是基于传统的电话网络。它们的缺点主要是,测量不是基于数据网络的,不能反映诸如延时、抖动和丢包等数据网络特有的问题,没有考虑网络故障对用户感觉造成的影响,单纯的从收发信号差异的角度分析网络语音问题。为了克服这些缺点,国际电联的G.107标准提出了E-model,它关注数据全面的网络损伤因素,很好地适应在数据网络中语音质量的评估。
E-model的前提是假设语音质量损伤因素总是物理附加的,简单说来就是,如果诸如噪声、回音、延时、编码器性能、抖动等网络损伤因素能够被灵活的加入,那么网络的一个全面客观的质量等级或称为“呼叫者体验”的因素就能够被估计。
4.1 E-model的基本算法公式及其与MOS值的对应
E-model用来作为算法最终结果的是R值,被称为全面的网络传输等级要素,取值范围从0到100。R值的计算从没有网络和设备的损伤影响开始,此时语音质量是最好的,R=Ro。Ro是无网络延时和设备损伤因素的基本信号与收发噪声以及电流、背景噪声之比,即基本信噪比。但是因为网络和设备损伤因素的存在,减少了通过网络的语音质量,R值的基本计算公式如下:
R=Ro- Is-Id-Ie+A
其中,Is:与语音信号传输同步的损伤
Id:语音信号传输延时后的损伤
Ie:由设备引入的损伤,例如编码器损伤
A:优势因素,致力于考虑呼叫者的期望因素,在大部分情况下,一般设置为0。
由公式可知,全面的语音质量(R值)的计算是通过首先估计一个连接的信噪比(Ro),然后从中减去网络损伤(Is,Id,Ie),最后再用呼叫者对语音质量的期望(A)进行补偿后得到。实际应用中,基本公式中的输入Ro、Is、Id和Ie,每一个都需要考虑各种各样的实际网络损伤因素,通过非常复杂的数学计算而得到。
前面已经讲过,任何的测量方法,最终都将对应为MOS值标准,E-model也一样。下面的曲线图清楚的表示出了R值和平均主观值MOS之间的映射关系。X轴表示E模型的R值,Y轴表示平均主观值MOS。
加入用户的感知特性(以用户满意程度表示),进行语音质量等级划分,对应R值和MOS值的范围如下表所示。由于网络数据与实际语音之间存在转化过程,这样固有的损耗使得R值最大只能到93.2,也就是平均主观值MOS只有4.4。G.107的R值默认最大为94。 |