英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料
用于监测多方VoIP通信质量的改进E-模型
摘要 - 保持良好的体验质量(QoE)对于IP语音(VoIP)应用程序至关重要,尤其是那些在公共互联网上运行的应用程序。在最终用户感受到的QoE准确在线评估中,VoIP应用程序可以采取措施在低于可接受的水平时改进QoE。 ITU-T建议G.107引入了E-模型,该模型提供了评估两方VoIP会话的QoE级别的方法。在本文中,我们提供了当所有音频由集中式焦点节点处理时,对于多方VoIP会话的E-模型的准确性的分析。我们分析了我们称之为“焦点转码效应(FTE)”,“焦点转发效应(FFE)”以及参与会议的终点数量的影响。通过比较三种常见音频编解码器的PESQ方法生成的QoE度量标准,我们发现标准E模型不能为多方VoIP会话提供准确的QoE评估。然后,我们为这些多方VoIP会话的编解码器引入改进的E-模型。我们描述了QoE监测应用中改进的E模型的实现,表明它产生的结果与实际的PESQ得分相似。
关键词-VoIP,QoE,PESQ,E-模型,多方。
介绍
IP语音(VoIP)性能取决于许多与网络有关的因素,包括可用带宽,端到端延迟,数据包丢失和抖动。这些参数的差异通常会导致VoIP性能下降,终端用户感受到体验质量(QoE)。此外,除了网络问题之外,诸如编解码器选择,编解码器参数和抖动缓冲区大小等应用程序特定因素也会影响QoE。对于VoIP应用的实施者来说,评估最终用户感受到的QoE非常重要,并在其降至不可接受的水平时采取缓解措施。平均意见评分(MOS)是衡量最终用户直接感受到的呼叫的QoE的普遍接受指标 - 它封装了网络和实现特定问题的影响。
近年来,VoIP已经成为一个非常重要的应用程序类别,VoIP客户端被企业和个人广泛使用。基本的双方VoIP通信在可靠性和降低成本方面取得的成功促进了多方VoIP会议设施的出现。直观地说,确保多方会议中的QoE更加困难,因为在不同的会议期间,不同的人通过不同的网络路径进行连接将会发言。在本文中,我们检查为两方VoIP会话开发的在线QoE估计模型的E模型是否适用于多方会话。我们发现它不是 - 对于三种常用的音频编解码器,我们发现它始终高估了一系列网络路径丢包情况下的MOS值。我们指定了一个增强的E-model,描述了它在在线VoIP QoE监控工具中的实现,并显示了可以提供更准确的QoE估算的结果。
本文结构如下。 sect;II介绍了最常用的QoE度量标准,并提供了相关工作的简要调查。 sect;III介绍了用于多方VoIP系统的主要架构。 sect;IV分析多方VoIP的QoE,识别和分析导致QoE退化的主要影响与两方通话相比。 sect;V指定了我们修正的多方通话的E-模型,惠斯特sect;VI描述了它在通话质量监测系统中的实现。最后,sect;VII总结了本文并概述了进一步工作的领域。
II。相关工作
由于测量语音质量对服务提供商和最终用户来说很重要,因此ITU-T提供了两种测试方法主观和客观测试。主观测试代表了通过给出平均意见评分(MOS)来评估语音质量的最早尝试。 ITU-T Rec。 P.800 [1]提出了MOS测试程序,用户可以将语音质量从1(差)调至5(优)。当然,听众的数量是估计准确分数的重要因素。因此,使用MOS的主观测试是耗时的,昂贵的并且不允许实时测量。因此,近年来,开发了一种客观方式(无人类感知)测量MOS分数的新方法:特别是PESQ [2]和E模型[3]。
PESQ,语音质量的感知评估,是一种侵入式测试方法,它考虑到两个音频信号:一个是参考信号,而另一个是实际降级信号。两个信号都通过PESQ算法发送,结果是PESQ分数。由于预先需要全部信号,因此此方法不能用于监控实时呼叫。
另一方面,E模型是一种可以实时应用的非侵入式测试方法。这是一个数学模型,它将影响话音质量的所有损伤因素组合在称为R值的单个度量中,然后可以将其映射到MOS等级(表1总结了此映射)。 R值在0到100的范围内,其中R = 0表示最差的质量,R = 100表示最好的质量。 R的计算公式如下:
R = R0-Is-Id-Ie,eff A(1)
其中R0是在0dBR点处的信噪比(S / N),Is表示语音语音减损,Id是由于延迟而发生的减损,Ie,eff是由于设备造成的损害(例如:编解码器和数据包丢失),而A是有利因素(例如:有线电话A = 0)。如[4],[5],[6]所述,E-模型可用于基于VoIP的通信系统的语音质量评估。然而,E模型仅适用于ITU编解码器,在[7]中,我们导出了广泛使用的非ITU编解码器的SILK和iLBC的E模型。
为了简化计算并专注于监测通话质量所需的最重要因素,已经提出了E模型的修正版本[8]。 Paulsen等人[9]为VoIP应用引入了一种新的参数化QoS测量方法。他们提出的改进的E-模型使用“玻璃盒”原理。他们考虑了典型的IP环境参数,而最初的E-模型是为电路交换网络设计的,并且不能真正考虑到这些因素。他们将结果与PESQ和原始E模型结果进行了比较,并且与原始E-模型相比,它们在测量MOS方面显示出更高的精度。 Ren等人[10]研究了抖动如何影响VoIP质量以及如何将这种影响模型化为E模型。他们使用PESQ算法来测量这种效应,结果他们引入了一个新的Ij公式,并将其添加到表示抖动损伤因子的原始E-模型中。 Zhang等人[11]后来使用先前的扩展E模型,以便通过将它们应用于不同的VoIP系统(Skype,Google Talk和Windows live),比较原始和扩展E模型的性能(包括抖动损伤因子)信使)。他们的结论是,Windows Live Messenger在收听方面表现优于Skype,而Skype则拥有最大的MOS,而Google Talk的收视率通常最低。 Obafemi et al。 [12]研究了E模型,重点关注了无知参数抖动播放缓冲区对E模型导致通话质量的准确性的影响。他们的结果表明,在评估感知到的通话质量时,不应忽视自适应播放缓冲区。他们建议修改原始E-模型以包含自适应播放缓冲的测量。 Zhang等人[13]提出了一种新的算法来测量数据包丢失
III。多方VOIP
大多数VoIP应用使用的会话发起协议(SIP)[14]支持与多个参与者建立通信会话。尽管如此,VoIP应用在实现VoIP会话方面具有相当大的灵活性。目前,VoIP会议通过三种可能的连接拓扑来实现[15]:分散式,集中式和混合式。这些模型如图1所示;他们描述如下:
bull;分散模型
在分散模型中,所有会议终端都通过单播或多播相互连接。每个端点都使用SIP与其余端点进行交互。会议没有焦点或中心,所以数据流向所有客户端分发;
bull;集中模型
集中模型是基于一个称为焦点的中心控制点。焦点可以是专用的媒体服务器(如IBM Sametime Uni fi e Telephony [16]中使用的那种),或者其中一个会议终端可以执行此任务(如Skype [17]和Jitsi [18]中所使用的)。重点通常负责所有会议终端之间的SIP信令。此外,电话会议中所有传输的音频数据必须首先通过焦点解码,混合(如果不止一个用户在讲话)并最终重新编码并发送到其余终端;
bull;混合模型
混合模型基于集中式和分散式架构的组合。它依赖于底层覆盖网络,其中一些节点充当彼此完全连接的父节点;另一些是仅连接到一个父节点的子节点。
我们专注于集中模型,因为它在设计VoIP多方会议系统中很常见。每个端点都直接与焦点连接,并且目前还不知道其他端点与焦点之间的其他连接。多重链接通常会受到不同的降解因素影响。
IV。多方通话的QOE分析
在本节中,我们将介绍使用集中式多方VoIP应用程序启动的多方VoIP通话的QoE分析。我们使用PESQ和E模型估计MOS分数。 PESQ是一种侵入式方法,既需要原始信号又需要降级信号,因此我们将其作为E模型估计的基准,因为它应该实现高度的估计准确性。在我们的分析中,我们研究了三种常用编解码器的性能:G711,SILK和ILBC,在不同的网络条件下。图2显示了我们实验中使用的测试床;我们在三个用户之间建立不同的VoIP多方通话。在图中,标签L1和L2表示用户B之间的链接,用户B充当Dummynet [19]以模拟L1和L2中0-5%范围内的不同分组丢失率,增量为0.5%。在我们的分析中,为了统一比较参数,我们考虑用户A(说),用户B(焦点)和用户C(听)。
我们分别记录来自用户A和用户C的原始和降级音频信号;这些信号然后被用作PESQ算法的输入,其产生范围为1-5的MOS值。为了获得准确的测量结果和分数,我们在每种编解码器的不同网络条件下取得了超过200个PESQ MOS值。我们还开发了一个在线监测模块,该模块使用E-模型来估计MOS分数,但是我们排除了计算中的延迟因子,因为PESQ在估计MOS时没有考虑到它。对于E模型,当我们使用Jitsi作为VoIP应用对三种编解码器重复这种实验时,我们确实包括了来自两个链路的丢包率。
从图3我们可以看出,不同焦点转码的L1和L2不同包丢失率下的PESQ得分与没有焦点转码的调用的PESQ得分不同。此外,这些PESQ分数与由单链路与两链路的分组丢失率之和导致的PESQ分数相比有所不同。例如,A和C之间的会议呼叫之间的会议呼叫的PESQ分数与具有分组丢失率为2的两个用户之间的单个链路相比分别与L1和L2的分组丢失率等于1%和3% 4%。特别地,使用G.711编解码器,当有2个链接时,PESQ MOS得分为2.526,而单链接时为2.81。使用ILBC编解码器时,使用2个链接时PESQ得分为1.82
2.37单链路时,L1和L2的丢包率之和。我们还观察到,改变向会议链路引入丢包的顺序会产生非常相似的结果;换句话说,将L1丢包率增加1%,对L2增加3%将得到几乎相同的结果,即3%到L1和1%到L2。
这些观察导致我们研究为了能够集中焦点的存在而产生的影响
A.焦点转码效果(FTE)
在集中式模型中,所有数据包都被转发到作为中心焦点的节点。为了理解信号,该节点将分组解码回音频信号。然后,在重新协商使用的编解码器之后,将该信号重新编码并转发给电话会议中的其余用户。数据包的解码/重新编码过程称为代码转换过程。这个过程对最终用户感受到的QoE有影响。我们通过使用三种不同编解码器在不同丢包率下使用图2所示设置测量电话会议的PESQ MOS得分来研究FTE效应。图3显示了G711,ILBC和SILK编解码器分别标记为带转码效果的PESQ的PESQ得分。
B.焦点转发效果(FFE)
我们研究了从重点到其他用户的数据包转发过程及其对最终用户QoE的影响。为了仅研究这种影响,A和C之间建立了典型的点对点呼叫,它们通过同一个网关连接到互联网。我们通过在用户A和用户C之间添加另一个节点来使用图2所示的测试平台,以便从A到C转发的所有数据包都被强制首先通过网关节点。该过程仅在没有转码效果的情况下模拟转发效果。我们使用3种不同的编解码器测量了不同分组丢失率下不同已建立呼叫的PESQ分数。对于G711,ILBC和SILK编解码器,这些可分别在图3中显示,标记为PESQ,无焦点转码。
C.用户数量的影响
为了研究通话中用户数量的影响,我们开始与3个用户进行电话会议,我们将用户数量从3增加到6,每次增加一个用户。在每次增加一个用户时,我们都测量了某个用户的PESQ MOS分数。首先,呼叫由用户A,用户B和用户C使用G.711编解码器发起,其中用户B充当呼叫中的中心焦点。在我们的实验中,我们使用PESQ算法来测量和跟踪用户A的通话质量,因此用户A被认为是扬声器,而我们认为用户C是听众。在测量用户的通话质量时,我们确保没有网络损失
答:当3个用户参与呼叫时,MOS PESQ是3.98。我们发现,每当用户数量从3增加到6时,这个分数是不变的。这表明,至少对于合理少量的用户来说,多方通话的集中模型中的用户数量对最终用户感知的通话质量没有明显的影响。
D.电子模型的准确性
为了研究原始E-模型在评估多方音频呼叫的QoE方面的准确性,我们在我们的监测系统中采用了原来的E-模型
V.用于多方通话的纠正的E-模型
在本节中,我们为国际电联标准E-模型推导了一个修正函数,以便使其适用于评估多方通话的QoE。在图4中,我们将原始E模型(x轴)的值映射到由PESQ算法(y轴)估计的实际质量。例如,对于SILK,在丢包率为4%时,E模型估计的音频MOS值等于2.87,而通过PESQ算法计算的实际MOS值应该等于1.73。通过使用最小二乘法应用曲线拟合,这些点很好地适用于三阶函数MOSC。考虑到焦点降级因素FTE和FFE,它表示最终用户感受到的多方会话中的实际QoE。如表2所示,它是为参数x1,x2,x3和x4的三种编解码器中的每一种导出的。在公式2中,MOS是标准的E模型函数。
MOSC = x1·MOS3 x2·MOS2 x3·MOS x4(2)
为了在线估计QoE,可以通过首先捕获网络特征(包丢失率是L1和L2的损失率之和)来采用校正的E-模型,获取编解码器鲁棒性因子,然后计算映射后映射的R到MOS。这个由标准E模型产生的MOS值然后在等式2中用于计算MOSC,MOSC是由多方VoIP会话的终端用户感知的估计的MOS。
VI。监测系统设计和结果
我们开发了一个监控系统,该监控系统基于我们改进的改进E模型,用于监控多方通话的VoIP通话质量。我们的监控系统针对特定数量的RTP数据包,根据我们修正后的E模型捕获并执行有效的MOS值计算。我们的系统根据呼叫中使用的编解码器使用系数数据库,请参阅表II。它基于网络终端,环境可以是具有语音质量监控的个人或家庭网络。我们的监控系统工作如下。首先,系统
全文共6666字,剩余内容已隐藏,支付完成后下载完整资料
资料编号:[15168],资料为PDF文档或Word文档,PDF文档可免费转换为Word
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。