编辑点评:通过对北京大学校园无线网络实际测量的流量特征和用户行为的分析,给出了与用户体验直接相关的关键质量指标的选择依据和方法。本文的分析基础虽然是基于北京大学校园网的数据,但所描述的分析和选择方法对国内各高校校园无线网具有普遍性和参考价值。
1.研究背景
北京大学从2002年开始,逐步建立覆盖校园的无线网络。经过多年持续性建设和升级改造,北京大学校本部已经实现了教学区和学生宿舍区全面覆盖、科研和办公区近半数覆盖的、大规模高密度的无线网络。随着用户越来越多地使用并依赖于无线网络,北京大学也对校园网核心与汇聚层进行了大规模改造,实现了无线网络的独立组网,并在校园网出口针对无线网络的使用特征进行了大量的优化。根据网管数据显示,无线网络在线AP数量超过1.3万台,每日使用无线网络的终端超过5万台,高峰期同时在线终端超过3万。良好的无线网络环境和大量的用户使用数据的积累,为更好地分析并建立用户QoE评价体系提供了良好的数据基础。
通过对无线网络的用户行为及网络性能进行分析为网络管理员提供优化调整网络的数据,已经成为了无线网络管理的一个共识。Mikhail Afanasyev等人对谷歌城市无线网络的用户行为进行了详细的分析[2],谷歌城市网络属于室外公共无线网络,组网方式,用户群体、网络环境等因素与校园网具有很大不同。Sanjit Biswas等人研究了基于分布式网络管理系统的大规模无线网络行为[3],分析对象包括了横跨各个行业的近20000个无线网络,分析方法值得借鉴,但由于研究对象庞杂,看到的现象和得出的结论与将校园无线网作为单一研究对象时会有所不同。
从用户的角度去研究并评价无线校园网,主要包括三方面的内容:
1、考察无线用户上网流程,分析每个阶段影响用户体验的因素,并选取相应的指标来评价网络运行状况;
2、设计无线校园网运行状况评价分析系统,并从三类指标中,分别选取部分指标进行分析,特别是针对网络可保持性的分析;
3、计算出了不同区域的KQI指标,指明了以后网络优化的方向。
2.影响无线网络用户体验的KQI指标
2.1.无线网络KQI指标分类
用户体验质量(QoE)是从用户的角度感受到的业务水平,其中QoE的主观方面难以量化,本文只考虑QoE的客观方面,客观方面使用关键质量指标(KQI, Key Quality Indicator)来表示。对于无线网络而言,首先需要确定相应的指标,才能更加直观的评价无线校园网,这些指标从开始关联、认证、访问网络和下线的上网流程,大致可分为三大类:网络可接入性、网络传输质量、网络可保持性。
网络可接入性是指在用户开始接入无线网到能够使用网络这一阶段的网络性能,这部分性能决定了用户能不能使用网络,用户终端无法连接上AP,那么用户也就无法用网。根据实际的接入流程,具体指标可以包括:覆盖率、连接AP成功率、连接AP耗时、获得IP地址成功率、获得IP地址耗时、登录校园网关成功率、登录校园网关耗时等。
网络传输质量是指用户成功接入到无线校园网且连接不会中断的时候,使用网络的体验,最明显的表现为网络速度非常慢,会极大地降低用户体验。相比于可接入性和可保持性,用户正常使用网络的时间最长,所以该类指标对用户体验的影响最大。根据实际的网络负载情况和数据传输流程,具体指标可以包括:在线总人数和总连接数、AP负载、AP在线时长、不同信道的负载、信号强度、传输速率、带宽、报文重传率、端到端时延、时延抖动等。
网络可保持性是指用户在使用网络的过程中,网络服务不会中断。结合北京大学无线校园网的实际情况,用户终端重新连接AP的时候,如果IP地址不发生变化,用户不会感知到重连,也不会影响用户继续上网;如果IP地址发生变化,则需要重新登录ITS网关,该步骤是用户能感知到的,且会影响用户继续上网。因此,在北京大学无线校园网环境下,可保持性可转化为重连且IP地址变化的情况。根据实际的网络负载情况和数据传输流程,具体指标可以包括:连接会话长度、用户活跃时间、跨区域重连次数、IP异常重连次数、移动性等。
2.2.KQI指标的分析与选取
2.2.1.指标选取方法
不同的指标对用户体验的影响程度是不同的,利用北京大学无线网管数据长期已有历史数据,可以通过使用多元线性回归,分析它们有哪些影响因素以及各个因素对结果的影响的大小,从而找到对用户体验影响较大的指标,最终提取一部分指标来作为评价无线校园网的标准。
数据分析是基于已有数据或者能够获得的数据,并具有可计算性。进行数据分析的数据集来自北京大学校内用户连接AP的历史数据。由于数据量很大,因此本文分析主要采用了两周的数据,所有数据是从管理Aruba和Cisco设备的网管系统中获得的。
由于数据源较多,为了便于后续的处理,我们将数据进行整理,以每个连接作为基本单元存放在数据库中,所有的计算和分析都基于数据库。主要源数据包括如下:
2.2.2.无线用户获取IP地址成功率
无线校园网通常采用DHCP协议为用户动态分配IP地址,用户只有成功获取到校园网IP地址之后才能使用网络。表2统计了两周的数据,可以看出,在此期间,有11.6%的连接没有成功获取到IP地址。
获取IP地址成功与否是0/1变量,所以可以使用逻辑回归方法来分析。对于每次连接,可能的影响因素有:
1、发生连接所在的时间点hour,因为不同时间段AP设备负载可能有差别;
2、信号强度signal,信号强度反映的是当前网络的连接质量,信号强度越好,成功率应该越高;
3、AP负载ap_load,该因素反应的是当前该AP的连接人数;
4、连接所在的区域location;
5、用户终端的设备类型device_type,因为每个设备类型申请IP地址的机制可能有所差别;
除了和当前连接有关系,推测还有可能和上一条连接有关,比如上一条连接中下载流量很大,可能会影响本次申请IP地址的过程。上一次连接中可能的因素有:
1、连接会话长度session_length;
2、下载流量download;
假设成功获取IP地址,则success_get_ip为1,否则为0。而location、device_type都是无序分类变量,加入逻辑回归之前处理成1~N的格式,并标记为分类变量,而不是有序连续的变量,hour这里也当做无序分类变量,取值为0~23。对文中各连续变量进行标准化并进行逻辑回归之后,可以看出影响结果的因素有设备类型、信号强度、AP负载、发生连接所在的时间点和区域,而与上一次连接无关。具体计算结果如下:
进一步对历史数据进行分析,明确连接所在时间点和区域对获取IP地址的影响情况。
图1 分区域统计获取IP地址情况
在图1中可以看出,文史楼、理科一号楼的比例过高,而宿舍楼和勺园的失败比例均为0。具体分析原因可知,虽然这些楼宇都是高密度覆盖,但是由于不同时期采用的部署方式不同,造成用户IP地址获取成功率也不同。在早期的高密度部署中,为了保证更好的信号覆盖,调高了单个AP的发射功率,允许低速率终端的接入,这些措施导致频段利用率高,相互干扰严重,反而影响用户的连接。
综上所述,获取IP地址成功率可以作为体现无线网络,特别是在可接入性方面选取的一项KQI指标。针对IP地址成功率进行多维度,特别是按区域维度对网管历史数据进行大数据分析,可以客观反应不同区域的用户体验QoE。
2.2.3.信号强度
用户设备的信号强度不仅直接反映了当前网络的质量,而且会影响用户连网行为。在连接网络的时候,终端会根据信号强度去决定是否可以建立关联、与哪个AP关联,在使用网络的过程中,信号质量的变化可以直接影响SNR、连接速率、丢包率等,从而导致上网体验发生变化。
图2 校园网用户终端类型、信号强度CDF曲线
通过北京大学无线网络的网管数据统计可以看出,北京大学校园无线网中,2.4GHz的终端占比为64%,考虑到有些同时支持两个频段的终端可能工作在2.4GHz或5GHz频段,实际支持2.4GHz的终端比例会更高,因此对2.4GHz的用户终端表现进行详细分析,可以更好的体现用户体验质量QoE的实际水平。基于网管数据的信号强度CDF统计曲线表明,北大校园网内超过80%的无线终端连接,信号强度都不低于-81dBm。超过90%的无线终端连接,信号强度都不低于-87dBm。
使用多元线性回归分析信号强度和哪些因素有关,选用的可能因素有:
采用以上的因素进行多元线性回归,结果如下:
可以看出,信号强度和设备类型、区域、所处的时间点都有关系。
这里以设备类型为例对历史数据进行进一步分析。首先将历史数据中缺少信号强度的记录过滤掉,将设备类型中的Win 7、Windows、Win XP、Win 8、Win 98、Win CE、Win 2000、Win Vista和Win Server汇总到Windows类型,也就是使用Windows操作系统的PC端。使用iOS系统的设备,包括iPhone、iPad、iPod汇总为iOS。
图3 IEEE 802.11g/n协议(2.4GHz)不同设备类型的信号强度
基于IEEE 802.11g的统计数据显示,Windows设备和OS X设备,也就是PC端的信号强度是明显好于移动端的信号强度。PC设备中,Windows设备的信号强度好于OS X设备,而移动端中的Android和iOS设备,信号强度没有多大差异。802.11g协议下,-80dBm对应的速率为54Mb/s,即802.11g下的最大速率。可以看出,90%的Windows设备连接、81%的OS X设备连接可以达到该速率,但是移动设备的连接中,能达到54Mb/s仅为70%。
基于IEEE 802.11n的统计数据显示,Windows设备的信号强度仍然是最好的,Android和OS X设备的情况大致相当,iOS设备信号强度最差。802.11n协议下,-76dBm对应的速率为130Mb/s,即802.11n单空间流的最大速率。可以看出,92%的Windows设备连接、77%的OS X设备连接、77%的Android设备连接可以达到该速率,但是iOS设备的连接中,能达到130Mb/s的为62%左右。
图4 移动设备和PC设备的总连接数比例
图4是PC设备和移动设备连接总次数的比较。综合信号强度按设备类型的分析,移动设备虽然占了88%的无线连接,但是信号强度却偏低。如何保障移动终端的信号强度,是校园无线网调优关注的一个重点。
综上所述,信号强度可以作为体现无线网络,特别是在传输质量方面选取的一项KQI指标。针对信号强度进行多维度,特别是按区域维度对网管历史数据进行大数据分析,可以客观反应不同区域的用户体验QoE。