本课题研究的科学问题是“网络动态行为及其可控性”,以解决未知的网络行为与确定的传输控制目标之间的矛盾。课题组认为,研究网络行为就是对网络中表现的各种现象进行合理的解释,并能够预测出行为未来的发展趋势。
网络的动态行为通过基于不同数学模型的各种行为测度体现,是设计网络体系结构和各种网络协议的理论依据,因此本课题的目标是以测度为基础,研究网络行为的描述理论;以测量为手段,研究新的网络测量实验科学方法;以突发数据流为典型,研究刻画互联网行为的多维理论模型。
这些由行为测度所刻画的网络流量行为规律是新一代网络体系结构设计,网络传输控制机制设计,网络服务质量管理机制设计,以及网络安全监控机制设计的重要依据。
课题目标
互联网络发展至今已成为一个庞大的非线性复杂巨系统,具体表现为:系统的规模和用户数量巨大且仍在不断增长,异质异构的网络融合发展;网络协议体系庞杂,垂直方向上呈现出多样化的层次结构,而水平方向上又以地域和功能为标准,进一步形成分布且多级的架构;在业务性质上表现为多种业务的集成与综合,业务量突发性日渐明显,且不同业务要求不同的服务质量保证;网络节点间、节点与数据分组间由于协议而产生的非线性作用以及用户之间的合作与竞争,使网络行为呈现出相当的复杂性并且难以预测。
如何建立系统、科学与本质地刻画用户及其流量动态特性,以及网络自身行为特征的模型,是深刻认识和把握当前乃至新一代互联网的关键所在。它必将对网络行为状态的描述与预测,新协议的设计、开发与应用,新一代互联网络的规划、管理与控制,以及构建安全、可信赖的网络基础设施起到至关重要的指导作用。
理论模型是网络流量控制研究的基础。无记忆性的基本假设和由此而演绎出的理论与方法面临严峻挑战。突发自相似流量的重拖尾分布给队列分析制造了不小的障碍,进而无法找到理想的资源预留策略和有效的连接接纳控制方法。构造独立业务源数学描述模型本身就困难重重,而非线性协议的耦合作用又进一步增加了定量描述聚合流的困难。前者固然重要,但它们同控制策略与机制一起组成的子系统模型才是针对特定目标进行优化控制的基础。模型对于传输控制之所以重要,是因为只有基于一定的模型,我们才有手段通过一定的观测变量较为准确地综合出网络的当前状态,甚至有可能预测其变化趋势,这样采取的控制策略才会有的放矢。
凭借局部经验和启发式算法,对运动规律和行为状态浑然不知的复杂系统进行控制的结果是可以想象的。当然,建立精确的网络流量模型决非易事,甚至完全不可能,但已有的研究表明:粗线条的近似模型对于某些传输控制问题往往是足够充分,模型应该是未知的网络行为与确定的传输控制目标之间建立联系的纽带。
本课题以网络流量行为的观测与建模和端-端传输控制作为切入点,深入研究“网络动态行为及其可控性”科学问题,以期解决未知的网络行为与确定的传输控制目标之间的矛盾。
经过课题全体人员的探索前进,目前课题进展顺利。课题在2006年度的研究工作中,已发表和收录论文共计42篇,其中SCI收录13篇,EI收录18篇(SCI和EI同时收录的只统计SCI),其中包括国际刊物6篇,国际学术会议16篇;提交国内专利3项。
我们约略介绍其中的一些重要成果。
高速网络测量系统Watcher
这是一个基于高速光纤以太网流量分光方式获取流量镜像并支持网络报文和流抽样的被动测量系统,支持对IPv4和IPv6网络的GE信道测量。系统能在一段连续时间内,以低丢包率对双向指定长度的IP报文头部的捕捉和存储,存储以固定的格式完成,以便以后任意的分析程序的执行。
整个系统由n个采集存储子系统和控制系统构成,时钟同步采用NTP,服务器位于控制系统,单独运行。该系统针对高速多链路逻辑信道网络环境,采用基于动态自适应抽样流测量的技术,和多机协同的被动网络流量监测系统的体系结构,可以对高速互联网主干网络环境下的多链路逻辑信道的流量信息进行指定长度的全报文采集和动态自适应的抽样采集。系统规模具有可扩展性,可根据实际链路数量增加链路流信息测量系统数量。该系统通过提供Netflow格式兼容的IP流数据记录为今后深入网络流量行为学研究提供了流量历史资料和数据。系统包括网络流量高速采集、报文自适应抽样、流自适应抽样及抽样方式下的流属性估计,以及多机协同综合多链路流信息等四个主要功能。
课题组对多链路逻辑信道网络测量环境特点进行了分析,提出了与多链路逻辑信道测量环境相适应的被动流信息测量的数据流模型,并在此基础上提出了适用于被动自调节抽样流信息测量系统的总体结构设计。
在自适应抽样链路流信息测量的设计中,采用报文抽样和流抽样分别控制测量的CPU资源和内存资源的消耗。设计中,课题组提出了基于动态报文计数的报文流速计算和基于阈值检测-趋势触发的报文抽样比自适应调节算法,以根据报文流速自动调节报文抽样比;同时改进了抽样-保持流抽样算法,使用基于概率分布的流抽样控制模型与用抽样点同步抽样的模型参数快速计算算法相结合,构造了一种新的自适应流抽样调节算法。
在测量系统的实现中,课题组提出了用于多链路逻辑信道下多路链路流信息归并和综合功能实现的具体算法,使用多哈希索引表轮换策略来实现混合到达的多路流信息按时间片归并功能,以及基于哈希索引表与链表相结合的数据结构实现信道流记录的快速查询策略。测试结果表明,课题组提出的用于多链路逻辑信道环境测量的自适应抽样流测量系统的设计达到了预期的功能和性能要求。
系统中,前端链路流信息采集单元执行数据帧高速捕获,时间标记,根据流量负载自适应报文数据抽样,根据网络流容量自适应调整流抽样,根据抽样比流属性估计,以及流数据高速输出等主要功能。
后端信道流信息综合单元完成对来自多个物理链路的多链路流信息数据的汇总处理。它根据流信息估算整个逻辑信道的总体流量情况,修正个流属性参数,估算抽样比引入的修正误差和生成被监测多链路逻辑信道总体和抽样个流的流信息,流信息数据格式以Netflow标准格式输出。
高速网络测量技术研究
课题组重点探索了高速信道的抽样流测量问题,提出了新的流抽样估计算法和流识别算法,并在流测量实现方法提出了一些改进方法,在改善资源使用效率方面取得较好的结果。
课题组给出了一种新的由抽样报文统计数据来推断原始报文流分布的方法,此方法不仅适用于TCP流,对于普通流也是可行的。该方法分析了产生一个长度为L的抽样流的原始流的分布概率并计算了可产生这个长度为L的抽样流的原始流长度的期望值,进一步找到可以抽成这个抽样流的概率最大的几个原始流。然后把流按被抽空(一个报文也不被抽到)概率的不同区分长流和短流,对于长流可以用一个非常简单易算的估计方法,认为它是由可产生它的最大概率的几个原始流产生的;对于短流则构作一个方程组,对于这个方程组构作一个极大似然估计,进一步通过EM算法进行求解,得到了对于短流的估计。通过该算法的时间复杂度分析,并与传统的EM算法进行了理论比较,该方法可以有效地控制时间复杂程度,优于目前国际上已发表的同类研究。
课题组还提出了其它具有不同特点的抽样估计算法,包括基于报文抽样和流抽样的双抽样方法进行估计流数量和流分布的方法;以及高速网络流数估计方法,使用哈希结构存储聚类流中子流流数的相关概要信息,在控制测量资源和测量精度的前提下检测出子流流数突变的聚类流信息。
在流测量方法的实现优化方面,课题组提出了基于MGCBF算法的长流信息统计及维护方法,利用网络中流长呈重尾分布的特性,以较小计算代价大幅度减小传统组流算法所需要的存储空间,并可保证长流信息的基本完整。
另外,课题组还提出了一种基于IP流速特性的动态超时策略算法DToS,该算法可以根据网络当前的运行状况和流速特性,针对各活跃流所表现出的不同特征,动态地为其确定超时参数,以取代传统的64秒的静态判定方法。
高速流控机制与算法设计
在以往的传输协议包括目前占主导地位的TCP协议中,拥塞控制算法设计普遍采用了依赖于经验的启发式设计加典型,有限和局部仿真试验验证的设计方法,得到的算法往往是静态的和准静态的,不能适应快速变化的动态网络化环境。因此,研究人员试图通过建立和完善网络系统模型,并在此基础上借助一定的成熟理论,发现新的方法,对具体的拥塞控制机制、协议和算法逐渐加以完善和优化。经典的模型研究成果包括Padhye等人提出的稳态吞吐量模型,V.Misra等人提出的流体流模型,以及F.Kelly等人基于经济学模型提出的效用模型等等。
课题组通过在模型方面的深入研究,发现将种群生态学模型引入到网络拥塞控制的研究之中能够取得意想不到的效果。我们的主要思路是考虑到在网络中不同的流需要竞争网络带宽,而在生态环境中, 不同的物种同样也需要竞争食物。种群生态学的主要研究内容是种群规模和结构随时间的变化而变化的规律,它与网络拥塞控制所研究的根本问题一样,都是资源分配问题。通过这种合理的类比关系,我们可以将很多经典的生态学演化模型借鉴到网络流控领域中来。
在这一思路的基础上,我们综合生态学中的Logistic模型和Lotka-Volterrra 模型设计了一种设计新的基于速率的流量控制算法,并通过基于路由器显式虚拟负载反馈的方式进行了具体实施。
基于速率方案的实现方式,使得分配给一个连接的带宽与两点间的延时无关,这使该算法能够支持公平的带宽分配,这对于解决网络中传输流的公平性有重要意义。同时,基于速率的方案具有一定的传输流整形效果,有利于改善高速网络中传输流高度突发的现象;而且,该算法无需复杂的队列管理。
最终的试验结果表明,无论是在简单的哑铃网络拓扑结构中,还是在复杂的多瓶颈网络拓扑结构中,这种流控算法都能够体现出高效、公平和鲁棒的特性。
3G网络中的HSDPA技术研究
高速下行分组接入(HSDPA)技术是一些无线增强技术,利用HSDPA技术可以在现有技术的基础上使下行数据峰值速率有很大的提高。HSDPA已经成为3G网络中的热点研究问题。但是目前HSDPA中使用的可变带宽自适应技术会明显削弱TCP的传输性能。
课题组首先通过实验验证和分析了可变带宽会明显降低TCP传输的吞吐量,同时提出了一种分段连接的窗口自适应TCP代理方案来改善这一状况。在这一代理方案中,HSDAP中的内置机制得以充分利用。通过基于动态带宽信息进行TCP代理的窗口大小调整,我们能够使队列长度紧密保持在参考值附近。因为带宽变化具有随机性, 我们使用了成熟的随机控制理论来设计相应的调整算法。
通过建立离散状态模型,我们分析了整个系统的稳定性。同时,实验表明TCP代理方案使得单元链路的利用率在很多网络条件下都能保持在90%以上, 并成倍地提高了TCP的吞吐量。该方案明显优于现有的TCP协议。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。