近年来,随着Internet 的迅速发展,对等网络技术(peer-to-peer,简称P2P)的应用越来越广泛。然而,P2P技术在给人们带来娱乐和方便的同时,也带来了隐忧。P2P应用的流量日益增大,它们占据了大量的互联网带宽,巨大的资源消耗引起企业及ISP瓶颈链路的阻塞。P2P 流量占用带宽接入的大量资源,许多ISP也纷纷报告他们的网络流量中有大约超过50%属于P2P流量。各大网络服务提供商迫切地需要识别已经限制某些P2P的流量,而对P2P流量识别最有效的办法之一就是特征码匹配识别,目前特征码的提取主要依赖专家提取,提取周期长、工作量大,往往不能及时满足服务商的要求。因此,针对P2P流媒体的特征码自动提取方法进行研究,有助于增强对P2P应用的监测和控制力度,阻止或减轻P2P造成的不利影响。
提取方法
现阶段特征码提取主要依赖人工提取。人工提取又名专家提取,是人工地去观察某一流媒体应用的连接建立信息(五元组信息)、监听端口信息、流量特征信息、以及数据包负载内出现的特殊字符串等信息。它主要关心的是某条何时建立,何时终止,以及在流连接建立的阶段出现了哪些特殊字段,而所有这些信息都要依靠专家们人工地去分析判断,得到的特征码虽然准确率比较高,但生成周期耗时长、技术水平要求高,效率非常低。为了解决这个难题,迫切地需要一个流媒体特征码的自动提取算法。通过长期的观察实验,P2P流媒体在资源共享的过程中,两两之间进行交互的控制信息非常频繁,并且这种行为有共同点存在,基于这个特性,设计出一种基于控制信息的特征码自动提取算法。在不失准确性的前提下,它缩短了特征码的提取周期,实现了程序的自动提取,克服了特征码提取技术水平要求高的问题,提高了特征码提取的效率。
特征码的提取过程
先做个假设,首先已经确定某台主机已经是在进行流媒体的行为,再对其进行特征码提取。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。