网络业务运行故障报警
监测系统运行期间准确监测到多起网络业务异常,并帮助网络管理人员快速排除故障,减少了业务中断造成的影响,某日中午时间核心交换机CPU使用率超过网络管理员设置的阀值,管理员收到报警邮件,监控图如图23。
图23 Cisco6509 CPU使用率
12:30到13:40期间Cisco6509CPU使用率突然升高到20%以上,这种现象十分不正常。这段时间并不是学院师生上网的高峰,但对核心交换各端口实时流量监控图的观察,发现核心交换机下联的HP5304汇聚交换机在这一时间段同时出现流入\流出流量的异常,如图24所示可以初步判断该现象与学生宿舍区网络状态有密切关系。对该宿舍区流量监控图进行分析。
图24 核心交换下联HP5304端口流量
用户的正常网络流量应呈现出使用流量的不对称性,也就是说下行流量比较大,而上行流量相对较小。一般来说这个时间段不是学生上网的高峰时间段,上行流量大部分都在20M到30M之间,但当时上行流量突然间增大到60M左右如图所示,上行流量几乎是下行流量的一倍,怀疑HP5304交换机下存在感染木马病毒或ARP病毒的计算机,表现出对外疯狂发包,上行数据流量、上行数据包速率突然增大,从而造成接入核心交换机Cisco6509的CPU利用率随之升高。通过监测系统对交换机端口的实时流量监控图,根据设备部署情况以及交换机端口与宿舍房间号对应表,管理员很容易就可以查出问题用户具体是宿舍区的哪个楼层,哪个房间的,对故障做出快速、及时的反应,对问题用户计算机进行全面检测,清除存在的病毒和木马程序。
通过监测系统所呈现出的图形列表,网络管理员可以直观地看出各个网络端口流量的具体情况,比如出现故障的时间段,端口网络流量高峰时间点等,对网络管理和分流具有非常重要的指导意义。利用监测系统进行流量监控和流量分析是整个网络合理化的重要环节,通过对路由器、交换机等设备端口流量的监控,我们可以直观地了解网络中各个部分的带宽使用情况,第一时间发现异常网络流量,有效防范黑客和病毒的攻击。同时,还可以根据各个端口使用带宽的情况对网络带宽进行合理划分,大大提高网络的运行效率。
本监控系统在我院实际网络环境中成功应用,实现对学院网络环境中的核心交换设备、汇聚、接入交换机设备相应的技术性能指标的监测,对UPS设备运行状态的监控,使整体网络运维状态可以自动化检测,并对发现的异常情况予以及时报警。监测系统会按照设定好的时间周期对网络设备进行定期的轮询工作,抓取设备实时运行状态和端口网络流量信息,网络管理员通过系统平台及时看到相应的数据信息并进行分析,做到对故障的快速反应。改变了网络管理员的工作方式,由被动变为主动,全面提高了网络管理员的工作效率,取得很好的效果,全面提升了我院校园网络的管理水平。
(作者单位为天津音乐学院图书信息中心)
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。