CNGI-CERNET2主干网一期工程覆盖全国20省市的25个核心节点,部署了50台核心路由器。为了通过运行全面测试各个设备生产商的设备IPv6协议栈实现的完整性,及不同设备之间的互联互通情况,CERNET2的建设采用了来自多个设备生产商的网络设备。网络管理系统的建立,一方面可以协助管理人员进行设备的调试,对网络设备协议实现的完整性进行测试,另一方面也为网络的运行提供了关键的支撑技术。
由于针对IPv6的网络管理还处于研究阶段,网络管理系统的开发工作也面临着许多困难和挑战。
第一, IPv6网络管理标准处于发展中。为了支持纯IPv6网络和双栈网络的管理,IETF工作组在RFC2465中定义了有限的IPv6管理MIB(管理信息库)。RFC2465提供的信息非常有限,不能满足网络管理的需求。
第二,设备生产商对IPv6管理标准的支持参差不齐。有些设备的SNMP协议还是通过IPv4协议栈实现的;有些设备没有实现RFC2465中的MIB;有些设备采用了自定义的私有MIB。
第三,在管理系统方面,只有很少的系统能够通过IPv6协议栈访问设备上的SNMP(简单网络管理协议)代理,更缺乏一体化的集中管理方案。
同时,SNMP的MIB能够提供的信息还是非常有限的,对于管理员全面分析了解网络的运行情况还是远远不够的。针对这些问题,我们通过用户行为分析、路由监视、服务测试等功能的开发,丰富了管理系统的功能,为管理员发现和诊断问题提供了有力的手段。
总体结构设计
针对大规模网络管理的需求与特点,系统采用了松耦合的、分布式的体系结构。每个模块可以独立部署并完成相应的网络管理功能。这些模块同时又提供和其他模块的接口,这些接口遵循一定的标准,并通过一体化网络管理集成环境实现系统集成。
图 1 一体化综合网络管理系统总体架构
总体结构如图1所示。
针对各个网络管理模块功能独立,管理员查找信息不便的问题,系统通过网络管理信息搜索引擎,实现同域内多个系统以及不同域间的系统能够自由搜索和获取所需的信息,解决网络管理信息的封闭性、异构性,实现信息的快速发现和定位。
不同的网络管理模块会从不同的侧面监视到网路的故障和变化情况,来自单个网络管理模块的事件不能反映网络故障的真实原因,大量的事件风暴也会给管理员的判断、处理带来困难。事件综合处理平台将汇总分析来自各个网络管理模块的事件信息,实现分散孤立事件的关联分析,提供对网络中事件的综合处理、关联、判断、压缩。最后需要管理员手工处理的事件会转到Ticket系统,事件被分发给负责的工程师处理。事件在各个模块之间进行传递的接口和信息传递关系如图2所示。
图2 模块间事件传递关系
从图中可以看到,来自各个模块的事件通过事件接口传递到综合处理模块并通过规则关联对事件进行分析。最后,工作人员通过事件流程管理系统进行事件的处理、分配、管理、跟踪。
系统功能
除了传统的网络管理功能,系统从IP网络、路由、业务等层次进行网络的监控管理,形成多层次、多视角、一体化的展示平台和实时监控平台,全面实现IPv4和IPv6的一体化管理、基本网络运行和应用层网络业务的一体化管理,为网络的运行提供有效监控和保障。
系统通过可视化技术全面展示网络的运行情况,将网络运行情况、节点信息、链路信息、网络资源及其变化情况都以可视化的方式进行展示。
网络晴雨表既显示了网络的拓扑结构,节点之间的连接关系,同时又将节点、链路的基本信息,故障、性能等信息在一张图中动态地显示出来。不同的显示界面通过链接联系起来,管理员可以很快找到需要的信息。如图3所示。节点或者链路如果显示的颜色不是红色,则表明是正常的,如果显示为红色,则表明有故障信息存在,鼠标停留在节点上会提供相关的故障信息。对于正常节点,鼠标停留到节点上,就可以显示该节点的最基本的三项信息:路由器名称,路由器IP地址和路由器类型。鼠标单击路由器节点会进入该路由器的下一级拓扑视图,鼠标单击链路则会显示该链路的流量图。鼠标双击节点或链路则会转到其综合信息显示页面。
图3 网络晴雨表
综合信息显示通过搜索引擎从各个模块获取信息,并以直观、友好的方式显示出有用的信息。显示方式分为两种,循环显示和单一显示。单一显示适用于管理员希望关注某个设备信息时的需求场景,循环显示用于管理员平时查看的一个界面,不用手动即可以看到所有的设备情况。
图4节点综合信息显示
如图4,左上角使用油量表来显示路由器当前的一些重要的基本数据:RTT、LOSS、温度、CPU和MEM的利用率。左边栏中间是节点的详细信息,它列出了一些基本的属性。左边栏下面是路由器的故障信息。中间栏的上面是事件信息的两个统计图,饼图显示的是这个路由器各个事件种类所占的比例;柱状图显示的是一天内、一周内和一月内各种事件的数量趋势。中间栏中部是RTT和LOSS当天内的趋势图。中间栏下面是最近的事件列表。右边栏显示的是路由器所拥有的接口列表,它显示了当前所有接口的状态信息和基本的属性。
图5 综合信息显示
如图5,链路显示的信息可以分为两个接口的信息。左右对称,这样通过两个接口的信息我们可以充分显示出一个链路的信息。每个接口的信息包含以下内容:两个油量表,分别显示当前接口的如流量和出流量的利用率。链路的详细信息会显示当前接口的状态和基本属性,事件管理信息会显示最近发生的事件。
系统通过引入路由监测代理技术,在对网络和路由器造成极小负载的前提下,采集BGP和OSPF路由信息。通过分析路由信息及时发现网络故障根源,监视路由变化及路由的稳定性,可视化界面可以向管理员展示任一时刻网络的拓扑结构和路由路径。
为了对网络性能及用户行为进行分析,及时发现网络中存在的性能隐患,了解网络发展趋势,CERNET2部署了分布式的主动和被动测量系统。从被动采集网络流量进行统计分析,到模拟用户行为观察网络的响应情况,系统实现了从数据链路层到应用层的全方位的性能监测,全面掌握网络运行状态。
在管理系统的开发中,我们发现各个生产厂商的设备在SNMP over IPv6和MIB定义上都存在着各种差异,这给系统的开发带来了一些困难。对于设备存在的和标准不符的情况,我们尽量通过和设备生产商的沟通促使其达成和标准的一致。另外也有一些问题是由于标准定义不够明确,不同的生产商的实现存在差异,或者生产商定义了自己的私有MIB,针对这种情况,我们在系统开发中提供了一些配置功能,通过系统的可配置功能解决问题,或者针对设备实现专用的管理模块。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。