从2000年左右开始,校园数据中心历经十多年的变化,很多高校已经基本完成了数据中心的基础环境建设,校园数据中心已经成为数字校园建设的必要环节。如何做好数据中心的运营管理工作,使之能够不断满足学校的信息化建设需求,不断为信息化用户提供服务,是越来越多高校关心的话题。
我们总结清华大学数据中心多年来的建设管理经验,简要分析了当前阶段校园数据中心的管理工作组成内容,并以清华大学数据中心为例,介绍了清华大学数据中心的运营管理与服务经验。
数据中心管理内容分析
数据中心作为基础保障环境,为学校各类应用系统提供运行环境,同时也为校内各单位提供相关的IT 服务。校园数据中心的管理对象可以划分为基础保障环境和信息系统,其中信息系统由应用及数据资源组成。各管理对象具体说明如下:
基础保障环境:管理对象包括机房、网络、存储、服务器、容灾系统、数据库、应用软件等。
数据资源:在当前阶段数据资源主要是指数据库中的数据。
应用:运行在某一环境,并提供服务的应用程序称为应用,一个信息系统由一个或多个应用组成。
数据中心所管理的对象来源如图1所示。
图1 数据中心管理对象来源示意图
在建设阶段可以分为系统建设和环境建设两类,系统建设包括业务系统、公共软件平台等。环境建设是指数据中心的软硬件建设。在建设阶段主要完成规划设计、开发或采购活动。在各类项目建设完成后,进入运维阶段,在此阶段主要有运维管理、流程管理和服务管理三块内容,最终通过服务管理将建设成果转换为服务提供给用户。在运维阶段,具体管理内容如下:
1. 运维管理
基础保障环境运行维护:负责基础保障环境的规划和建设,为应用系统运行提供稳定、高效的运行环境,具体包括硬件环境、系统软件以及公共服务软件的安装、配置、监控、优化等维护工作。
数据管理:对各应用系统运行过程中产生及使用的数据的管理,包括结构化数据和非结构化数据,具体包括对数据遵循的标准检查、数据的存放及安全、数据生命周期管理等,为用户提供良好的数据环境和数据服务管理等。
应用管理:为保证信息系统的稳定、高效运行而对相应应用系统进行的安装、配置、优化、监视等运行维护工作。
信息安全保障体系的建设与管理:信息安全管理策略的制订与实施,包括机房、主机、网络、应用、数据以及容灾等层面的防护措施的实施,以及相关安全管理制度的制订及落实,确保数字校园信息的保密性、完整性和不可否认性。
2. 流程管理
流程是指运维服务过程中一系列、有规律的业务活动,在运维管理过程中,通过流程将运维管理的各块工作串联在一起,使用户有着良好的信息服务体验。流程管理中使用较多的流程,是根据IT服务最佳实践ITILV2中的流程进行改造而成,主要是以用户需求和IT基础设施为核心产生的一系列活动,包括服务台、事件管理、问题管理、变更管理和发布管理等。在运维服务中,通常以服务台作为单一入口,以配置数据库为核心,各个管理活动的相互关系如图2所示。
图2 服务支持流程关系图
服务台:服务台有时也称帮助台,它不是一个服务管理过程,而是一种服务职能。服务台经常与事件管理紧密结合,用来连接其他的服务管理流程,逐渐被称为一线服务支持的代名词。
事件管理:是对IT 基础架构及IT 服务交付有影响的事件或事故进行管理。事件可以是硬件或应用系统故障,信息、报警或异常,也可以是一个服务的中断或者服务性能的降低等。
问题管理:目的是消除引起事件的深层次根源以防止事件再次发生,它包括主动性问题管理和被动性问题管理两类活动。被动性问题管理的目标是找出导致以前发生的事件产生的根本原因,并提出解决措施或纠正建议;主动性问题管理的目标是通过找出运维服务中的薄弱环节来阻止事件的发生,并提出消除这些薄弱环节的建议。
配置管理:是一个将系统中软件和硬件等配置项资源进行识别和定义,并记录和报告配置状态和变更请求以及检验配置项的正确性和完整性等活动构成的过程,配置管理不仅要记录资源信息,还要记录他们之间的关系。
发布管理:是由一项或多项经过批准的变更所组成,发布管理流程是指对经测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。
变更管理:从记录变更请求开始,对变更进行审核及评估,通过审核的变更要经过测试后才能够被实施,实施后需要对变更进行评价,以保证变更被有效实施。
3. 服务管理
服务管理旨在帮助IT 服务部门确保所提供的服务能够高效、有序的进行。同时,对服务质量能够进行科学、有效的管理与控制,确保提供的所有服务都符合要求的服务级别,并不断提高服务效率和水平,提升用户满意度。在当前阶段,服务管理主要包含服务目录制定、服务级别协议管理及服务评价三方面内容。
服务目录:服务目录是对提供的所有服务的描述,同时,也是服务级别协议需要引用的重要文件。
服务级别协议管理:是指对协议签署、执行、以及变更情况的监督和控制。在服务级别协议的执行过程中,检查服务是否达到协议要求的服务级别,以及用户对提供服务的满足程度,解决复杂问题和突发问题,并对业务和用户对服务产生的新需求或变更需求进行管理。
服务评价:对IT服务质量、运维服务能力以及提供的服务是否满足业务和用户需求进行评估,评估结果直接反映出用户对IT服务的满意程度。同时,也是服务提供部门持续改进服务的重要依据。服务评价包括对用户满意度的调查和IT 服务部门的定期自评两个方面。
运维管理是数据中心管理工作的基础,流程管理是主线,串接各块的管理工作,通过服务管理的转化,将数据中心内部的管理工作以服务的形式提供给用户,并通过服务评价将用户对服务质量的满意度及新需求反馈给数据中心,用于数据中心后期的建设以及运维管理、流程管理的改善。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。