高校信息化普遍存在安全管理制度不完善、队伍建设缺乏编制、师生网络安全意识薄弱等现象,这给高校网络安全管理造成了较大威胁。因此,制定科学完备的数据中心管理制度是高校数据中心的重要任务。
本文根据当前高校数据中心的运维体系,分析《信息安全技术网络安全等级保护测评要求》中的测评对象及相应测评指标,明确管理对象的安全要求。在此基础上,探索数据中心的管理制度,并完善数据中心管理域,从制度上保障高校数据中心的安全运转。
高校数据中心运维体系
运维体系的核心思想是技术和管理规范并重。运维团队在标准规范和管理制度的指导和约束下,采用适当的运维工具,实现数据中心的四个运维目标,即安全、稳定、高效和低成本。运维体系结构如图1所示。
图1 高校数据中心运维体系
1.运维对象
高校数据中心提供的服务有以下几个方面:数据中心基础设施的建设和运维;全校性信息系统的运维,比如校园门户、统一认证、一卡通系统、邮件服务、云服务、高性能计算等;为学校二级单位提供IT设备的托管服务。因此,运维对象包括数据中心的基础设施、IT设备、运维工具和运维人员等。
2.运维工作
高校数据中心的常规运维分为巡检和维护,巡检对象主要是智能系统所无法监控到的对象,结合人工巡检和智能监控,及时发现故障或潜在的隐患,并实施相应的故障维护。此外,高校作为一个开放性的研究场所,网络信息系统比较容易受到黑客或者非法组织的入侵和攻击。因此,持续完善应急预案和演习,协助处理应急事件,并在国家重保期间协助护网行动也是数据中心运维的重点工作。
3.运维组织
高校数据中心大多采用混合管理模式,将专业性强、难度大的运维外包给第三方专业技术运维单位。学校运维人员负责数据中心的建设和管理以及核心业务的运维,在保证数据中心专业性维护需求的同时,兼顾节省高校的人力和财力。
信息系统安全等级保护测评要求
信息系统等级保护系列标准为国家推行信息系统安全建设、安全检查、安全整改提供了技术标准。其中,2019年正式实施的《信息安全技术网络安全等级保护测评要求》针对IT技术和应用将安全控制点划分为安全通用要求、云计算安全扩展要求、移动计算安全扩展要求、物联网安全扩展要求、工业控制系统安全扩展要求;按照不同的安全等级要求,从安全技术和安全管理两个方面定义安全控制点的安全项。其中,每一项的安全项由四部分内容组成,分别是测评对象、测评指标、测评实施和单元判定。
1.安全物理环境
物理环境指数据中心的基础设施,包括数据中心机房、相关辅助用房、电气系统、通风空调系统、消防系统、智能化系统等,为IT设备和信息系统的运行提供保障服务。其中,安全测评的内容包括物理访问控制、防雷(火、水、潮)、防盗窃、防破坏、温湿度控制、电力供应等方面。
2.安全计算环境
计算环境包括计算设备、计算系统以及数据,安全测评内容包括身份鉴别、访问控制、恶意代码防范、入侵防范、数据备份、数据完整性、数据保密性以及个人信息保护等。
3.安全管理
安全管理测评对象是人员和文档,人员包括系统管理员、安全审计员、安全管理员、机房管理员,文档包括管理文档(策略、制度、规程)、记录类文档等。
数据中心管理制度架构
海恩法则指出,每一起严重事故的背后,必然有29次轻微事故和300起未遂先兆以及1000起事故隐患,事故发生是由量积累的结果。数据中心安全稳定运行的前提是及时发现系统故障、及时解决系统故障以及规避人为错误。因此,数据中心运维的首要工作是通过建立科学规范的管理制度,提高预防性维护和预测性维护能力,以制度治理替代人治,厘清工作职责与边界,明确运维工作流程以及规范系统操作。
结合上述的高校数据中心运维体系和信息系统安全等级保护测评要求,数据中心管理制度可分为管理规范类和技术实体类(如图2所示)。
图2 高校数据中心管理制度架构
1.管理规范类
机房是数据中心的重点场所,水、电、火、人为破坏是影响机房安全的关键因素,从安防、消防、人员三个方面规范机房的环境要求、机房的出入和巡检要求、值班要求、人员职责、应急预案及处理流程,从而规范机房的安全管理。
2.技术实体类
提供安全、稳定的校园服务是数据中心的运维目标。其中,硬件故障、设备误操作以及人为破坏是IT设备的安全影响因素;权限控制和网络配置漏洞、软件程序的非法性、系统误操作、IT设备故障、人为破坏是信息系统安全的影响因素。因此,从访问控制、软件验证、系统操作、系统配置、数据备份与恢复等方面制定具体的规程。
数据中心管理制度的探索与实施
华南理工大学是国内最早开始信息化建设的高校之一,其中信息网络工程研究中心负责中国教育和科研计算机网华南地区骨干网、广东省教育和科研计算机网(GDERNET)骨干网络、学校校园网、学校云、一卡通系统、以及信息系统的规划、建设、运维和服务。
数据中心管理制度需求探索
1.新管理模式的需求
随着学校校区的扩建以及信息化高速发展的需求,华南理工大学分别在三个校区建设并运行数据中心,有限的运维人员已无法支撑数据中心的运维需求。因此,在人员编制有限的条件下,信息网络工程研究中心积极探索数据中心管理模式,将电力、消防、空调等基础设施的运维工作外包给第三方专业公司负责。同时,在混合管理模式下,数据中心管理制度需要在值班制度、机房管理、操作规程、信息保密等方面制定相应的管理制度,统筹管理数据中心本校运维人员和第三方运维人员,实现数据中心的高效安全运维。
2.网络信息安全的要求
按照教育部对教育行业信息系统安全等级保护的要求,华南理工大学的学校主页和一卡通系统的信息安全等级保护定级为第三级。其中,测评项安全管理制度要求针对各类管理内容和人员制定由安全策略、管理制度、操作规程、记录表单等构成的全面的安全管理制度体系。
数据中心管理制度研究
2015年,华南理工大学数据中心依据当时的运营需求对管理制度进行了修订,涉及值班制度、机房安全、消防安全、信息系统联网安全保密、网络中心安全应急预案等制度。随着数据中心建设和网络安全要求,旧制度所涉及的管理对象和安全要求已无法满足当前学校数据中心高效安全运营的需求。此外,从2018年开始,华南理工大学的学校主页、一卡通系统每年进行信息安全第三级等保测评,每年出具的测评报告结果都有提及管理制度完善的问题。
基于以上需求,华南理工大学数据中心研究高校数据中心管理制度的通用框架,以国家法律法规及上级相关部门的文件精神为基础,结合等保测评报告建议和学校实际情况,从安全角度全面完善数据中心的管理制度。
管理规范类制度
数据中心的安全是全校信息化的基本保障,其中威胁数据中心安全的最不可控因素是人为因素,人员和操作规范是制度的核心。
1.托管服务制度
明确托管服务范畴和托管设备的规格要求,数据中心负责托管设备的物理安全,托管单位负责设备的运维工作。
2.机房管理制度
机房管理制度的目标对象是出入机房的人员和设备。从机房环境、机房出入、机房的工作范畴、机房运维终端以及授权的一卡通和账号的使用等方面进行规定,避免人为造成的安全事件。
3.机房值班管理制度
明确值班人员的值班时间、专业要求、工作内容、工作要求,为全校提供良好的托管服务。
4.机房消防管理制度
明确数据中心人员的消防责任,增强人员的消防安全意识。制度主体内容包括消防设施日常巡检内容、安全用电用火条例以及突发火灾应急预案和处理流程等。
技术实体类
IT设备、应用系统以及数据构成数字校园服务的生态体系,因此需要加强对设备、系统、数据的管理。
1.设备安全管理制度
明确设备管理员的管理职责,从巡检、操作和维护三个方面规范对设备的管理,及时发现故障或隐患,排除设备故障,实现设备生命周期的延长。
2.系统安全管理制度
明确信息系统上线前的系统要求,上线后的系统管理员职责、系统运维的操作规程、系统的访问控制以及安全事件预案和处置流程,下线后的系统销毁要求。
3.密码管理制度
针对数据中心、设备、系统三类管理员所掌握的机房出入、运维终端、设备管理、系统管理的密码,明确密码设置要求、密码使用规范,防止密码被猜破、被泄露。
4.备份与恢复管理制度
对系统、配置文件、数据制订备份恢复方案和操作规程,并规定验证和预演要求,以保证备份数据的正确性和可用性。
5.存储介质安全管理制度
从存放、使用、销毁等方面制订存储介质的管理条例,保护介质内的数据,避免数据被泄露。
6.数据安全管理制度
依据“谁经手、谁使用、谁管理、谁负责”的管理原则,明确数据管理者和使用者的责任,规范数据存储、数据访问、数据的巡检、失效数据的销毁规范,同时制订突发数据事件预案和处理流程以降低事故影响程度。
华南理工大学在广州国际校区的建设中,按照A级标准在国际校区建设了大型数据中心,并升级改造五山校区和大学城校区的数据中心,为学校信息化发展打下了坚实基础。与此同时,如何科学有效地运维三地校区的数据中心是学校必须解决的问题。
文章从运维体系、网络信息安全两个方面分析并厘清数据中心的管理对象和网络信息安全要求,结合学校的实际情况,全面探索数据中心的管理规范类和技术实体类制度。目前,该制度已经在三个校区实施,在满足信息安全第三级等保测评要求的同时,通过制度对人员、IT设备、系统等对象进行规范管理,实现了高效、安全的运维目标。
作者:艾飞、黄建波、苏宣瑞、刘志权(华南理工大学信息网络工程研究中心)
责编:陈永杰