数据治理作为数字化转型的第一道必答题,现已引起各大高校和企事业单位的普遍重视。数据治理的主要任务包括数据资源目录建设、数据模型设计、数据标准建设、数据质量管理、数据开放共享等。其中,数据资源目录作为开展数据治理各项任务的索引图和总账本,是破解数据治理难题的关键,也是数字化转型工作的切入口和出发点。
数据资源目录建设现状
数字化转型中的组织和单位都已充分认识到建设数据资源目录的重要性,但在建设过程中极易出现目录建设目标不明确、数据梳理不充分的问题,导致数据资源目录建成后缺乏实际指导意义、难以满足使用需求。
建设目标不明确,目录缺乏实际指导意义
建设数据资源目录的基本方法是数据调研,在进行调研前需明确数据资源目录建设的目标或用途是什么,以此为依据圈定调研范围和调研重点。
若为指导数据共享、解决填表难的问题,调研重点应放在面向个人采集的信息数据;若为指导信息化建设,数据调研范围不应局限于现有信息系统中管理的数据,而应扩大至各业务部门认为有必要管理的所有数据;若为指导数据中台建设,调研范围应包括各项数据可在何种密级的网络中集中存储。
如果数据调研前未明确目标,将导致调研不充分,进而使得依据调研结果拟制的数据资源目录无法发挥实际作用。
数据梳理不充分,目录难以满足使用需求
高价值数据往往来源于业务、服务于业务,因此建设数据资源目录需要各领域业务人员深度参与。但由于调研人员无法熟悉所有领域业务,各领域业务人员对数据治理重要性认识不足、配合调研积极性不够,以及业务人员担心暴露当前数据管理不善问题、担心数据共享安全不托底等主观原因,使得在数据调研阶段未能全面梳理业务数据。
即使业务人员具有较强的主观积极性,但由于系统梳理业务数据难度大、业务人员对数据存储的技术层面了解欠缺等客观原因,使得业务人员在参加数据调研时仍难以全面提供数据资源目录建设所需信息。因此,数据资源目录建设中最常见的问题就是数据梳理不全面、不深入,导致数据资源目录中的信息无法满足共享使用需求。
数据资源目录建设实践
学校网信办于2022年正式成立学校数据治理小组,启动数据资源目录建设工作,规划了“谋划准备、数据调研、建用互促”的建设路线。
为避免建设目标不明确、数据梳理不充分的问题,数据治理小组首先明确了“服务共享、指导建设”目标,科学设计数据调研方案(图1),并在数据调研中贯彻“启发式”和“服务式”理念,较为全面充分地梳理出各业务部门所掌握的数据,初步完成学校数据资源目录建设,系统梳理出校本级管理的4000余个数据字段,包含各数据字段的权威数据源、存储现状、联系人、可集成共享网络类别(互联网、内部网、办公网)等信息。
图1 数据调研路线
瞄准“服务共享、指导建设”目标
科学设计调研方案
1.服务数据开放共享,重点攻克师生填表难问题
学校数据治理小组将数据目录建设首要目标确定为“通过促进部门间数据共享做到同一数据仅填报一次或仅核对一次,从而解决师生反复填表问题”。
开展数据调研前,学校数据治理小组对科研人员、教学人员和学生进行抽样调查,梳理各类人员近一年填报的数据字段,并在正式调研时寻找各数据字段归口管理部门。
初步拟制数据资源目录后,重点核查不同业务部门均需面向师生采集的数据,并通过跨部门协商明确此类数据的唯一权威数据源。数据资源目录出台时,同步发布权威数据源管理细则,规定“对已明确权威数据源单位的数据字段,各单位若需使用该数据字段应向其权威数据源单位申请,原则上不得重复采集”。
2.指导信息化建设,不断丰富完善数据资源体系
经过“十三五”时期建设攻关,学校在网云基础设施方面取得长足进步,但业务应用建设相对薄弱,大量数据尚未通过信息化手段实现自动化采集管理。为实现学校治理管理现代化,学校全面推开各领域业务应用建设,现阶段急需明确各领域建设需求,为信息化建设提供参考。
因此,学校数据治理小组开展数据调研时,以形成“建设数据资源目录驱动梳理信息化建设需求、信息化建设反哺数据资源目录建设”的良性循环为目标,着重引导各业务部门以业务需求为起点,全面梳理必要管理数据字段,并逐步梳理各数据字段存储现状。对尚未实现自动化采集管理的必要管理数据字段,各业务部门在后续建设业务信息系统时,将聚焦实现其自动化采集管理。
贯彻“服务式启发式”数据调研理念
深入开展数据梳理
1.针对调研人员无法熟悉所有领域业务,以及各领域业务人员对数据治理重要性认识不足、配合调研积极性不够的问题,坚持“消除壁垒、强化共识”的服务式数据调研理念。
消除壁垒:在数据调研前研读各业务部门的上级数据需求、行业标准规范、各业务部门职责清单和一年内发布的各类文件,梳理其中涉及的数据资源并熟悉各部门业务,尽量消除调研人员与各业务部门工作人员间的知识壁垒,提高调研沟通效率。
强化共识:在梳理各业务部门数据前,举例引导工作中面临的填表难、统计难等问题,并分析此类问题背后存在的数据共享需求,使其了解数据共享的重要意义,激发其配合数据治理工作的积极性。为响应已调研部门的数据共享需求,在开展后续部门调研时,重点定位已调研部门需求数据的归口管理部门。
2.针对系统梳理业务数据难度大、业务人员对数据存储的技术层面了解欠缺、担心数据共享安全不托底的问题,坚持“由泛而精、由纲及目、由全向深”的启发式数据调研理念。
由泛而精:结合各业务部门一年内发布的通知公告,归纳梳理其中拟采集的数据,并提前整理国标、行标中可能与各业务部门相关的数据,综合形成较为宽泛的业务部门备选数据资源清单。在正式调研时由各业务部门在备选数据资源清单上进行删改和补充,形成精准的部门数据资源清单。得益于各业务部门备选数据资源清单的启发,业务人员在未提前梳理总结业务数据情况下可快速进入状态,全面系统列举本人业务涉及数据。
由纲及目:在调研前定义粒度较粗、容易列举的数据项概念(描述特定事物的一组数据字段的集合)。调研中先引导业务人员梳理业务涉及的数据项,再以梳理出的数据项为纲,协同业务人员、信息系统使用者、信息系统管理者、信息系统开发方共同细化完善数据项中的数据字段,起到纲举目张、执本末从的效果。
图2 数据项示例
由全向深:如图2所示,在首轮数据调研时求全而不求深,尽可能梳理出各业务人员掌握的全部数据字段,但仅记录数据字段名称和对应联系人等浅层信息,不涉及数据存储现状、集成共享范围、数据质量等深层信息,避免业务人员因主客观原因忽略相对敏感、质量不高、暂未管理的数据字段,同时避免在调研之初陷入信息泥潭。
随着数据治理工作推进,逐步引导各数据联系人扩展数据资源目录的信息维度,补全更深层次的信息。例如,在数据资源目录即将发布前,补充完善数据存储现状信息,以支持数据需求部门快速定位数据供应方;在建设数据中台时,补充完善数据可集成共享的网络、现有数据标准、数据接口等信息。
数据资源目录工作展望
数据资源目录是数字化转型中后续工作的铺垫,在后续工作中应注重持续维护完善数据资源目录,并善于运用数据资源目录,重点在数字化转型生态构建、示范引导建设等方面取得突破。
坚持建用互促,筑牢数字化转型之基
“凡战者,以正和,以奇胜”,数据资源目录建设同样如此。“以正和”是筑牢基本盘,即按照既定计划扎实推进数据资源目录建设;“以奇胜”是寻求新突破,即及时运用数据资源目录开展数据共享试点,通过实际成效调动各部门参与积极性。
此外,数据资源目录建设不是一次性工程,其后续的维护完善和推广运用至关重要,只有不断在运用中发现不足并及时补充完善,才能使数据资源目录长期有效地发挥对数字化转型的基础支撑作用。
因此,数据治理小组在数据调研过程中以数据共享思维为基础,主动互通各业务部门间数据底数,促进部门间数据共享合作,从而调动各业务部门配合数据资源目录建设及数据治理后续工作积极性,形成数据资源目录建设与运用的互促之势。
在数据资源目录发布时,同步建设出台权威数据管理细则,明确权威数据源单位的数据资源体系建设、数据质量提升、数据开放共享责任,权威数据目录维护分工,权威数据认定和变更流程等,为数据资源目录的运用提供制度保障。
后续,学校将及时配套建设数据资源目录管理平台,覆盖权威数据源的公示查询、变更申请、问题提报等功能,实时化动态化维护,保证数据资源目录的权威性和准确性;及时开展数据标准和数据中台建设,促进数据资源目录进一步扩展完善。
注重生态构建,盘活数字化转型之源
全体师生、教职员工是个人数据的第一负责人,各级基层单位是单位数据的负责实体,各业务部门是业务相关数据的负责实体、个人及基层单位数据的归口管理实体和主要需求实体,此三方是数据流转的主要参与方。只有将此三方纳入数据建设生态,达成“数据赋能业务、数据服务教研”的共识,构建“建、管、用”共同体,才能最大程度盘活数据资源,进而实现高质量数字化转型。
因此,数据治理小组在数据调研过程中通过国内外高校数字化转型案例介绍、校内跨部门数据共享需求分析和数据赋能业务案例分析等手段宣贯数字化转型的思路和意义,并已在业务部门间达成基本共识。
后续,学校将基于数据中台和数据资源目录建设个人信息门户、基层单位信息门户、业务部门信息门户,为个人、基层单位、业务部门提供数据的查询、维护、纠错,让各方能直观感受到数据资源建设进展,并调动各方力量提升学校数据质量,打造全员参与的数据建设环境。
加快示范建设,培育数字化转型之势
数字化转型的基础条件初步具备后,即可科学全面开展各业务领域应用建设。然而,业务领域应用建设的专业性强、任务艰巨,无法全部由单个部门主导完成。因此,应选取增效明显、受益面广的重点公共数据应用、典型领域业务应用、跨部门业务应用开展攻关建设,形成示范引导效应,逐渐形成各业务领域争相转型的势能。
因此,学校将重点围绕办学态势展示、智能辅助决策两项需求,依据数据资源目录,对接数据中台,建立完善大数据处理平台、分析算法库和开发工具集,支撑大数据典型应用开发。
选取数据建设基础好、服务师生需求大的教学管理领域作为试点,集中精力开展教学管理数字化转型,从数据层面和业务流程层面联接整合现有的本科研究生教务系统、教学督导系统、智慧教室平台系统,实现对教师教、学生学等各教学环节和过程的质量数据伴随式采集汇总,对教学质量问题进行监测研判,及时告警反馈,形成“计划-执行-检查-处理”(PDCA)人才培养闭环。
调研跨人事部门、后勤部门、学生管理部门的业务应用联动需求和数据交互需求,协调组织开展相关建设,为提升人财物一体化全周期管理和服务能力提供支撑。
作者:包涵、祁帅辉(国防科技大学网信办)
责编:陈荣