随着互联网、物联网、大数据等技术的发展,高校各类信息系统、设备产生了海量的不同类型的数据,各业务系统之间有着较强的业务数据依赖,如何管理和利用好这些数据,是高校需要思考的问题。近些年,教育部等部门陆续发布了《教育信息化2.0行动计划》《教育部等七部门关于加强教育系统数据安全工作的通知》《教育部关于加强新时代教育管理信息化工作的通知》等文件,提出到2025年,新时代教育管理信息化制度体系基本形成,信息系统实现优化整合,数据实现“一数一源”,数据孤岛得以打通,数据效能充分发挥,服务体验明显提升,为数据治理指明了发展方向,提出了更高的要求。
数据治理是从智慧校园向智能校园演进的必然要求,是推动高校治理体系和治理能力现代化的重要路径。数据治理包括两个方面的内容:第一,对数据进行治理,数据是治理对象,简称“治数”,其目的是提高数据质量、使用效率等问题,为实现数据应用打下基础;第二,用数据实现治理,数据是治理工具,也就是“数智”。
当前各高校基本初步完成智慧校园的建设,各主要业务部门搭建了业务系统,信息化部门具备了基础的数据共享能力。然而随着学校业务的发展及成熟,各类信息系统、设备产生海量的数据,数据治理问题逐渐暴露出来。下面以江苏大学为例,展开说明高校数据治理面临的问题。
数据治理面临的问题
权威数据源头不明确
学校各业务部门各自产生和负责的数据资产不清晰,权威数据的源头不明确,数据管理流程不规范。亟须对全校的数据资产进行统计归纳,梳理清楚数据的字段基本情况、字段交换情况、权威数据源情况、数据变更影响情况等,实现数据治理体系的可持续优化。
数据管理困难、工作量大
传统数据共享均在数据库层面用视图完成,对于新建系统或应用来说,原本的数据共享工作无法复用。数据管理运维人员经常会困惑,“各业务域有哪些数据在共享仓库?使用的情况究竟怎样?”,数据管理面临着工作重复、对接工作量大、管控难等问题。
数据获取困难、协调沟通成本高
厂商在建设学校各类系统时大多需要获取业务数据,由于数据资产情况模糊,往往需要直接和产生数据的厂商对接,不仅面临原有厂商人员离职、沟通不畅等问题,还可能出现数据难以查找、数据注释不全等情况,且涉及业务部门、信息化中心、系统/应用厂商多方间的协调,沟通成本高,效率低下。
数据成果难感知
在数据标准制定、数据清洗转换、数据共享开放等 技术性的环节完成后,往往校领导、各业务部门、师生等群体对于建设成果没有直观的感知。校领导不清楚现在学校的资产情况哪些地方存在可改进点;业务部门不清楚信息化中心已经治理生成了哪些数据资产,哪些是可用的,哪些是自身负责的,哪些是需要的或者需要的时候该去哪获取;师生不清楚自身相关的数据由哪些部门负责,在各类申报出现问题时该找谁解决;应用开发商不了解学校已有的数据资产、信息标准、数据质量,导致应用上线后才发觉无法达到预期的效果。
数据资产管理平台建设实践
基于上述在数据治理和管理中遇到的挑战,江苏大学数据与信息化处构建了以数据资源目录为核心的数据资产管理平台,见图1,以业务视角重新梳理各类群体在数据治理过程中应担负的职责、可享受的服务等,并以统一的数据门户入口连接各类角色,实现数据治理体系在校级层面的优化。
图1 数据资产管理平台系统界面
数据资产管理平台是全校数据资源的一个有序清单。它可以使用元数据来帮助学校管理数据,帮助数据专业人员收集、组织、访问和充实元数据,从而为数据发现和治理提供支持。通过数据资源目录的建设,可以逐步解决学校数据来源不明确、权责不清晰以及架构数据不全面等问题。数据资产管理平台与学校共享数据中心完成对接,耦合学校已有的数据标准体系,提供数据资源的全生命周期管理能力,使数据资源的使用和管理过程在线化、流程化、业务化。平台面向校领导、各职能部门和一般数据用户提供直观的数据目录展示大屏和报表;提供数据目录的挂载、编辑、下线、申请等功能;提供数据表的查询功能;提供数据资源访问入口,可浏览、检索、申请数据资源。
通过构建以数据资源目录为核心的数据开放门户,数据资产管理平台整体架构将数据资源以可视化、流程化、具体化的形式供全校各部门自主使用,支撑上层各式各样的智慧校园数据应用建设,如图2所示。
图2 平台架构
为快速响应数据治理需求、节省学校信息化建设经费,数据与信息化处组织技术骨干进行技术攻关,自行开发了数据资产管理平台。平台采用了前后端分离的软件架构体系,部署方式采用Jenkins+Docker+Nginx。平台采用的技术路线,便于多人协同开发、灵活运维。平台支持的数据库连接类型包括Oracle、SQLServer、MySQL、PostgreSQL等。
1、明确权威数据源的方案:数据资源目录
学校数据与信息化处在整理各部门信息系统建设情况和现有数据资源情况的基础上,与各部门沟通讨论,制定了《江苏大学数据资源目录》文件,明确了各部门所负责的各类数据,明确了数据的权威源头。
数据资产管理平台提供在线数据资源目录浏览与查询功能,用户可利用树形目录,按照部门来查找相应的数据资源,也可以直接按照字段名、字段释义等进行模糊搜索,便于数据需求方查找所需数据的权威源头,也帮助各部门明确自己所负责的数据源。
2. 便捷数据运维方案:数据资源管理
数据资产管理平台还为数据管理运维人员提供了便捷的数据运维功能。除了默认的主数据数据源外,数据管理运维人员可以配置其他数据源,平台会自动采集所配置数据源内的表结构、字段等信息,生成可供配置的数据资源目录,无需手工录人。数据管理运维人员可以在线维护各个数据资源的业务域、责任部门、上线状态、字段等信息,使得整个信息一目了然。
3. 高效数据共享方案:数据资源查询与共享申请
数据资产管理平台为数据需求方提供了数据资源查询功能。厂商在建设信息系统时,如需获取其他系统的业务数据,可直接在数据资产管理平台中搜索所需数据,点击查看搜索结果的详情,即能获得具体数据的管理部门、数据字段情况、数据质量情况以及数据样例等信息。大多数情况下,厂商无需再跟所需数据的原有厂商、业务部门、信息化中心等进行多方沟通协调,提高了系统建设效率。
同时平台还通过与办公系统对接,提供了申请数据共享的审批流程。对于所需的数据资源,用户可在线申请,经过相关管理部门审批后,可获得数据的访问权限,使得数据共享的过程高效而规范。
4. 数据治理成果可视化方案:数据资源大屏
数据资产管理平台提供数据大屏页面,通过对现有数据进行统计、汇总、分析,利用饼图、条形图等方式,多维度展现了当前数据治理的成果。校领导、各业务部门等可通过数据资源大屏,直观地了解到目前数据资源的总量、数据表的总量、数据资源涉及的责任部门数量与分布情况、数据资源业务域分布情况、数据资源责任人、敏感字段等情况。
结语
伴随着数据资产管理平台的建成,江苏大学逐步明确了各业务数据的权威源头,掌握了数据共享情况,实现了数据便捷共享,并为师生提供了高效的数据资源管理与获取方式,有效提升了学校数据治理能力,为后续数据治理工作的开展打下了坚实的基础。
*基金项目:江苏省现代教育技术研究 2023 年度智慧校园专项课题(课题编号:2023-R-107319)
来源:《中国教育网络》2024年7月刊
作者:吴云龙、王聪(江苏大学数据与信息化处)
责编:余秀