党的二十大首次将“教育数字化”写进报告,足见数字化在教育领域的关键引领。从2022年12月发布《关于构建数据基础制度更好发挥数据要素作用的意见》,到2023年2月发布《数字中国建设整体布局规划》,再到十四届全国人大一次会议表决通过组建国家数据局,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等。各行各业数字化转型蓬勃发展,推进教育数字化已经成为全国普遍共识和重要战略目标任务,教育领域也在积极推进国家教育数字化战略行动。
《上海交通大学“十四五”发展规划》中指出要以数据为驱动力,进一步推动学校管理决策向数据驱动、协同治理、主动服务转变,以信息化支撑内部治理体系和治理能力现代化。数据治理是数字化转型的基础,通过数据治理才能挖掘并体现数据资产的价值。随着教育统计事业数字化转型的深入开展,高校作为数据提供的基层单位,也需要不断提高自身数据采集、审核、管理、发布的能力。上海交通大学在数据治理过程中,以典型数据应用为驱动,构建数据治理框架和平台,通过反复迭代不断提升数据质量。
01
责任部门确定
数据治理工作是“一把手”工程,需要全校参与。党政办公室推动力、协调力强,但是在技术层面理解不深入;信息化推进办公室对学校整体数据了解深入,但是技术能力存在局限性;网络信息中心有很强技术能力,但是其协调推动能力不足,与数据决策的结合不够紧密。
目前,信息化推进办公室是数据治理的主要责任部门,统筹全校数据资源整合和共享;规划发展处负责全校统计数据统一归口管理,梳理各级各类数据应用需求;网络信息中心支持各单位梳理数据资源目录,开发数据共享应用,为数据治理提供技术保障。三部门互相配合,协同推进全校数据治理。这种组织架构将统筹推进、部门协调、技术能力有效结合在一起,以提供数据应用为出发点开展数据治理,推动全校数据资源整合共享。
02
数据应用分类
学校数据应用主要分为四类:
一是校级数据报送。高校作为高等教育的基层单位,根据《中华人民共和国统计法》规定,每年依法填报《高等教育基层统计报表(以下简称高基表)》《中央预算编制基础数据表》等各级各类报表。该类报表统计口径固定,能反映学校的发展变化情况。
二是院校研究分析。学校在人才培养、教育教学、科学研究、国际合作等多个方面需要不断发展,通过对标国内外高校,以精准的指标型数据为研究基础,找出自身差距,寻求改革发展的新路径。
三是部门院系管理。学校职能部处、直属单位和学院的管理需要结合各自情况,针对业务数据进行采集和处理,同时参考校级数据和院校研究数据作为辅助。
四是科学决策支撑。通过对全面、及时、准确和多维度的数据进行深度挖掘分析,为学校的科学决策和高质量发展提供数据支撑服务。
03
具体工作推进
根据教育部《教育系统核心数据和重要数据识别认定工作指南(试行)》的指导,结合上海交通大学实际情况,将数据分为基础数据、扩展数据、业务域数据三类,如图1所示。
图1 上海交通大学数据分类
基础数据主要包括本科生、研究生、留学生的基本学生数据和专任教师、科研人员、行政人员、教学及辅助人员、离退休人员等教职工基本数据。扩展数据主要包括各个部门业务数据,包括项目、获奖、基地、论文等科研数据,经费收入支出等财务数据,土地、建筑物、实验室等资产类数据,交流交换情况等国际交流合作数据,授课、评教等教学数据,毕业生发展情况等就业数据,该类数据主要沉淀在各个部门管理领域,是衡量学校各方面发展的重要指标。业务域数据是指部门内部管理数据,满足本部门业务和管理需要,不涉及部门交叉。
在数据分级分类的基础上开展数据资源梳理、汇总形成校级数据资源目录。数据治理工作流程如图2所示,明确数据权威源,坚持“一数一源”原则,优先通过共享获取数据。数据业务部门根据管理职能需要,通过信息系统或其他手段进行数据采集和检查维护,确保源头数据真实、准确、完整。
图2 数据治理工作流程
在进行数据归集前,进行数据标准检查,完成数据规则转化,通过数据清洗形成规范可用的数据,传输进入数据资源管理平台。数据资源管理平台是学校数据资源的汇聚中心,实现规范化统一管理,支撑学校数据标准维护实施、数据质量监测、数据共享交换、数据授权应用和数据安全管理等。信息化推进办公室定期考核评估归集的数据质量,推动数据源头部门整改问题数据,加强数据质量控制。
04
典型数据应用
数据资源共享平台,如图3所示,涵盖校内信息系统、第三方公开数据、政府共享数据、填报采集数据等方面数据,通过数据的清洗加工、归集整合、入库存储、交互共享,形成质量良好、互相关联的数据资源,打破基础数据、扩展数据、业务域数据壁垒,联通数据孤岛,提升数据应用能力和使用效能,通过数据挖掘、知识图谱、数据可视化分析等方法,在学校级、部门级、院系级、学科级四个维度上实现校级数据上报、院系研究分析、部门院系管理,为科学决策提供数据支撑服务。
图3 数据资源共享平台
数据综合统计平台,针对业务部门临时性数据采集项目和固定性报表项目。主要实现三个功能:一是关联数据推送,对于各级各类报表中关联性数据进行梳理,对其他报表中有相关的数据指标实现数据推送。例如将高基表中涉及学校基础数据推送到其他相关报表。二是业务数据采集,根据业务部门采集需求增加个性化表单设计。三是相关数据分析,对于报表的年度数据进行存储,实现数据可视化分析。
针对高等教育基层统计建立校内填报系统。高基表是教育部为全面系统地掌握我国各级各类教育事业的发展状况进行统计的报表,主要统计学校基本情况、班级数、学生数、教职工数、校舍、资产和基本建设投资等指标。高基表校内填报系统采用全台账式填报方式,对学生、专任教师、建筑物等信息从系统中直接提取数据,根据部门统计人员在统计中的处理规则形成一级规则,统计人员在统计中的处理规则形成二级规则,通过后台规则处理生成规范数据。对于非系统对接数据,建立台账模板,通过权限分配的方式开放给业务部门填报。
目前已完成通过48份台账自动生成高基表所有报表,极大提高了统计效率。数据审核方面,通过和上年数据比对,设定数据预警阈值等多方校验,加强部门审核责任流程控制,提高了数据填报质量。
教育数字化转型离不开高质量的数据支持,高质量的数据又来自持续的数据治理。数据治理需要全局性谋划和统筹性推进,坚持以数据应用为驱动力,聚焦核心业务,全校各部门多方协同、持续维护来提升数据质量,才能将数据资产的价值最大化,助力高校高质量发展,促进学校治理能力现代化。
作者:杨松、张金冉(上海交通大学规划发展处、信息化推进办公室)
责编:陈荣