2024年9月,中共中央办公厅、国务院办公厅在《关于加快公共数据资源开发利用的意见》(简称《意见》)中指出,要破除公共数据流通使用的体制性障碍、机制性梗阻,激发共享开放动力,优化公共数据资源配置,释放市场创新活力,充分发挥数据要素放大、叠加、倍增效应。高校数据作为重要的公共数据资源,共享成为其价值最大化的关键路径,《意见》恰好为高校数据共享锚定了航向。
数据共享与数据治理相伴而生,在高校信息化发展的历史长河中,“需要数据共享”的共识早已达成。新形势下,高校数据共享迎来了新的机遇和挑战。如何克服困难,做好数据共享,释放数据潜能?怎样让优质的高等教育资源洒满大地,惠及全球,为构筑国家竞争新优势提供坚实支撑?这些问题亟待探索和解答。
价值驱动
携手共促数据共享
数据共享是指数据在不同主体之间流通和使用,从而使数据价值最大化的一种活动。
“高校数据共享是指高校内部应用系统和校内其他应用系统或校外应用系统之间的数据共享,是一种运行于计算机网络的活动。”华南理工大学副首席信息官兼网信办主任陆以勤表示。
于高校而言,“数据共享不仅能够打破信息孤岛,实现资源的优化配置,还能推动高校内部及校际间的协同合作,为高校发展注入新的活力”。西安交通大学网络信息中心主任锁志海将数据共享的价值总结为以下三点。
首先,提升管理水平。通过数据共享,高校可以充分利用现有的信息资源,避免重复建设和资源浪费。例如,不同部门之间可以共享学生信息、教职工信息等基础数据,减少数据冗余和不一致性。
其次,促进教学科研创新。数据共享不仅限于行政管理层面,对于教学和科研也具有重要意义。通过共享教学资源和科研成果数据,教师可以获取更广泛的教学素材,丰富教学内容;科研人员可以基于共享的数据进行跨学科、跨领域的研究合作,加速科学发现的进程。
再次,增强决策支持能力。数据是决策的重要依据,数据共享有助于学校管理层全面了解学校的运营状况,包括招生就业、教育教学、科学研究等方面的数据。这些数据为管理决策提供了有力支持,有助于提升管理效能和决策的科学性。
为高效推进优质教育资源开放共享,充分发挥教育数据倍增效应。2024年1月,教育部部长怀进鹏在世界数字教育大会上指出,中国国家教育数字化战略将突出应用服务导向,扩大优质资源共享,推动教育变革创新;3月,2024年政府工作报告提出,健全数据基础制度,大力推动数据开发开放和流通使用;8月,教育部副部长王嘉毅在2024全球智慧教育大会上表示,加强资源共享,促进教育更加公平包容。
各高校纷纷采取行动。与此同时,共享哪些数据?共享到哪?如何共享?这些问题也成为各高校亟须优先解决的关键性问题。
谈到共享哪些数据,就绕不开数据的分类分级。“数据分类分级是开展数据安全建设的基础,也是促进数据充分利用、有序流动和安全共享的重要前提。”中国农业大学信息化办公室校园数据中心副主任虞萍表示,数据分类具有多种视角和维度,其主要目的是便于数据管理和使用。数据处理者进行数据分类时,可在遵循国家和行业数据分类要求的基础上,从多个维度进行分类,并对不同维度的数据类别进行标识。
千校千面,由于各高校校情不同,所以在数据分类上也存在差异。但整体上,大部分高校基本将学校数据分为教学、科研、管理等几大类,以求全面、有效地支持学校管理和决策。例如,沈阳工业大学构建了决策支持系统,以共享数据中心为依托,以用户需求为导向,实现校情、教学、科研等17个主题大类354项综合数据查询、统计、分析和展示。
在做好数据分类分级的基础之上,锁志海认为,高校数据共享过程中,需要共享教学、科研、管理等各类与学校日常教学、管理、生活相关的数据,如学生基本信息、教职工基本信息、选课信息、成绩信息等。这些数据需要共享到学校的各级管理部门、教学科研单位以及有需求的外部机构。
那么,如何共享这些数据?
对外经济贸易大学财务处处长王海涛表示,一般可以采取两种方式:一是业务系统间直接共享,二是通过数据中心共享。业务系统间直接共享,会增加数据共享的成本,使数据共享逻辑复杂。原则上,除非有特殊需求,必须进行业务系统间直接共享外,均要通过数据中心进行共享。
“近年来,在数字校园建设阶段,数据共享主要通过共享库或中间库交换,实现不同业务系统中核心基础数据的更新同步。在智慧校园建设阶段则通过数据中台等全面汇聚、融合计算支撑部门协同、流程重构以至业务智能。在这一过程中,数据共享的范围不再局限于校内部门之间,部分高校也积极申请政务数据资源与学校数据融合,获得了良好的应用效果。”上海交通大学信息化推进办公室、网络信息中心副主任姜开达表示,部分单位还尝试建立校际数据共享机制,如教育部教育管理信息中心牵头建立的高校数据共享联盟、U21联盟数据共享支持战略协作小组等。
U21联盟(Universitas 21),一个由全球优秀研究型大学组成的国际高校联合体。目前,U21联盟共有27所成员高校,来自六大洲、18个国家。作为“影响力的催化剂”,U21联盟坚持“共享卓越、共享知识、共享经验”的理念,通过促进成员高校间师生的交流与合作来实现全球的知识流动、跨境合作。
寻根溯源
破解数据共享难题
高校数据的核心特征是多元化,数据来源多,涉及多个平台和业务系统。因此,这些年各高校在数据共享的探索和实践中,也是困难重重。
一是统一技术支撑平台匮乏。清华大学信息化工作办公室主任张小平在相关采访中表示,数据共享之所以复杂,一方面是因为缺乏统一的技术支撑平台。清华大学通过两年前部署的学校数据平台,完成了数据的集中整合,实现了由学校统一平台支持数据共享,解决了技术层面数据共享的瓶颈。而在解决了技术平台缺失的难题后,学校还需建立有效的数据共享机制。
二是数据共享和管理机制不够完善。由于这些年高校内部的部门分割和条块化过于琐碎,造成数据过于分散,数据共享和管理机制不够完善。锁志海指出,部分高校在数据共享方面缺乏完善的管理机制,再加上数据共享往往需要多部门协作,但不同部门间存在利益冲突和沟通障碍,导致数据共享意愿不强,影响数据共享的效果。对此,高校需不断优化数据共享流程,提升各部门在数据共享、使用中的满意度,促进各部门主动参与数据共享工作。
三是数据标准不统一。在多部门协作的过程中,由于不同部门、不同系统之间的数据标准存在差异,导致数据共享时需要进行复杂的数据转换和清洗工作。武汉理工大学信息化办公室主任马斌指出,高校在数据治理和共享标准的建设上有待进一步深化。在数据精准获取、高效流转、安全使用方面的相关标准建设还有较大的改善空间,需要持续进行完善和补充。对此,锁志海认为,高校应以国标、教育部行标为基础,通过对学校实际情况的调研和分析,制定学校的校标,同时建立完善的数据质量管理体系,确保数据的准确性、完整性和实时性,提高数据共享的效率和质量。
四是数据共享与安全难以平衡。数据安全是一切数据活动的底线,也是开展数据共享的前提和重中之重。况且在学校里,学生学习记录、成绩及选课信息等均属于个人敏感信息,关乎学生隐私权益,共享时面临的法律风险显著。张小平指出,传统的“脱敏处理”策略适用于满足宏观分析与统计需求,但在针对个人提供精准的定制化服务时,如何在保护个人隐私的情况下,实现各部门数据共享利用,仍会遇到诸多应用场景限制。对此,他认为“可用不可见”“可算不可识”是最为理想的解决方式,学术界和产业界也仍在研究探索相对成熟的方案。采取“事先知情同意”的策略是当前实现个人数据共享应用的重要手段。
不仅是技术的革新
更是理念的飞跃
数据共享是数据治理的主要目标之一。“数据治理虽然包含的内容更多、范围更广,但其中主要的一个目的就是更好地共享数据、使用数据。”高亮表示。回望这些年,我国教育领域的优质数据资源共享正在全面铺开。
在国家层面,国家智慧教育平台建设作为教育数字化战略行动的先手棋和重要抓手,坚持系统集成,成为资源富矿和服务高地,极大地拓展了数据共享的深度和广度。据介绍,截至2023年底,平台累计注册用户突破1亿,浏览量超过367亿次、访客量达25亿人次,数字技术的叠加、倍增、溢出效应充分显现。2024年1月26日,教育部公布国家教育数字化大数据中心已起步建设。1月30日,国家智慧教育平台国际版正式上线,大量的中国优质教育资源走向国际,惠及全球学习者。
紧接着,为丰富国家智慧教育平台数字教育资源供给,提升资源质量,并保证平台数字教育资源内容安全,教育部先后印发《国家智慧教育平台数字教育资源入库出库管理规范》《国家智慧教育平台数字教育资源内容审核规范》,确保教育资源绿色共享。
在高校层面,孙秋瑞表示:“当前,大部分高校已经开始重视数据共享,建立了数据共享平台或数据中台,实现了数据的集成和共享。”
的确,近些年各高校建设了各种类型的数据平台,如中间库、共享交换库、数据治理平台、数据中台等,数据平台、标准规范、数据治理等取得关键进展,夯实了数据共享与应用的基础。例如,上海交通大学建设了实现业务系统数据同步的共享库系统和推进校院两级数据融合管理的院系管理平台;浙江大学建设公共数据库,形成公共数据平台、个人数字档案、数栈大数据平台、日志数据平台四大数据平台协同体系。武汉理工大学探索实施了“理论+实践”双轮驱动的数据共享路径,坚持标准先行,构建了数据共享交换指标体系;坚持应用为王,打造了一批数据共享的典型应用场景;坚持示范引领,持续开展数据治理。
姜开达认为,未来高校数据共享范围将进一步扩展,跨单位、跨地域、跨行业的数据共享将不断增多,数据应用的深度和广度将进一步拓展。跳出高校看高校,结合政务数据开放共享,将获得更丰富的数据场景。在大语言模型等人工智能加持下,新型数据中心将推动高校数据治理和共享应用更加智能和安全,数据将全面赋能教育教学应用和学校现代化治理。
为进一步发挥数据要素价值,释放数据潜能,各位高校信息化部门负责人在采访中基本从以下几个方面作出指引,点亮高校数据共享的前行之途。
一是加强顶层设计,制定数据共享战略和规划;二是建立统一的数据质量、数据标准、数据生命周期等管理机制;三是采用加密、授权等技术手段,加强数据安全和隐私保护;四是加强人员培训,提高数据意识和技术水平;五是引入先进的数据技术和工具,如人工智能大模型等,提高数据共享的效率和质量;六是科学治理与应用来自内部和外部的各种数据,对内要优化内部数据共享机制,对外通过申请政务数据资源以及建立校际数据共享机制,拓展外部数据共享合作,丰富数据来源。
总之,高校推进数据共享,不仅是技术的革新,更是理念的飞跃。数据共享并不是一个部门的单打独斗,而是各业务部门的协同作战,是智慧与资源交织的交响乐章。这些年,通过深化数据治理,构建共享机制,各高校正逐渐打破信息孤岛,实现数据的互联互通与安全共享。这不仅提升了数据的质量与控制水平,更为教育数据的广泛流通与高效利用铺设了坚实的基石。未来,愿各高校在数据共享方面做出的努力,能够激发更多高等教育创新的火花,让数据成为照亮教育未来的璀璨星光。
来源:《中国教育网络》2024年10月刊
撰文:陈永杰