高校数据共享是指在高校内部不同部门、系统之间以及高校与外部机构之间,按照一定的规则和权限,实现数据的流通、交互和使用。它不仅仅是数据的简单传递,更是通过整合、分析和利用数据资源,为高校的教学、科研、管理等各项工作提供更全面、准确的信息支持。
追因
数据治理和数据共享相辅相成
提到数据共享,大多数人都会联想到数据治理。其实,数据治理和数据共享相辅相成。数据治理是数据共享的基础,通过建立数据标准、规范数据流程、确保数据质量等措施,为数据共享提供可靠的数据资源。数据共享则是数据治理的目标之一,通过共享数据,实现数据价值最大化,同时也检验和促进数据治理的效果。
高校之所以进行数据共享,主要原因包括以下四个方面。
一是提高管理效率,避免数据重复采集,让数据多跑路,师生少跑腿;二是促进教学科研,为教师和学生提供更丰富的数据资源,支持教学方法创新和科研项目开展;三是提升决策水平,通过整合多源数据,为学校领导提供更全面的信息,以便做出更科学的决策;四是满足国家和社会需求,响应国家信息化发展战略,提高高校服务社会的能力。
数据共享的内容包括但不限于学生信息(如学籍、成绩)、教师信息(如教学、科研、职称)、课程信息、科研项目信息、财务信息、资产信息等。为了给高校各项工作提供更加全面、准确的信息支持,这些数据需要共享到学校的各级管理部门、教学科研单位以及有需求的外部机构。
高校可以采用数据接口、数据仓库、数据交换平台等技术手段,同时建立完善的数据共享机制和权限管理体系,实现数据共享,确保数据的安全和合理使用。
岁月流转,时代更迭。回望这些年,高校数据共享也已经历了四个发展阶段。
一是数据孤岛阶段。高校开始建设各自的业务系统,但这些系统间的数据库是独立的,形成了信息孤岛,没有实现技术上的数据共享。
二是网状结构阶段。在这个阶段,高校开始尝试通过不同的数据共享方式(如ETL、数据视图、数据接口等)打通系统数据,实现跨系统的业务协同。但由于缺乏统一规划,数据共享呈现网状结构,系统间的耦合度非常高。
三是星状结构阶段。数据成为高校的重要资产,信息化建设的需求转变为如何有效管理和共享数据,降低系统间的耦合度。高校普遍采用星状化架构进行系统间的解耦,建设数据管理和共享的中心节点,将各个系统的数据汇聚到中心节点,再按需分享到需要数据的系统。
四是平台化阶段。随着教育部推动实施国家教育数字化战略行动,高校数据共享和应用呈加速发展态势。高校开始建设数据仓库、数据交换平台、数据资源目录、数据中台等。统一标准,规范流程,简化操作,创新应用场景,赋能管理服务。
如今,高校数据共享已经迈入新的发展阶段。大语言模型等人工智能技术的发展,为数据共享带来了更多的智能化前景。高校信息化建设中,将更多考虑数据资产的高效管理、安全治理和智能应用前景。我们可以将这个新的阶段称之为“数据安全和深化应用阶段”。该阶段反映了高校数据共享从无到有,从分散到集中,再到平台化、资产化、智能化的过程。
破局
数字化转型加速
高校数据共享涉及数据质量、数据标准、数据安全与隐私保护、管理机制、人才培养等多个关键要素。当前,大部分高校已经开始重视数据共享,建立了数据共享平台或数据中台,实现了数据的集成和共享。但是,数据孤岛现象依然难以完全打破,数据质量、数据标准、数据生命周期等机制难以覆盖全部信息系统并贯彻始终,数据安全和隐私保护压力大,人员数据意识不足等,影响了数据的可用性。
针对这些挑战,高校一要加强顶层设计,制定数据共享战略和规划;二要建立统一的数据质量、数据标准、数据生命周期等管理机制;三要采用加密、授权等技术手段,加强数据安全和隐私保护;四要加强人员培训,提高数据意识和技术水平;五要引入先进的数据技术和工具,如人工智能大模型等,提高数据共享的效率和质量。
北京师范大学在数据共享方面采取了以下行动。
第一,成立校务数据管理中心,从数据汇总、统计、汇报的角度对数据进行有效利用,充分挖掘数据价值,支撑学校决策。这一举措是为了从顶层设计角度制定数据标准和管理办法,使得数据在采集、存储和使用过程中有章可循;并站在学校整体的高度,对数据进行深度统计和分析。
第二,建立数据共享平台,对学校的主要数据资源进行整合。制定了数据标准和管理办法,规范数据的采集、存储和使用流程。这一举措是为了支撑学校发展,将各个部门和系统分散的数据整合起来,实现数据的互联互通;为各个部门和系统提供一致、准确的数据基础,便于各部门之间进行协同决策;推送数据快速在不同系统和部门之间流转,使得学校各项业务流程更加顺畅和高效。
第三,在数据共享领域积极展开探索,致力于实现数据的有效应用。其一,将数据提供给各个业务系统,以此实现传统的数据利用方式。其二,针对部分轻量化、短平快的数据需求,结合办事大厅、低代码平台以及万能表单等轻应用开发模式,迅速将数据提供给校内师生使用,从而满足师生多样化的需求。这一举措是为了在数据共享领域积极探索有效应用,基于平台化阶段的数据共享探索更高效、更智能的数据应用模式;充分发挥数据价值,满足校内师生的多样化需求,推动数据共享从传统模式向更加灵活、多样的模式转变,从而赋能学校的管理服务。
未来
拓展数据共享深度和广度
数字时代背景下,高校数据共享将更加普及和深入,数据将成为高校的重要资产。2024年3月,2024年政府工作报告提出,健全数据基础制度,大力推动数据开发开放和流通使用;8月,教育部副部长王嘉毅在2024全球智慧教育大会上表示,加强资源共享,促进教育更加公平包容。一系列新指示把高校数据共享推向了高潮。
在技术发展和政策支持下,高校可从以下几个方面入手,顺利推动数据共享朝着更高效、更安全、更智能的方向发展。
第一,加强领导,提高对数据共享的认识。高校要深刻理解数据共享在现代化管理、教学科研创新以及服务师生等方面的关键作用,在全校范围内营造重视数据共享和数据安全的良好氛围,确保全体师生员工都能认识到数据共享对于学校发展的深远意义。
第二,建立健全数据共享机制和管理体系。这是保障数据共享有序进行的基础。高校应制定详细的数据共享规章制度,明确数据的所有权、使用权、管理权等权限划分,规范数据的采集、存储、传输、使用和销毁等各个环节的流程。同时,有条件的高校可以设立专门的数据管理机构,负责统筹协调全校的数据共享工作,加强对数据共享过程的监督和评估,及时发现并解决问题,确保数据共享工作的顺利开展。
第三,加强数据治理,提高数据质量。数据质量是数据共享的核心要素,高校要建立完善的数据质量管控体系,对数据进行定期清洗、校验和更新。通过制定数据质量标准,对数据的准确性、完整性、一致性、时效性等方面进行严格把关,确保共享的数据真实可靠、可用有效。其实,高校在系统规划阶段,就应依据数据共享标准进行整体架构设计,确保新系统能够与现有数据共享体系实现无缝对接,数据能够顺畅流通和共享。从数据库表结构的设计到数据字段的定义,尽可能遵循统一的数据共享标准,避免出现数据格式不一致、接口不兼容等问题,为后续的数据整合和共享奠定便捷基础。
第四,加强技术创新,提高数据共享的效率和安全性。高校应积极引入先进的信息技术,如大语言模型等人工智能技术。大语言模型为用户提供了自然语言交互的能力,极大简化了数据共享的操作流程,为用户提供智能的数据推荐和个性化服务。对于复杂的数据内容,大语言模型可以提供更深入的解读和语义理解。
第五,加强与外部机构的合作,拓展数据共享的范围和深度,为高校发展迎来更多机遇。高校应积极与其他高校、科研机构、企业等建立合作关系,开展数据共享与交流合作。通过与其他高校共享教学资源、科研数据等,促进教育教学质量的提升和科研创新能力的增强;与科研机构合作,共同开展前沿科研项目,实现数据资源的互补和协同创新;与企业合作,将高校的科研成果与市场需求相结合,推动产学研用一体化发展。同时,积极参与国家和地方的数据共享平台建设,融入更大的数据生态系统,为社会发展作出更大贡献。
此外,从宏观角度去看,需要加强高校之间的数据共享与合作,建立高校数据共享联盟,共同推动高校数据共享向上生长;加强数据共享的政策支持和资金投入,为高校数据共享提供保障;加强数据共享研究和实践,探索适合高校的数据共享模式与方法,共绘数据共享蓝图。
国外高校在这方面已涌现出诸多可资借鉴的范例。譬如,美国校际社会科学数据共享联盟(ICPSR),其早在1962年便已创立,是一个由700多所学术机构和研究机构共同构建的国际联盟存储库。该联盟在为社会科学研究界提供数据访问服务、开展调查以及分析方法培训等方面发挥着引领作用。
鉴于此,我们应积极推动高校之间的数据共享与合作进程,充分汲取国外成功经验,结合自身实际情况,探索出一条具有中国特色的高校数据共享与合作之路,以实现高校数据资源的高效利用和优化配置,促进高校教育教学质量的提升、科研创新能力的增强以及社会服务水平的提高,为我国高等教育事业的繁荣发展注入强大动力。
近年来,在国家相关政策和战略的加持下,高校数据共享逐渐被打上聚光灯,迈上大舞台,成为提高教育质量、推动教育创新、提升高校治理能力的重要途径。随着数字化转型深入推进,未来高校在数据共享方面仍需深挖数据价值,始终坚持推进数字校园、智慧校园建设,为师生提供个性化、智能化的数据服务。同时,力求与外部机构之间实现数据的流通与共享,共绘数据共享蓝图,合力共建教育强国。
来源:《中国教育网络》2024年10月刊
作者:孙秋瑞、杨栋(北京师范大学信息化建设办公室)
责编:陈永杰