在现代社会中,数据是战略规划、协作创新、提升竞争力的重要资产。对于高等教育而言,数据治理至关重要。高校生成并管理着大量数据,要保证数据的质量和完整性,就必须对这些数据进行适当的治理。以下是国外四所大学的数据治理(Data Governance)/数据管理(Data Management)政策框架。这些大学通过制定并推行数据治理策略,优化对数据的使用,帮助学校做出明智决策、提升学术水平和管理效率。
牛津大学数据治理框架
英国牛津大学的数据治理是指采用结构化的方法来管理数据,以提高数据的准确性、完整性、一致性、有效性、及时性和唯一性。数据治理致力于明确各方角色和职责、标准和程序,以确保数据的准确性,并将其应用于各种需求。牛津大学正在通过创建数据治理框架和实施数据战略来实现这一目标。
以下是牛津大学数据治理的两个关键要素。
明确角色和职责
大学的行政数据系统之间有许多复杂且相互依赖的数据流,它们的整个生命周期涉及多个部门。这些数据包括:财务数据、学生数据、员工数据、地产数据、研究数据、发展和校友关系数据。
在发现数据问题时应该让谁参与,以及了解不同团队对彼此的期望非常重要。虽然牛津大学管理数据质量的角色和职责模型仍处于开发阶段,但目前已成立以下小组,共同承担推动良好实践的责任。一是数据执行组,主要负责制定大学行政数据的政策、问责和责任,不断评估大学满足外部要求和降低风险(监管和法规)的能力,同时充分利用其数据资产进行决策,并为战略目标提供支持。二是数据治理小组,主要负责与数据治理经理及其他人员合作,开发、实施和维护适当的数据运营模型。小组的目标是确保数据操作模型、关键数据治理和质量活动正常运行,为使用数据的所有人(分析师、报告撰写者或数据消费者)提供清晰的数据,提高数据重用、报告和决策的准确性、可信度和效率。三是数据保障小组,通过与其他小组合作,确保大学的外部数据回流。
一致的工具和技术
由于牛津大学的数据系统和流程具有相互关联性,需要使用一些工具和技术,使得人们在使用数据系统和流程时,了解其数据,在输入和使用数据时保持连续性和准确性。
数据治理框架将为此提供工具和技术,包括但不限于:
当其他渠道不可用或不明确时,弹出数据问题报告表。
建立数据问题日志,记录所报告问题的信息,以便监控解决进度。
数据质量培训模块。
Casewise数据库,其中包含商定的数据定义、来源和联系人姓名的详细信息,并且所有具有单点登录(SSO)的员工都可以使用。
支持定义数据标准和开发数据质量检查。
昆士兰大学数据管理框架
澳大利亚昆士兰大学数据管理是指在信息的整个生命周期中,安全、高效地收集、保存和使用数据的实践:从“创建和捕获”,到“保留和归档”,再到“处置或销毁”。
该校数据管理包括以下内容:
数据治理,即对数据管理各方面的规划。
数据架构,即大学数据的整体结构。
数据建模和设计,涵盖数据分析,以及分析系统的设计、构建、测试和维护。
数据储存和操作,涉及用于储存和管理数据的物理硬件。
数据安全,包括保护数据的所有要素,并确保只有授权用户才能访问。
数据集成和互操作性,包括将数据转换为结构化形式(即在有组织的数据库中),以及维护数据所需的一切工作。
管理文档和内容,包括所有形式的非结构化数据,以及使其能够访问结构化数据库并与之集成所需的工作。
管理参考数据和主数据,即通过标准化数据值,减少冗余和其他错误的数据管理。
管理数据仓库和商业智能(Business Intelligence),涉及分析和业务决策的数据管理和应用。
管理元数据,涉及创建、收集、组织和管理元数据(引用其他数据的数据,如标题等)的所有元素。
管理数据质量,涉及监控数据和数据源,以确保传递高质量信息、维护完整性并过滤质量差的数据。
通过数据管理,昆士兰大学可以优化对数据的使用,其好处体现在以下几个方面:其一,让大学更好地利用、理解和管理其海量数据;其二,确保大学的数据准确、可用、可访问;其三,将不遵守法规和违反安全规定的风险和成本降至最低;其四,使应用程序和系统开发更高效;其五,帮助做出更优质的决策和报告;其六,使流程的一致性更高。
在管理层面,数据越来越被视为学校资产,用于做出更明智的业务决策、改进营销活动、优化业务运营和降低成本。良好的数据管理对做出可靠且有价值的决策至关重要。在科研层面,由于昆士兰大学是一所研究型大学,需收集以多种形式生成的大量数据并进行储存。因此,收集数据的过程要保证安全,并确保可访问。需要有效的研究数据管理来支持产生高质量的研究成果,并满足合规、法律和资金要求。
昆士兰大学有四个部门负责数据的管理工作。一是数据战略与治理团队,负责构建和提升大学的数据管理能力,包括制定与大学数据资产的正式治理和管理有关的实践及流程。二是数据服务和分析团队,为昆士兰大学提供各种数据平台,以实现商业智能(Business Intelligence)和数据分析。三是记录管理和咨询服务部,负责管理数据保留和处置要求。四是图书馆,负责研究数据的管理实践和流程。
昆士兰大学以可信、可重复使用、可互操作、可查找、可访问的方式管理数据,在此过程中,大学的教职员工和研究人员都发挥着重要作用。
密歇根大学科研数据管理计划
作为大型公立研究型大学,美国密歇根大学有责任公平、安全地扩大科研数据的可访问性和透明度。同时,资助机构、出版商和其他机构也越来越多地要求密歇根大学公开其科研数据。这种要求符合科研领域主张更开放的学术研究的总体趋势,包括使数据更易得,以便复制或再现研究,或重新使用为新研究生成的数据。
为此,密歇根大学启动了科研数据管理计划(RDSI),该计划由科研副校长办公室领导,与学校许多其他数据支持部门合作,并于2024年1月1日发布了新的科研数据管理政策。该政策为科研数据的管理、保留、所有权和共享提供指导,并在广泛听取了教职工和学科专家的意见后制定。
在资源方面,密歇根大学提供了以下内容。第一,RDSI网站包含有关新的科研数据管理政策和相关事项的常见问题解答。第二,政策附有一份程序指导文件,其中总结了以下几个方面的资源和最佳实践:主要科研人员的职责、科研人员离开大学后该做什么的指导、提供有关数据再利用、存储和归档的详细信息。第三,RDSI网站还提供了其他信息,如更广泛的科研数据管理最佳实践和资源,并定期增补信息。第四,数据存储搜索器定期更新,根据数据类型、共享要求和访问需求提供科研数据存储解决方案。第五,RDSI为大学的科研社区成员提供了一个论坛,分享与科研数据管理相关的资源、挑战和最佳实践。第六,总结了新政策的高层动机和影响的可下载的幻灯片。第七,用于通讯或其他渠道的宣传工具包,包括宣传用语和图片。
2024年,RDSI工作组还将与全校的合作伙伴合作,开发更多的资源和指导,具体包括以下内容:第一,更新校级研究相关的科研人员入职和离职清单,为科研数据管理提供明确指导。第二,成立一个由信息技术服务部门牵头的小组,评估各单位的数据存储需求,特别是当科研人员在科研数据保留期内离职的数据存储需求。第三,不断更新PEERRS(负责任的科研与学术行为评估计划)培训模块,要求所有从事科研工作的员工和学生每三年完成一次培训。第四,密歇根大学图书馆正在牵头为主要科研人员和其他科研人员制定战略,以便在多个项目和人员之间长期管理科研数据,包括战略模型、最佳实践和其他指导。
科罗拉多大学数据治理网站
每天,有数千GB的数据通过科罗拉多大学的服务器。如果说人是美国科罗拉多大学的心脏,那么数据就是大学的神经系统。如今,大学建设了一个专用网站——科罗拉多大学数据治理网站(CU Data Gov),用于存储、管理和治理这些数据。CU Data Gov汇集了大学四个校区的所有资源,供用户查询数据政策和指南、了解不同数据组的角色和职责,查找所需的资源。随着数据治理的实施和扩展,该网站将持续发展。
科罗拉多大学数据治理是一项全校范围的计划,旨在提升数据的可用性和安全性。数据治理使大学有效管理其信息资源,并向决策者和利益相关者提供数据,以便获得一致、准确和高质量的信息,从而做出决策并宣传大学的运作方式。
CU Data Gov网站是科罗拉多大学数据治理项目的一部分。数据治理项目是一项长期性的全校项目,旨在提升大学的整体数据管理、数据安全性和使用价值。目前,学校已成立学生数据、研究数据和财务数据管理委员会。这些管理委员会对数据治理执行委员会负责,并管理其指定数据域内的数据。
实施数据治理的第一步是明确角色和职责。CU Data Gov网站上明确了数据组和角色,并公布了数据治理委员会、数据受托人和数据管理委员会的信息。网站提供了可访问大学全系统的、所有与数据相关的政策和指南的权限,并提供了校园信息技术办公室数据治理资源的链接。网站提供的最重要的资源是数据分类和影响分级表。数据分类有助于确保特定数据安全所需的安全要求。影响级别分为高、中、低,并在数据分类网页上进行了详细说明。此外,网站还分享了大学信息服务部提供的所有数据软件解决方案、校园数据资源链接以及有关科罗拉多大学Collibra数据治理平台元数据目录的信息。
未来,科罗拉多大学还将针对其他业务领域(如人力资源信息)建立数据管理委员会。随着小组的正式化,数据治理网站将进行扩展,以提供针对这些数据类别的特定信息。
来源:各大学官网
整理:陈茜