大数据时代数据产生的价值越来越大,基于数据的相关技术、应用形式也在快速发展,开发基于数据的新型应用已经成为高校建设的一个重点领域。当前各大厂商、用户都在探索与数据相关的开发技术、应用场景和商业模式,最终目的就是挖掘数据价值,推动业务发展,实现盈利。目前数据应用项目非常多,但真正取得预期效果的项目少之又少,而且开发过程困难重重,其中的一个重要原因就是数据质量问题导致许多预期需求无法实现。如果没有数据治理,再多的业务和技术投入都是徒劳的,因为很经典的一句话:GarbageinGarbageout。数据治理是保证数据质量的必需手段,从全球范围来看,加强数据治理提升数据质量已成为企业提升管理能力的重要任务。
数据治理是一个系统的、大型的、长期的工程,大型企业已经开始了实施,并取得了一定成果,但目前高校在数据治理方面还没有开始真正意义上的实践,究其原因,一方面高校还没有把数据治理的重要性提升到战略高度,另一方面没有将数据治理单独作为课题研究,没有形成系统的实施方法论。本文从管理和技术两方面出发探索适合高校信息化建设的数据治理方法,形成包含组织、制度、标准、流程、安全、技术等内容的数据治理方案,从而打造高校绿色数据生态环境,为数据应用提供基础保障。
数据治理概念
数据治理并不是一个新生事物,可以说,有数据的地方就存在数据治理,只不过随着数据应用的迅猛发展将它提到了一个高度,作为一个独立的研究领域。数据治理并没有标准的、严格的定义,概况地讲,所有为提高数据质量而展开的业务、技术和管理活动都属于数据治理范畴。
数据治理的英文是DataGovernance,《DAMA数据管理知识体系指南》一书给出的定义:数据治理是对数据资产管理行使权力和控制的活动集合。数据治理职能指导其他数据管理职能如何执行,图1说明了数据治理与其他几个数据管理职能的关系。
数据治理是技术与管理相结合的一套持续改善管理机制,贯穿在数据管理的整个过程中,通常包括了组织架构、政策制度、技术工具、数据标准、流程规范、监督及考核等方方面面,将其他几个数据管理职能贯穿、协同在一起,让企业的数据工作成为一个有机整体而不是各自为政。数据治理涉及的IT技术主题众多,包括元数据管理、主数据管理、数据质量、数据集成、监控与报告等。
数据治理体系框架
仅仅依靠技术手段,以建设系统的方式是难以有效解决数据治理面临的所有问题。构建数据治理体系是数据治理工作的基础,为了有序实施数据治理,应采用规划先行的原则,制定适合高校业务特点的管理流程,选择可行的和实施工具,明确数据治理的工作机制和工作内容,稳步推进数据治理各项工作,数据治理体系框架如图2所示。
战略:数据治理是在高校发展战略和规划的指导下进行实施的,这些战略和规划包括业务发展目标、IT规划以及数据治理相关的发展规划。
机制:机制是数据治理工作实施的基础保障,通过组织、制度、流程的建设和执行得以落实。机制是数据治理工作的重点,数据治理执行效果就是机制落实的效果。
专题:数据治理专题是数据治理的工作内容,包括数据标准、数据治理、元数据、主数据、数据生命周期等方面。
实施:数据治理工作最终在相关制度、规范和流程下通过数据治理组织借助技术手段和管理手段来实现。包括系统开发阶段为提高数据质量进行的校验设计;系统日常运维工作;数据分析应用阶段的数据集成;数据质量监控等。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。