信息由数据构成,数据是信息的基础,数据已成为高校信息系统建设的重要组成部分和信息化进程中的重要资源,是学校的血液。低质量的数据将导致业务流程阻塞、管理成本增加以及决策困难等一系列问题。根据“进去的是垃圾,出来的也是垃圾(garbage in garbagout)”这条原理,为了使高校信息系统建设取得预期成果,就要求信息系统提供的数据是准确的、规范的、完整的。如果数据质量得不到保证,信息化进程的实施就根本不可能达到预期效果。因此,为保障信息系统正常运行、提升高校信息系统的实用化水平、满足用户对信息化和数据的需求,就必须重视数据质量问题。通过构建完善的数据质量管理体系,提升数据质量,进而推动高校的信息化进程。
数据质量是什么
1.数据质量定义
在不同时期, 数据质量有不同的概念和标准。在过去,国际上关于数据质量的标准基本上是以提高数据准确性为出发点。但是随着质量含义的不断延伸, 对数据质量概念的认识也从狭义向广义转变, 准确性不再是衡量数据质量的唯一标准。数据质量的高低必须从用户使用的角度来看, 即使准确性相当高的数据, 如果时效性差, 或者用户不关心, 仍达不到质量的标准。总体来看,现代数据质量概念主要包括以下几个方面: 一是注重从用户角度来衡量数据质量, 强调用户对数据的满意程度;二是数据质量是一个综合性概念, 需要建立一套有效的数据质量管理体系,从多角度来评价数据的好坏。
2.数据质量影响因素
在数据的生产和处理中, 任何一个环节的问题都会对数据质量产生负面影响。影响数据质量的因素有很多,主要包括管理因素和技术因素:
(1)管理因素:业务数据定义不清、概念混淆会导致数据录入错误;数据标准缺失会影响数据的规范性;数据维护权责不明导致数据多部门维护与重复采集。此外,在信息系统使用过程中,用户操作不当会造成数据质量问题;同时,用户会在业务流程上关注较多,关心数据的流向,对数据本身质量重视不够, 认为数据只是信息处理过程中的副产品。
(2)技术因素:各个信息系统在实施过程中,大多只注重自身的数据处理能力,很少考虑与其他系统的数据兼容性;另外由于程序设计与校验不严,使得数据输入问题产生且未被发现,导致信息系统数据质量问题,比如数据元素定义不清、数据输入格式缺乏校验、数据存在冗余等;有些数据项在设计时缺乏缜密的结构化处理,为了开发方便,采用“备注”字段,造成数据使用麻烦;有些数据缺少更新时间、维护人等补充属性,导致回头查找、确认数据时,没有任何支撑数据可用。
3.数据质量标准
在进行数据质量评价时, 根据具体的数据质量使用需求对数据质量评价指标进行相应的取舍。对于高校来说,数据目前主要用于信息查询、共享与支撑决策,数据质量可以着重从以下几个方面加以衡量:
表 数据质量衡量
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。