清华大学承担了《XX 学校管理数据子集》和《XS 学生管理数据子集》两部分内容的修订和研制工作,由于《XX 学校管理数据子集》相对简单,对2002版标准改动不是很大,故本文暂且不谈。本文就《XS 学生管理数据子集》的研制过程进行简要总结,以及与同行们分享一些经验和体会。
《XS学生管理数据子集》是《CELTS-33高等学校管理信息标准》的重要内容,与其他数据子集相比,其具有内容丰富、成分复杂、集成困难、代码众多等特点。
界定子集之间的边界
首先,我们要明确学生管理数据子集与教学管理数据子集的边界划分。因为在教学管理中,学生的学习事务管理与教学管理是混在一起的。如何将它们划分清楚?我们制定了一条基本原则,在教学事务中凡是以学号为惟一关键字的数据类/子类,均属学生数据子集,反之那些不仅有学号、还有其他数据项(如课号、教工号等)为关键字的数据类/子类则属于教学管理数据子集。例如学生成绩数据类,其关键字只有学号,这里有课号但不属于关键字,因此学生成绩数据类是属于学生管理数据子集。而学生选课数据类,不仅学号是关键字,课号、教师号、教室号等也是关键字,因此学生选课属于教学管理数据子集。
其次,学生生活、课外活动等事务管理数据类明确属于学生管理范畴之内,因此学生管理数据子集包括以上两个主要方面的数据。
另外,有一类没有以学号为关键字的管理数据,但它们是为学生管理服务而产生的,如考场管理数据、学生毕业后的用人单位数据等,我们定义它们为学生管理辅助数据类。辅助数据类,不仅在学生数据子集中有,在其他数据子集中也有。
在2002版标准中,辅助数据类的划分有几处错误,反映了概念不够清晰。本标准在这方面都一一做了纠正。
构建学生管理数据子集
在2002版标准中,将学生管理数据分为学生管理信息子集、研究生招生管理信息子集和研究生非学历教育信息子集等三个信息子集,凸显了这部分管理数据的复杂性。在开始划定数据子集时,曾试图分为本科生管理数据子集和研究生管理数据子集。但制定过程中,还是觉得不够完善。一是数据交叉、冗余,二是因为现在大学中学生的成分又增加了国(境)外来华进修生,其数量每年都有很大增加,为了完整描述学生管理数据和减少数据冗余,我们将学生数据子集包含了4部分内容:
第一,学生数据部分(包含以本科生为主,同时兼容其他类学生的基本数据);
第二,研究生招生管理数据部分;
第三,研究生非学历教育数据部分;
第四,国(境)外进修生管理数据部分。
其中学生数据部分要比2002版的内容丰富了很多,增加了新生数据和录取等数据类。
通用/标准数据类减少了数据冗余
在高校信息标准系列文章之一《高校信息标准呼之欲出》一文中提到,为统一数据规范、减少数据冗余,设立了“通用/标准数据子集”。“通用/标准数据子集”在学生数据子集中发挥了很好的作用,以下面的例子说明之。
例1:“TB人员标准数据类”是“TB通用/标准数据子集”中的一个数据类。其标准数据项为:姓名、姓名拼音、曾用名、性别码、出生日期、出生地码、籍贯、民族码、国籍码、身份证件类型码、身份证件号、婚姻状态码、港澳台侨外码、政治面貌码、健康状况码、宗教信仰码、血型码、照片。这类数据项对各类学生均适用,因此学生管理数据子集在理论上就取用其“编号”即可,但为了使读者感觉其连续、易读,我们实际上还是在学生数据子集中将其主要数据属性列示出来。这就叫“取用”——整体使用。
例2:“TY通用时间数据类”其数据项为:年份、年月、日期、时间、学年、学期。学生管理数据子集再出现“入学日期”或“缺考学年”等“通用时间数据类”的同义数据项,我们就在元数据结构的“引用编号”中标出其编号,这样做的好处是数据格式统一规范。同样的道理,在实际使用中还是在学生管理数据子集中将其主要数据属性列示出来。这就叫“引用”——规范常用数据项的格式。
例3:同样对非“通用/标准数据子集”的数据项,只要前面已有,后面的同义数据项也可以采用这种“引用”处理方式。
数据分类排序(目录设计)是重要环节
高校信息标准虽然有了前面系列文章中提到的的总体架构,但还是一个比较粗的框架。要深入、完善标准数据分类、排序(目录结构设计)这项工作是不可缺少的。尤其是学生管理信息子集内容丰富而又繁杂, 如果分类不清、目录混乱将影响全局。
2006年7月我们组织了清华计算中心内部所有熟悉学生、教务管理工作的教师对学生数据进行了为期一周的大讨论,专门研讨学生部分的数据分类及名称用词是否得当、目录编排是否合理、整体架构是否完善。具体工作如下:
对学生管理数据进行分类整合(类似数学中的合并同类项)、精简数据类的数量,查看每部分数据是否完整,顺序是否合理,是否有重要的业务未被考虑进去,找出某些与其他数据子集有关联的数据项,个别的甚至要跨数据子集调整其数据类位置,最后制定出了满意的目录结构。这样做非常重要,能够起到提纲挈领、纲举目张的作用。经过大家的努力,制定出多个具体方案,然后进行比较、优化。最后拿出一份学生标准子集的比较完整目录结构,这样对于整个标准是非常有益的。
另外,一份完整的目录可以加强宏观上的把握,使各个数据子集最后合到一起之后,看上去比较和谐、一致。表1是学生管理数据子集的目录结构。
可以看出,本目录是按业务环节、学生层次和培养过程等几个因素排序的。
核对细节
很多细节需要反复推敲,例如数据类/子类的名称、“数据项名”、“中文简称”、“长度”、“可选性”和代码审定等等,主要是为了保证元数据在各个子集之间协调一致,使名称、注释等用词准确而无歧义,通俗易懂。表2给出一个数据子类的样例,可以看出所有数据项均为可选,因为它们在学校的系统之间并不参加数据交换,上级部门也没有这方面的需求。“取值范围”、“说明/示例”根据需要给予必要的描述。
学生管理数据子集是本标准中最为复杂、数据项最多的子集,它的完善过程得到了各兄弟学校的帮助,是研制组共同努力的成果。但我们还不满足现有水平,希望今后能得到各高校的反馈意见,进一步开阔眼界,提高本标准的质量和水平。欲穷千里目,更上一层楼。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。