编者按:本论文以比尔与梅琳达·盖茨基金会(Bill & Melinda Gates Foundation)所资助的研究为基础,是系列论文《展望21世纪的高等教育数据基础设施》中的一部分。2015年8月,美国高等教育政策研究所(Institute for Higher Education Policy,IHEP)率先召集了一个由全国高等教育数据专家组成的工作组,来讨论推动一系列改进数据基础设施质量的新兴方案,为州和联邦的政策对话提供信息。作为成果的系列论文提出了有针对性的建议,直接关心有关的技术、资源和政策考虑。本期主要就美国高等教育数据基础设施当前状态进行分析。
创建繁荣的高等教育数据体系(连载一)
概述
如今在美国,各种各样的机构产生和报告了数量惊人的数据,涉及高等教育中的学生、入学行为和模式、最终学习成果等各个方面。高等教育研究者和相关者所依赖的当前数据中仍然存在明显的缺口,使得有些重要问题仍然在很大程度上没有答案:
多少业余的、成人的、军队的、补习的和佩尔奖学金(Pell Grant)的学生成功获得了学位?
未能毕业的学生是转学到其他学校了还是彻底放弃了?
学生在大学期间学习了多少内容,他们毕业后是如何为社会做贡献的?
学生离校时是否还有贷款债务,他们是如何偿付贷款的,尤其是那些未能完成学业的学生?
学生毕业后获得了哪些工作?他们是否继续攻读研究生?
目前,高等教育的数据的采集和共享发生在多个层级和地方:在高等院校内,在州内,在跨州合作中,在私人数据库中,在联邦层级上。每个这样的数据收集库都是国家高等教育数据基础设施的一块,构成了一个碎片化的“系统”,杂乱地进行着教育数据的采集、汇总和报告。推动该基础设施的发展将极大地提升利用高等教育数据的能力,使人们能够回答上述的问题和其他更重要的问题,并促进学生取得成就。
创建一个协调的体系需要有计划地进行改革。消除现存的法律障碍和降低数据采集的负担,可以在所有层级的数据采集和报告中实现对数据的访问和使用的简化。实施标准化的通用数据定义和格式不仅有利于提升报告的实用性,而且可以形成有能力回应大量问题的数据集。将高等教育数据向较高层级直到国家层级汇总,可以为提升学生成就和消除教育差距建立起骨干结构。这些改进意见和其他一些关键的改进构成了本系列论文的核心建议。
通过高等教育数据协作计划(Postsecondary Data Collaborative,PostsecData),高等教育政策研究所召集了一个专家工作组,提出技术和政策方案来改进国家高等教育数据基础设施,以更好地为州和联邦的学生成就相关政策讨论提供信息支持。工作组成员都是经验丰富和影响广泛的实践者和政策制定者,多年从事与现有基础设施相关的工作。他们提出了对国家高等教育数据系统中现有各个部分的改进建议,以及对于某些情况下新建部分的建议。许多建议易于现在就付诸实践,其他建议所预计的实施途径则更为复杂。但是,尚未有人能提出作为“银弹”(Silver Bullet)的单一解决方案。工作组的目标是,推动现有的所有系统,向着一个更加密切关联和互相操作的高等教育数据体系而发展。
本论文汇总梳理了这些专家的工作,并提出了现在启动该讨论的充分理由。无论是从学院和大学中采集哪些数据,如何采集,如何汇总和存储,如何与其他已有数据相关联,还是如何扩散到公众中,在这些议题上都可以实现改进。
评估国家高等教育数据基础设施的当前状态
每个这样的数据收集库都是国家高等教育数据基础设施的一块,构成了一个碎片化的“系统”,杂乱地进行着教育数据的采集、汇总和报告。
目前并没有一个整体的、规划良好的、协调的国家高等教育数据系统。相反,为不同的目标而建设,受不同法律和规章的监管,由不同的主体拥有和运营,并采用了不同的数据定义的单独的系统组成了一个拼接品。最好的情况下,用户能够从各个系统中获得和使用某些数据,构建成某种程度上清晰一致的(如果不是完整的话)国家层级高等教育图景,以此来衡量某个学生的成就,某个机构的成就,以及某项纳税人在这项事业中的投资的成就。最坏的情况下,现有的基础设施都无法数清巨大的学生和院校的数量,而且会造成冗余、采集负担、浪费、低质量,导致无法实现最重要的目的——促进学生成就和在追求学位中的教育公平。
虽然目前的基础设施看起来是破碎、有瑕疵和不完整的,但这并不是由于参与者太多的原因。简单地号召在现有的体系基础上构建一个单独的、唯一的系统并不是一个可行的解决方案。在展望的未来中,如果没有以各自独特的目的而构建的多个数据仓库并存,也未免不太现实。目前在高等教育数据基础设施之上所体现的改进,应当是对这些数据仓库的优化,通过降低冗余和负担,提升对更加有用的数据的访问,使得参与者和系统在彼此之间以及更大的体系中有效地运作。
数据是这些多样的、互不连通的系统中的骨干,从学生开始进入高等教育系统的申请流程时起始。随着他们进入高等院校并在院校之间流转,他们在入学情况、经济资助、学业进展与完成、学习成效等方面的数据随之补充而来。这些数据随后在更高层级进行汇总,由高等学校、州和联邦政府、私人组织报告,并形成业务部门的和州一级的问责仪表盘(accountability dashboards)、美国联邦教育部(U.S.Department of Education,ED)的院校记分卡(College Scorecard)和联邦学生资助(Federal Student Aid,FSA)数据中心。
一般而言,当前高等教育数据基础设施中的数据是按照如下流向运转的:
当学生向某个学院或大学申请入学,或者向联邦/州政府申请经济资助时,他们提供关于自己的个人信息、统计类型、教育经历和学术成果。
随着学生的学业进展,院校取得了他们的入学情况和学业成效的数据,财务历史和需要,以及他们所获得的高等教育学分信息。
很多院校将这些学生的个人记录提交给州或其他中层的协作机构,或者提交给州际或州内的教育数据库和信息交换中心,形成了跨院校的数据仓库。有些数据仓库还和州内或州际的学生的K-12发展路径和工作成效数据相连接。
几乎所有的院校都自愿将学生整体数据的一部分提交到国家学生信息交换中心(National Student Clearinghouse,NSC)。NSC采集数据来为辅助高等院校的多种目的而服务,主要是用于学生转学到其他机构时对他们进行追踪和验证。
作为参与联邦学生资助项目的条件,院校也要将学生数据提交给FSA,还要按照要求的核心口径在学校层面汇总数据并提交给国家教育统计中心(National Center for Education Statistics,NCES)——这是高等教育数据集成系统(Integrated Postsecondary Education Data System,IPEDS)的一个组成部分。然而,联邦政府没有扮演面向所有学生的国家级单一学生数据仓库的角色,而只针对接受联邦第四项(TitleIV)资助的学生。
州和联邦政府也采集了就业和工资信息,常见的来源是雇主和其他政府机构。这些数据可以与学生数据相匹配,基于如社会安全号(Social Security Number)这样的通用识别信息。对可识别个人身份的信息访问是受到严格的隐私法律的限制和监管的,其中最主要的是《家庭教育权利和隐私法》(Family Education Rights and PrivacyAct,FERPA);本系列论文中Joanna Lyn Grama的文章提供关于此主题的更多细节。
尽管看起来这是一个良好协作的渠道,数据在其中流向了各种不同的主体,但是对于研究者、政策制定者和高等院校本身而言,现有的国家高等教育数据基础设施的功能局限性是广为人知的。这实际上是一个破碎的体系,困扰于法律监管和管理维护的限制,非标准化的数据定义、格式和结构,以及只有极少人可用的汇总数据存储——这些汇总数据可以回答当今高等教育事业中涉及广泛的一系列重要问题。尽管每个相关者——联邦、州、院校和私人机构都在尽力回答根据他们可用的数据可以回答的问题,但是每个相关者所能回答的问题都有其局限性。更加关键的是,无人知晓获取其他组成系统中的综合数据集的明确途径。
每篇论文涵盖了国家高等教育数据基础设施中的一个特定组成部分,指出了要改进的领域并提出建议。它们的内容并无互相竞争之意,而是共同提出互为补充的措施,目的是在确保安全和隐私的同时提升数据的质量、透明度和利用水平。重申一遍,这里并没有什么银弹。最终要发挥重要作用,就要形成一种在战略上进行协作的方式使这些现有的数据系统(以及对应的相关者)能够协同工作,才能回应当前与高等教育有关的关键问题,更不用说今后的二十年中将要面临的关键问题。每个高等教育的相关者都要发挥作用。在降低与数据冗余和低质量有关的成本和负担方面,以及在为提高学生学习成效提供更好信息方面,还有很大的潜力。实现完全不同的高等教育数据系统现代化,创建一个敏捷高效的高等教育信息体系,这是信息化工作者早就应该做的。
(文 /Archie Cubarrubia Patric Perry 翻译:陈强)
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。