自2018年起,内蒙古工业大学在自治区高校中率先启动了数据治理工作,逐步推进了制度构建、团队培养、理论学习、文化塑造、素养提升及一系列数据治理专项工程和职能域决策辅助试点项目。当前,学校以提升数据管理效能为重点工作,借助大语言模型的先进人机交互能力,加速推动数据治理成果在各个领域释放效能,显著提高了师生的满意度和获得感。
建设内容及成效
持续优化制度建设
为加强对数据质量的控制、确保其开放共享与有效利用,为下一步数据资产价值评估和入表做好准备,学校对2018年版《内蒙古工业大学数据管理办法(试行)》进行了全面且细致的修订。修订后的管理办法旨在强化高质量数据资源在教育教学、科研创新、管理运作及科学决策中的核心支撑作用。
同时,为确保数据管理工作的安全、合规与可控,学校特别将《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》的相关要求融入本次修订之中,以确保数据管理的每一环节都符合法律规定。
数据要素市场的培育是数字经济繁荣发展的基石。数据要素化的过程通常包含三个层次:数据资源化、数据资产化和数据资本化。本次修订的管理办法正是为了深化学校在第一层次数据管理工作中的成效,并为顺利迈向第二、三层次奠定坚实的基础。
夯实数据中台核心能力
数据管理效率的提升,首要体现在对数据的高效整合与无缝共享,而数据中台是实现这一目标的关键能力平台。构建统一的数据中台,可实现数据的集中存储、统一管控、跨部门共享及集市开放,确保高质量的数据持续为组织的发展提供动力。
2023年底,学校成功上线了新一代数据服务平台,集成了25个主要信息系统的9.6亿条数据资源,完成了旧共享交换平台300余个接口的迁移整合。在项目执行过程中,团队对全校35个职能部门的数据资源进行了全面的调研和摸底,确保全覆盖。在完成首批11个职能部门的数据确权后,正式发布了2023版数据资源目录,实现了数据供需关系的全过程线上流转。
自2024年以来,数据中台建设致力于全面提升数据资源的质量、活跃度和应用价值,扩大了决策支持能力的覆盖范围。主要措施包括:
1.利用数据中台的数据质量管理功能,制定数据质量检测规则,启动常态化数据质量监测。通过每月向职能部门发送数据质量报告,进一步推动了校级数据标准的规范化应用,提高了源头数据的生成质量,数据质量问题申诉、纠错和补录的试点工作也同步开启。
2.进一步拓展数据资源的整合边界,严格遵循学校信息化项目管理制度,确保新上线的业务系统实现数据双向共享流动。系统充分利用学校的主数据,防止冗余的数据采集,并为学校提供新颖的、具有洞察力的业务数据,以拓宽公共数据资源的涵盖领域。例如,校友管理系统和人员流量监测系统在上线前,需通过数据中台申请使用组织架构、人员基础信息及教务管理数据。而系统运行产生的结果性数据也将反馈回数据中台,实现数据的持续更新和增值。
3.探索解决无管理系统数据整合的策略,团队与国内合作交流处、国际教育学院和发展规划处紧密合作,利用一表通平台开发在线数据采集管理系统。高频使用的离线数据转为线上管理后,可纳入数据中台的定期同步任务中,显著提升信息资源整合的广度和深度。
创新性开发数据共享特色应用
基于前期数据治理工作的丰硕成果,团队利用一表通和网上办事大厅等低代码平台,精心为教师、学生及二级单位打造了一系列数据共享特色应用,受到了广泛的赞誉。具体建设包括以下三方面:
一是构建个人数据门户与查询平台。面向师生提供涵盖人力资源、教育教学、财务资产等多维度信息的统一查询服务;同时为二级单位定制一站式数据查询平台,在严格权限管理下,便捷支持其日常管理中的数据获取与上报需求。
二是建立辅助填报工具库。系统梳理师生常用表格(如职称评审、科研简历、成果证明等),形成标准化模板库,用户可通过复制、导出等操作快速完成填报。
三是开发评估支持工具。为迎接本科教学审核评估,针对各学院数据统计需求,团队开发了涵盖专任教师教学任务、科研项目、论文专利等维度的数据统计工具,助力学院高效完成材料准备与上报。
全面升级可视化主题数据大屏
为全面展示学校综合办学实力,团队倾力打造“数说工大”综合校情主题数据大屏,以高等学校四大职能为基准,将师资队伍、人才培养、学科与专业建设、办学条件、科学研究、社会服务、合作交流七大核心主题紧密串联,生动展现了学校的整体风貌与核心竞争力。
投入使用的半年内,综合校情主题数据大屏成功接待了十余次校外单位的来访参观,在全区乃至全国范围内进一步提升了学校信息化建设水平的知名度和影响力。
借助大语言模型优化数据服务的智能化程度
为进一步提升数据管理的效率并消除数据交互的“最后一公里”障碍,当前的数据获取手段亟待改进。此外,传统的数据查询方法通常要求用户具备一定的信息技术基础,而不具备此类专业技能的普通用户往往难以自如地进行SQL查询。
为此,团队引入了先进的大语言模型及增强技术,通过建立本地化部署的智能问答平台,为学校的管理层、教职员工和学生提供快速、精确获取所需信息的途径。目前,基于静态文本和表格数据的智能问答服务已经上线运行,用户可通过网上办事大厅和企业微信移动端的入口访问,服务内容已涵盖教务管理、学生事务、研究生教育、财务管理以及信息化服务等多个职能领域。
在完成基于静态文本和表格数据的智能问答服务平台构建后,团队将重心转向研发可利用大语言模型及其增强技术连接并获取数据集市中结构化数据的动态数据智能问答系统,以满足个性化查询统计需求。目前,团队的主要实践包括:
1.多模型本地化融合:采用多种大语言模型进行深度融合和优化,以增强系统的语义理解和问答生成性能。
2.RAG技术的创新实践:应用RAG技术,将检索信息与大语言模型生成的答案相结合,以确保答案的准确性和相关性。
3.结合学校数仓(集市)实现高效数据流处理:利用Dify平台的流程开发工具,实现高效的数据处理流程,包括数据清洗、转换、聚合等,以提升数据处理的效率和准确性。
提升数据管理关键岗位的技能水平
组织须不断培育数据管理的专业人才,强化员工的数据素养和技能,确保数据管理的潜力得以充分释放。
学校信息化部门深谙数据管理是一项持久且需迭代的任务,其中,数据管理者的技能和知识底蕴起着决定性作用。因此,部门支持并资助有志于提升能力的教职员工参加DAMA国际数据管理知识体系培训及认证考试。目前,已有2位教职员工成功获得DAMA中国颁发的数据治理工程师(CDGA)资格。
全面增强全员数据安全意识与信息素养
为深化数据管理效能,必须高度重视数据安全与隐私保护,并持续提升学校领导、教师以及学生的信息素养。
为实现这一目标,学校信息化部门主动为师生提供数据安全意识和信息素养提升的专题培训。半年内,信息化部门共举办了12场培训讲座和1次主题党日活动,从学校公共信息化服务平台、数据共享特色应用、正版化与网络安全、问题反馈与报修等多方面深入解读了学校统一建设的各类公共服务平台的基本功能。
问题与挑战
一是海量数据的复杂性。随着数字化转型的加速,学校积累了庞大的数据,而这些数据往往散落在各个“信息孤岛”,种类繁多且增长迅速,对有效管理和利用构成了重大挑战。
二是数据质量的不均匀性。尽管数据中台已成功整合了大量异构数据,但其中仍充斥着大量不一致、过时、错误和冗余的信息,极大地影响了数据分析的精确度和决策的有效性。
三是技术与人才的匮乏。数据管理与分析需要高级的技术支持和专业人才,而此类资源相对紧缺。对于高等教育机构而言,由于人力资源管理的局限性,这一问题显得尤为突出。
四是安全与隐私的困境。随着数据量增大,保护数据安全和用户隐私的难度也随之增加。进行数据治理后,数据中台犹如一个“装满鸡蛋的篮子”,面临网络侵袭和数据泄露的风险显著提升。
五是成本与效益的平衡。数据管理与分析需要大量的资源投入,组织在试图平衡成本与预期效益时可能会遇到困难。对于以公益为主的高等教育机构,这种矛盾尤为显著。
创新解决方案
一是建立前沿的数据管理系统。整合云计算、大数据处理和人工智能技术,打造可扩展的数据存储与分析架构,以应对不断攀升的数据量。同时,推行全面的数据治理策略,设定统一的数据标准和管理规范,以保障数据质量和一致性。
二是消除“数据孤岛”现象。实施跨部门、跨系统的数据集成策略,利用先进的数据集成工具,将分散的数据源融合到统一的数据平台,促进数据的流通与共享,提高利用效率。
三是提升数据质量管控。构建数据清洗、整合和验证的流程,确保数据的准确性和完整性。引入人工智能技术,利用机器学习等方法自动检测并修复数据中的错误和异常,以增强数据的可靠性。
四是构建专业人才梯队。改革人才引进政策,拓宽专业技术人员的晋升路径,通过校际、校企合作,共同培养和吸引具备丰富经验和专业技能的数据管理与分析专家,提升团队整体实力。
五是加强数据安全与隐私保护。建立完善的数据安全管理体系,采取先进的技术防护措施,按照国家标准对数据进行分类分级保护,确保数据的机密性、完整性和可用性。同时,加强全员的数据安全教育,提升师生员工的数据安全意识和技能。
六是平衡成本与效益。在构建数据管理体系的过程中,充分考虑成本效益,选择高性价比的技术和工具,通过数据分析和挖掘提升决策效率和响应速度,从而提高学校管理效率和师生满意度。
结语
提升数据管理效能,发展新质生产力,是一项复杂的综合性工程,需从技术层面、人才培育、管理创新等多个维度着手。
总结而言,应建立前沿的数据管理系统,强化数据质量的把控,并培育和引进专业的数据人才,以实现整体协同推进。唯有如此,高校才能在日新月异的信息化进程中抓住先机。
作者:陈博 颜培志 孙建华 倪佳赋(内蒙古工业大学信息化建设与管理中心)
责编:胡暄悦