大数据时代的使命
2012年,美国发起的“大数据”研究吸引了全球的目光。奥巴马称:“通过提高我们从大型复杂的数字数据集中提取知识和观点的能力,承诺帮助加快在科学与工程中的步伐,加强国家安全并改变教学研究。”透露出美国进行大数据研究的重要目标之一——教育。
为了推动大数据的研究,美国联邦政府的部门和机构宣布新的2亿美元的投资,“提高从大量数字数据中访问、组织、收集发现信息的工具和技术水平。”
“大数据”时代的脚步悄然而至,高校也身在其中。在高教学会信息化分会青委会日前举行的一次技术论坛上,一直专注于数据分析与挖掘工作的清华大学信息化技术中心袁芳做的一个报告引起了与会者的共鸣:《如何在大数据时代掘宝?》她认为,高校也正面临着大数据所带来的挑战与机遇。“随着互联网应用的丰富,每个学生和老师每天都在生产着各种各样的数据,当数据量达到一定级别后,就可以进行很有意义的分析挖掘工作。”她认为,海量数据的分析将对教育信息化产生深刻的影响和冲击。她觉得,“高校也要关注大数据技术的研究和应用,智谋未来。”
大数据时代势不可挡。相关人士表示,未来的十年将是一个“大数据”引领的智慧科技时代。随着社交网络的逐渐成熟,移动带宽迅速提升,云计算、物联网应用更加丰富。更多的传感设备、移动终端接入到网络由此产生的数据及增长速度将比历史上的任何时期都要多,都要快。
目前,几乎所有的高校都在进行数据中心的扩建因为这两年数据的发展与前几年比较已经不是一个数量级,以往数据中心的空间已经无法适应当前快速发展的要求。“目前我校数据资源正以每年30%到50%的速度在增长。”中央财经大学信息网络中心主任叶新恩说。
在北京师范大学,校务管理信息系统数据有500~600G,校园卡系统日记1TB~2TB,校园网日记数据大约有1TB。“从存储购买量的增长来看,2011年学校大约增加存储400TB,尤其是一些理科科研单位,如气候气象数据,遥感影像数据等存储量很大,其他教学类资源存储量也非常大。”北师大网络与信息中心主任刘臻说。
在清华大学,目前电子校务系统的运行业务数据大致有1.5 亿条,这还并不包括系统日志、校园卡交易等流水数据,换算到存储量的话,大致是7~8T的样子,其中并不包括视频等流媒体数据。
另外,非常关键的是,高校当今数据库里的内容不仅是多,而且结构已发生了极大改变,大量的数据是非结构化数据。据统计,全球结构化数据增长速度约为32%,而非结构化数据增速高达63%。这个趋势在高校亦然。
袁芳认为,对于传统的结构化的数据,由于已经达到一定数量,以关注其应用为主,而对于正在生长的海量的非结构化数据,则要关注怎么收集、用什么方式有效管理。“学校正在掌握着越来越多活的数据,这为我们提供了新的方向——寻找某个规律背后的原因。”她说。
复旦大学信息化办公室主任宓詠认为,从沉淀的数据中发现有价值的信息,深入挖掘、综合利用、转化为知识,才是信息系统真正价值的体现,而这方面可拓展的空间几乎是不可限量的。从管理的角度来看,如何充分利用信息系统中的数据,是系统实施之后最重要的工作,也是长期的工作。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。