怎样才能从庞大规模的碎片化数据中得到蕴藏其中但脉络不清的终极“故事”?需要突破四个挑战:隐私、分析技术、数据质量以及应用突破口。
在最近召开的一次关于大数据的会议上,西安交通大学徐宗本院士对大数据做了一个简单而透彻的解释:“当数据积累不够多时,数据就是零散的碎片,人们不容易看懂其背后所隐藏的故事。但随着数据超过某个临界值后,这些‘碎片’整体所呈现的规律就会在一定程度上被显现出来。”
大数据里蕴藏着巨大的价值,就像还没有开采的矿山。如何很好地对大数据进行分析、挖掘,以服务于特定的对象是各行各业的理想。
高校作为大数据时代的参与者和推动者,在研究大数据上具有得天独厚的优势。在过去的10多年中,高校的信息化积累了大量可用的、高质量的数据。它们整体上具备数量大、种类多、产生快、真实可信和具备分析价值等特点,完全符合大数据的特征。
因此,如何进行大数据的分析与利用,为高校管理工作带来更大的价值,是当前高校所面临的重要问题。
但大数据庞大的规模使得对其的分析成为一件极富挑战的事情。要想在海量碎片化的数据中勾勒出这些碎片背后的故事,从高校来说,需要面对几个挑战。
第一,隐私的挑战。这方面,呼声是截然不同的。一种意见认为,隐私权是所有事情中最重要的那个。而另外一种意见则认为,对隐私的强调会阻碍进步。“数据不分好坏,只有对数据的使用才分。”这个问题如此尖锐,即使在全球范围内,对大数据的隐私界定仍然在不断的探讨中。那么,对高校来说,如何面对这个无法回避的问题?
第二,数据质量的挑战。坦率地说,同各行业相比,高校信息化发展本身比较滞后,数据质量总体情况仍然比较差。其重要性已取得共识,但很少有学校真正投入人力、财力去对数据进行治理。随着数据服务的深入,数据的质量问题将会是一个拦路虎,所以未来更多的高校会花精力在上面。
第三,大数据分析技术的挑战。正如本文一开头提到的,要从如此庞大规模的碎片化数据中得到这个有价值的故事,取得若干有价值的结论,需要很好的方法和工具。对于高校来说,我们需要回答以下这些问题:如何使得这些数据能够作为数据分析模型的“输入”,得出希望得到的数据分析“结果”?并且利用这些输出“结果”与已有的成熟评价结果进行比较、反馈、调整和优化。
“如果大数据的分析技术不建立起来的话,很多的假设都是不成立的,大数据的危险性可想而知。”徐宗本院士说。
第四,应用的挑战。换言之,高校怎么挑选到最有价值的应用。教育教学是一个非常复杂的系统,受各种因素的影响,而如何找到那些可以破解高校发展中痛点的数据服务,是值得信息化部门结合业务需求好好思考的。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。