在高校信息化建设中,数据分析和数据挖掘的范畴已经不仅仅限于学生、科研等传统数据,从高校网站的页面访问中也可以提取到很多有价值的数据和线索。校园站点访问数据作为一种重要的数据样本,有助于掌握高校网站运行情况,为校园站点优化策略的制订和实施提供了重要参考。
高校网站访问数据介绍
近年来,高校网站建设工作取得了长足进步,站点数量和页面数量增长迅速,站点功能不断完善,网站在师生日常学习工作中起到了重要作用,同时成为学校对外展示形象、方便社会公众获取学校信息的重要平台。
总的来说,高校站点访问数据具备以下几个特性:
1. 海量性。高校除门户网站外,各职能部门、院系、研究所都建有各自的网站,站点和页面数量非常多。学生、教师、校友、考生等作为网站访问主体,导致站点访问量也很大。在此基础上生成的访问数据具有海量性,这要求数据统计软件具有大规模的数据处理和存储能力。
2. 多源性。校园站点访问数据来自于不同的站点和不同页面,数据来源多样,采集点非常分散,这要求数据统计软件能够分散部署,统一采集数据。
3. 差异性。由于校园各个站点具有不同的技术架构,因此生成的访问数据也有着很大差异。如用静态页面、Ajax,以及flash等不同技术架构的站点在访问数据的生成方式和结果上就有所不同,这要求数据统计软件具有强大的兼容性。
基于网站访问数据的以上特性,谷歌公司提供了一项相应的Web服务:Google Analytics(简称GA,下同)。GA作为一种重要的数据统计服务软件,具有强大的数据处理和存储能力,能够从不同平台多渠道地获取网站访问数据,并为用户提供丰富详尽的图表式报告,在高校统计和分析站点访问数据、制订页面优化策略方面起到了重要作用。
校园站点GA部署
GA的部署方式决定了校园网站访问数据的全面性和准确性。在部署前,新用户需要在GA的网站中创建一个统计账户,并添加相应网站信息,获取站点跟踪代码。在部署阶段,需要根据不同的站点特性确定部署方式。
1. 新站点部署。这是最简单的部署方式,只需要将GA生成的站点跟踪代码放置到每个页面的</head> 结束标记之前即可。
2. 原有站点部署。根据高校各个站点创建的时间不同,在一些校园站点上可能曾部署过旧的GA统计代码,由于GA版本的不同,这些代码有可能是同步追踪代码,需要统一切换至最新的异步追踪代码。异步追踪代码的优点是能够以异步方式记录页面访问,在客户端没有读全代码的情况下也能够触发记录,降低代码读取时间,提高数据收集的准确性。
3. 移动站点部署。由于GA主要利用js 获取访问数据,而一些移动设备并不能支持JavaScript, 因此在移动站点开发时,需要下载GA的移动程序包进行部署。目前支持的后台语言包括PHP、JSP、ASP.NET和Perl等。谷歌也同时提供了Android和iOS版的SDK,用于在原生移动应用中部署GA。
4.其他环境部署。在校园站点中往往还存在Flash、Silverlight等应用,特别是对于一些纯Flash站点,其栏目和内容访问数据很难获取。GA分别为这些应用提供了相应的跟踪组件,能够在开发环境中进行安装和部署。
此外,由于校园站点数量众多,除门户网站外,部门站点大都使用二级域名,要求既能够完整查看校园站点总体访问数据,又能够根据二级站点单独查看子域的相关数据。不能采用为每个站点分别设置新域的方法,而是需要在GA配置中设置跟踪内容范围,即设置为一个域名包含多个子域名,在主域下创建多个配置文件,以此实现二级网站访问数据的整合。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。