VOD(Video On Demand,视频点播技术),也称为交互式媒体视频点播系统,是计算机技术、网络技术、多媒体技术发展的产物,是一项全新的信息服务。如今各大高校校园网建设日趋完善,网络辅助的重要性日益凸显,VOD系统在高校辅助教学领域得到充分应用,由此展开一系列针对VOD系统服务性能的研究,其中优化站点服务、提供个性化选择成为研究的热点。
VOD系统在应用过程中遇到的问题是,随着VOD系统中影片资源集的不断增大,点播人数的众多,服务器的负荷日益加重。VOD服务器系统、网络传输系统和终端系统的性能是视频点播系统能否提供高质量服务的三个方面。因此希望通过对不同时间段、不同用户群点播数据的挖掘提出优化服务器负载的解决办法,也就是针对VOD服务器系统,利用Web挖掘技术优化其性能,以免成为整个系统的瓶颈。校园网络因其使用群体层次高、频度大、范围广,因而更加需要高质量的网络。如何通过分析用户行为,合理分配流量,提高用户使用网络的效率已成为校园网络管理的一个重要课题。
我们以南通大学校园网教学VOD点播系统为基础,运用Web挖掘技术,以校园网用户的行为特征为对象进行关联性分析,在对点播系统优化后,通过有针对性的引导,对不同用户进行个性化推荐,以提高页面访问的效率和视频资源的利用率,从而减轻服务器负载,使点播更加流畅,并提出一个新思路:根据各大高校的网络部署,不仅可以针对整个群体进行推荐,还可以将用户进一步划分,区分为学生组和教师组,甚至细分至各学院不同专业,就可以根据同一IP地址段用户的点击习惯来生成该区域用户的关联模型,从而有针对性、更精确、更人性化地提供VOD的推荐服务。
Web挖掘向用户智能化推荐资源
数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识。这些知识是隐含的、事先未知的潜在有用信息,提取的知识表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式[1]。数据挖掘是知识发现过程的一个基本步骤,也是最重要的步骤,它是用来评估的隐藏模式。
Web包含丰富、动态的超链接信息,以及Web页面的访问和使用信息,这为数据挖掘提供丰富的资源。Web挖掘发展成为数据挖掘中的一个重要分支。Web挖掘的过程可粗略地分为:问题定义、数据准备数据挖掘算法执行和模型建立、对结果的分析和模型的评估。Web挖掘的任务很多有分类、聚类、关联、预测等。根据挖掘目的,采用不同的任务和技术对结果的影响非常重要,也是能否得到有意义结果的关键因素。
根据VOD系统用户点播影片的详细访问记录,我们可以从中发现用户的行为模式,建立访问模型,有针对性地为用户做出智能化推荐,减少用户盲目搜索的时间,提高VOD系统的服务效率。根据这一目标,我们采用Microsoft关联性规则算法[2],该算法的两个关键参数是MINIMUM_SUPPORT(项要成为频繁项集所必须满足的最小支持度)和MINIMUM_PROBABILITY(关联规则的最小概率)来说明项集以及该算法生成的规则。在我们进行Web数据挖掘过程中,需要多次设置参数组合来比较挖掘结果,并通过模拟测试以得到最佳参数设置[3][4]。
建立动态变化的VOD前台系统
为保障研究课题的顺利进行,我们对实验环境进行精心部署,在服务器上安装SQL2005来进行数据挖掘。因为数据挖掘不是实时的数据处理,所以我们进一步将VOD的前台点播页面也同时部署在这台服务器上,以便更好地实施后续工作。在研究过程中,我们采用VisualStudio.Net为开发平台,使用C#语言来进行编程。由于VOD用户对每个页面的浏览和每部影片的点播都会存入日志数据库,我们通过对该数据库的挖掘来获取详细数据,并构建模型,创建一个独立的影片推荐模块。根据不同用户组的历史点击情况,定制个性化的点播页面,形成动态变化的VOD前台系统,并嵌入到当前的点播系统中,从而优化服务器负载,改善网站系统运行情况。
具体实施步骤如下:
第一步:对分组用户进行汇总,将数据库中的信息作为数据源,考察用户各项行为数据。对Web挖掘的数据特征项进行分析,并进行数据预处理,挖掘出有效数据。
第二步:根据Web挖掘的具体目标,制定挖掘任务,并构建模型。
第三步:利用Web挖掘所得到的数据,结合终端用户的实际点播情况,动态生成点播系统的前台页面。
VOD个性化点播推荐系统的设计方案由离线部分和在线部分两部分组成,如图1所示。其中,离线部分实现数据的采集、预处理以及推荐模型的生成等功能,在线部分接受推荐请求、运行推荐策略并实时产生推荐结果。
图1 VOD推荐系统模型
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。