数据模型建立及关联规则表的生成
在VisualStudio2005中创建AnalysisServices项目,首先要建立数据源和数据源视图。我们将整个VOD点播系统数据库作为数据源,但用于前台推荐的数据仅仅是其中一部分。本次研究根据日志数据表生成两个视图,一个是Customer表,用于表征用户,另一个是PlayLog表,用于表征用户的浏览记录。在创建挖掘结构中将Customer作为事例表,PlayLog表作为嵌套表,通过LogIp关联,在挖掘模型中选择合适的数据挖掘算法并设置合理的参数,如图3所示。
图3 挖掘模型
设置挖掘模型后,就可以通过挖掘模型浏览器来查看挖掘的结果,图4为推荐模型生成项之间的网络图。
图4 由推荐模型生成项之间的网络关系
在图4中,我们可以看到,点播的影片之间存在着关联。例如:对某用户来说,中间绿色圈内为首点播影片,周围橙色圈的影片表示与该片存在很大关联的影片序列;紫色圈内的影片表示,它们与示例影片存在相互引用的关系,而呈灰白色的影片则表示,它与示例影片之间暂时达不到关联规则的要求,排除在推荐列表之外。
一般,我们可以采用DMX来查询数据,但是由于点播系统的访问量非常大,点播日志呈指数级增长。每次都通过实时查询挖掘模型来获取数据库的推荐信息,将会大大增加服务器的压力。因此,我们进一步优化推荐方案,通过数据挖掘将关联规则一次性生成,并存入数据表中,与影片数据库分别部署。前台点击时,通过SQL查询语句查询数据表中对应的项即可作出影片推荐。根据影片更新情况和访问情况,按周期执行数据挖掘模型,将用户点播的最新情况更新到关联规则表中,确保影片推荐的质量。通过对原本无序的访问进行有序地引导来减少点播流量,从根本上减轻服务器负载,使得点播更加流畅。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。