您的位置:首页 > 参评方案展示 > 智慧校园

西安石油大学:校园网PT资源共享策略

  校园网PT资源共享平台

  NexuPHP是由浙江大学的Nexus团队发起并开发完成的,利用它可以实现了一个基于局域网环境的、完整的、有序的、重视用户信誉度的资源共享平台的解决方案。目前国内高校校园网上部署的PT资源共享平台大多是基于开源的NexuPHP的基础上改进和扩充功能建立起来。PT资源共享平台利用校园网入口高带宽的优势,同时发挥基于P2P网络资源文件交换的BT下载的长处,在校园网上实现可控的、可资源共享、高传播速度的信息交流,有效地利用校园网内网资源,满足校园网用户对高清资源在线流畅使用的需求。该平台在管理上通过对Ratio(上传量和下载量的比例)的判定实现对用户权限的配置,以此来督促用户积极上传资源和后期保种;在服务对象上是面向校园网内的师生用户,实行邀请注册的机制,不允许用户自由注册,有效限制共享使用平台的用户数。

  PT资源共享平台存在的问题

  由于NexuPHP采用的技术、运行机制和用户分享机制的特点,使得基于NexuPHP的PT资源共享平台在使用中存在下列问题:1.资源来源分散,使得校园网用户上传的资源散乱或有时发生缺失现象;2.PT资源平台的资源积累需要组织专人上传和更新,这种方式给PT平台的管理维护人员带来相当大工作量;3.PT平台资源更新速度与外网的资源更新相比,速度较慢;4.如果负责管理上传资源的人员不能及时更新用户喜爱的资源,就不能带动其他用户自觉上传和做种,导致用户流失和资源过期,PT平台将会形同虚设,最终失去存在的意义。

  从PT平台管理者的角度来看,PT平台需要加快更新速度,同时为了满足不同用户的需求,种子资源要涵盖不同领域的不同内容;要及时过滤不良信息,在不侵犯版权的前提下及时更新资源,提供健康积极的共享高清资源,减少人力资源配备,力求实现自动运行平台资源更新。

  从用户角度出发,用户希望PT资源共享平台提供高清的娱乐和学习资源,同时保留有用的、存活时间久的资源。

  显然,现在的PT资源共享平台运行模式、资源总量和资源的更新速度并不能完全满足校园网用户需求。

  改进校园网PT下载/上传模式

  西安石油大学基于现存的校园网PT平台,提出一种资源自动下载/上传的解决方案Zero PT(ZPT)。自动更新资源的计算机Zero Robot(zero)充分利用夜间良好的带宽,下载网络资源并上传到校园网PT平台。为了保证zero持续不断的运行,ZPT必须要满足以下条件:

  (1)资源自动采集

  (2)资源自动下载

  (3)资源自动删除

  (4)资源自动发布

  (5)资源自动做种

  采用Ubuntu操作系统下,Transmission-daemon种子下载工具。

  1.采集RSS链接信息

  资源的采集是ZPT良好运行的基础,寻找合适的RSS链接信息提供站点,可以获取源源不断的高清资源。其中基于NexuPHP发布的RSS订阅页面是高清资源来源的最佳选择,里面包含ZPT所需的种子文件链接、资源标题、简介、分类等必要信息。zero通过调用RSS解析函数,可以定时采集最新的RRS连接信息,与以前的手工采集相比,采集速度更快,采集信息更加精准,更加集中,从根本上杜绝了资源散乱的问题。

  2.下载资源

  zero定期从数据库中读取种子文件的下载链接地址,并将获取的最新链接添加到Transmission软件自动监控目录,使用Transmission自动监控机制,自动下载种子文件,种子文件下载完成后,Transmission解析种子文件并在网络中搜寻对应的资源,下载资源文件。ZPT定期获取Transmission资源下载的进度信息,如果监测到有资源下载完成,就在数据库中查找并标记,表示此文件下载完成,可上传。此方法简化了资源下载的步骤。

  3.删除多余的文件

  (1)删除过期的种子文件

  查看Transmission自动监测目录下后缀为.added的文件,表明种子文件过期,需要及时删除。

  (2)删除资源文件

  zero定期检查硬盘中资源文件的总数据量,并与设定的最大存储量阈值比较,如果超过设定的阈值(例如总磁盘存储量的80%),找出已经上传的并且存活时间最久的资源文件索引,停止做种,删除资源。这种做法既避免因硬盘空间不足导致新下载的资源没法存储,又能避免近期下载的资源被误删,同时解决了PT平台需要人工频繁删除资源的问题。

  4.资源发布

  NexuPHP对资源发布者采用会话身份认证,即只有登录成功的并且具有发布权限的用户才能发布资源。ZPT采用cURL模拟HTTP行为实现用户登录方式,登录时用cURL模拟HTTP POST提交用户名、密码和一些必要的cookie信息到目标地址。通过登录验证之后,zero从数据库中读取需要发布的种子信息,通过cURL将其提交到目标地址,完成资源的发布任务。此模块完全取代人工发布资源步骤,包括登录,填写资源标题、简介、分类等一系列繁琐的填写文字操作。

  5.自动做种

  资源发布成功之后,目标站点会自动返回一个页面,用正则表达式获取页面中的种子链接和资源对应的ID号。调用curlTool工具类获取种子文件的内容信息,写到以ID命名的种子文件中,并将种子文件存放在Transmission监控目录下。Transmission依据此新建的种子文件下载资源文件,由于下载的资源文件的位置在本地文件夹中,Transmission自动验证本地文件,成功后实现自动做种,可供PT平台的用户下载。此步骤是最为关键的一步,在人工操作中,需要将自己刚发布的资源重新下载一次,下载目录要与上传的目录一致,这样Transmission软件才能找到这个上传的资源,并验证通过,才能完成做种的工作。通过ZPT系统可以完全取代人工操作,成功率高且节省人力。

  zero定期重复自第1步的过程。总体来说,ZPT系统从资源的采集到资源的做种,完全取代了人工操作,把PT资源共享平台管理人员从繁重、单调的劳动中解放出来。同时加快了PT平台资源的更新速度,把更多更好的高清资源分享给全校师生。

  改进后的信息分析

  自ZPT实施以来,zero自动下载/上传做种带动整个PT平台的资源更新,形成一个良性的发展循环状态,吸引更多的学生和教师使用此平台下载资源,同时促使用户贡献出自己拥有的宝贵资源。

  图1是PT平台用户每月下载zero提供的种子资源、用户提供的种子资源和总资源的下载次数统计图。

  在2015年5月到2016年5月,从下载情况看,zero提供的资源下载总次数为587023次,用户提供的种子资源被下载总次数为260328次,ZPT的使用使PT资源平台的种子资源的下载次数相对提高2.25倍。从时间上看,2015年11月份之后,用户提供的种子资源被下载次数明显多于zero提供的种子资源。从总体上分析,用户提供的种子资源被下载次数的曲线和PT站点所有种子资源被下载次数是正相关的,说明用户提供的资源更符合PT站点的用户需求。

  如图2所示,蓝色标记表示2014年5月到2015年5月ZPT未实施的情况下,PT平台总资源被下载的次数,黄色标记表示,2015年5月到2016年5月在ZPT实施的情况下,PT平台总资源被下载的次数。使用zero前,PT平台的资源被下载的总次数为69585次,使用zero后,PT平台的资源被下载的总次数为587023次,PT平台的活跃度提高7.44倍。

  由改进后的PT资源共享平台的数据量和用户下载资源量分析,以及zero所带来的正面影响和引导效果可以看出,ZPT的使用不仅节省了人力资源,而且推动了整个PT平台的较快发展,使校园网内的PT平台步入一种良性发展状态,并同时满足了PT平台管理人员和用户的新需求,达到了开发本系统的目的,也符合PT站点的建设初衷和目的,保证了PT资源平台的持续性发展。

  由于全自动的ZPT系统缺少管理员的参与,使得系统存在一些问题:不能自动鉴别是否为不良信息,不能鉴定重复的资源等。在以后的改进中需要运用文本挖掘技术,从资源的简介和评论中判断资源是否健康。

  (作者单位为西安石油大学)

来源:中国教育网络作者:董振涛 郑宏涛
《中国教育网络》
杂志微信公众号
高校信息化应用
微信公众号
高校网络安全
微信公众号