【关键词】 基础教育资源;垂直服务体系;搜索引擎Berse
引言
教育信息资源,简称教育资源,是指蕴涵着教育相关信息的各类信息资源。狭义上讲,教育资源仅仅指用于教学过程及教学评价与管理的教材、课件、辅导资料、参考资料、习题集、试题集、工具型资料、教学标准与过程规范等,这些教育资源的特点是具有一定的教育价值[1]。广义的教育资源还包括教育新闻、招生信息、教育类广告等资源。这些资源虽然不具有教育价值,但也是教育工作者非常关注的。本文后面所说的教育资源,指的是广义的教育资源。
基础教育资源就是指服务于基础教育领域的教育资源,既可以是数字化的,也可以是非数字化的。数字化的教育资源在承载信息量、复用、传递、共享、交流、反馈等方面比非数字化的资源具有非常明显的优势。
Web是一个巨大的资源库,蕴藏着各种丰富的数字化资源。在教育信息化进程中,广大基础教育工作者需要大量的数字化的教育资源,中小学生及其家长也越来越多地依赖数字化的教育资源。如何让广大基础教育工作者、中小学学生及其家长有效地利用Web上的数字教育资源,为基础教育服务,为教育信息化服务,是一个摆在我们面前的重大课题。
Google的创始人之一Larry Page有句名言:“我们若能够妥善地搜寻资料,实在已经改变世界”。Goole和百度等著名搜索引擎的出现,确实让世界上许多人的工作方式发生了改变。如今,许多人依赖于搜索引擎来搜寻各种资料,从而完成自己的工作。但这还不够:人们在使用这些搜索引擎的时候,经常会发现,即使是著名的搜索引擎,搜索出的资料也难以尽如人意。排在搜索结果前面的许多资源,根本不是自己所需要的。图1和图2分别说明了使用Google和百度搜索引擎搜索中学物理中的重要概念“万有引力”的前5条搜索结果(2006年6月10日搜索结果)。从图1和图2中可以看出,这些通用搜索引擎给出的前5条结果中,只有1到2条记录与中学物理相关。
“我们若能更好地利用Web,实在已经拥有了数字教育资源的半壁江山。”这是我们针对基础教育领域所提出的服务理念。在该理念的驱动下,我们开展了面向基础教育的Web资源垂直服务体系研究。我们的思想是,通过对茫茫Web中的资源进行搜集、分析和过滤,建立一个Web基础教育资源服务平台,为基础教育领域的广大用户提供该领域特定的Web资源服务,亦即我们所说的“垂直服务”。
Web上基础教育资源的分布
1999年,国务院批转了教育部提出的《面向21世纪教育振兴行动计划》,首次明确地将“教育信息化”确定为教育发展的重要主题,并指出教育资源建设是重点。全国各地掀起了一股开发各类教育资源的热潮。据统计,2003年我国共有小学42.58万所,初中学校6.47万所(其中职业初中1019所),以及普通高中1.58万所[2]。为了响应教育部的号召,全国各地许多有条件的中小学校及企业纷纷投入了大量的人力、物力进行教育资源的开发建设。与此同时,Web教育资源也受到广大中小学老师,以及相关科研人员的重视。由于当前我国教育信息化建设尚处于初级发展阶段,基础教育资源建设缺乏行之有效的建设标准和整合手段,Web基础教育资源经历了爆炸性增长之后,目前呈现高度分散状态,重复性建设非常严重。
为了向基础教育领域的用户提供垂直服务,我们分析了Web上基础教育资源的类型和分布状况。从资源的共享程度看,Web上基础教育资源可以大致分成三类:其一是某个组织或者局部区域所拥有的基础教育资源库,这类资源是封闭的、外界访问不到的;其二是集体或者个人开发并发布在互联网上供Web用户无偿使用的资源,这类资源有着非常可观的数量;其三是散落在互联网上的教育相关的一般性资源,如新闻、招生信息、产品广告,这些资源也经常为广大基础教育工作者、中小学生及其家长所关注。
从资源的呈现方式看,基础教育网络资源的分布状况如下:
(1)综合性教育教学网站:一般由教育主管部门、教育科研组织及教学服务单位创办。这类网站一般提供多学科、综合性的教育教学资源及相关的教育服务信息,它们或者公开对外提供免费服务,或者只对局部地区提供免费资源共享。例如,K12教育教学网(www.k12.com.cn)是一个专业型基础教育网站,绝大部分资源公开,为全国基础教育教学科研提供无偿服务。
(2)专题性教学网站:一般由教育科研单位、中小学校、学科教学组织等创办,提供基础教育某个学科或某一领域的专题性教学资源,资源类型包括教案、试题、教学论文、课件、教学素材、教研动态等。这类网站的基础教育资源往往比较集中,针对性较强。例如,地理课堂网(杭州教育局教研室地理学科组承办,http://www.zjdl.net)、信息技术课程网(南京师范大学信息化教育研究所创办,http://www.ictedu.cn)、现代小学数学网(杭州市现代小学数学中心创办,http://www.msmaths.com)、创新作文网(《课堂内外》杂志社主办,http://zuowen.new-class.cn)等。
(3)校园网教学网站:由中小学校创建并维护,主要针对本校的教学提供各种教学资源。这种网站有些仅对本校师生提供服务,也有一些提供公开或半公开的信息服务。
(4)门户网站开设的教育频道:一般由商业公司创办,它们在门户网站内部开设教育频道,公开对外提供各级各类教育信息与教育资源索引,属于非专业性基础教育资源网,其内容往往比较庞杂。例如,新浪网教育频道(http://edu.sina.com.cn)提供教育新闻、各种考试真题、各级各类招生信息、校园生活、学习方法等内容,其中既有基础教育资源信息,也有考研、留学等非基础教育资源信息。
(5)个人创办的教学网站:由基础教育一线学科教师、教学研究人员,或者有兴趣的其他人士,凭个人爱好和兴趣,以个人或个人联盟的性质创办。这类网站的内容一般也是专题性的,内容大多比较单一,往往与创办者教学或研究方向有关。站内资源大部分为创办者平时收集的教学资源,或者是其它网站的教学资源链接,其中也不乏有办得比较好的。例如,中学历史在线(http://www.ls11.com),起初由站长本人凭个人兴趣创办,随后通过同行互助、聘请专家等途径使网站内容日益丰富。
综合以上分析,Web上的基础教育资源分布广、种类多、数量多、优劣差距大,这给广大基础教育工作者和学生及家长在寻找自己想要的资源时带来了很大的困难。
面向基础教育的Web资源垂直服务体系
针对Web上的基础教育资源的以上特点,我们建立了一个Web基础教育资源服务平台。该平台通过对Web中的各种资源进行搜集、分析和过滤,并建立一个中心索引库,同时为基础教育领域的用户提供资源的检索和浏览服务,并通过捕捉用户的行为或者接受用户的定制,为用户提供资源推送服务。该平台代表了面向基础教育的Web资源垂直服务体系的一个具体实现。平台包含如下具体的子系统:
● 基础教育资源搜索引擎
● 基础教育网站黄页
● 基础教育资源索引
● 基础教育资源的定制与个性化推送
其中,基础教育资源搜索引擎是一个专门服务于基础教育领域的专业化网络搜索引擎,它通过提供关键字检索、分类检索,以及二者的组合检索,为基础教育领域的用户提供专业、便捷的资源检索服务。基础教育黄页网站是一个专门针对互联网上的基础教育相关网站而实现的一个黄页网站,对互联网上的基础教育相关网站进行分门别类的整理,并且提供浏览和检索的功能。基础教育资源索引是专门针对互联网上的基础教育资源而实现的一个索引网站,对互联网上的基础教育相关资源进行分门别类的整理,并且提供浏览和检索的功能。基础教育资源的定制与个性化推送则是在前面三个子系统的基础上,通过捕捉用户行为或者让用户定制其感兴趣的主题,为用户提供基础教育资源的地址与推送服务。
本文后面部分将对基础教育资源搜索引擎这个子系统作更详细的介绍。
基础教育资源搜索引擎
作为一个专门服务于基础教育的专业化网络搜索引擎,其关键目标是要建构一个具有专业特色的资源索引数据库。一般的通用搜索引擎之所以信息检索准确率较低,最重要的一个原因在于它存在一个过于庞杂的索引数据库。对于通用搜索引擎,因为要具有通用信息检索能力,所以对网络蜘蛛下载的信息不可能做太多的筛选,相反,还要力求信息覆盖面尽可能广。另外,由于检索范围太广,通用搜索引擎的用户检索行为及检索目标很难预料,这样,使用关键字进行检索,检出信息量必然很大,内容杂乱。如果采用比较复杂的检索策略与检索技术,又会造成系统的响应时间过长。因此,搜索引擎索引数据库覆盖面过大与检出信息杂乱是通用搜索引擎难以克服的矛盾。在当前的技术条件下,要保证快速响应用户的检索请求,并对检索行为进行准确预测,就必须对检索范围加以限制。基础教育资源搜索引擎是一种专业型搜索引擎,它通过对中文文本自动分类来建构专业索引数据库,使其只包含基础教育资源及相关信息,试图克服通用搜索引擎的这一内在矛盾。
图3说明了基础教育资源搜索引擎的系统结构。从图3可以看出,基础教育资源搜索引擎由文档下载子系统(网络蜘蛛程序)、文档自动分类子系统、文档自动标引子系统与用户检索子系统等四部分构成。基础教育资源的定制与个性化推送也建立在该搜索引擎基础之上。
基础教育搜索引擎的工作流程如下:首先,网络蜘蛛根据某种策略在互联网上自动寻找基础教育相关的资源,下载并保存新发现的资源及其URL;然后,经过资源预处理程序除去其中不相关的信息(噪音),再交由文档自动分类器对文档进行过滤、分类处理;接着交由文档标引程序建立倒排索引,形成基础教育搜索引擎索引数据库,这样,当用户向基础教育搜索引擎提交查询请求时,用户检索子系统就可以从基础教育资源索引数据库中检索出相匹配的资源及其URL,用户根据此URL就能访问Web上的原始资源。其中,文档自动分类器需要事先对人工提供的已分类样本文档进行机器学习,从中提取出基础教育资源的各类别特征,形成基础教育资源特征库。在此基础上,文档自动分类器即可对网络蜘蛛下载下来的资源进行判断和自动分类。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。