高校信息化建设初期,多是独立开发建设相互独立的应用系统,每个部门或单位都是一个数据源,每个数据源都是异构的,进而形成了一个巨大的异构数据环境。在提高了效率的同时,这些系统的相互独立性也为整体管理设置了障碍。
为了将高校信息系统建成一个高度集成和开放的系统,一种办法是推倒重建,考虑到成本、实施周期和难度因素等,这不是一种切实可行的解决方案。另一种办法是整体考虑高校的信息化需求,根据实际情况,对各个信息系统进行整体规划,选择一个合适的集成平台,把学校各部门的“信息孤岛”有机地集成起来。因此,如何解决已建立的应用系统之间的信息集成是当前数字校园建设中面临的主要问题之一。
信息集成技术
信息集成所要解决的问题是把位于不同的、异构信息源上的数据合并起来,以便为用户提供这些数据的统一视图,通过异构数据集成系统进行统一操作。因此,处理各种各样的异构情况成为信息集成的主要任务。利用数据集成技术将高校内已有系统集成是提升高校内部系统、达成高校目标和增强高校竞争力的重要手段,也是当前计算机应用的发展趋势之一。
信息集成技术的研究始于80年代早期,现已在实际领域得到应用,并且产生了良好效果,但在我国教育领域的应用还不是很多。
目前,在开发信息集成系统时所采用的方法基本可以分为两类:物化方法(Materialized,也称数据仓库法)和虚拟方法(Virtual,也称中间件法)。
物化方法:在客户端与数据源(服务器)之间增加一层,称为数据仓库,用于存储来自各数据源的待集成数据,系统提供对这个数据仓库的查询机制。这种方法的优点是既可用于信息集成,又可用于决策支持查询。该方法存在的问题是,当信息源的数据发生变化时,数据仓库中的数据也要做相应的修改。因此,这种间接访问方式的最大缺点是数据更新不及时,数据重复存储。这种方法通常需要一些新的技术,如有效数据加载和增量更新维护等。
虚拟方法:该方法使用了与数据仓库法完全不同的结构。数据仍保存在各数据源上,集成系统仅提供一个虚拟的集成视图(即全局模式)和对该集成视图查询的处理机制。系统能自动地将用户对全局模式的查询请求转换成对各异构数据源的查询,它依赖于两类软件组件:包装器(wrappers)和中间件(mediators)。 包装器包装数据源,把底层的数据对象转换为统一的数据模型;在某种程度上,中间件是信息源中数据的一个视图,中间件中并没有数据,用户可以对中间件进行查询,对于每一个用户的查询模式需要一个中间件。中间件从包装器或其他中间件获取信息,通过集成不同数据源信息,并解决它们之间的冲突来提炼信息,然后把信息提供给用户或者其他的中间件。由于该方法不需要重复存储大量数据,并能保证查询到最新的数据,因此比较适合于高度自治、集成数量多、且更新变化快的异构信息源集成。
通过上述两种方法的比较,我们选择虚拟方法,即中间件法来实现已有系统的集成。本文针对高校的信息化发展现状,将基于Web Service的信息集成引入数字校园中,为高校目前存在的异构数据的数据集成提供了一个解决方案。
Web Service技术
Web Service特指用Web服务描述语言(Web Services Description Language ,WSDL)描述的、通过HTTP发送的、处理XML 编码的SOAP 消息的分布式服务架构(也可称作Web服务)。Web Service技术主要包括XML、SOAP、WSDL、UDDI等技术。
在Web service体系中,所有的应用实体都被抽象成服务,其中包括三个角色和三种操作,如图1所示。
三个角色分别是:
1.服务提供者(Service Provider):从应用角度看,它是指服务的所有者;从体系结构上看,它是指提供服务的平台。
2.服务请求者( Service Requester):从应用角度看,它是指需要请求特定功能的企业;从体系结构上看,它是指查找和调用服务的客户端应用程序。
3.服务代理( Service Broker):它是指用来存储服务描述信息的信息库(Repository),服务提供方在这里发布他们的服务,服务请求方在这里查找服务,获取服务的绑定信息。
三种操作分别是:
1.发布( Publishing):服务提供者需要首先将服务进行一定描述并发布到注册服务器上。在发布操作中,服务提供者需要通过注册服务器的身份验证,才能对服务描述信息进行发布和修改。
2.查找( Finding):服务请求者根据注册服务器提供的规范接口发出查询请求,以获取绑定服务所需的相关信息。在查找操作中,一般包含两种查找模式:一种是浏览模式(Browse Pattern),另一种是直接获取模式(Drill down Pattern)。
3.绑定(Binding):服务请求方通过分析从注册服务器中得到的服务绑定信息,包括服务的访问路径、服务调用的参数、返回结果、传输协议、安全要求等,对自己的系统进行相应配置,进而远程调用服务提供者所提供的服务。
解决方案
目前,数字校园建设的重点之一是建立统一的数据平台,解决各个子系统中数据的异构问题,实现子系统之间的数据共享。Web Services的提出就是为了解决异构系统的集成问题,通过Web Services技术,对服务进行定义,从而隐藏旧应用接口的一些复杂性,异构系统之间的交互( 如数据交换、数据挖掘等)难题可以得到很好的解决。
针对高校的集成需求,通过Web Services来实现系统之间数据与业务的衔接。例如,针对许多系统都需要从学生信息系统中获取学生基本信息的情况,我们可以在学生信息管理系统中设计一个Web服务,其他信息系统在需要时就可以通过这个服务来获取学生的基本信息。对于每个部门的子系统,可以把需要提供给外界的信息以Web服务的方式来提供,而其他需要相关信息的系统通过调用这些Web服务来获取。
具体来说,校园网中现存的各个子系统应该被看作Web服务体系结构中的服务提供者的角色,但是由于异构性的存在,因此需要由一层中间件将原有系统的功能接口转化为统一的服务接口,这个工作实际可以看作是对旧系统接口的改造和更高层次抽象,WSDL技术在这里得到了很好的应用,所有的接口信息都以WSDL文档的统一形式展现给下层的系统模块。使用WSDL描述这些Web服务,并按需将其发布到注册中心以供查询,同时所有这些工作均可使用支持规范的工具来完成。此时,系统之间的集成就变为Web服务的对接。开发人员可以通过UDDI API来查询Web服务的注册中心或与相关技术人员进行交流,获取对方的Web服务的WSDL描述文档,然后通过平台工具自动将WSDL描述文档装载到自己的开发平台中,并生成相应的接口。同时,开发人员可以使用XML Schema工具快速地理解应用交互需要使用的数据结构,然后在自己的应用中引入刚刚使用平台工具生成的调用接口和数据结构,使用SOAP技术与对方的Web服务进行交互,从而完成系统应用集成。
对于最终的用户来说,需求是多样化的,很多情况下,需要结合多个子系统中的数据做一些数据分析或数据挖掘的工作。例如,当校方发现学生的成绩下降时,希望了解学生成绩下降是否跟学生在VOD系统花费了过多的时间有关;能否建立一个受国家资助大学生的消费模型以调整助学策略;可否通过学生的阅读记录和成绩分析图书馆对学生学业的帮助程度。这些高级的需求是不能由一个简单的独立系统得出结论的,需要利用多个系统的数据进行数据挖掘。中间服务层实际上就是这样的一个个分析系统,对于用户来说,它们相当于更高抽象层次的服务,可以进行可视化的操作;而在整个系统结构中,它们应该被看作是Web服务体系结构中的服务请求者的角色,正是它们对于上层子系统提供的服务发出了调用请求。由于上层子系统各自的功能服务已经由WSDL进行了统一的抽象描述,以统一的接口形式暴露给下层,所以对于中间服务层模块来说,只要把对各个子系统的服务调用请求按照SOAP规范进行封装,就可以顺利实现相关的调用。
面向服务的架构是实现高校信息系统之间数据和业务无缝衔接的理想方案,它在服务层中将各业务功能点以服务的形式暴露于系统之外,其他信息系统可以通过服务协议对服务进行访问。这种技术简化了系统集成,可以快捷、容易地对业务需求的变化做出反应。另外,面向服务的架构是与平台和语言无关的,因此无需考虑应用实施的环境是何种平台系统和设备。和其他的系统集成技术相比,面向服务的集成是解决高校信息系统集成的理想选择。
结束语
高校信息系统是一个有机的整体,但由于软件开发技术的限制以及高校信息化由零到整的发展历程,使得各个子系统高度独立,数据与业务无法共享。因此,高校信息系统集成是高校信息化建设的一个重要研究领域,也是高校当前面临的紧迫问题。尽管现在大多数高校都在搞数字校园建设,但是真正能集成原有的资源,利用原有的设施,使各部门能协同工作的却不多。本文利用Web Service 对数字校园的建设提出一个新的架构,可以说是这方面的一次有益尝试。当然,数字校园的建设是一个长期和浩大的工程,如何搞好这一工程,还有待于进一步研究和探讨。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。