
郑海山 厦门大学信息与网络中心副主任
随着DeepSeek的开源发布,算力平权时代来临,人工智能部署及使用成本大大降低,诸多信息化层面原本难以实现或不敢想象的能力瞬间触手可及。像文本归纳、关键信息提取等任务,如今借助生成式人工智能可轻松完成。这为信息化系统升级迭代注入新活力,更为高校数字化转型发展道路开拓了新的方向。目前,各大高校正积极将人工智能融入教学、科研、管理与服务各领域。本文通过分析生成式人工智能与信息化系统的耦合度,剖析其如何能逐步渗透高校管理信息化领域,直至实现人工智能无感融入信息化的全过程。
AI与信息化系统的中低耦合现状
很多高校都已经部署了各类蒸馏或满血版大语言模型,这些模型作为工具类服务,与高校信息化系统耦合度较低甚至无耦合。它们为师生提供知识问答、文本创作、写作辅助、数学运算及编程等功能,且能解决云平台服务连续性与数据安全问题。然而,本地化部署硬件投入巨大,师生的固定作息规律导致白天高峰期面临算力紧张,夜间又存在闲置等资源分配问题。如果要在算力、成本及数据安全间寻求平衡,通常可采用在云平台租借GPU资源,利用开源大语言模型搭建自建平台,为师生提供服务的方式。
还有部分高校的信息化系统与AI处于中耦合的情况,即通过RAG(Retrieval-Augmented Generation,检索增强生成)等技术,将校园特色语料、教学资源、部门规章制度、办事指南等纳入知识库,在用户向大语言模型提问时,带上知识库的知识片段,解决幻觉问题。比如在用户咨询一卡通物理卡办理流程上,通用大语言模型因为学习的是互联网的公开语料,导致难以准确回答,此时,校级的知识库就可以做到有效的补充。
如果本身知识库就是对外开放的,可直接使用云平台的各类服务。如果数据较为私有,则应选择本地化部署。这类知识库对大语言模型的生成要求能力不高,可不使用推理或满血版模型。
在这个阶段,可能会用到一些智能体(Intelligent Agent)或者多个智能体协同工作。其中有些智能体只是简单地内置了一些提示词,而有些则更加复杂。提示词可以视为一种新的编程语言,从早期的穿孔纸带,到机器语言,汇编语言,再到高级语言,编程语言的灵活性逐步提升,容错率也越来越高。过往的编程语言均具有严格的规则和结构,而提示词则更宽容。
虽然高校普遍使用的流程引擎也具有较高的灵活性,具备一定的“智能性”,但是流程引擎还是以预先设定的各类判断逻辑进行流转。智能体可以成为新的流程引擎。有些问答涉及多个知识库联合,这在编排上就会更加复杂。比如要先对用户的提问进行意图识别,再使用流程对多个智能体进行编排,最终给出问答结果。虽然这类情况的耦合度可能会稍高一些,但是整体上还仅是复杂的RAG知识库而已。
如果要将人工智能应用到诸如网络或网络安全运维等要求较为严谨和专业的领域,就需要对历史沉淀的数据进行更加结构化梳理,构建层次关系,并实施更高质量的审核和维护。不过这些领域由于输入相对独立,与各信息化系统关联度较低,耦合度也不算太高。
AI与信息化系统深度整合的三大策略
通用大型语言模型仅学习了面向互联网公开的极少数语料,而大量需要统一身份认证登录后才能访问的内部数据尚未被掌握。深度耦合需要信息化系统的整体升级。面向AI时代,信息化系统应当如何进化呢?
策略一:躬身入局
第一种进化方式是将传统的鼠标点击和键盘输入操作转变为自然语言交互,同时将人类的思考和决策过程替换为生成式人工智能推理。这种方式对每个功能点的实现都进行了重新设计和优化,以更好地融入人工智能。
举例来说。对于科研系统,在申报项目时,必须选择是横向还是纵向项目,并填写合同名称、类别、委托单位、经费总额、项目成员、项目起止时间、预期成果等详细信息,这些信息通常可以在科研合同中找到。此时,用户可以上传扫描版的不可编辑PDF或可编辑PDF文件。通过OCR技术或PDF格式解析,系统能够将非结构化数据转换为结构化数据,自动提取相关字段并进行填充。用户仅需进行确认和必要的少量修改,显著减少了填写表格的工作量。
对于财务报账系统,也可只上传电子凭证,系统自动解析其中的信息,提取出差地点、时间、交通工具等,并对材料的合规性进行初步审核。比如检查是否食宿自理,费用是否超标等情况。通过以上改变,可减轻填报人的工作量,也可减轻人工审核的工作量,在提高审核效率与准确性外,还能确保审核标准的一致性,减少人为因素导致的误差。
对于OA公文流转系统,由于公文的结构化程度通常较低,且流转过程往往依赖于领导的批示。当需要具体办理时,公文秘书需根据批示将公文转发至不同分管领导或具体办事人员,这一过程繁琐且耗时。这时则可借助大语言模型的自然语言解析能力,结合历史同类审批事件的数据,对领导批示进行语义理解和智能分析,自动识别批示中的关键信息和意图,匹配相应的审批流程,实现公文的全自动或半自动或辅助转发和分流。
对于校内的办事流程,比如单位或教职工申请网络系统对外服务为例,其流程通常包括以下步骤:首先选择使用网站群或自建,若选择自建,则需依次申请虚拟机、IP地址、堡垒机和域名,同时申请部分数据中心数据,以及与统一身份认证系统对接。而选择网站群,也会遇到域名的申请等操作。此外,还需梳理访问人员权限,申请接入反向代理实现校内外访问的有效控制,接入统一日志系统,完成上线前的安全检查,确保系统安全稳定后正式对外开放。以往,这些步骤主要依赖流程引擎进行中转审批,用户需根据流程的文本提示自行评估和申请各类资源。
对于领导驾驶舱系统,使用者可以通过自然语言与系统交互,进行数据探索、统计和分析等操作。系统后端借助基于大语言模型的NL2SQL(Natural Language to SQL)技术,实现对数据库的精准查询和数据的智能分析。通过一段时间的收集,对于那些使用频率较高的需求,系统可以将其固化为特定的功能点,在高度自由的探索同时,满足不同用户的多样化需求。
在这种模式下,信息化系统依靠自身进行人工智能升级换代。然而由于大语言模型的复杂性和资源需求,很多信息化系统一般较难完全自己实现大语言模型的本地化部署和推理任务。为解决这一问题,高校应提供一个多元化的模型平台,综合考虑成本和数据安全等因素,适配不同后端的大模型。这些大模型可以来自云平台的API,也可以是本地化部署的模型。它们可以是通用或推理的模型,也可以是蒸馏版或满血版的模型,甚至是经过微调的行业特定模型或学校自有模型。它们可以是相同模型的不同版本,同一个版本在不同平台的部署。通过内部独立区隔或共享机制,该平台能够满足不同层次的需求。最终,通过授权和API发布,形成面向信息化系统的人工智能基础设施,为信息化系统提供高效的人工智能服务。
策略二:功成不必在我
第二种方法是通过API接口开放系统的部分功能,使其成为学校信息化整体架构中的一块“积木”,便于与其他智能体和系统集成,实现协同工作。
在此模式下,信息化系统无需主动与人工智能耦合,而是以“功成不必在我”的理念,将自身定位为被人工智能智能体调用的对象,从而实现人工智能改造。这些智能体较为复杂,具备长期或短期记忆功能,能够感知环境变化,进行自主决策,并利用现有工具采取行动以达成目标。
在实现层面,这些智能体可运用多种技术,如工具(Tool)、行动、Function Calling(函数调用)、插件、MCP(Model Context Protocol)等。尽管这些技术名称各不相同,但它们的核心目标都是为了使人工智能能够查询外部数据,提供丰富且个性化的上下文支持,或调用外部能力以完成既定的任务与目标。
在此过程中,智能体需接收自然语言描述,利用大语言模型的思维链过程,对用户意图进行推理与拆解,进而规划任务并将其分解为子任务。根据需求,智能体生成需调用的外部函数名及其参数,执行调用后,对返回结果进行提取与解析,再将信息反馈至大语言模型进行处理。这一过程可能包含多个自我反思与修正的环节,智能体将不断循环上述步骤,直至任务圆满完成。
对于信息化系统而言,过往主要聚焦于面向人类用户的操作便利性和界面友好性。然而,面向人工智能时代,系统应提升对机器用户的友好度,确保智能体能够高效调用系统功能。为此,信息化系统应将部分功能以API形式对外开放,使智能体能够便捷地调用,实现“功成必定有我”的协同合作。
例如,在前述场景中,信息化系统可以开放申请虚拟机审批、申请统一身份认证、查询域名重复和推荐等表单的预填功能,以及流程节点的确认与查询功能,还可以提供关系型数据库的访问权限。使得复杂的业务流程,在一次或多次的聊天交互过程中,智能体便能借助这些开放的API,顺利完成工作任务。
策略三:机器人流程自动化RPA
上面两种是理想的模式,在信息化系统未能进化到这一层级的情况下,能否有其他方式可以迂回加入人工智能的能力呢?有的,比如RPA(Robotic Process Automation,机器人流程自动化)的使用。
RPA通常在客户端运行,其核心价值在于前端集成,尤其适用于那些用户无法控制或修改成本较高的信息化系统。传统上,RPA对使用者的技术要求较高,但在人工智能技术的加持下,RPA已变得更加智能和用户友好。借助类似于computer-use和Browser-use的类库,通过视觉能力和推理相结合,RPA能够在DOM级别甚至GUI界面上识别和操作按钮、菜单和文本框等元素,模拟鼠标和键盘操作,从而实现自动化的任务执行。
例如,在上级数据报送网站进行数据填报时,RPA可以通过自然语言指令,在本地打开数据文件,自动填写到网站平台。在前述例子里,科研系统未实现人工智能,也可使用RPA技术,在本地打开PDF文件,利用OCR技术解析文件内容,并将相关信息自动填入浏览器中。此外,类似Manus,还可以在隔离的云端受控沙盒环境中执行各类自动化任务。
结语
人工智能的发展日新月异,它为教育的各个领域带来了前所未有的变革与机遇,高校信息化系统亦在其列。从提升教学效率到优化管理流程,从促进科研创新到增强校园信息化服务体验,人工智能的应用优势正不断凸显。然而,技术的飞速发展也伴随着新的挑战,如自动化流程中的责任归属、数据隐私风险以及伦理道德困境等,这些问题亟待我们深入研究与解决。尽管前路漫漫,但我们有理由相信,随着技术的持续进步与完善,人工智能与高校信息化系统的深度耦合将指日可待。
来源:《中国教育网络》
作者:郑海山(厦门大学信息与网络中心)
责编:陈荣