近年来,网络安全事件频发,不少国内外高校、企业遭到攻击,大量敏感信息泄露。网络安全教育作为一项预防性措施,能很大程度上减少网络安全事件发生,而在作为重要的人才培养基地的高校中,培养和提高网络安全意识和技能,有助于学生的健康发展。
由于环境的变化和学生的个性化需求,高校传统的网络安全教育理念和方式存在局限性。大数据时代,用户画像技术是重要的数据分析工具,通过数据采集、处理、提取、构建等操作,实现数据隐藏价值挖掘,为用户提供针对性的服务。在高校网络安全教育中应用用户画像技术,能够挖掘出用户的需求内容,实现资源服务的精准匹配和推送,提高用户信息化素养和网络安全意识,不断完善高校网络安全教育内容。
在中国知网搜索“用户画像、高校”主题关键词,检索出有关高校领域用户画像的研究文献279篇;搜索“大数据、高校网络安全”主题关键词,检索出有关高校领域网络安全的研究文献87篇。通过分析和研究已有论文,可以发现国内高校关于网络安全教育的画像研究起步较晚,最早报道是2016年,且大部分论文主要研究用户画像在高校图书馆、思政教育方面的应用,较少涉及网络安全教育方面。
鉴于此,本文借鉴国内外专家对用户画像在高校教育方面的应用研究,提出基于用户画像的高校学生网络安全素质提升模型,研究大数据画像在高校网络安全教育的应用。
用户画像概念和构建流程
用户画像最早由“交互设计之父”阿兰·库珀(Alan Cooper)在1998年提出,它是通过分析数据建立的用户模型,是分析用户真实需求、开展后续服务的有效工具。用户画像是大数据的产物,用于分析用户的社会属性、兴趣爱好、行为特征等,进而得出用户的真实喜好、行为等;还可以动态收集、分析用户的变化行为,实时、精准描述和预测用户需求。库珀将用户画像应用于计算机领域,用于分析用户需求,改善产品性能。之后其他学者也对用户画像理论和实践内容进行了丰富。
用户画像最早采用统计学的方式对用户进行描述。随着大数据的发展,可以通过采集各个系统、平台上的数据预测用户的需求,以可视化方式展现用户画像。用户画像构建流程有4个步骤,即数据采集、数据处理、标签提取、构建用户画像。
数据采集是用户画像构建的基础,直接影响用户画像的真实性和完整性。为了得到精准的用户画像,需要提供的用户数据多样、准确、全面。构建的用户画像不同,采集的侧重点也不一样。数据处理是构建用户画像的重要环节,目的在于挖掘数据的隐藏价值。完成用户数据采集后,需要对其进行分类,并采取一定的数据处理方式提取用户特征。数据处理过程包括整理、清洗、过滤、挖掘等,其中,数据挖掘是重点工作,常用算法包括聚类算法、关联算法、分类算法、神经网络等。标签提取是对数据进行整理、聚类、关联分析、文本分析等操作后,从中提取特征值和关键信息,从而形成标签,得到多维度的用户描述。构建用户画像往往就是用户信息的标签化过程,利用大数据技术分析用户行为、偏好等,做到精准分析和预测,为后续开展个性化和精准服务提供重要的数据支持。
基于用户画像的高校学生网络安全素养提升模型
随着高校对学生网络安全素养的要求不断提高,高校应该以学生为中心,通过分析和挖掘学生画像数据,利用各类算法模型进行匹配关联,构建学生网络安全素养提升模型,如图1所示。模型分为4个步骤,通过采集学生数据,经过数据标签化过程,完成用户画像构建,然后运用合适的模型算法,向用户提供智能化服务。
图1 基于用户画像的高校学生网络安全素养提升模型
数据采集
高校网络安全教育的主体是学生,根据学生的用户属性和行为方式,将用户数据分为3个方面:基础数据、学习数据、行为数据,如表1所示。采集的数据越详细,用户画像越清晰,后期数据分析越准确。
表1 高校网络安全素养提升用户画像数据
基础数据主要是对学生个人信息的描述,如姓名、性别、年龄、专业、生源等,这些数据主要来源于学工系统,同时也可以根据实际情况增加需要的项目。
学习数据主要描述学生在学习过程中的行为和偏好,主要包括学生参加的网络安全方面的课程、实践课程、工作坊、讲座、知识竞赛、图书借阅等。学习数据主要来源于教务系统、工作坊系统、学生社区活动系统、图书馆系统等。
行为数据主要包括学生的安全上网行为数据、门禁出入数据、消费数据等。安全上网行为数据用于描述学生的上网习惯和特征,重点记录学生学习网络安全方面的行为数据,包括浏览、下载、搜索相关内容、文献、书籍等,以及不良的上网行为数据,包括访问黄赌毒等不良网站、刷单行为、挖矿行为、点击钓鱼邮件、泄露个人信息行为等。数据可以通过学校网络安全设备、上网行为管理设备等安全监管设备搜集。门禁出入数据用于描述学生进出学校、寝室的时间、地点等行为轨迹,数据主要来源于门禁系统。消费数据主要是校园卡消费流水数据,数据来源于校园一卡通系统。
数据标签化和用户画像构建
数据标签化是指用户信息的标签化过程,即将用户特征信息映射到标签体系中,包括数据处理和用户标签提取,不同的标签能描述用户的不同视角。用户画像构建则是数据标签化后的产物,是将数据信息处理、挖掘、标签化后,构建多维度、全方位的用户画像。
数据处理过程中,因为数据来源复杂,来自各个业务系统、数据平台等,数据类型多样,有非结构化数据、结构化数据和半结构化数据,所以处理起来比较困难。其中,本文用户的基础数据属于结构化数据,学习数据、行为数据中大部分属于非结构化数据和半结构化数据。
本文从三个维度对学生建立标签体系,分别是学生的基础属性标签、学习属性标签、行为属性标签,如表2所示。基础属性标签是对学生个人信息的描述,标签有姓名、性别、专业等。学习属性标签源于学生所学课程、参加的活动等,反映学生的学习过程及偏好,标签有网络安全相关课程学习时长、课程体系学习程度、参加相关活动次数、相关知识竞赛得分情况、相关图书借阅次数、文献下载数量等。行为属性标签来源于学生浏览网页内容、门禁出入、消费等,反映学生上网行为习惯、活动情况、消费情况等,标签有浏览网络安全相关内容时长、检索关键词数量、下载资料数量、门禁出入异常记录数据、消费流水数据。
表2 高校网络安全素养提升标签体系
完成用户标签提取后,可以通过各类直观的方式展现用户画像。例如,可以利用直方图、雷达图等各类统计图呈现效果,或者借助标签云,结合人物图片和用户标签进行呈现。其中,用户画像越清晰,对应的特征值和标签越多,反之则越少。同时,为了深入研究用户画像的应用,还需要构建群体画像,通过归纳总结形成具有相近信息化素养和能力的用户群体画像。个人画像和群体画像的构建,方便观察和分析个体与群体的特征及发展趋势,为后续用户画像的应用提供基础数据。
智慧服务模型算法
为了更好地为学生提供服务,需要构建相关的智慧服务模型,匹配关联用户画像,并不断完善相关算法。根据用户画像模型,采用多种方式相结合的数据挖掘算法,分析和预测用户的资源需求和行为趋势,然后通过高效的信息化手段,为用户提供有价值的信息资源和服务。
构建用户画像和资源服务之间的智能推荐模型,根据学生的基础信息化素养和社交行为数据构建用户画像,同时对所提供的课程内容、培训服务、图书资料等进行数据分析挖掘,匹配关联两者,从而实现精准的网络安全教育资源推送服务。构建学生个体与群体之间的智能分析模型,根据个体画像和群体画像数据,分析预测学生个体和群体的网络安全素养发展规律,提高网络安全素养,预防网络安全事件的发生。
基于内容推荐算法是常用的推荐算法之一,它匹配用户的喜好和拟推荐内容之间的相似程度,将用户喜欢的资源内容推荐给目标用户,实现精准化服务。深度学习算法是近年来系统领域的研究热点,利用深度神经网络的强大表征能力,提高预测的准确性和效果。
开展智慧服务
1. 为学生推送精准化的网络安全资源和培训服务
学生用户画像的构建,使得学校开展精准化教学成为可能。高校可以根据学生的特点、需求、爱好等,为学生提供精准化的网络安全资源和培训服务。
根据用户画像,利用大数据分析,实现精准化的资源推送。例如,根据学生的专业、年级以及专业课程,为其推送个性化的信息化、网络安全相关资料;根据学生的兴趣爱好,为其推送相关的课程、视频、课件等。
根据用户画像,分析用户的需求变化,制定相关的培训计划,提供精准的服务内容,从而满足用户的需求。例如,非电信专业的学生,平时接触计算机网络较少,可以根据学生生源、专业等特点,提供对应的信息素养培训;针对大一新生,推送个性化的培训、讲座、知识竞赛等,提高新生的网络安全意识;通过大数据分析,统计各个分院的网络安全问题,针对问题较多的学院,制定相应的培训方案,降低安全事件发生概率。
2. 为学生制定个性化的网络安全教育策略
利用学生用户画像开展教学活动,提高学生网络安全防范意识和能力,构建一个以提升学生网络安全素养为目标的教学模式。在日常教学过程和实践活动中,加入学生画像,根据学生学习数据、活动数据、互动数据、行为数据等,分析学生的信息化能力和网络安全意识,推送相关专业课程学习资料,把提升学生网络安全素养嵌入课堂中。同时也可以根据学生能力范围、兴趣爱好等,把学生分为不同的小组,开展不同类型的教学活动、教学评估,实现个性化教学方式。
为丰富用户画像内容,可以将信息素养教学融入学校的第二课堂活动、实践项目、工作坊等,涵盖学生的整个学习生涯。分析用户画像与群体画像内容,为学生提供针对性、渐进式的培训和咨询,弥补学生的不足之处,锻炼学生的实践能力和学习能力。
3. 辅助管理层制定科学的决策
大数据画像技术不仅在学生教学的精准化、个性化方面发挥重要作用,对于管理层而言,还起到辅助科学决策的作用。学校的领导者通过数据分析和挖掘学生画像,可以知道每个分院学生对信息化素养和网络安全的了解程度,从顶层设计出发,制定相应的人才培养方案和课程设计。信息化工作者通过分析个体画像和群体画像,从网络安全角度出发,制定相应的防护措施和策略,增添防火墙、审计设备、监管设备等,制定细化的黑白名单策略,重点关注网络安全意识不足的分院和对象,降低网络安全风险。分院学工老师通过对学生数据长期、持续追踪和分析,动态调整网络安全教育策略,同时重视学生反馈,做好反馈机制,针对性地为学生提供更具有价值、更贴近学生需求的教育服务,提高学生体验感。
4. 动态预测趋势,开展针对性措施
利用用户画像还能动态预测用户个体和群体的发展规律。通过分析用户画像和动态数据,可以检测追踪学生群体的变化规律和群体性特征,依据学生群体的变化特征,动态调整相应的教学方案和计划,保障教学质量,提高教学效率。
同时,大数据画像技术还可以用于预测趋势,对于有潜在网络安全风险的个体或群体,及时做出针对性干预,给出个性化的防范建议和服务推送。例如,对于非工科类专业学生,积极推送个性化的学习资源和培训服务,防患于未然;对学生上网行为数据进行实时追踪和分析,发现学生访问不良网站时,及时采取相应的措施,如弹窗警告、短信通知等,纠正学生的错误行为;对一卡通、微信、支付宝等消费交易数据进行分析和追踪,重点关注大额消费和突发性消费。
结束语
信息化的飞速发展对大学生网络安全教育提出更高的要求。加强大学生的网络安全教育,既是培养新时代高素质人才的需求,也是稳定校园环境、保障学生安全的需求。在大数据时代,传统的网络安全教育模式亟待改变,大数据画像技术在高校网络安全教育的应用打破了传统的教育模式,利用大数据平台对用户数据进行充分挖掘,教育过程从“经验型”模式向“数据支持型”模式转变,使得决策更加科学和有效。利用大数据画像技术,能在海量的信息中挖掘出潜在的价值,即学生的个体和群体特征,为学生提供精准的个性化推送,制定专门的教学方式,为个性化教学提供基础保障。利用大数据画像能够提高教学效率,实现数字化教育新模式。
基金项目:宁波职业技术学院2024年度课题《大数据时代高职院校网络安全教育的路径研究》(编号:NZ24081Q)
来源:《中国教育网络》2024年8月刊
作者:吴震(宁波职业技术学院信息资源中心)
责编:余秀