在信息爆炸时代,在互联网上除了拥有许多有效信息外,还充斥着许多垃圾信息,这给人们在享受网上冲浪乐趣的同时带来很大的困扰。防御和检测垃圾信息已成为当前互联网技术中的一个重要课题。
垃圾邮件伪装术
垃圾邮件现在还没有一个非常严格的定义,一般说来,凡是未经用户许可就强行发送到用户邮箱中的任何电子邮件都可称作是垃圾邮件。垃圾邮件包含的内容种类繁多,包括赚钱信息、成人广告、商业或个人网站广告、电子杂志、连环信等。
对信息进行伪装后发送是目前垃圾制造者经常甚至必须采取的手段。随着反垃圾信息技术的提高,制作者的伪装手段也日益复杂,目前已经从简单的在垃圾信息中加入随机词、对URL伪装等方式演变为使用文字变形,甚至将垃圾信息放入图片等复杂手段。垃圾邮件制造者通过多种方法对发送的信息进行伪装,主要的方法有:变形文字、噪声文字和图片垃圾。
变形文字
目前,这种方法被垃圾制造者普遍采用,其原理是采用误拼写或使用替代字符的方法将垃圾信息进行变形,以达到改变信息校验和、干扰基于内容过滤器对词条特征提取的目的。
噪声文字
在垃圾邮件中加入噪声文字以躲避过滤器的检查也是垃圾信息制造者经常采用的手法。该方法经常用于攻击基于统计学习方法的过滤器,如贝叶斯、支持向量机、最大熵过滤器等。根据所加入的噪声词的类型,这种方法可以进一步分为:随机文字攻击和好词攻击。
图片垃圾(Image Spam)
图片垃圾是将邮件的文本信息放在GIF或JPEG图片中,对垃圾邮件进行伪装。图片垃圾可使垃圾邮件避开基于内容的垃圾邮件过滤器的检测。
通常,图片垃圾中包含一些用来迷惑收件人的无意义的计算机自动生成的文字。
除了以上几种主要手段外,目前在电子垃圾邮件中还经常使用HTML 编码、JavaScript程序、主题欺骗等手段。
检测及过滤垃圾邮件之法
目前垃圾邮件占发送邮件的比例已经从1998年的10%上升到现在的92.3%。从垃圾邮件的发展历史以及上文的分析来看,垃圾邮件具有内容多样化以及技术复杂化的趋势。垃圾邮件与反垃圾邮件一直是一场博弈。为对抗垃圾邮件,国内外研究人员提出许多检测和过滤垃圾邮件的技术。
法律法规
目前,大多数国家政府针对垃圾邮件有相应的立法,并采取多种法律手段来反击垃圾邮件。但是对于大量的垃圾邮件,法律的作用是微乎其微的,甚至由于只要遵守一定的规则,就可以大量发送广告邮件——法律在一定程度上促进垃圾邮件的发展。
协议的改进
协议的改进是指通过改变发送邮件的方式来过滤邮件,如:需要发送者的认证;按邮件发送量的大小收取费用;通过验证邮件是否来自合法区域及是否带有正确的密码来识别合法邮件。这些协议大多提供较完整的解决方案,却往往因为需要对现有的邮件协议进行升级或替换,应用部署受到限制,很难在电子邮件用户中推广。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。