对于互联网用户来说,目前在注册BBS论坛、电子邮件甚至是发送大量即时通讯信息的时候,服务器通常会要求他们在发送网络请求前首先输入图片中显示出的一组扭曲的字母或数字。
然而,这一我们现在看起来已经习以为常的验证机制在十几年前曾困扰着诸多互联网服务提供商。而且,许多人不知道的是,这一问题最初是由一名年仅22岁的研究生成功解决的。
下面,就让我们回顾一下当时这名年仅22岁的研究生是如何成为全球垃圾电子邮件终结者的故事。
验证码之父
在刚刚开始自己的研究生生涯仅仅几周后,年仅22岁的路易斯-范-安(Luis von Ahn)便帮助解决了一个困扰了互联网多年的问题。
在2000年的时候,免费电子邮件服务迎来了自己的又一个春天,但与此同时,垃圾邮件的发展速度也十分迅速。这些垃圾邮件发起者会自动创建无数个邮箱帐户,然后利用这些帐户群发垃圾邮件。如果这些账户遭到服务器封停的话,他们也仅仅需要再创建一个新帐号即可。
除此之外,当时许多销售音乐会和体育赛事门票的网站也同样是垃圾邮件的受害者,部分垃圾邮件账户会大批量预定音乐会和体育赛事的门票,然后仅仅从中选出一些位置极佳的座位进行购买,再通过转卖获取暴利。
显而易见的是,当时的网站亟需找到一种可以准确分辨正常用户和机器人僵尸账户的有效方法。
当时,刚刚进入匹茨堡卡内基梅隆大学(Carnegie Mellon University)求学的路易斯和他的导师马努-埃尔布卢姆(Manuel Blum)就想出了一个解决方法。他们的方法首先需要满足两个必要条件:那就是它必须提供一种常人用户容易通过,但电脑却无法通过的测试机制。而且,电脑还需要能够准确判断用户的回答是否正确。
据悉,路易斯和埃尔布卢姆最初希望向网络用户显示一张诸如猫或者过山车的图片,然后让他们回答图片中物体的名称。如果回答正确,电脑则判定对方是正常用户,并接受他们接入电邮服务、订票网站的请求。
不过,这样的方法同样带来了一些问题,那就是有时正常人也不能很好的辨认出图片中的物体。
因此,路易斯和埃尔布卢姆随后又提出了另一种方法,那就是在图片中显示一组经过扭曲的字母,然后要求用户将正确的字母输入到回答框中。实践证明,这一种方法相比前者要可靠许多,并在后来被正式称作“全自动区分计算机和人类的图灵测试”(Completely Automated Public Turing test to tell Computers and Humans Apart)。不久后,包括雅虎和其他一些电邮件服务商纷纷采用了由路易斯和埃尔布卢姆的设计这一验证机制,且有效遏制了当时垃圾邮件的发展势头。
在此之后,路易斯继续自己的求学之路,并获得了博士学位。在此期间,他还接到了来自比尔-盖茨(Bill Gates)的电话,盖茨希望邀请路易斯前往微软工作,但后者却婉言谢绝。
大放异彩
大学毕业后,路易斯开发了一系列基于互联网的系统,其中包括一个可以将任务分成很多小任务分给多人共同完成的模式,而这一理念也就成为了现代“众包”和“游戏化”概念的前身。
2006年底,路易斯开始了自己在卡内基梅隆大学的执教生涯,当时他接到了来自麦克阿瑟基金会(MacArthur Foundation)一个通知他获得了“天才”奖以及50万美元奖金的电话。同期,他在经过计算后发现,虽然自己所发明的验证码安全机制大幅改善了互联网安全性,但由于识别和输入每条验证码大约需要花费10秒钟的时间,而全球网民每天识别和输入验证码的次数多达2亿多次,这就意味着该机制已经浪费了全球网民的大量时间。
那么,为什么不能找到一种利用广大网民时间更有效的方法呢?
在路易斯一次在华盛顿地区开车回家的路上,他突然想到“我们为什么不向用户显示由自动文件数字系统扫描出的印刷文本图片呢?”因为电脑同样无法识别这些图片的内容,但人类却可以轻易识别。而且在使用这种方法后,进行安全验证的网民实际上也在不知不觉中参与了老旧书报的数字化工作中,路易斯将自己创造的这一机制称为“reCAPTCHA”。
随后,《纽约时报》开始利用这一技术启动了自己的旧刊数字化工作,路易斯则利用该技术创办了一家独立公司,而该公司在2009年被谷歌收购,并在随后被应用于谷歌的图书数字化项目。
虽然只有30多岁,但路易斯已经为计算机科学和人工智能领域作出了巨大贡献。有分析人士认为,路易斯成功利用了计算机和人类的能力携手解决了一些他们无法凭借各自力量完成的任务。简单来说,路易斯的想法就是从一些业已发生的事情中找到所蕴含深层机制,并试图找到更好的解决方法。
对此,路易斯表示:“我的工作就是发掘互联网在减少协同工作和交易成本方面的巨大潜力,并使数百万人可以更加高效的工作。”
据路易斯自己预计,现在已经有超过10亿人参与到了老旧书籍和报刊的数字化工作中。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。