你知道“验证码”是怎么来的吗?

 阅读量 | 时间:2015年01月18日 00:00

每天都有那么多人没日没夜的在上网、玩游戏,能不能把这些能量收集起来为人所用?

可以,而且已经被利用了。

不过不是机械能。这个问题让我想起聪明的 Luis von Ahn 和他的reCAPTCHA。我觉得这个题主的想法很好啊,就像@浦海回答的,大多数人都把焦点集中在发电上了,题目主要是问这个过程中的能量能不能被利用,广义的能量我想也可以包括人类的精力和智力,从这个侧面来说就是个众包(crowdsourcing)的问题。

很多人已经知道神人Luis von Ahn和reCAPTCHA了,我再啰嗦讲一下。Luis von Ahn是CMU教授,2000左右和别人提出了CAPTCHA,就是万恶的验证码。现在看来也许验证码是个显而易见的点子,但是从历史上看,它绝对是个判断正在输入的是人类还是机器的简单高效方法。再后来,这个教授就想了,每天这么多人都在识别输入一串字符,能不能利用它呢?于是后来他就又搞出了reCAPTCHA。

如果我们想电子化一些从前的文档,比如19世纪的纽约时报,我们要不得依靠人力,手动地一个一个字地输入电脑,要不然就直接扫描,然后用软件识别。但是软件识别的准确率不能保证,尤其是扫描或者文档本身质量很差的时候,比如:

 

你知道“验证码”是怎么来的吗? IT业界 第1张

 

reCAPTCHA做的,简单来说就是把上图的单词切割抽取出来,然后与一组自动生成的字符混合,生成验证码,发送到各各网站上,像这样:

 

你知道“验证码”是怎么来的吗? IT业界 第2张

 

reCAPTCHA默认如果电脑产生的字符你输入正确,那么从文档中抽取的字符你的输入也将是正确的,然后通过交叉验证,重复验证,各种算法保证准确率。于是坐在电脑前上网的我们,每次输入验证码的时候,就可能顺便为某个图书馆的文档录入做出了贡献。

一个经常被提到的实例就是,借助广大网民之手,纽约时报从1851年到现在的所有报纸,总共超过1千3百万篇文章都已经成功录入计算机。如果依靠手工输入,人力,资金,时间都将是巨大的,然而借助reCAPTCHA,以及每天上网的我们,这项工作短时间内已经完成了。

09年reCAPTCHA被谷歌收购了,大家可能也都注意到了,谷歌更进一步利用验证码来帮助它们识别门牌号,路牌等等,用来修正谷歌地图的精度。这样谷歌地图的准确度,以及用户的体验都得到了提升。

 

你知道“验证码”是怎么来的吗? IT业界 第3张

 

Luis von Ahn真是很有想法的人,后来他又创办了很火的Duolingo,帮助大家学外语。

顶: 0踩: 0

来源:(QQ/微信:13340454),转载请注明出处!

本文地址: