差評(píng)君
這些年來(lái),驗(yàn)證碼的形式越來(lái)越豐富,不少網(wǎng)友“吐槽”,沒(méi)有足夠的知識(shí)儲(chǔ)備,連驗(yàn)證碼都看不懂了。不知你有沒(méi)有想過(guò),這種明顯讓用戶體驗(yàn)不佳的東西,存在的意義到底是什么?
其實(shí),驗(yàn)證碼的用處可以用簡(jiǎn)單的一句話來(lái)解釋清楚:區(qū)分計(jì)算機(jī)和真正的人。
2000年年初,互聯(lián)網(wǎng)的浪潮剛剛在全世界掀起,當(dāng)時(shí)最讓用戶苦惱的一件事就是垃圾郵件太多。甚至有一些家伙還特意設(shè)計(jì)了程序,可以終日無(wú)休止地大量注冊(cè)新郵箱賬號(hào),用來(lái)發(fā)送垃圾推廣郵件。一位名叫路易斯的天才程序員就想到了法子,他發(fā)現(xiàn)計(jì)算機(jī)程序很難認(rèn)清手寫(xiě)的文本,而人類(lèi)可以輕松看懂。所以,可以在注冊(cè)賬號(hào)的時(shí)候設(shè)一道門(mén)檻——必須輸入“歪曲”的文本才能完成注冊(cè),用來(lái)識(shí)別計(jì)算機(jī)和真人。驗(yàn)證碼由此而生,無(wú)數(shù)的黃牛、垃圾郵件、爬蟲(chóng)程序就這樣被驗(yàn)證碼擋在了門(mén)檻外面。
有網(wǎng)友計(jì)算過(guò),全世界的網(wǎng)民每天要輸入近2億次驗(yàn)證碼,每次輸入按花費(fèi)10秒計(jì)算,人類(lèi)每天花在驗(yàn)證碼上的時(shí)間已經(jīng)超過(guò)55萬(wàn)小時(shí)。
或許有人會(huì)說(shuō):“浪費(fèi)時(shí)間就是浪費(fèi)生命!驗(yàn)證碼浪費(fèi)了人類(lèi)大量的生命!”不過(guò)說(shuō)起來(lái)你可能不信,實(shí)際上輸入驗(yàn)證碼的時(shí)間并沒(méi)有全被浪費(fèi)。每一次輸入驗(yàn)證碼,你都可能在為人類(lèi)的文化事業(yè)或者為人工智能貢獻(xiàn)一分力量。
還是那個(gè)發(fā)明了驗(yàn)證碼的天才路易斯,他發(fā)現(xiàn)許多公益組織在把舊書(shū)掃描成電子版,對(duì)計(jì)算機(jī)來(lái)說(shuō),那些斑駁的文字太難識(shí)別了。他想,書(shū)籍的內(nèi)容大部分是文本,驗(yàn)證碼也是文本,把掃描版的書(shū)籍文本對(duì)接到驗(yàn)證碼上,讓用戶來(lái)識(shí)別不就行了?于是,一個(gè)叫作reCAPTCHA的新式驗(yàn)證碼系統(tǒng)誕生了。
reCAPTCHA會(huì)提供兩個(gè)單詞讓用戶識(shí)別。這兩個(gè)單詞都是書(shū)籍掃描版的一部分。計(jì)算機(jī)其實(shí)已經(jīng)知道第一個(gè)單詞是啥了,不過(guò)第二個(gè)單詞計(jì)算機(jī)暫時(shí)還沒(méi)能力認(rèn)出來(lái)。面對(duì)第二個(gè)單詞,一旦有10個(gè)人輸入了同樣的答案,那么這個(gè)答案就會(huì)被當(dāng)作正確答案??窟@種方法,reCAPTCHA每年能讓230多萬(wàn)本舊書(shū)轉(zhuǎn)化為電子版。
除此之外,你輸入的驗(yàn)證碼,還可能成為人工智能訓(xùn)練的養(yǎng)料。有一類(lèi)街景驗(yàn)證碼,是讓人們選小轎車(chē)、路牌或者自行車(chē)等圖片。在費(fèi)眼又費(fèi)腦地輸入它們的時(shí)候,你其實(shí)在為谷歌的人工智能免費(fèi)打工。因?yàn)檫@些圖片大都來(lái)自谷歌街景,其中的一部分圖片是AI(人工智能)已經(jīng)識(shí)別出來(lái)的,用來(lái)識(shí)別你是否為真人,另外還會(huì)夾雜著幾張AI難以識(shí)別的街景,需要借助于你的勞動(dòng)力。而這些數(shù)據(jù),最后都會(huì)被用于培訓(xùn)人工智能。在各位的“辛勤喂養(yǎng)”之下,運(yùn)用了谷歌AI技術(shù)的無(wú)人駕駛汽車(chē)Waymo,已經(jīng)在自動(dòng)駕駛領(lǐng)域處于遙遙領(lǐng)先的地位。
如今,收購(gòu)了reCAPTCHA的谷歌已經(jīng)把大部分驗(yàn)證碼升級(jí)成了reCAPTCHA v3。用戶只要點(diǎn)擊一下“我不是機(jī)器人”的按鈕,就能輕松通過(guò)驗(yàn)證。但即便如此,驗(yàn)證碼還是能從你身上吸點(diǎn)油水。因?yàn)樵谀泓c(diǎn)擊按鈕的同時(shí),谷歌會(huì)監(jiān)控你的行為。鼠標(biāo)的運(yùn)動(dòng)軌跡,甚至你打開(kāi)的網(wǎng)頁(yè)都可能被收集,這些數(shù)據(jù)會(huì)被用來(lái)判斷你是否為真人,并且?guī)椭?yàn)證碼系統(tǒng)進(jìn)化。目前國(guó)外有超過(guò)65萬(wàn)個(gè)網(wǎng)站用reCAPTCHA v3,每點(diǎn)擊一次驗(yàn)證按鈕,就等于打卡告訴谷歌你來(lái)過(guò)這兒,谷歌就會(huì)根據(jù)你去過(guò)的網(wǎng)站來(lái)給你推送定制的廣告。
隨著OCR(光學(xué)字符識(shí)別)技術(shù)和AI的發(fā)展,驗(yàn)證碼也在不斷被破解,過(guò)去簡(jiǎn)單扭曲一下的字母,已擋不住現(xiàn)在的程序了。但無(wú)論驗(yàn)證碼怎么進(jìn)化,只要你是真真切切的人,驗(yàn)證碼這一關(guān)都不可能真正擋住你。就像reCAPTCHA一直所倡導(dǎo)的那樣:Tough on bots,easy on humans(對(duì)機(jī)器人困難,對(duì)人類(lèi)簡(jiǎn)單)。
(李金鋒摘自微信公眾號(hào)“差評(píng)”,視覺(jué)中國(guó)供圖)