姚秦川
當(dāng)年,美國《紐約時報》為了便于報紙以后的管理,方便讀者查閱,決定將那些已經(jīng)出版并保存了幾十年的舊報紙全部電子化。不過,這項工作到底該如何操作,卻讓工作人員頗感頭疼。
最簡單可行的辦法就是掃描那些舊報紙,進(jìn)行光學(xué)字符識別。不過,因為那些舊報紙有油墨的痕跡和折疊的印記,并且顏色發(fā)黃變暗,再加上幾十年前的字體與現(xiàn)在的字體有很大的區(qū)別,所以辨識起來極為費(fèi)勁。除此之外,更令人擔(dān)心的是,由于那些報紙保存的時間久遠(yuǎn),紙張變得非常脆弱,稍有不甚,就會損壞整張報紙。當(dāng)時,《紐約時報》的工作人員就關(guān)于要不要用掃描的辦法來完成這項工作進(jìn)行了多次會議,會議上大家各執(zhí)一詞,沒有一個統(tǒng)一的結(jié)果。最終,報社高層領(lǐng)導(dǎo)決定,基于保護(hù)報紙的考慮,他們不打算采用掃描的辦法,同時為了盡快找到簡單可行的辦法,報社在報紙上刊登了啟事,希望廣大市民能獻(xiàn)計獻(xiàn)策,解決這個棘手的問題。
啟事發(fā)出去后,很快便有市民來到報社,說他想到了一個主意,不過是一種笨辦法,那就是報社派出專門的打字員,逐字逐句地重新敲打報紙上的內(nèi)容。然后,報社安排專職人員進(jìn)行校對。這個辦法雖然行得通,但實際操作起來并不容易,不僅進(jìn)展速度非常緩慢,而且效果也不理想。最終,這個辦法被報社否定了,但他們還是對這位市民給予了獎勵——免費(fèi)贈閱半年的《紐約時報》。時間一天天過去,就在報社領(lǐng)導(dǎo)都對解決這個問題失去信心時,卡內(nèi)基梅隆大學(xué)的博士生路易斯·馮·安得知了此事,他打電話給報社,主動將此難題包攬了過來。
路易斯之所以敢接手這件棘手的事情,是因為在兩年前,他發(fā)明了一件新鮮的事物——驗證碼,這是區(qū)分當(dāng)下程序使用者是計算機(jī)還是人的公共全自動程序。同時,該程序還具有可防止惡意破解密碼、刷票等功能。最值得贊賞的是,它操作簡單,一個人就可以完成復(fù)雜的工作。在路易斯將自己發(fā)明的驗證碼推向市場后,立即在全世界廣受歡迎,同時它也被應(yīng)用到了各行各業(yè)。
《紐約時報》的領(lǐng)導(dǎo)商量后,決定將此任務(wù)交給路易斯完成。路易斯在接手了這個艱巨的任務(wù)后想到,全世界每天都有幾億個驗證碼在被校驗,如果把《紐約時報》的文章切成小片,再把它們當(dāng)作驗證碼發(fā)給全世界的人,這些人在使用驗證碼的時候,不知不覺中就幫助報紙完成了輸入和校對。
不僅如此,對于那些難以識別的字符,系統(tǒng)可以發(fā)給多個校驗者,當(dāng)幾個人傳回的數(shù)據(jù)一致時,就說明識別的結(jié)果是正確的。然后,再將它們返回系統(tǒng)重新整合,一切便萬事大吉。最終,路易斯利用這個簡單又便利的辦法,將《紐約時報》幾十年的報紙全部實現(xiàn)了電子化,解決了困擾《紐約時報》多時的難題。他也因為此事,被當(dāng)年的《紐約時報》授予“年度創(chuàng)新人物獎”。
(徐珍摘自《知識窗》)