北京石油附中 殷逐云
二維條碼的新用途
北京石油附中 殷逐云
信息需要輸入計(jì)算機(jī)才能進(jìn)行后續(xù)處理?,F(xiàn)在,手寫筆跡只有通過照相機(jī)、掃描儀來輸入。但裝訂好的筆記本、試卷很難拍照掃描,文字識(shí)別率也很低。將二維條碼印刷在紙上,在筆式攝像機(jī)上安裝筆芯。手持?jǐn)z像機(jī)書寫,書寫過程中攝像機(jī)將二維條碼拍照下來,并通過USB/藍(lán)牙/WIFI傳入計(jì)算機(jī)。計(jì)算機(jī)識(shí)別二維條碼就可以得到攝像機(jī)的位置,從而得到筆跡的電子坐標(biāo)。
二維條碼;筆式攝像機(jī);手寫筆跡
教育大數(shù)據(jù)正在迅猛發(fā)展,這是因?yàn)榻逃鎸?duì)的是一個(gè)個(gè)學(xué)生,因此,教學(xué)必須做到以人為本,多方面、多維度來跟蹤和研究每一位學(xué)生的學(xué)習(xí)行為數(shù)據(jù),從而找到各自的問題,并予以針對(duì)性的解決。
現(xiàn)在城市里的學(xué)校,每個(gè)教室都有計(jì)算機(jī)、投影儀,基本上每位老師、學(xué)生都有計(jì)算機(jī),查詢資料、講課都沒有問題,但是每天都會(huì)大量書寫,比如試卷、筆記,這些信息是大數(shù)據(jù)的最重要部分,卻很難方便地輸入計(jì)算機(jī)。目前是通過照相機(jī)、掃描儀來輸入。這導(dǎo)致3個(gè)問題,1是很多卷子是裝訂好的,掃描困難繁瑣,而且中間變形厲害,圖像變形甚至缺失。2是試卷、筆記都是有順序的,掃描拍照后是獨(dú)立的jpg圖片,必須將圖片和實(shí)物一一對(duì)應(yīng),很繁瑣。3是計(jì)算機(jī)收到的是圖片,筆劃丟失潦草、皺褶、臟點(diǎn)會(huì)使得OCR識(shí)別率很低,而很多情況下文本是需要的。依靠人工當(dāng)然可以處理這3個(gè)問題,但由于試卷、筆記太多,老師、學(xué)生又有很多其它事情,很難做到。最終就是學(xué)生手上有大堆試卷和筆記本,每次查找都很費(fèi)事,丟失也十分常見,老師對(duì)每個(gè)學(xué)生的信息掌握不全,大數(shù)據(jù)分析也就十分困難。
上述問題的核心在于手寫筆跡如何電子化,這可以利用二維條碼和筆式攝像機(jī)來解決。
二維條碼是按照一定的數(shù)學(xué)公式將各種元素,如點(diǎn)、短線、長(zhǎng)線、折角等形狀組合后產(chǎn)生的圖像,在橫向和縱向同時(shí)表達(dá)信息,能在很小的面積內(nèi)表達(dá)大量的信息,已在各行各業(yè)廣泛使用,如微信、支付寶等等。
二維條碼必須通過攝像機(jī)拍攝后才能解析其信息。目前的筆式攝像機(jī)很多,價(jià)格也很低,稍加改造就可以用于手寫筆跡的采集:將筆芯嵌入攝像機(jī),以便書寫時(shí)留下油墨筆跡;改變形狀,以方便握持;筆芯尾部增加壓力傳感器,書寫時(shí)產(chǎn)生的壓力可以啟動(dòng)攝像機(jī)。
首先將一個(gè)個(gè)不同的二維條碼印滿整個(gè)紙面,保證攝像機(jī)運(yùn)動(dòng)到任何地方都至少可以拍到一個(gè)條碼。
由于紙面上還有原有信息,不能被二維條碼遮擋。一種解決方法是選擇占用面積十分微小的二維條碼,布置在紙面的空白處,優(yōu)點(diǎn)是使用常規(guī)油墨,缺點(diǎn)是如果空白處太小,二維條碼還是會(huì)放不下,所以要預(yù)先分析紙面內(nèi)容的分布。由于攝像機(jī)拍攝面積很大,并且紙面內(nèi)容通常不會(huì)太密,所以二維條碼通常還是可以放下的。
另外一種方法是利用紅外隱形油墨來印刷條碼。人眼只能看到360-720nm波段的光線,這種油墨在可見光范圍內(nèi)是無色的,肉眼不可見,但在紅外波段如850nm則是黑色的。普通油墨在可見光范圍內(nèi)是有色的,在紅外波段是看不見的。目前的攝像機(jī)都可以拍到紅外光,紅外隱形油墨價(jià)格也很低,這樣就完美解決了條碼和紙面內(nèi)容的沖突。
攝像機(jī)拍到圖像后,可以先存儲(chǔ)在筆內(nèi),或者實(shí)時(shí)通過USB/藍(lán)牙/WIFI發(fā)送到計(jì)算機(jī)上,這些技術(shù)已十分成熟。
計(jì)算機(jī)收到圖像后,根據(jù)條碼產(chǎn)生公式,對(duì)圖像進(jìn)行逆運(yùn)算,解析出條碼信息。攝像機(jī)連續(xù)攝像,每張圖片都會(huì)解析出一個(gè)條碼,由于每個(gè)條碼的印刷位置是已知的,將各個(gè)位置連起來,就恢復(fù)了筆跡。二維條碼信息量很大,除了包括位置,也包括了頁(yè)碼,計(jì)算機(jī)可以根據(jù)頁(yè)碼,將本頁(yè)的原有內(nèi)容以圖片方式顯示出來,然后再將筆跡顯示在其上面,這樣用戶在計(jì)算機(jī)上既看到了紙面原有內(nèi)容,也看到了筆跡,和實(shí)際紙面完全一致。
由于紙面上本來就要印刷內(nèi)容,多印刷些條碼也不增加成本。
這種解決方案優(yōu)點(diǎn)很多。首先是價(jià)格很低。其次是無需培訓(xùn):使用者書寫時(shí),筆尖接觸紙面就會(huì)自動(dòng)開啟攝像機(jī),沒有任何額外的操作。再次,攝像機(jī)只要拍攝到一個(gè)條碼,計(jì)算機(jī)就可以計(jì)算出筆尖位置,所以即使紙張上有皺褶、臟點(diǎn),對(duì)計(jì)算的影響也很小。最后一點(diǎn)是本頁(yè)的原有內(nèi)容圖片是用word/ PDF等生成的,和實(shí)際紙面情況無關(guān),所以非常清晰干凈,紙張上的皺褶、臟點(diǎn)都不會(huì)顯示出來。
計(jì)算機(jī)還可以對(duì)筆跡進(jìn)行ICR(智能筆跡識(shí)別)識(shí)別,得到文本文件。攝像機(jī)內(nèi)部是有時(shí)鐘的,所以每個(gè)圖片都有時(shí)間,計(jì)算機(jī)也就知道了每個(gè)筆劃的書寫時(shí)刻。常見的OCR識(shí)別(光學(xué)字符識(shí)別),比如對(duì)書本、車牌拍照掃描后的圖像的識(shí)別,由于文字是標(biāo)準(zhǔn)體,所以識(shí)別率很高,接近100%,但對(duì)手寫筆跡就不行了,因?yàn)槭謱懝P跡通常很亂,連筆、丟筆劃的情況也很多。ICR則將字符的筆劃順序也考慮進(jìn)去,大大提高了識(shí)別準(zhǔn)確率。
這個(gè)產(chǎn)品一旦上市,在學(xué)習(xí)中會(huì)有很多用途。
首先是筆記本,學(xué)生可以將所有筆記都存儲(chǔ)到計(jì)算機(jī),還可以進(jìn)行ICR識(shí)別。由于變?yōu)榱擞?jì)算機(jī)文件,大家可以方便的交流。老師、家長(zhǎng)也可以隨時(shí)了解學(xué)生的情況。
其次通過藍(lán)牙/WIFI,可以隨時(shí)將筆跡數(shù)據(jù)傳到教室的計(jì)算機(jī),學(xué)生不用起身,在座位上就可以回答問題,其筆跡可以通過投影儀顯示出來。由于藍(lán)牙和WIFI都支持多個(gè)終端,所以可以多個(gè)學(xué)生同時(shí)回答,大大節(jié)省了課堂時(shí)間。
試卷也被收集進(jìn)入計(jì)算機(jī),老師、家長(zhǎng)可以對(duì)學(xué)生的多個(gè)試卷進(jìn)行分析。
由于知道筆跡的時(shí)間,老師可以輕松地知道每個(gè)學(xué)生在各個(gè)題目所花的時(shí)間,從而知道學(xué)生的難點(diǎn),進(jìn)行針對(duì)性的指導(dǎo),還可以對(duì)試卷進(jìn)行進(jìn)一步的改進(jìn)。在外國(guó)人、小學(xué)生學(xué)習(xí)寫字時(shí),可以方便地知道其筆劃順序是否正確,避免倒插筆。
老師在課堂上用word/PPT講解,經(jīng)常會(huì)加入新的內(nèi)容。黑板上書寫的內(nèi)容擦掉就全沒了??梢詫ord/PPT和條碼一起打印出來,課堂上用本產(chǎn)品在紙面上書寫,所寫內(nèi)容通過藍(lán)牙/WIFI傳入計(jì)算機(jī),和原有word/PPT文件合在一起,并實(shí)時(shí)投影。
總之,由于手寫筆跡可以方便地電子化,且每個(gè)筆劃的時(shí)間都準(zhǔn)確地獲得,就解決了很多問題。
如果攝像機(jī)再加上錄音功能,還可以在書寫時(shí)同步錄音。由于筆劃含有時(shí)間,錄音文件也含有時(shí)間,使用者在計(jì)算機(jī)上選中某個(gè)筆劃,就可以方便的找到其對(duì)應(yīng)的錄音。
附圖1