劉貫偉,張?jiān)品?,安增花,武艷紅
(恒銀金融科技股份有限公司 天津300281)
目前各大廠商的現(xiàn)金自助設(shè)備已經(jīng)具備較高的鈔票處理速度,現(xiàn)金存取款一體機(jī)達(dá)到 8張/s以上,清分機(jī)可以達(dá)到 15張/s以上,每張鈔票的識(shí)別時(shí)間只有幾十毫秒,需要完成鈔票類型識(shí)別、鑒偽識(shí)別、冠字號(hào)識(shí)別(部分幣種需要識(shí)別兩個(gè)冠字號(hào),如2015版 100元人民幣等)、清分信息識(shí)別等,其中鈔票類型的識(shí)別是鑒偽識(shí)別、冠字號(hào)識(shí)別、清分信息識(shí)別的前提和基礎(chǔ)。
每個(gè)國家的鈔票一般有多個(gè)面額,如人民幣具有5個(gè)面額:1元、5元、10元、50元、100元,其中目前流通的還有 1999版、2005版、2015版以及 2019年8月30日發(fā)行的2019版,每張鈔票在現(xiàn)金自助設(shè)備搬送過程有 4個(gè)面向,包括正面正向、正面反向、反面正向、反面反向。
鈔票類型包括國別、面額、版本、面向 4方面信息。在現(xiàn)金自助設(shè)備使用過程中,鈔票識(shí)別模塊識(shí)別1張鈔票所有信息只有幾十毫秒的時(shí)間,而鈔票類型識(shí)別只能占用 20毫秒左右的時(shí)間,在清分機(jī)等高速設(shè)備中甚至要求更短時(shí)間內(nèi)完成識(shí)別,因此快速準(zhǔn)確識(shí)別鈔票類型是現(xiàn)金自助設(shè)備穩(wěn)定運(yùn)行的關(guān)鍵。
針對(duì)單國別(如人民幣)鈔票類型的識(shí)別,目前大多數(shù)采用機(jī)器學(xué)習(xí)技術(shù)[1],而且在識(shí)別時(shí)間和準(zhǔn)確性2方面均取得了很好的效果。但是面對(duì)多國鈔票識(shí)別時(shí),識(shí)別速度和準(zhǔn)確性往往不能兼顧,尤其是在同時(shí)處理 10個(gè)國家以上的鈔票時(shí),總識(shí)別種類將達(dá)到幾百類,識(shí)別時(shí)間和識(shí)別準(zhǔn)確性問題會(huì)更加突出。
文章針對(duì)現(xiàn)金自助設(shè)備鈔票識(shí)別的問題,提出2層識(shí)別機(jī)制,分別采用圖像感知哈希技術(shù),快速完成初級(jí)識(shí)別,篩選出一部分可能的鈔票類型,再在第一層識(shí)別基礎(chǔ)之上利用 MOSSE相關(guān)濾波器做第二層識(shí)別,準(zhǔn)確確定鈔票類型。
圖像感知哈希技術(shù)可以將任意分辨率的圖像數(shù)據(jù)轉(zhuǎn)化為幾十、幾百或幾千個(gè)比特的二值序列,而且滿足魯棒性、安全性等要求,可以用于圖像搜索、圖像版權(quán)認(rèn)證等[2,3]。張維克等利用圖像 DCT(離散余弦變換)低頻系數(shù)的感知不變性得到安全哈希序列索引,具有較好的唯一性、魯棒性和安全性,但是只能抵抗3°以下的旋轉(zhuǎn)[4]。
感知哈希生成框架基本包含 3個(gè)部分:特征提取、量化和編碼,其中特征提取是圖像感知哈希生成的關(guān)鍵[4]。圖像感知哈希算法計(jì)算過程[5]如下:
①縮小圖像:收縮到 32×32的大小,方便計(jì)算DCT(離散余弦變換)。
②由于鈔票圖像一般都是灰度圖像,可以直接使用可見光的灰度圖像。
③計(jì)算 DCT,并去掉高頻信息,保留左上角的8×8區(qū)域的低頻信息。
④計(jì)算縮小 DCT后的所有像素點(diǎn)的平均值,大于平局值記為 1,反之記為0,得到 64位的該圖像的哈希值。
MOSSE濾波方法是在ASEF等方法的基礎(chǔ)上提出來的,和傳統(tǒng)方法相同的是,為獲得相應(yīng)的濾波器,該算法也需要一系列的輸入圖像作為訓(xùn)練樣本。一般輸出圖像指定為具有二維高斯分布形狀,其峰值位于輸入圖像的中心[6]。
由卷積定理可知,空域中的卷積可以利用頻域中矩陣逐元素相乘得到,從而免去空域中麻煩耗時(shí)的卷積運(yùn)算。對(duì)于每個(gè)輸入訓(xùn)練樣本圖像 Fi,由于輸出圖像Gi是提前指定,因此濾波器為[6]:
假設(shè)最終需要的濾波器為 H,MOSSE通過最小化輸出均方和誤差來獲得初始的濾波器,該優(yōu)化問題可以表示如下:
其中*表示對(duì)應(yīng)元素相乘。由于濾波器H的所有元素都是由頻域空間中矩陣對(duì)應(yīng)位置上的元素相乘得到,其每一個(gè)元素(有 w、v標(biāo)識(shí)位置)都可以被獨(dú)立解得。將 Hwv視為獨(dú)立的元素,問題變成如下式所表示形式:
文獻(xiàn)[6]中給出了H的解析解:
文獻(xiàn)[6]同時(shí)給出了具體證明過程,這里不再詳細(xì)敘述,由此得到MOSSE濾波器的初始解。
文章設(shè)計(jì)實(shí)現(xiàn)的多國鈔票幣種信息識(shí)別方法,分為2個(gè)步驟:
①第一層識(shí)別,利用感知哈希算法初級(jí)篩選。
②第二層識(shí)別,利用 MOSSE濾波器進(jìn)行最終確認(rèn)。
圖像感知哈希實(shí)現(xiàn),選取鈔票正面向傳感器產(chǎn)生的可見光圖像的5個(gè)位置區(qū)域,包括鈔票正面4個(gè)角和正中區(qū)域。每個(gè)區(qū)域分別計(jì)算感知哈希指紋,計(jì)算方法前文已有表述。
圖像感知哈希識(shí)別過程,分為 2個(gè)階段:初始階段和識(shí)別階段。初始階段,完成原始標(biāo)準(zhǔn)圖像的感知哈希指紋的獲??;識(shí)別階段,如圖3所示,對(duì)待識(shí)別鈔票圖像計(jì)算哈希指紋并與原始標(biāo)準(zhǔn)哈希指紋匹配。具體過程如下:
①初始階段:獲取原始標(biāo)準(zhǔn)圖像感知哈希指紋,對(duì)所有需要識(shí)別鈔票的 5個(gè)位置區(qū)域的圖像感知哈希指紋,對(duì)所有需要識(shí)別鈔票,分4個(gè)面向采集4張標(biāo)準(zhǔn)圖像,其中需要圖像傾斜角度小于 0.1°,盡可能保證原始模板圖像不傾斜。計(jì)算得到的哈希指紋,作為模板存儲(chǔ)在內(nèi)存中以供計(jì)算使用。
圖1 利用圖像感知哈希算法識(shí)別過程Fig.1 Recognition process using image perceptual hash algorithm
②識(shí)別階段:計(jì)算哈希指紋匹配結(jié)果,對(duì)待識(shí)別鈔票圖像計(jì)算感知哈希指紋匹配結(jié)果;根據(jù)計(jì)算結(jié)果篩選出可能鈔票類型,文章采用5個(gè)位置區(qū)域的匹配結(jié)果均大于0.6,即認(rèn)為是可能的鈔票類型。
由于各國鈔票的尺寸不一,因此選取鈔票中心區(qū)域作為MOSSE相關(guān)濾波器的目標(biāo)區(qū)域,選取正反面的可見光圖像中間區(qū)域作為目標(biāo)區(qū)域,利用 2個(gè)MOSSE濾波器,同時(shí)計(jì)算匹配結(jié)果,確認(rèn)識(shí)別鈔票類型。
MOSSE算法實(shí)現(xiàn),分為2個(gè)階段:訓(xùn)練階段、計(jì)算識(shí)別階段。
①訓(xùn)練階段:對(duì)所有需要識(shí)別鈔票的圖像(正反面可見光圖像),分別訓(xùn)練對(duì)應(yīng)的MOSSE濾波器。
②識(shí)別階段:計(jì)算待識(shí)別鈔票的MOSSE濾波器輸出,使用峰瓣率 PSR(Peak-to-Sidelobe-Ratio)表征匹配和定位情況[6]。
其中 peak表示實(shí)際輸出結(jié)果中的峰值,μ和σ表示以峰值為中心的 11×11窗口內(nèi)像素的均值和方差。
待識(shí)別的鈔票通過與可能的鈔票類型的標(biāo)準(zhǔn)濾波器計(jì)算后,得到所有PSR輸出,找到最大值即得到最佳匹配值,即獲得了鈔票類型。
對(duì)人民幣、美元、以色列謝克爾、菲律賓比索、印度尼西亞盧比、伊朗里亞爾、柬埔寨瑞爾、印度盧比、孟加拉塔卡、俄羅斯盧布 10個(gè)國家的流通貨幣進(jìn)行測(cè)試,總測(cè)試樣本數(shù)量 10萬張,鈔票類型識(shí)別率達(dá)到99.95%以上。
在金融自助設(shè)備運(yùn)行過程中,對(duì)于待識(shí)別的鈔票圖像,存在 2個(gè)不確定因素:①鈔票傾斜,鈔票在自助設(shè)備中運(yùn)送過程不可避免地會(huì)出現(xiàn)傾斜,而且傾斜角度是隨機(jī)分布的;②圖像亮度變化,由于鈔票的新舊程度和 CIS傳感器不一致性問題,鈔票圖像亮度會(huì)出現(xiàn)不一致。
針對(duì)這 2類問題,MOSSE濾波器在進(jìn)行初始化訓(xùn)練時(shí),加入傾斜樣本,因此對(duì)鈔票傾斜具有一定的抵抗能力。由于 MOSSE是對(duì)目標(biāo)外觀進(jìn)行建模,因此MOSSE濾波器對(duì)外部光照的變化不敏感。測(cè)試結(jié)果也顯示對(duì)隨機(jī)傾斜角度以及亮度不一致的鈔票同樣具備很好的識(shí)別能力。
部分鈔票,不同版本,圖像幾乎相同,如人民幣的1999版的和2005版,此類鈔票不在文章討論范圍內(nèi),后續(xù)可以利用其他光譜的圖像或者可見光圖像的微小區(qū)別再進(jìn)行識(shí)別。
文章以人民幣、謝克爾、盧布等鈔票為例,詳細(xì)介紹利用圖像感知哈希和 MOSSE算法解決多國鈔票類型快速識(shí)別的理論原理和實(shí)現(xiàn)方法,并且測(cè)試結(jié)果也驗(yàn)證了原理和方法的正確性:用感知哈希算法進(jìn)行初次篩選,用 MOSSE進(jìn)行最終確認(rèn)幣種,可以滿足幣種信息識(shí)別對(duì)時(shí)間和準(zhǔn)確性的要求。