摘 要:圖像識別技術(shù)是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術(shù)。文章通過MATLAB軟件采用圖像字符識別技術(shù),通過圖像采集、預處理、特征提取、模板匹配等方式,實現(xiàn)對含有商品保質(zhì)期的圖片進行識別,提取保質(zhì)期信息與當前時間比較根據(jù)比較結(jié)果進行和判斷,用以提醒用戶商品是否過期,有效的避免了這類事件對商家造成的損失以及不良影響。
關(guān)鍵詞:字符識別技術(shù);預處理,特征提取;模板匹配
圖像中有效信息的提取是非常關(guān)鍵的,要首先進行圖像識別,字幅圖像識別首先要對圖像識別技術(shù)是一種通過數(shù)字化技術(shù)對所采集的用來研究實驗的圖片進行處理,然后利用計算機進行分析,使之能在不同模式下將有效信息變短辨別出來的一門技術(shù)。圖像進行預處理,每個圖像中都有噪聲,圖像預處理的主要目的就是減少噪聲造成的影響,以防對實驗結(jié)果產(chǎn)生影響,然后再對預處理的圖像進行分割,得到含有有效信息的圖像,然后對得到的有效圖像進行特征提取,再通過模板匹配實現(xiàn)圖像中字符的識別,以此來達到圖像識別的目的。接下來作者對圖像識別的具體步驟進行詳細介紹。
1 圖像識別技術(shù)
圖像識別技術(shù)是一種通過數(shù)字化技術(shù)對所采集的用來研究實驗的圖片進行處理,然后利用計算機進行分析,使之能在不同模式下將有效信息變短辨別出來的一門技術(shù)。自動圖像識別系統(tǒng)的過程分為五部分:圖像輸入、預處理、特征提取、分類和匹配,其中預處理又可分為圖像分割、圖像增強、二值化和細化等幾個部分。
2 圖像預處理步驟及方法
2.1 預處理
預處理的步驟后可以包括下面幾個過程:灰度化、二值化等操作消除圖像中的無關(guān)信息,防止其無關(guān)信息對實驗結(jié)果產(chǎn)生影響,生成一個簡單清楚的圖像。能否達到預期時候?qū)⑸唐穲D片中有關(guān)于
保質(zhì)期的有效信息讀取出來,達到實驗后期與匹配庫中的目標字符成功進行匹配識別的效果,這一切都要看前期圖像字符預處理能否較為理想的完成。
2.2 灰度化
將彩色圖像轉(zhuǎn)化為灰色圖像的過程稱為圖像的灰度化處理,文章介紹幾種常見的方法:
(1)最大值法:將像素的三原色的值都等于它三原色中那個最大的原色的值,即:
G=R=B=MAX(R,G,B)
(2)平均值法:顧名思義,這個方法說的是將像素三原色的值設(shè)置成像素三元色的平均值,即:
R=G=B=(R+G+B)/3
(3)加權(quán)平均值法:這個方法說的是設(shè)置一組權(quán)值,其中,?棕R、?棕B、?棕G分別是R、B、G的權(quán)值。?棕R、?棕B、?棕G取不同的值時,將形成不同的灰度圖像。然后對三原色的值進行加權(quán)平均,得到一組新的三原色值,顯示圖像,即:
R=G=B=(?棕RR+?棕BB+?棕GG)/3
最大值法處理后的灰度化圖像會比較亮,也就是高亮度;平均值法處理后的圖像產(chǎn)生的灰度化圖像會比較柔和;加權(quán)平均值法在處理灰度化時候,可以人為的去改變圖像的灰度化程度,比較靈活。
2.3 二值化
在此次項目中,我們采用最大類間方差法找到圖片的合理閾值,它是按圖像的灰度特性,將圖像分成背景和目標兩部分。背景和目標之間的類間方差越大,說明構(gòu)成圖像的兩部分的差別越大,當部分目標錯分為背景或部分背景錯分為目標都會導致兩部分差別變小。因此,使類間方差最大的分割意味著錯分概率最小。
3 圖像分割
圖像分割的目標是把拍照圖像中的每個字符從整個圖像中分離出來,成為單個字符,此方法一般是對像素進行操作,典型的圖像分割方法有閾值法、邊緣檢測法、區(qū)域法、聚類法等,在此,由于我們之前已對圖像進行了預處理,所以只需要用基本的投影分割法,對 x軸, y軸分別進行投影分割,即可得到單個字符清晰的的分割效果,由于拍照所得的圖片樣品是印在商品上的有效日期,它的有效日期的字符是標準體,十分整齊,所以不會出現(xiàn)將兩個字符分割到一起的問題。所以可采用投影分割法進行處理。
4 特征提取
特征提取就是提取圖像中的信息特征,常見的特征提取方法一般分為以下兩種:(1)結(jié)構(gòu)特征提?。航Y(jié)構(gòu)特征提取是指利用目標字符的特別的字符結(jié)構(gòu)特征進行提取的方法,這種方法往往可區(qū)分性強,同時穩(wěn)定性強。(2)統(tǒng)計特征提?。航y(tǒng)計特征提取是指對全部整個完整的字符進行分析處理,然后提取該有效字符。
由于在本次項目中,用到的是商品上有關(guān)保質(zhì)期的有效信息,都是有關(guān)于數(shù)字,因此我們提取數(shù)字方面的特征,在本次實驗中作者用到的特征提取的方法為以下兩種方法,粗網(wǎng)格特征提取的方法和筆劃密度特征提取的方法:
(1)粗網(wǎng)格特征提取
粗網(wǎng)格特征是指不同數(shù)字在不同位置塊內(nèi)的黑色素點個數(shù)特征,它代表的是圖像的整體分布特征。
這種方法首先把數(shù)字圖片分成幾個局部小區(qū)域,并把每個小區(qū)域上的點陣密度作為描述特征,即統(tǒng)計每個小區(qū)域中圖像象素所占百分比作為特征數(shù)據(jù)。
這種方法被廣泛運用在各個領(lǐng)域。
(2)筆劃密度特征提取
每個數(shù)字的筆劃長短,大小形狀都不一樣,所以0-9每個數(shù)字的筆劃特征都不一樣,由于每個數(shù)字的筆劃數(shù)量,集中分布的地方也不同,所以可以提取筆劃密度特征參數(shù)進行識別。
我們可以通過以不同方向掃描輸入的樣本數(shù)字,計算其掃描線和筆劃相交的次數(shù),不同的筆劃相交次數(shù)不一樣,以此可以形成筆劃密度的特征向量。
5 模板匹配
5.1 模板匹配概念及原理
模板匹配法是指在實驗建立的基礎(chǔ)模板匹配庫通過某些從圖像字符中查找提取到的特征向量,從匹配庫中找出與目標字符最相似的字符,即如果庫中存在該字符那么就可以從模板匹配庫中找到并輸出目標字符。在進行模板匹配時會用到,前面說到的從圖像字符中提取出來的特征向量。
觀測向量:觀測向量說的是對目標對象進行處理分析然后得到的原理數(shù)據(jù)構(gòu)成的向量。
R=[r1,r2,...,rm]T
R是觀測向量,r是觀測值。
觀測空間:由觀測向量的維數(shù)決定的m維幾何空間。
特征向量:對觀測向量進行特征選擇和提取,得到反映事物本質(zhì)特性的特征構(gòu)成的向量。
X=[x1,x2,...xn]T
X是特征向量,x是特征值。
特征空間:有特征向量的維數(shù)決定的n維幾何空間(n 特征選擇:去除次要的特征,篩選出重要的特征。 特征提?。和ㄟ^壓縮變換或映射,降低特征維數(shù)。 歐氏距離:設(shè)有兩個n維的特征向量x1和x2, 那么這兩個目標對象的歐氏距離可以被定義為如下: 可以根據(jù)實驗的要求來改變加權(quán)系數(shù),使得實驗的準確性大大提高,同時也使得識別的過程步驟更加的靈活,增加了各個特征在識別中的重要程度。 5.2 模板匹配方法及思想 設(shè)檢測對象的模板為t(x,y),令其中心與圖像f(x,y)中的一點(i,j)重合,檢測t(x,y)和圖像重合部分之間的相似度,對圖像中所有的點都進行這樣的操作,根據(jù)相似度為最大或者超過某已于直來確定對象物是否存在,并求得對象物所在的位置。 相似度:該值越大,表示匹配程度越好。 f—f(x+u,y+v)在S內(nèi)的均值,t—t(x,y)在S內(nèi)的均值。 6 仿真分析 文章通過MATLAB處理平臺對所采集的圖像進行分析,通過對圖像的預處理、特征提取、模板匹配等方式,結(jié)果如圖2所示。 圖1 原始圖像 圖2 實驗結(jié)果圖 從圖中可以看出,本次項目通過圖像字符識別技術(shù),可以很好地對圖像進行識別,并與當前系統(tǒng)時間進行比較,根據(jù)比較結(jié)果進行判斷輸出商品是否過期,達到提醒的目的。 7 結(jié)束語 本次實驗是基于圖像識別中的圖像字符識別技術(shù)來實現(xiàn)對圖片中的有效信息進行識別,并進行對有效信息的提取和處理,最后通過判斷來實現(xiàn)文章的目的,即實現(xiàn)對商品保質(zhì)期的提醒功能。文章主要是講利用圖像識別技術(shù)來對含有商品保質(zhì)期信息的圖片進行識別,并且提取保質(zhì)期信息與當前時間進行比較,根據(jù)比較結(jié)果進行判斷,輸出結(jié)果,提醒用戶商品是否過期,或臨近保質(zhì)期期限,已達到實現(xiàn)商品保質(zhì)期提醒功能,從而也有效地實現(xiàn)了商品的有效使用以及及時處理,避免了商品因為一些忽視,不注意等原因?qū)е律唐愤^期的事件,有效地避免了這類事件對商家造成的損失以及不良影響,也保護了消費者的合法權(quán)益。 參考文獻 [1]林篤盛,呂海堂,基于雙光源圖像合成法的標牌字符識別方法研究[J].工業(yè)控制計算機,2014,27(9):53-54. [2]楊小冬,寧新寶.自動圖像識別系統(tǒng)圖像分割算法的研究[J].南京大學學報,2004,40(4):424-431. [3]李建華,馬小妹.基于方向圖的動態(tài)閾值圖像二值化方法[J].大連理工大學學報,2002,42(5):626-628. [4]劉靜.幾種車牌字符識別算法的比較[J].電腦與電信,2008(8):72-74. [5]杜敏.基于混合特征提取提取的手寫體數(shù)字識別方法的研究[J].西安交通大學學報,1996(9):94-98. [6]馬莉.MATLAB語言實用教程[M].北京:清華大學出版社,2010. [7]Yuntao Cui,Qian Huang,Automatic license extraction from moving vehicles, IEEE Transaction on Pattern Analysis and Machine Intelligence,1999,7(4):126-130. [8]Luis Salgado. Automatic car plate detection and recognition through intelligent vision engineering. IEEE Trans PAMI,1999,17:71-76. 作者簡介:王斌(1995-),工作單位:杭州電子科技大學,研究方向:圖形識別。