房倩
中山大學(xué)物理學(xué)院
特征信息的新數(shù)字圖像識別方法研究
房倩
中山大學(xué)物理學(xué)院
隨著社會的快速發(fā)展,我國的科技水平也得到了很大的提高。尤其是在新興領(lǐng)域的數(shù)字圖像的識別上,我國科學(xué)工作者一直在不斷的研究著,為對數(shù)字圖像的識別尋找更好的方法。在以前的方法中,往往存在著一些弊端,而本文提出了一種新的數(shù)字圖像的識別方法,主要是運(yùn)用特征信息的比較。本文著重闡述了特征信息的新數(shù)字圖像識別方法的原理,和對這個方法的一些研究。
特征信息;新數(shù)字圖像識別;方法
數(shù)字圖像的識別指的就是利用計算機(jī)對圖像進(jìn)行處理,或者分析,去識別不同的圖像的一種技術(shù),而這個方法大部分是利用了數(shù)學(xué)的一些原理去操作的。對數(shù)字圖像的識別這個應(yīng)用非常廣泛,比如在一些醫(yī)學(xué)領(lǐng)域上、軍事領(lǐng)域上、或者是一些農(nóng)業(yè)或工業(yè)的等一些領(lǐng)域上,數(shù)字圖像的識別都得到了很大的應(yīng)用。不過科學(xué)工作者也研究出了很多的方法,但是這些方法在數(shù)字圖像識別的時候,不能把對線進(jìn)行識別快,處理簡單,和識別率高不能同時具備,在實(shí)際應(yīng)用中帶來了很大的影響。但是特征信息的新數(shù)字圖像識別方法缺可以補(bǔ)充這個劣勢,但是我們要首先明白它的原理。
數(shù)字識別算法的原理它是利用對一個數(shù)字的高度來去做一些水平線,然后把水平線與這個數(shù)字的交點(diǎn)并做上記號。首先是在這個數(shù)字高的三分之一和高的五分之六做水平線,這兩條水平線與數(shù)字的交點(diǎn)做兩個記號。然后再把數(shù)字平均分成兩部分,分別在這個數(shù)字的上部分做三條水平線,然后再在下部分做三條水平線,然后把這兩部分分別進(jìn)行四等分。然后把這些水平線與數(shù)字的交點(diǎn)在分別做上記號。我們可以把對進(jìn)行識別的數(shù)字設(shè)為A[1]。
第一部分是,我們要把前面做了些許處理的數(shù)字進(jìn)行掃描,這時候需要把這個數(shù)字的四個特征信息記錄下來,包括起始的行,列,然后尾行、和最后的列這四個位置.然后在計算出這個數(shù)字的高和寬。第二部分,在這個數(shù)字的寬這列做上一條垂直的線,然后這是在記下這個線與數(shù)字的交點(diǎn)。然后這時需要假設(shè),先去假設(shè)這個數(shù)字是多少,再接著去進(jìn)行一系列的計算和推理。這時還需要進(jìn)行對數(shù)字的上部分做上4條水平線,在下部分做條水平線,這時候把上部分與下部分各平均分成5部分。然后在進(jìn)行重新假設(shè)這個數(shù)字的值取值多少,在進(jìn)行去重復(fù)計算。在我們計算的過程中,有時候會出現(xiàn)兩個數(shù)字的非常接近,比如數(shù)字6和數(shù)字9進(jìn)行識別的時候,可能會發(fā)現(xiàn)這兩個數(shù)字都會容易被識別成數(shù)字8。這時準(zhǔn)確率會有所降低。這時就需要去增加水平線的數(shù)量,比如在上面進(jìn)行五等分,這時水平線的數(shù)量會增加,對數(shù)字的識別率會增高。
2.1對四個數(shù)字0、3、4、7這四個數(shù)字的識別舉例
在它的實(shí)驗(yàn)原理中,我們可以得知要根據(jù)數(shù)字的特征信息去進(jìn)行數(shù)字的識別。我們可以先看這四個數(shù)字的特征信息,第一個數(shù)字0它是一個圓形,然后形狀是很封閉的;而3這個數(shù)字的形狀是比較特殊的,它的上部分與下部分是一樣的,都屬于一個鉤的形狀;而4這個數(shù)字屬于一個封閉的環(huán)形;這個7數(shù)字是可以分成兩部分進(jìn)行分析,第一部分是上部分是一個“一”水平形狀,而下部分是“1”豎著的形狀。這四個數(shù)字的形狀也有著相似之處,但是如果只用一條水平線很難完成對這四個數(shù)字進(jìn)行正確的識別,至少需要用兩條水平線。這時我們需要進(jìn)行第一步,做兩條水平線,位置在高的三分之一的地方,和五分之六的地方。然后根據(jù)這兩條水平線與數(shù)字的交點(diǎn)個數(shù)的不一樣可以進(jìn)行識別。但是這個數(shù)字4會在經(jīng)過圖像的處理后,數(shù)字4的識別不容易被識別出來。因?yàn)?的特征信息會表現(xiàn)的不太清晰,有時會成為不封閉的狀態(tài),降低了它的識別率。這時候就需要采取排除法去處理,把數(shù)字4的特征信息的改變進(jìn)行忽略,這是數(shù)字4被識別出來。因此,這四個數(shù)字都被成功的識別了出來,我們可以看到表1進(jìn)行了詳細(xì)的解釋,記錄了這四個數(shù)字與水平線的交點(diǎn)的數(shù)量[2]。
表1:數(shù)字0、3、4、7的特征信息的解釋
2.2對數(shù)字2、5、6、8和數(shù)字9的識別分析研究
在我們上述的推理和研究中,我們會發(fā)現(xiàn)在我們做了一條垂直線的時候,這條垂直線與數(shù)字的交點(diǎn)數(shù)會有3個,這時我們會看出這個待識別的數(shù)字會有我們所要研究的5個數(shù)字的其中一個。那我們開始進(jìn)行識別,取我們所要對數(shù)字進(jìn)行等分的一個數(shù)值為k,而做的水平線為k-1,而這個k的取值越大,我們知道對數(shù)字識別的準(zhǔn)確率越高。但是如果k的取值越大,我們計算的時間會花的越長,然后直接影響了我們對數(shù)字識別的效率。所以為了保證這兩方面都要具備,這是我們就需要給這個值設(shè)定一范圍,去一個適當(dāng)?shù)闹???梢园堰@個K值分別進(jìn)行取值為2、3、4、5和6時,對所要識別的數(shù)字進(jìn)行多次測試,可以設(shè)為10次,這時候就可以看出數(shù)字被正確是被需要幾次,還有被識別的正確率。這是需要不斷進(jìn)行測試的,K的不同取值,對數(shù)字的識別率會有很大的不同,但是會存在一個值,這些數(shù)字的識別率是最高的[3]。因此,通過這些測試,我們會看出K的最適合的取值,這是我們就完成了對數(shù)字的識別。
綜上所述,這種首先提取數(shù)字的更多的特征信息然后進(jìn)行數(shù)字識別的方法,很大的提高了數(shù)字的識別率,所以相關(guān)工作者應(yīng)該更好的運(yùn)用這一方法。
[1]馬斌,邊樹海,王長濤,韓忠華,孟慶斌.特征信息的新數(shù)字圖像識別方法[J].沈陽建筑大學(xué)學(xué)報(自然科學(xué)版),2011(06)
[2]王宇新.基于特征分布的圖像識別方法研究與應(yīng)用[D].大連理工大學(xué),2012.
[3]蓋光建.基于圖像的特征信息提取與目標(biāo)識別[D].哈爾濱理工大學(xué),2009.