摘要:有效字符的傾斜校正算法可以有效提高文字算法識(shí)別率和識(shí)別速度。本文對(duì)基于最小二乘直線擬合和Hough變換的傾斜校正算法進(jìn)行仿真,證明Hough變換具有更好的傾斜校正效果。
關(guān)鍵詞:傾斜校正;最小二乘法;Hough變換
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007—9599 (2012) 14—0000—01
傾斜校正算法是文字識(shí)別算法的重要組成部分,高效的傾斜校正算法可以獲得更加標(biāo)準(zhǔn)的字符圖像,這可以大大的提高文字識(shí)別算法的效率。最小二乘直線擬合和Hough變換算法是常見的兩種傾斜校正算法,本文對(duì)兩種算法進(jìn)行了仿真并分析結(jié)果,找到一種較好的傾斜校正算法。
一、最小二乘直線擬合的傾斜校正算法
最小二乘直線擬合的傾斜校正算法的具體實(shí)現(xiàn)步驟:
(1)針對(duì)文本分割后的圖像,定位出字符串的空間坐標(biāo),構(gòu)造出數(shù)據(jù)集合{X,Y}其中X,Y為輸入向量,里面存儲(chǔ)的是字符串的空間坐標(biāo)。
(2)構(gòu)建一元回歸模型。假設(shè)存在一個(gè)一元回歸模型 ,隨機(jī)變量Y關(guān)于自變量的回歸為 。其一元線性回歸模型為: ,其中參數(shù)a,b, 關(guān)于自變量X都是獨(dú)立的。
(3)直線擬合,求解回歸系數(shù)。設(shè)字符串的數(shù)據(jù)集合有N個(gè)特征點(diǎn) (i=0,1,2…n—1),這N個(gè)特征點(diǎn)相互獨(dú)立,估計(jì)值與樣本的偏差為:
當(dāng)偏差為最小值時(shí)即為傾斜角度,即
根據(jù)KKT條件獲取最優(yōu)a,b值,即:
(4)根據(jù)回歸系數(shù)求傾斜角度。求得的a即為直線的斜率,根據(jù)直線的斜率a很容易得到傾斜角度 。
(5)根據(jù)傾斜角度,進(jìn)行旋轉(zhuǎn)變換。將求得傾斜角度 帶入旋轉(zhuǎn)變換公式(4)即可得到傾斜校正后的圖像。
最小二乘直線擬合的傾斜校算法的仿真測試如圖1。
二、Hough變換的傾斜校正算法
Hough變換的傾斜校正算法的具體實(shí)現(xiàn)步驟:
(1)對(duì)原始傾斜圖像進(jìn)行邊緣檢測;(2)對(duì)邊緣圖像進(jìn)行Hough變換,轉(zhuǎn)換到極坐標(biāo)空間;(3)量化極坐標(biāo)參數(shù)空間,對(duì)于直線檢測而言,參數(shù)空間是二維;(4)構(gòu)造一個(gè)二維數(shù)組A,其結(jié)構(gòu)與參數(shù)空間相匹配,并設(shè)置所有元素為0;(5)將極坐標(biāo)空間映射到二維數(shù)組A中,A中的每個(gè)元素值代表極坐標(biāo)中經(jīng)過該位置的正弦曲線的個(gè)數(shù);(6)統(tǒng)計(jì)二維數(shù)組A中的極大值,極大值點(diǎn)即為x—y坐標(biāo)系中的直線在極坐標(biāo)系中的映射;(7)根據(jù)(6)中極大值點(diǎn)的位置,即可確定出直線的法線與x軸的夾角 ,從而可以進(jìn)一步確定出圖像的傾斜角度;(8)根據(jù)得到的傾斜角度對(duì)原始傾斜圖像進(jìn)行旋轉(zhuǎn)變換,從而對(duì)原始傾斜圖像進(jìn)行校正。
對(duì)基于Hough變換法的傾斜校正算法仿真如圖2。
利用Hough變換可以檢測出某條直線。Hough變換方法是先將直角坐標(biāo)系中目標(biāo)點(diǎn)映射到極坐標(biāo)系中進(jìn)行累積,即先把直角坐標(biāo)系中任意一條直線上的全部點(diǎn)累積到極坐標(biāo)系中的同一點(diǎn)集中,然后檢測極坐標(biāo)系中點(diǎn)集的峰值來尋找長的直線特征。Hough變換一個(gè)最突出的優(yōu)點(diǎn)就是抗干擾能力強(qiáng)。即使待檢測直線條上有小的擾動(dòng)或斷裂,經(jīng)過Hough變換后,仍能檢測到明顯的峰點(diǎn)。
為了能夠更好的比較分析校正結(jié)果,分別對(duì)這兩種不同校正算法校正后的圖像畫了一條直線作為參考如圖3。
通過對(duì)圖3的觀察比較可以看出Hough變換的傾斜校正算法更具有優(yōu)越性。而且Hough變換有一個(gè)突出的優(yōu)點(diǎn)是抗干擾能力強(qiáng)。即使待檢測線條上有小的擾動(dòng)或斷裂,在進(jìn)行Hough變換后,仍能得到明顯的峰點(diǎn)。因此,Hough變換比最小二乘法的傾斜校正效果好。