程 紅,王志強(qiáng),白新偉
(中國(guó)人民解放軍空軍航空大學(xué)特種專業(yè)系,吉林長(zhǎng)春 130022)
航拍膠片注釋信息閾值分割算法研究
程 紅,王志強(qiáng),白新偉
(中國(guó)人民解放軍空軍航空大學(xué)特種專業(yè)系,吉林長(zhǎng)春 130022)
航拍膠片注釋信息對(duì)后續(xù)的圖像處理非常重要,但是曝光不均、相機(jī)抖動(dòng)或者膠片數(shù)字化產(chǎn)生的畸變都會(huì)導(dǎo)致注釋信息產(chǎn)生背景模糊、泛白、灰度不均等現(xiàn)象,這給注釋信息標(biāo)識(shí)符的分割和識(shí)別帶來很大困難。該文提出了一種基于CASDA與Niblack相結(jié)合的閾值分割算法,能夠有效解決傳統(tǒng)分割方法存在的字符分割斷裂問題。實(shí)驗(yàn)證明,該算法能夠在保證注釋信息準(zhǔn)確分割的同時(shí)兼顧處理速度。
閾值分割;圖像增強(qiáng);CASDA法;Niblack法
航拍膠片的注釋信息中記錄著航拍中重要的飛行姿態(tài)參數(shù)和成像信息,如相機(jī)類型、經(jīng)緯度、俯仰角等信息,這些信息的準(zhǔn)確獲取對(duì)后續(xù)的圖像處理非常重要。注釋信息的解譯一般要經(jīng)過預(yù)處理、定位、閾值分割、標(biāo)識(shí)符分割和標(biāo)識(shí)符識(shí)別[1]等步驟。其中,注釋信息的閾值分割在整個(gè)識(shí)別過程中起到關(guān)鍵作用。閾值分割處理效果不好將會(huì)造成字符的粘連或者斷裂,從而直接影響后續(xù)的標(biāo)識(shí)符分割和識(shí)別。目前,常用的閾值分割方法主要有全局閾值法[2]、局部閾值法[3]和動(dòng)態(tài)閾值法[4]三類;但這三類傳統(tǒng)的方法都不能很好地解決字符的粘連或斷裂問題,如全局閾值法沒有借助像素的鄰域特征,局部閾值法雖然考慮了像素鄰域的特征,但又缺乏對(duì)整體圖像信息的參考,而動(dòng)態(tài)閾值法又比較耗時(shí)。因此,根據(jù)傳統(tǒng)閾值分割法的不足,本文提出了基于CASDA與Niblack相結(jié)合的閾值分割算法。
基于CASDA與Niblack相結(jié)合的閾值分割算法,先對(duì)注釋塊圖像自動(dòng)檢測(cè)虛影區(qū)域,確定出正常區(qū)域和虛影區(qū)域,然后對(duì)正常曝光區(qū)域進(jìn)行全局閾值處理以提高處理速度,再對(duì)虛影區(qū)域采用局部閾值法逐點(diǎn)確定閾值以消除粘連及斷裂,這樣結(jié)合了全局閾值及局部閾值算法的各自優(yōu)點(diǎn),實(shí)現(xiàn)對(duì)注釋信息塊快速而有效的閾值分割。
根據(jù)注釋信息塊的自身特點(diǎn)(圖1),結(jié)合圖像在曝光及掃描時(shí)的情況將注釋塊分成四行,每行包括注釋塊的一行標(biāo)識(shí)符。由于注釋塊的產(chǎn)生是利用發(fā)光二極管曝光的原理,且二極管間距離較近,因此很可能會(huì)產(chǎn)生點(diǎn)光源的散射效應(yīng),即周圍未曝光區(qū)域也會(huì)“泛白”,產(chǎn)生虛影假象。
由于航拍膠片注釋塊存在“行距大,列距小”的特點(diǎn),“泛白”對(duì)于相鄰“行”的影響遠(yuǎn)小于“列”,因此本文只需將“行”作為一個(gè)整體處理即可,即在正常曝光情況下,注釋塊應(yīng)該“非黑即白”,灰度直方圖呈現(xiàn)“雙峰”特點(diǎn)。根據(jù)這一特點(diǎn),檢測(cè)注釋塊每行所對(duì)應(yīng)的灰度直方圖。根據(jù)直方圖灰度值的最小間隔w0,先給定一門限w,使其等于10w0,然后求取直方圖上各離散點(diǎn)與上一離散點(diǎn)及下一離散點(diǎn)的偏導(dǎo)。如果出現(xiàn)先正后負(fù)的情況,這一離散點(diǎn)有可能為“峰”,也有可能為干擾。結(jié)合事先設(shè)定的門限,如果在以該離散點(diǎn)為中心的寬度門限w內(nèi),此點(diǎn)為局部極大值,便認(rèn)為這一點(diǎn)為峰值點(diǎn)。由此,可判斷整個(gè)注釋塊各行對(duì)應(yīng)的直方圖中存在的峰數(shù)?;谏鲜雠袛?如果檢測(cè)出的注釋塊某行所對(duì)應(yīng)的直方圖出現(xiàn)“多峰”,證明該行標(biāo)識(shí)符和背景之間出現(xiàn)很多干擾像素,則該行屬于虛影區(qū)域;反之,如果出現(xiàn)“雙峰”,則該行即在正常區(qū)域。
圖1 原始注釋信息Fig.1 The original comment information
從圖2可以看出,原始注釋塊的灰度直方圖均是第一、二行出現(xiàn)“多峰”,左側(cè)的“峰”應(yīng)為背景區(qū)域像素形成,右側(cè)的“峰”應(yīng)為標(biāo)識(shí)符區(qū)域形成,而中間出現(xiàn)的像素則為干擾,即虛影區(qū)域。第三、四行雙“峰”比較明顯,說明圖像對(duì)比度比較大,標(biāo)識(shí)符比較突出。為后續(xù)處理方便,此處將同為虛影區(qū)域的一、二行合并,將正常區(qū)域的三、四行合并。注釋塊的虛影區(qū)域如圖3所示。
確定出圖像的正常區(qū)域和虛影區(qū)域后,先采用CASDA閾值分割算法[5]實(shí)現(xiàn)正常區(qū)域的閾值分割,該方法將圖像空間分布特性與統(tǒng)計(jì)特性有機(jī)結(jié)合,大大加快了閾值分割的分類速度,與Bernsen、Kittler[6]等算法相比較,CASDA法具有速度快、能消除不均勻光照引起的偽影、極少出現(xiàn)標(biāo)識(shí)符斷裂等優(yōu)點(diǎn),閾值分割效果好?;叶葓D像均值為:
式中:g1表示正常區(qū)域圖像中標(biāo)識(shí)符灰度,r1表示標(biāo)識(shí)符像素點(diǎn)所占比例,g2表示背景灰度,r2表示背景像素點(diǎn)所占比例,且 0≤g1,g2≤255,0≤r1, r2≤1,r1+r2=1。
則方差計(jì)算如下:
為把白字從黑底中分割出來,選取閾值為:
為了確定標(biāo)識(shí)符像素點(diǎn)與背景像素點(diǎn)的比例,需要事先設(shè)定一閾值以實(shí)現(xiàn)標(biāo)識(shí)符與背景的分類。這一閾值的選取根據(jù)實(shí)驗(yàn)選為最大最小灰度值和的1/6;然后對(duì)正常區(qū)域圖像采用CASDA法進(jìn)行閾值分割,求出均值、方差,再結(jié)合式(3)即可求出閾值T,從而實(shí)現(xiàn)分割。閾值分割結(jié)果如圖4所示。
圖4 注釋信息的正常區(qū)域閾值分割Fig.4 The threshold segmentation of normalarea of comment information
由于注釋信息塊的曝光源近似點(diǎn)光源,因此曝光時(shí)可能會(huì)產(chǎn)生局部曝光不均,從而產(chǎn)生虛影區(qū)域。為了方便后續(xù)的標(biāo)識(shí)符分割、識(shí)別,需先對(duì)虛影區(qū)域進(jìn)行圖像增強(qiáng)。由于線性變換、直方圖等增強(qiáng)方法只能從整體上實(shí)現(xiàn)增強(qiáng),局部對(duì)比度依然不能得到增強(qiáng),因此,本文采用數(shù)學(xué)形態(tài)學(xué)中的頂帽和底帽變換。該變換不僅能夠保留原圖像的結(jié)構(gòu)信息,還能消除圖像的背景干擾,突出感興趣的目標(biāo)。開啟和閉合是形態(tài)學(xué)中的兩個(gè)重要運(yùn)算,它們是由膨脹和腐蝕組合而成的復(fù)合運(yùn)算。開啟運(yùn)算可以去除比結(jié)構(gòu)元素更小的明亮細(xì)節(jié),而閉合運(yùn)算可以去除比結(jié)構(gòu)元素更小的暗細(xì)節(jié),所以它們經(jīng)常組合在一起用來平滑圖像并去除噪聲。頂帽變換和底帽變換并用則可以明顯增強(qiáng)對(duì)比度。通過驗(yàn)證,選取類型為square、大小為100的結(jié)構(gòu)元素效果最好。實(shí)驗(yàn)結(jié)果如圖5所示。
圖5 注釋信息虛影區(qū)域增強(qiáng)Fig.5 The enhancement of shadow area in comment information
Niblack算法[7]是動(dòng)態(tài)閾值法中的一種,即每個(gè)點(diǎn)都有各自的閾值。該方法基于局部均值和局部標(biāo)準(zhǔn)差,其核心公式為:
式中:T(x,y)為圖像任一點(diǎn)(x,y)處的閾值,m(x, y)為圖像的局部均值,s(x,y)為圖像的局部方差,k是一個(gè)調(diào)整系數(shù)。
為了確定圖像中每個(gè)點(diǎn)的閾值,需要對(duì)圖像進(jìn)行擴(kuò)充,擴(kuò)充窗口的大小在Niblack方法中非常重要,既要能小到保持足夠的局部細(xì)節(jié),又要能大到抑制噪聲。通過實(shí)驗(yàn)發(fā)現(xiàn),擴(kuò)充窗口大小取值15、調(diào)整系數(shù)k取值0.08時(shí)效果最好。為了排除閾值處理后的獨(dú)立干擾點(diǎn),本文在閾值化后加入了一步開運(yùn)算處理,結(jié)構(gòu)元素選為rectangle,大小為[2 2]。處理結(jié)果如圖6所示,整體效果如圖7所示。
在實(shí)驗(yàn)過程中,采用傳統(tǒng)的Bernsen法、Niblack法、Sauvola法、CASDA法、迭代法、直方圖閾值分割法、Kittler法及本文算法對(duì)航拍膠片進(jìn)行閾值分割實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果比較如圖8、表1。可以看出,迭代法和 Kittler法作為全局閾值法雖然執(zhí)行速度很快,但是粘連情況比較嚴(yán)重,這不利于后續(xù)的標(biāo)識(shí)符分割;直方圖閾值分割法需要根據(jù)圖像灰度直方圖確定分割“谷底”,而由于干擾的存在,合適的“谷底”位置不易確定;采用Bernsen法和 Sauvola法都有偽影產(chǎn)生,分割起來比較困難,同時(shí)由于這兩種方法是采用局部閾值,需計(jì)算每個(gè)小窗口圖像,因此運(yùn)行時(shí)間比較慢;Niblack法、CASDA法對(duì)于光照相對(duì)平均區(qū)域效果很好,但對(duì)于虛影區(qū)域的處理不是很好,存在標(biāo)識(shí)符斷裂情況;采用本文算法不僅不存在偽影現(xiàn)象,而且對(duì)復(fù)雜區(qū)域的處理效果也很好,同時(shí)由于結(jié)合了全局閾值法,程序執(zhí)行時(shí)間也比較快,時(shí)效性很好。
圖8 閾值分割效果對(duì)比Fig.8 The contrast of threshold segmentation algorithms
表1 算法執(zhí)行時(shí)間比較Table 1 The contrast of algorithm executing time
本文提出的航拍圖像注釋塊閾值分割算法結(jié)合了全局閾值法和局部閾值法的優(yōu)點(diǎn),在圖像質(zhì)量好的區(qū)域利用CASDA全局閾值法,既保證了處理效果又節(jié)省了程序執(zhí)行時(shí)間;而對(duì)虛影區(qū)域先采用形態(tài)學(xué)方法進(jìn)行圖像增強(qiáng),然后采用Niblack法進(jìn)行局部閾值求取。實(shí)驗(yàn)證明,本算法明顯優(yōu)于Bernsen法、Sauvola法、Niblack法等傳統(tǒng)的閾值分割方法,具有良好的適應(yīng)性。
[1] 陳凱,曾慶業(yè),龐怡杰.航拍膠片注釋信息字符識(shí)別方法[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(7):235-237.
[2] ISMA IL A H,MARHABAN M H.A simple app roach to determine the best threshold value for automatic image thresholding [A].2009 IEEE International Conference on Signal and Image Processing Applications[C].2009.162-166.
[3] GONZALEZ R C,WOODS R E,EDDINS S L.阮秋琦(譯).數(shù)字圖像處理(MA TLAB版)[M].北京:電子工業(yè)出版社,2005. 307-314.
[4] 劉新宇,吳勇,李龍.道路標(biāo)線圖像分割方法研究[J].交通與計(jì)算機(jī),2008,26(6):56-60.
[5] 張引.基于空間分布的最大類間方差牌照?qǐng)D像二值化算法[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2001,35(3):272-280.
[6] 楊碩,尚振宏.一種新的二維條碼圖像二值化算法[J].昆明理工大學(xué)學(xué)報(bào)(理工版),2008,33(1):44-46.
[7] 李倩.文檔圖像的二值化算法綜述[J].中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,15(4):67-69.
A Threshold Segmen tation Algorithm of Commen t Information in Aerial Photos
CHENG Hong,WANG Zhi-qiang,BA IXin-wei
(Department of Specialty,the A viation University of A ir Force,Changchun 130022,China)
The comment info rmation of aerial photos is very important for image p rocessing.The fuzzy,w hite o r non-uniform gray value of the background of comment info rmation is caused by non-unifo rm exposal,shaking o r aberration of digital photos, w hich makes it difficult to segment and interp ret the comment information.In this paper,the threshold segmentation algo rithm based on CASDA and Niblack is p roposed,the p roblem that character fragmentation is resolved in traditional segmentation algorithm.Experiment results show the high p recision and fast speed fo r the segmentation of the comment information.
threshold segmentation;image enhancement;CASDA algo rithm;Niblack algorithm
TP751
A
1672-0504(2011)04-0045-03
2010-12-30;
2011-03-10
程紅(1969-),女,博士,教授,碩士生導(dǎo)師,從事遙感信息處理研究。E-mail:kaola0811@163.com