李新利 李笑笑 楊國田
摘 ? 要:圖像處理是人工智能的基礎,而圖像分割是圖像處理的關鍵技術。圖像特征提取和目標識別,在一定程度上取決于圖像分割的質量如何。在圖像處理與分析課程教學過程中,文章針對閾值分割算法和效果進行研究,提出了一種基于和聲搜索的閾值尋優(yōu)算法;基于圖形用戶界面,編寫了圖像閾值分割算法軟件。軟件可實現基本全局閾值、Otsu最佳全局閾值、多個全局閾值、局部均值閾值、局部中值閾值、自適應分塊閾值以及基于和聲搜索的閾值分割算法。學生可直觀感受不同閾值分割算法的分割效果和特點,圖像閾值分割軟件具有良好的教學效果和啟發(fā)學生創(chuàng)新思維的作用。
關鍵詞:圖像處理;閾值分割;和聲搜索;圖形用戶界面
中圖分類號:TP317.4 文獻標志碼:A 文章編號:1673-8454(2020)13-0093-04
一、引言
圖像處理、分析和識別是進行人工智能深入研究的基礎。隨著人們對人工智能科學的進一步重視,圖像處理問題作為一項研究熱點進入越來越多人的視野。圖像處理與分析課程是模式識別與智能系統(tǒng)學科核心專業(yè)學位課,其內容融合了計算機圖形學、計算機視覺和模式識別等多個領域的知識,需要學生具有較強的理論綜合能力和實踐能力。因此培養(yǎng)理論與實踐并重的高素質人才成為教學的重要任務。
圖像分割是圖像識別和計算機視覺至關重要的預處理。沒有正確的分割就不可能有正確的識別。但是,在進行具體的分割時經常會遇到各種問題。例如光照不均、噪聲過多、背景與目標差別過大等,造成分割效果不理想。而不同的圖像分割算法也各具特點。因此在教學中,為了讓學生能夠對比理解多種圖像分割算法的特點,本文基于圖形用戶界面,設計圖像閾值分割算法軟件,并提出一種基于和聲搜索的閾值分割算法,不僅能讓學生直觀感受不同圖像閾值分割算法的特點與效果,還啟發(fā)學生對科研創(chuàng)新的靈感。
二、圖像閾值分割算法
1.圖像閾值分割原理[1]
假設圖像中的灰度直方圖對應于圖像f(x,y),該圖像由暗色背景上的較亮物體組成,以這樣的組成方式,物體像素和背景像素所具有的灰度值組成了兩種支配模式。閾值分割即通過選擇閾值T,將不同模式分開,從背景中提取物體。此時,f(x,y)>T的任何點(x,y)為一個對象點;否則為背景點。分割后的圖像g(x,y)如(1)所示。
g(x,y)=1, ? f(x,y)>T ? 0, ? f(x,y)≤T(1)
式(1)中,當適用于整個圖像時為全局閾值處理。當T值發(fā)生改變時,圖像中任何點(x,y)的T值取決于(x,y)的鄰域特性(例如鄰域中像素的平均灰度),此時為可變閾值。
2.全局閾值
全局閾值的分割與點的灰度值有關。整幅圖像使用同一個閾值做分割處理,適用于背景和前景有明顯對比的圖像。
(1)基本全局閾值
在目標和背景差異明顯、灰度值相差較大的時候,采用基本全局閾值比較好。如圖1所示,原始圖像取自伯克利數據庫。[2]分割閾值選擇直方圖中兩個波峰間的波谷所對應的灰度值,實現對場景中月亮的分割。
(2)Otsu最佳閾值
Otsu算法采取最大類間方差作為判斷標準,不需要輸入附加參數。不論圖像的直方圖是否有明顯的雙峰,均可以找到較理想的閾值,獲取較好的分割效果。圖2為生物質燃料燃燒實驗中的火焰圖像,其直方圖沒有明顯的雙峰。采用Otsu最佳閾值分割,其分割效果如圖2c所示。分割有助于提取火焰面積、形狀等特征信息,進一步進行燃燒狀況、燃料燃燒性能等的深入研究。
(3)多閾值
多閾值是對單個閾值的擴展。當圖像直方圖有多個波峰波谷的時候,可以采用多閾值處理把圖像分割成多個區(qū)域。圖3原始圖像取自伯克利數據庫[2],采用多閾值分割效果如圖3所示。
3.可變閾值
(1)分塊閾值
可變閾值分割與圖像像素的空間坐標有關。當照明不均勻、有突發(fā)噪聲或者背景灰度變化較大時,分塊閾值分割能得到較好的分割效果。將原始圖像劃分成較小的子圖像,并對每個子圖像選取相應的閾值。圖4為某燃煤機組爐膛燃燒層的燃燒火焰圖像,煤粉和一次風混合氣流從左側進入爐膛,在火焰圖像中形成一段類似舌形黑龍的區(qū)域,即未燃燒區(qū)。通過圖像分割可提取未燃燒區(qū)信息,對進一步研究爐內燃燒狀況具有重要作用。
(2)局部閾值
局部閾值分割可以根據圖像的局部特征進行處理,其與圖像像素位置、灰度值及鄰域特征值有關。圖5為墻體裂縫圖像,由于光源位置和拍攝角度產生光照不均問題,采用局部閾值分割可以得到比較好的效果。
三、基于和聲搜索的閾值分割算法
1.和聲搜索算法思想
和聲搜索(Harmony Search,HS)算法是一種新穎的智能優(yōu)化算法,模擬了音樂演奏的原理?;竞吐曀阉魉惴ㄋ枷肴缦拢篬3]
Step1:在可選音調范圍[xmin,xmax]內隨機產生與和聲記憶庫大?。℉armony Memory Size,HMS)數目相同的HMS組音調X1、X2……XHMS。其中每組音調包含n個音,以X1為例:X1=[X11,X12,…,X1n],x11,x12,…,x1n皆屬于[xmin,xmax]范圍。
Step2:將每組音調按照某種組合方式生成HMS個和聲f(X1)、f(X2)……f(XHMS)。將每組音調與對應的和聲一起放入和聲記憶庫(Harmony Memory,HM),得到初始化和聲記憶庫,其形式如(2)所示:
Step3:在[0,1]之間隨機產生一個變量r1,將r1與記憶庫取值概率(Harmony Memory Considering Rate,HMCR)相比較。如果r1小于HMCR,則在初始化的和聲記憶庫中隨機選取一組和聲。否則,在可選音調范圍[xmin,xmax]隨機產生一組音調,按照Step2中的組合方式生成得到一組和聲。
Step4:如果這組和聲是從和聲記憶庫中得到的,需要對這組和聲進行微調。在[0,1]之間隨機產生變量r2,如果r2小于音調微調概率(Pitch Adjusting Rate,PAR),則隨機讓音調向上或向下調整微調帶寬 (band width,bw)大小,得到一組新和聲。否則,不做調整。
Step5:若新和聲優(yōu)于和聲記憶庫中最差和聲,則用新和聲替換最差和聲,得到新的和聲記憶庫。否則,和聲記憶庫不做改變。不斷重復Step3、Step4,直到創(chuàng)作(迭代)次數達到設定值。此時和聲記憶庫中的最優(yōu)和聲即為所求。
2.基于和聲搜索的圖像閾值分割
基于和聲搜索的圖像閾值分割算法,本質是進行閾值尋優(yōu)。通過選取圖像類間灰度均值差作為和聲搜索算法的目標函數,能使類間灰度均值差最大的閾值即為分割閾值。其分割流程如圖6所示。
針對電纜隧道的隧道墻體裂紋檢測,隧道的特殊環(huán)境會使攝像機拍攝墻體圖片時,出現光照不足和對比度不高情況。對此墻體圖像進行圖像處理檢測裂縫,采用本文所提出的基于類間灰度均值差的和聲搜索算法進行分割,并與其他閾值分割算法進行對比,如圖7所示?;陬愰g灰度均值差的和聲搜索算法可以取得較為滿意的結果。
四、基于圖形用戶界面的圖像閾值分割
圖形用戶界面主要由窗口、菜單、對話框等各種圖形對象組成,便于人機交互。[4]本文基于圖形用戶界面編程實現包括圖像全局閾值分割、可變閾值分割以及基于和聲搜索的閾值分割在內的7種圖像分割算法。
1.圖像閾值分割界面設計
為便于實驗演示和學生操作,設計軟件通過選擇圖像按鈕獲取圖像并得到圖像直方圖分別顯示在兩個axes部件,通過點擊不同的圖像閾值分割算法可以對圖像進行處理并在第三個axes部件上輸出圖像??删庉嫿缑嫒鐖D8所示。
軟件中包含七種分割算法可供選擇,通過不同的算法可以得到不同的分割效果。用戶界面可對分割算法參數進行調整,包括改變多閾值分割閾值數量、改變局部閾值分割中濾波窗口的大小、改變自適應閾值分割的分塊數目。學生可以在實際操作中了解各種分割算法及參數對分割效果的影響,從而在今后圖像分割算法的選擇上得到啟發(fā)。
2.圖形用戶界面運行
圖形用戶界面運行窗口如圖9所示。通過點擊選擇圖像可獲取原始圖像及原始圖像直方圖,點擊所選算法,可直觀顯示圖像分割效果。再次選擇其他算法,可以獲得不同算法對同一圖像的處理結果,通過保存圖像按鈕可以保存原始圖像、原始圖像直方圖及處理后的圖片,便于學生之后進行更細致的對比和分析。
五、教學應用及效果
圖像處理與分析課程具有較強的理論性和實踐性,為提升學生的綜合素質和創(chuàng)新能力,針對圖像閾值分割的教學,基于教學內容和教學方法進行研究和改進。
一是融入學科前沿和電力特色的教學內容。針對圖像閾值分割,除了講授經典分割方法,如全局閾值、Otsu最佳閾值、多閾值、分塊閾值和局部閾值等,還給學生引入了基于和聲搜索的閾值分割,及時讓學生了解和關注到前沿知識和技術。針對圖像閾值分割案例,緊密結合電力大學的學科特色,所選用的圖像閾值分割案例包括電廠鍋爐燃燒火焰圖像、電纜隧道的墻體裂紋圖像,以及生物質燃燒火焰圖像等,把工程實際和科研項目中的相關圖像處理內容融入教學過程中,實現專業(yè)知識和研究領域緊密結合。
二是理論和實踐并重的教學方法。首先通過理論講解,讓學生初步學習不同圖像閾值分割的算法原理,然后通過所設計的圖像閾值分割軟件,演示不同閾值分割算法的分割效果,以及分割算法中參數改變對分割效果的影響,讓學生直觀體會不同分割算法、不同參數的分割效果和特點,有助于學生理解不同分割算法的適用范圍。理論和實踐并重的教學方法,加深了學生對算法的理解,激發(fā)了學生的學習興趣。
六、結語
在圖像處理與分析課程教學過程中,本文針對閾值分割算法和效果進行研究,提出了一種基于和聲搜索的閾值尋優(yōu)算法?;趫D形用戶界面,設計實現包括基本全局閾值、Otsu最佳全局閾值、多個全局閾值、局部均值閾值、局部中值閾值、自適應分塊閾值以及基于和聲搜索的閾值分割算法。在教學中,實現了將學科前沿和電力特色內容融入基礎知識的教學內容改進,以及理論與實踐并重的教學模式。所設計的教學圖像閾值分割軟件不僅方便學生使用,而且培養(yǎng)了學生創(chuàng)新思維和科研能力。
參考文獻:
[1](美)Rafael C.Gonzalez,Richard E.Woods;阮秋琦,阮宇智等譯.數字圖像處理(第三版)[M].北京:電子工業(yè)出版社,2011.6:443-513.
[2]Arbelaez P,Maire M,Fowlkes C,et al.Contour Detection and Hierarchical Image Segmentation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(5): 898-916.
[3]趙玉新,楊新社,劉利強.新興元啟發(fā)式優(yōu)化方法[M].北京:科學出版社,2013.8:201-219.
[4]宗節(jié)保,段柳云,王瑩等.基于MATLAB GUI軟件制作方法的研究與實現[J].電子設計工程,2010,18(7):54-56.
(編輯:王天鵬)