張 麗,李 瀟,吳皓天,陳海珠,胡 迪
(1.浙江網(wǎng)新數(shù)字技術有限公司,浙江 杭州310030;2.浙江省交通運輸科學研究院 道路工程研究所,浙江 杭州310023)
圖像分割是圖像處理領域的一個重要分支,旨在將圖像劃分成互不相交的幾個區(qū)域[1-3],將目標分離出來。上世紀70年代開始,國內外的專家和學者開始探索利用拓撲學、數(shù)學等方法進行圖像的處理與分割。出現(xiàn)了一批先進的圖像分割技術,典型代表有邊緣檢測、小波分割、遺傳算法等計算方法[4-7]。
隨著圖像成像技術的發(fā)展,圖像的密度不斷提高,目標區(qū)域與背景的像素梯度越來越小,傳統(tǒng)的圖像處理技術出現(xiàn)了一定的局限性[8-9]。邊緣檢測分割處理技術的響應速度快,但該方法容易將目標邊緣碎片化,目標邊緣喪失連續(xù)性和封閉性[10-12]。小波變換能將圖像從時域變換成頻域,通過分析信號的頻率變化,來檢測圖像目標的邊緣信息。而遺傳算法是通過概率的變遷來指引搜索方向,遺傳算法最大的缺陷是評價函數(shù)難以選擇,初始種群較難確定[13-15]。
為改進傳統(tǒng)圖像分割方法,本文在傳統(tǒng)圖像分割方法的基礎上,通過對比分析最大熵閾值分割法和迭代式閾值分割法的原理,并在此基礎上對比研究了最大類間方差法。最后,選擇瀝青路面裂縫進行對比驗證,比較三種方法的差異,得出最大類間方差法的優(yōu)勢。
閾值化是圖像分割中一種重要的技術?,F(xiàn)有大多數(shù)方法都通過圖像的一維灰度直方圖選擇閾值。但是,當圖像的信噪比遞減時,采用這些方法將產生很多的分割錯誤。近年來,出現(xiàn)了一些方法開始利用圖像的二維灰度直方圖-像素的灰度值分布及其鄰域的平均灰度值分布所構成的直方圖來進行閾值分割。這些方法由于利用了圖像的灰度信息和鄰域的空間相關信息,其效果較傳統(tǒng)方法有明顯改善。
二維最大熵分割法的定義如下:將圖像分成兩類分別是目標和背景,目標用A 來表示,背景用B 來表示,而類A 和類B 有著不同的分布概率分別如式1-1、式1-2所示,(ST)為分割閾值的矢量。
讓目標類A 和背景類B 的后驗熵最大是二維最大熵分割的最終目的,則與每個分布有關的熵被定義為式1-3 與式1-4,如下所示:
能夠獲取圖像中的信息量越大,對我們獲取最佳的閾值越有幫助,這是因為信息量越大對目標和背景的分析越透徹,因此讓圖像的總熵H(s,t)取得最大值,此時的信息量也就最大,想求的最佳閾值正是此時所對應的(s,t),求出的閾值(s,t)必須滿足如式1-5 所示的判斷函數(shù):
迭代式閾值分割的基本思想是開始時選擇一個閾值作為初始估計值,然后按某種策略不斷地改進這一估計值,直到滿足給定的準則為止。在迭代過程中,關鍵之處在于選擇什么樣的閾值改進策略。一般好的閾值應該具備兩個特征,即能夠快速收斂和在每一個迭代過程中新產生的閾值優(yōu)于上一次的閾值。
如下迭代式閾值的選擇算法的具體步驟:
(1)選擇圖像灰度的中值作為初始閾值T0;
(2)利用閾值T 把圖像分割成兩個區(qū)域(設為R1和R2),用下式計算區(qū)域R1和R2的灰度均值μ1和μ2。
(3)計算μ1和μ2后,用下式計算出新的閾值Ti+1。
(4)重復步驟(2)和步驟(3),直到Ti+1和Ti的差小于某個給定值。
Otsu 法即為最大類間方差法,使用的是聚類的思想,把圖像的灰度數(shù)按灰度級分成兩個部分,使得兩個部分之間的灰度值差異最大,每個部分之間的灰度差異最小,通過方差的計算來尋找一個合適的灰度級別來劃分。所以可以在二值化的時候采用Otsu 算法來自動選取閾值進行二值化。Otsu 算法被認為是圖像分割中閾值選取的最佳算法,計算簡單,不受圖像亮度和對比度的影響。因此,使類間方差最大的分割意味著錯分概率最小。
Otsu 法是一種使類間方差最大的自動確定閾值的方法,該方法具有簡單,處理速度快的特點,是一種常用的閾值選取方法.其基本思想如下:設圖像像素數(shù)為N,灰度范圍為[0,L-1],對應灰度級i 的像素數(shù)為ni,概率為:
把圖像中的像素按灰度值用閾值T 分成兩類C0和C1,C0由灰度值在[0,T]之間的像素組成,C1由灰度值在[T+1,L-1]之間的像素組成,對于灰度分布概率,整幅圖像的均值為:
則C0和C1的均值為:
其中:
由上面三式可得:
類間方差定義為:
對基于閾值分割后的算法進行仿真實驗,輸入的圖像是經(jīng)分割的圖像,如表1 所示為圖像分割結果對比分析。
由圖2、圖3、圖4 可以看出,由三種分割方法對比得到如圖4 最大熵閾值分割法不適合路面裂紋圖像,分割后的圖像客觀評價較差,此算法對噪聲和目標大小十分敏感,特別當背景和與目標的灰度差別不是太大時,往往不能得到好的分割效果,如圖3 的Ostu 閾值分割后的圖像可以,看出一條非常清楚裂紋。如圖2 所示迭代式閾值對圖像進行分割后的裂紋信息顯示出來了,但還是有噪音存在,這些噪音由路面圖像本身固有的特性產生的。故裂縫圖像數(shù)據(jù)分割處理方面,選擇Ostu 閾值分割最佳。
表1 不同方法對圖像分割后的PSNR 和RMSE
圖1 原始瀝青路面裂縫圖像
圖2 迭代式閾值分割圖像
圖4 最大熵閾值分割圖像
通過分析三種方法的原理,并采用實際的瀝青路面裂縫圖像進行對比實驗,得到了圖像分割的處理結果,獲得了以下的結論。
(1)最大熵閾值分割法對噪聲的敏感程度最高,目標圖像與背景分割的效果最差。
(2)迭代式閾值分割法的收斂速度最快,但圖像的噪音仍然較多。
(3)Ostu 閾值分割法的信噪比最高,均方根誤差最小,圖像分割效果最好。