邱 東 李佳禧 楊宏韜 劉克平
(長(zhǎng)春工業(yè)大學(xué)電氣與電子工程學(xué)院 吉林 長(zhǎng)春 130012)
圖像的最基本特征之一是圖像的邊緣[1],圖像邊緣檢測(cè)是圖像預(yù)處理和機(jī)器視覺中的最基本問題之一,被廣泛應(yīng)用在圖像壓縮、圖像分割和模式識(shí)別等相關(guān)領(lǐng)域,一直廣受關(guān)注[2]。1959年Julesz[3]首次提出了邊緣檢測(cè)這一概念,1965年Roberts[4]發(fā)表對(duì)邊緣檢測(cè)系統(tǒng)的研究論文,自此邊緣檢測(cè)的概念被大家所了解。后續(xù)學(xué)者又提出了以二階導(dǎo)數(shù)為基礎(chǔ)的邊緣檢測(cè)算子,如Laplacian算子、Marr-Hildreth算子[5]。近幾年,隨著圖像處理新技術(shù)的不斷發(fā)展,出現(xiàn)了諸如基于聯(lián)合統(tǒng)計(jì)學(xué)的邊緣檢測(cè)算法[6]、基于蟻群理論的檢測(cè)算法[7]等算法。
Canny邊緣檢測(cè)是從不同視覺對(duì)象中提取有用的結(jié)構(gòu)信息并大大減少要處理的數(shù)據(jù)量的一種技術(shù),目前已廣泛應(yīng)用于各種計(jì)算機(jī)視覺系統(tǒng)[8]。Sobel算子是一種結(jié)合了微分求導(dǎo)和高斯平滑,用于圖像邊緣檢測(cè)的離散微分算子,通常應(yīng)用于計(jì)算圖像灰度的近似梯度[9]。傳統(tǒng)邊緣檢測(cè)算子Canny、Sobel檢測(cè)精度有限,對(duì)噪聲的抗干擾性不高,由此引入圖像信息測(cè)度的理論[10],在邊緣點(diǎn)和非邊緣點(diǎn)的分類尺度上效果較好。
圖像的邊緣檢測(cè),在本質(zhì)上屬于將邊緣點(diǎn)和非邊緣點(diǎn)進(jìn)行分類的問題。本文結(jié)合核函數(shù)極限學(xué)習(xí)機(jī)(KELM)學(xué)習(xí)速度快和收斂速度快等優(yōu)點(diǎn)[11],提出了一種基于圖像信息測(cè)度和核函數(shù)極限學(xué)習(xí)機(jī)的圖像邊緣檢測(cè)方法(ISKELM)。實(shí)驗(yàn)結(jié)果表明,本文提出的基于核函數(shù)極限學(xué)習(xí)機(jī)的邊緣檢測(cè)方法相比傳統(tǒng)的Canny、Sobel算子,檢測(cè)得到的圖像邊緣更清晰,連續(xù)性更高,對(duì)噪聲的抵抗性更好。
圖像的噪聲點(diǎn)和邊緣點(diǎn),在本質(zhì)上具有明顯的特征區(qū)別:邊緣點(diǎn)具有結(jié)構(gòu)性的灰度突變,在其鄰域內(nèi)具有方向性的灰度分布;而噪聲點(diǎn)的灰度雖然也具有突變性,但它不具有邊緣點(diǎn)所具備的一些特征。
圖像的信息測(cè)度是度量一個(gè)小區(qū)域σ內(nèi)的圖像復(fù)雜程度的量,一般取σ為3~8個(gè)像素點(diǎn)的圓形區(qū)域。若圖像信息測(cè)度值較大,則圖像在σ區(qū)域內(nèi)存在邊緣;反之,圖像信息測(cè)度值較小,則圖像在σ區(qū)域內(nèi)無邊緣。
設(shè)圖像灰度對(duì)應(yīng)為f(x,y),當(dāng)前像素點(diǎn)的坐標(biāo)為(x0,y0),以點(diǎn)(x0,y0)為中心的鄰域?yàn)棣?,ρ表示鄰域半徑,則滿足:
σ={(x,y)||x-x0|≤ρ,|y-y0|≤ρ}
直線l為經(jīng)過像素點(diǎn)(x0,y0),并且角度為θ∈(0°,180°)的一條直線,將區(qū)域σ分成σ1、σ2兩部分,如圖1所示。
圖1 σ區(qū)域示意圖
現(xiàn)構(gòu)造如下定義圖像信息測(cè)度參數(shù),計(jì)算圖像在σ區(qū)域的邊緣信息。
在圖像中,邊緣點(diǎn)的結(jié)構(gòu)性特征是邊緣點(diǎn)和非邊緣點(diǎn)的一個(gè)顯著差別,(x0,y0)點(diǎn)的結(jié)構(gòu)性邊緣信息測(cè)度C(x0,y0)定義如下:
(1)
式中:點(diǎn)(x,y)∈lk;g(x,y)為點(diǎn)(x,y)的梯度幅值:
(2)
若邊緣軌跡經(jīng)過該鄰域內(nèi)的中心像素點(diǎn),當(dāng)直線L與圖像的邊緣軌跡重合,C(x0,y0)取得極大值,由于邊緣點(diǎn)的結(jié)構(gòu)性特點(diǎn),邊緣點(diǎn)的梯度值比較接近,沿邊緣的梯度值基本相同;若處在平滑區(qū),L在任何方向的C(x0,y0)值都比較接近,同樣與該點(diǎn)的梯度近似相等;若為噪聲區(qū),C(x0,y0)所具有的平均作用可以將梯度強(qiáng)度降低。
由此看出,C(x0,y0)所具有的平均作用能夠有效削弱噪聲的影響。
邊緣點(diǎn)所具有的方向性,為邊緣點(diǎn)的顯著特點(diǎn)之一,點(diǎn)(x0,y0)的方向性信息測(cè)度為:
(3)
如果點(diǎn)(x0,y0)在圖像的邊緣區(qū)域,則O(x0,y0)值較大;如果點(diǎn)(x0,y0)在圖像的平滑區(qū)域,則O(x0,y0)值較小。
圖像的邊緣點(diǎn)與非邊緣點(diǎn)的灰度分布,在其各自的鄰域內(nèi)不同,圖像的邊緣將邊緣點(diǎn)的鄰域分成灰度不相同的兩個(gè)區(qū)域,非邊緣點(diǎn)在其鄰域內(nèi)的灰度分布單一,根據(jù)這一特點(diǎn),構(gòu)造鄰域一致性邊緣信息測(cè)度。
點(diǎn)(x0,y0)的鄰域一致性邊緣信息測(cè)度為:
k=0,1,2,…,n
(4)
σ1k區(qū)域中的全部像素點(diǎn)的灰度值之和為:
(5)
σ2k區(qū)域中的所有像素點(diǎn)的灰度值之和為:
(6)
式中:fσ1k、fσ2k表示σ1k、σ2k兩個(gè)區(qū)域內(nèi)的所有像素點(diǎn)的灰度值之和。
R(x0,y0)能夠反映出圖像邊緣點(diǎn)的灰度值在其鄰域內(nèi)的分布情況。在邊緣區(qū),R(x0,y0)值較大;在非邊緣區(qū),R(x0,y0)值較小。
2004年黃廣斌教授提出了一種單隱含層神經(jīng)網(wǎng)絡(luò)——極限學(xué)習(xí)機(jī)(ELM),彌補(bǔ)了人工神經(jīng)網(wǎng)絡(luò)(ANN)訓(xùn)練時(shí)間較長(zhǎng)的缺陷,能夠以極快的訓(xùn)練速度達(dá)到較好的泛化性能。極限學(xué)習(xí)算法原理如圖2所示。
圖2 極限學(xué)習(xí)機(jī)原理圖
其中X為輸入矩陣,表示為:
(7)
設(shè)輸入層、隱含層的層間的權(quán)值為θ,隱含層節(jié)點(diǎn)的閾值表示為b,其表達(dá)式為:
(8)
輸出層于隱含層之間的連接權(quán)值為β,其表達(dá)式為:
(9)
設(shè)隱含層的輸出矩陣為H,激活函數(shù)為g(x),則:
(10)
極限學(xué)習(xí)機(jī)ELM的網(wǎng)絡(luò)輸出T表示為:
T=[t(1),t(2),…,t(N)]T
(11)
綜上可得:
Hβ=T
(12)
樣本X對(duì)應(yīng)于的目標(biāo)輸出Y,其表達(dá)式為:
(13)
極限學(xué)習(xí)機(jī)ELM的輸出方程為:
(14)
當(dāng)使用極限學(xué)習(xí)機(jī)處理分類問題時(shí),決策方程可改寫為:
(15)
算法步驟如下:
對(duì)于任意訓(xùn)練集:
N={(xj,tj)|xi∈Rn,tj∈Rm,j=1,2,…,N}
(16)
(1) 已知隱含節(jié)點(diǎn)的輸出函數(shù)G(?i,bi,x),i=1,2,…,L,L是隱含節(jié)點(diǎn)的數(shù)量。
(2) 隨機(jī)設(shè)置隱含節(jié)點(diǎn)參數(shù)(?i,bi),i=1,2,…,L。
(3) 計(jì)算隱含層輸出矩陣H。
(4) 計(jì)算輸出權(quán)重向量β:β=H+T,其中:H+是H的MP廣義逆矩陣。
傳統(tǒng)極限學(xué)習(xí)機(jī)采取隨機(jī)映射方式,在極限學(xué)習(xí)機(jī)(ELM)中引入核函數(shù),構(gòu)造核極限學(xué)習(xí)機(jī),簡(jiǎn)稱KELM,解決了由于隨機(jī)給定隱含層參數(shù)所導(dǎo)致的穩(wěn)定性差的問題,并且不需要知道隱含層的特征映射維數(shù),直接通過核函數(shù)點(diǎn)乘的方式就可以得出結(jié)果,大大減輕了計(jì)算量。
隱含層輸出矩陣H可簡(jiǎn)寫為:
(17)
每個(gè)樣本x(i)由Q維空間映射成為L(zhǎng)維特征空間是由函數(shù)g(x(i))完成的,當(dāng)這個(gè)映射未知時(shí)可以采用核函數(shù)取代HHT,表示為:
K(x(i),x(j))=HHT=
ψELM
(18)
g(x)HT可表示為:
g(x)HT=[K(x,x(1)),K(x,x(2)),…,K(x,x(N))]
(19)
綜上,式(19)可以表示為:
(20)
M符合MERCER定理的函數(shù)均可用作極限學(xué)習(xí)機(jī)ELM的核函數(shù),常見的核函數(shù)有:
(1) 線性核函數(shù):
KLINE=K(x,x(i))=xT·x(i)
(2) 多項(xiàng)式核函數(shù):
KPOLY=K(x,x(i))=(x·x(i)+1)dd=1,2,…,N
(3) 高斯核函數(shù):
常見的高斯函數(shù)是核函數(shù)值的取值范圍在[0,1]的函數(shù),結(jié)合高斯函數(shù)平滑且抗干擾性較強(qiáng)這兩個(gè)優(yōu)勢(shì),一般分類器若采用核函數(shù)的方法,優(yōu)先選用高斯核函數(shù)?;诖?,本文采用高斯核函數(shù)與極限學(xué)習(xí)機(jī)相結(jié)合,對(duì)圖像邊緣進(jìn)行提取。
基于前面引入的圖像邊緣信息測(cè)度:結(jié)構(gòu)信息測(cè)度C(x0,y0)、方向信息測(cè)度O(x0,y0)、鄰域一致性測(cè)度R(x0,y0),組成了描述邊緣信息的特征分量,將邊緣信息的特征分量表示為:
I(x0,y0)={R(x0,y0),O(x0,y0),C(x0,y0)}
(21)
將特征分量I作為核函數(shù)極限學(xué)習(xí)機(jī)(KELM)的訓(xùn)練矢量,完成訓(xùn)練后,將核極限學(xué)習(xí)機(jī)直接用于圖像的邊緣檢測(cè),具體流程如下:
1) 選取一幅圖片作為訓(xùn)練用圖,采用人工干預(yù)的方法去除噪聲和虛假邊緣,得到樣本圖片的邊緣圖像,并保留清晰的邊緣;
2) 對(duì)所保留的每一邊緣點(diǎn)計(jì)算邊緣信息的特征分量I(x0,y0),作為訓(xùn)練樣本;
3) 將同等數(shù)目的邊緣點(diǎn)和非邊緣點(diǎn)隨機(jī)抽取,并將邊緣點(diǎn)編碼為1,非邊緣點(diǎn)編碼為0;
4) 對(duì)核函數(shù)極限學(xué)習(xí)機(jī)進(jìn)行訓(xùn)練;
5) 將訓(xùn)練完成后的核函數(shù)極限學(xué)習(xí)機(jī)用于其他圖像的邊緣提取。
算法流程如圖3所示。
圖3 算法流程圖
為驗(yàn)證本文中算法的有效性,實(shí)驗(yàn)選取了三幅數(shù)字圖像處理技術(shù)中常用的圖片進(jìn)行處理,如圖4所示。
(a) Rose (b) Lena
(c) House圖4 待檢測(cè)圖像
對(duì)上述三幅測(cè)試用圖,分別采用Canny算子、Sobel算子、極限學(xué)習(xí)機(jī)(ELM)、核函數(shù)極限學(xué)習(xí)機(jī)檢測(cè)(ISKELM)的方法進(jìn)行圖像邊緣提取,得到的結(jié)果如圖5-圖7所示。
圖5 Rose邊緣檢測(cè)結(jié)果
圖6 Lena邊緣檢測(cè)結(jié)果
圖7 House邊緣檢測(cè)結(jié)果
可以看出,ELM、ISKELM以及Canny、Sobel算子均可以對(duì)待檢測(cè)的邊緣實(shí)現(xiàn)檢測(cè),但是基于核函數(shù)學(xué)習(xí)機(jī)的檢測(cè)(ISKELM)所得到的邊緣軌跡更加清晰,虛假邊緣大大減少,抗噪聲能力更強(qiáng),邊緣圖像更加清晰,紋理性更強(qiáng)。
邊緣點(diǎn)的位置精度、邊緣的寬度以及邊緣的連續(xù)性可以衡量判斷圖像邊緣檢測(cè)的性能,在此引入文獻(xiàn)[12]提出的評(píng)價(jià)邊緣檢測(cè)性能的標(biāo)準(zhǔn)度量F,定義為:
(22)
式中:ID表示理想的邊緣像素個(gè)數(shù);IL表示實(shí)際檢測(cè)到的邊緣像素個(gè)數(shù);Ii表示被檢測(cè)到為邊緣點(diǎn)與最近的理想邊緣點(diǎn)的距離;α為取值[0,1]之間的懲罰因子。實(shí)驗(yàn)中采用該衡量標(biāo)準(zhǔn)的標(biāo)準(zhǔn)測(cè)試圖像,如圖8所示,該測(cè)試圖像邊緣信息已知,將不同算法對(duì)實(shí)驗(yàn)用圖像進(jìn)行檢測(cè),與標(biāo)準(zhǔn)測(cè)試圖像的邊緣特性進(jìn)行比較,可以得出每個(gè)算法的邊緣檢測(cè)性能指標(biāo)F。通過F的取值可以反映出邊緣檢測(cè)性能的優(yōu)劣,F(xiàn)值越接近1,說明該檢測(cè)方法的邊緣提取效果越好。
圖8 度量F邊緣提取性能測(cè)試標(biāo)準(zhǔn)圖
圖9反映了不同邊緣檢測(cè)算子的性能評(píng)價(jià)度量F隨信噪比的變化,可以看出,基于信息測(cè)度和核函數(shù)極限學(xué)習(xí)機(jī)的邊緣檢測(cè)(ISKELM)的檢測(cè)效果優(yōu)于Canny和Sobel算子,也優(yōu)于基于ELM的邊緣提取。
(a) α取值0.1時(shí)性能比較
(b) α取值0.9時(shí)性能比較圖9 度量F隨信噪比SNR的變化折線圖
圖像邊緣檢測(cè)是機(jī)器視覺中重要的概念之一,傳統(tǒng)的邊緣檢測(cè)算子如Canny、Sobel算子的檢測(cè)精度有限,對(duì)噪聲的敏感度較高。本文提出了一種基于信息測(cè)度和核函數(shù)極限學(xué)習(xí)機(jī)的圖像邊緣檢測(cè)方法,該方法基于數(shù)學(xué)測(cè)度概念,構(gòu)造了一個(gè)描述邊緣點(diǎn)信息測(cè)度的特征矢量,運(yùn)用核函數(shù)極限學(xué)習(xí)機(jī)對(duì)特征矢量樣本數(shù)據(jù)集進(jìn)行分類訓(xùn)練,實(shí)現(xiàn)了邊緣檢測(cè)的功能。實(shí)驗(yàn)結(jié)果表明,相比傳統(tǒng)邊緣檢測(cè)算子如Canny算子和Sobel算子,本文方法提取的圖像邊緣更加清晰,對(duì)于噪聲的抑制抵抗能力更強(qiáng),虛假邊緣大大減少。