李文生,原 達(dá),苗 翠,王冬雨
基于多標(biāo)簽層次聚類的GPR圖像雙曲波提取方法
李文生,原 達(dá),苗 翠,王冬雨
(山東工商學(xué)院智能信息處理重點(diǎn)實(shí)驗(yàn)室,山東 煙臺(tái) 264005)
探地雷達(dá)(GPR)圖像雙曲波提取是分析地下目標(biāo)位置和結(jié)構(gòu)的重要方法,但在真實(shí)環(huán)境中,由于噪聲和雜波的干擾,使得提取出的雙曲波存在結(jié)構(gòu)不完整、碎片化和形狀異常等問(wèn)題,不利于數(shù)據(jù)分析和三維建模等后續(xù)操作。為此,提出了一種基于多標(biāo)簽層次聚類的雙曲波提取方法(MHCE)。首先通過(guò)信息熵評(píng)價(jià)像素鄰域的穩(wěn)定性,構(gòu)造了基于信息熵的距離度量來(lái)進(jìn)行層次聚類;然后利用聚類后的鄰接空間進(jìn)行多標(biāo)簽聚類以降低雜波和噪聲對(duì)雙曲波提取的影響;最后結(jié)合多標(biāo)簽聚類結(jié)果的擬合形狀和紋理方向提取雙曲波。實(shí)驗(yàn)表明,該方法對(duì)于真實(shí)GPR圖像雙曲波具有較好的魯棒性,能夠獲得規(guī)范化的雙曲波形狀和位置參數(shù)。
探地雷達(dá)圖像;雙曲波;信息熵;多標(biāo)簽層次聚類;魯棒性
探地雷達(dá)(ground penetrating radar,GPR)作為一種探測(cè)介質(zhì)內(nèi)部特性和分布規(guī)律的無(wú)損探測(cè)方法,已被廣泛應(yīng)用于建筑、采礦、環(huán)保、考古、市政工程、軍事等領(lǐng)域[1-3]。對(duì)GPR圖像雙曲波的提取有助于精確推斷地下埋藏物內(nèi)部結(jié)構(gòu)和目標(biāo)的深度、形狀等重要信息。在真實(shí)環(huán)境中,GPR所接收到的信號(hào)十分復(fù)雜,雙曲波提取受到了諸多因素的影響。首先,電臺(tái)、無(wú)線電廣播等信號(hào)源發(fā)射的無(wú)線信號(hào)可以使GPR圖像中形成許多排列緊密的小型雜波,雜波過(guò)多會(huì)模糊其他雙曲波的波形。尤其是在天線附近,磁場(chǎng)影響嚴(yán)重,極易導(dǎo)致GPR圖像中的數(shù)據(jù)發(fā)生錯(cuò)位或部分丟失。同時(shí),脈沖余振、系統(tǒng)內(nèi)部干擾、地表不光滑或地下介質(zhì)不均勻等引起的散射以及剖面旁側(cè)的繞射等都會(huì)在圖像中形成雜波[4],影響圖像質(zhì)量。其次,在采集過(guò)程中,雙曲波的形狀和清晰度容易受到采集速度和深度的影響。采集速度過(guò)快會(huì)導(dǎo)致雙曲波波形過(guò)寬。并且隨著探測(cè)深度的增加,信號(hào)振幅相應(yīng)地減小[5],導(dǎo)致雙曲波的清晰度逐漸降低。最后,不同結(jié)構(gòu)的地下介質(zhì)會(huì)使圖像產(chǎn)生不同類型的噪聲,如雪花噪聲、高斯噪聲等[6]。這些問(wèn)題為建立完整的GPR圖像樣本集和在真實(shí)環(huán)境中進(jìn)行雙曲波提取帶來(lái)了挑戰(zhàn)。
許多基于有監(jiān)督學(xué)習(xí)的雙曲波提取方法憑借準(zhǔn)確和魯棒的特點(diǎn)受到了廣泛的關(guān)注。TORRIONE等[7]使用支持向量機(jī)(support vector machine,SVM)和HOG特征進(jìn)行GPR圖像雙曲波識(shí)別并取得了較好的效果。TBARKI等[8]提出使用OSVM (one-class SVM)進(jìn)行GPR圖像地雷檢測(cè),表明OSVM在數(shù)據(jù)類別不平衡時(shí)由較大優(yōu)勢(shì)。GIOVANNESCHI等[9]使用字典學(xué)習(xí)方法獲取了GPR數(shù)據(jù)的稀疏表示,并利用SVM進(jìn)行雙曲波識(shí)別,提高了雙曲波提取的準(zhǔn)確度。MISSAOUI等[10]考慮到不同干擾源對(duì)應(yīng)的雜波類型不同,提出MDHMM算法通過(guò)融合不同類型的雜波實(shí)現(xiàn)高檢測(cè)和低誤報(bào)率。ZHANG等[11]利用Gibbs sampling獲取模型參數(shù),在初始化參數(shù)方面具有更強(qiáng)的魯棒性。MANANDHAR等[12]將隱馬爾可夫模型(hidden Markov model,HMM)與多示例學(xué)習(xí)框架(multiple-Instance learning,MIL)結(jié)合進(jìn)行雙曲波識(shí)別,并使用貝葉斯方法推測(cè)HMM參數(shù)以提高識(shí)別性能。盡管HMM在雙曲波識(shí)別中可以取得較好的識(shí)別效果,但其參數(shù)初始值對(duì)識(shí)別效果影響較大。此外,MAAS和SCHMALZL[13]也將神經(jīng)網(wǎng)絡(luò)(neural network,NN)[14]用于雙曲波識(shí)別。有監(jiān)督學(xué)習(xí)使用訓(xùn)練模型識(shí)別雙曲波,具有較強(qiáng)的魯棒性及泛化能力,然而這類方法對(duì)特征提取質(zhì)量要求較高,特征提取的效果會(huì)直接影響模型的識(shí)別性能。
MAAS和SCHMALZL[13,1]使用Hough變換擬合目標(biāo)參數(shù)以提取雙曲波。Hough變換通過(guò)在參數(shù)空間中投票來(lái)確定目標(biāo)參數(shù),該方法擁有較高的擬合精度,但時(shí)間復(fù)雜度高。DOU等[15]根據(jù)列間的連接情況對(duì)像素聚類,將其結(jié)果從波谷分裂為多個(gè)簇,并根據(jù)各簇的形狀特征進(jìn)行雙曲波提取。該算法具有較高的準(zhǔn)確率,但只考慮了形狀特征,雙曲波提取時(shí)容易受到噪聲的干擾。在此基礎(chǔ)上,KAFEDZISKI等[16]結(jié)合Hough和DOU等[15]提出的聚類算法在純凈的GPR數(shù)據(jù)中取得了較高的準(zhǔn)確率,但該算法在真實(shí)GPR中受噪聲和雜波的影響較大。ZHOU等[17]考慮了雙曲波間存在相交部分的情況,提出了OSCA算法進(jìn)行雙曲波提取,該方法在只具有少量雜波和噪聲的GPR圖像中取得了較高的準(zhǔn)確度,但存在噪聲干擾時(shí)很難提取完整的雙曲波。
基于多標(biāo)簽層次聚類的雙曲波提取算法(multi- label hierarchical clustering-based hyperbola extraction method,MHCE)的實(shí)現(xiàn)分為預(yù)處理、多標(biāo)簽層次聚類、雙曲波提取3個(gè)階段,如圖1所示,第1階段結(jié)合引導(dǎo)圖濾波[18]和最大類間方差法(Otsu)[19]獲取了圖像的二值圖;第2階段為層次聚類算法構(gòu)造了基于信息熵的距離度量,并基于聚類結(jié)果的鄰接空間提取與雙曲波具有相同鄰接結(jié)構(gòu)的像素子集;第3階段結(jié)合像素子集的擬合形狀和紋理方向進(jìn)行雙曲波提取。MHCE的核心是多標(biāo)簽層次聚類算法,該算法能夠去除不符合雙曲波數(shù)據(jù)分布特性的像素子集,減小雙曲波提取階段的計(jì)算量,并提高雙曲波提取的準(zhǔn)確率。
本文為層次聚類算法構(gòu)造了基于信息熵的距離度量,并利用聚類結(jié)果的鄰接空間進(jìn)行多標(biāo)簽聚類。多標(biāo)簽聚類之后,任何與雙曲波的鄰接結(jié)構(gòu)相同的像素子集將被賦予一個(gè)標(biāo)簽,部分像素?fù)碛械臉?biāo)簽數(shù)量不止一個(gè)。
圖1 算法流程圖
1.1.1 基于信息熵的距離度量
本文使用信息熵評(píng)價(jià)像素鄰域的穩(wěn)定性,并將其作為層次聚類算法的距離度量。本節(jié)首先定義了分支和行段的概念,然后介紹了如何使用信息熵評(píng)價(jià)像素鄰接空間的穩(wěn)定性,并在最后給出了基于信息熵的層次聚類算法的實(shí)現(xiàn)流程。
對(duì)于任意2個(gè)擁有不同形狀的像素集合,其分支間相同的鄰接方向?qū)?yīng)鄰接空間的結(jié)構(gòu)可能不同,如圖2所示,當(dāng)分支在水平方向存在鄰接關(guān)系時(shí),雙曲波和非雙曲波分支的鄰接空間是相同的,然而當(dāng)分支在豎直方向存在鄰接關(guān)系時(shí),雙曲波分支的鄰接空間呈等腰三角形,但非雙曲波的鄰接空間呈直線型。顯然使分支在豎直方向存在鄰接關(guān)系能夠更好地提取目標(biāo)。
為了保證分支間的鄰接方向是豎直的,定義了行段的概念,并利用行段獲取分支。
圖2 分支劃分示意圖((a1)和(a2)為豎直方向存在鄰接關(guān)系的雙曲波和鄰接空間;(b1)和(b2)為水平方向存在鄰接關(guān)系的雙曲波和鄰接空間;(c1)和(c2)為豎直方向存在鄰接關(guān)系的非雙曲波和鄰接空間;(d1)和(d2)為水平方向存在鄰接關(guān)系的非雙曲波和鄰接空間)
如圖3所示,圖中共包含9個(gè)數(shù)據(jù)點(diǎn),由于數(shù)據(jù)左右位置無(wú)相鄰數(shù)據(jù),因此無(wú)法構(gòu)成行段。數(shù)據(jù),的橫坐標(biāo)順序相連,因此,構(gòu)成了一個(gè)行段1,同樣的,數(shù)據(jù),和數(shù)據(jù),,,分別構(gòu)成了2個(gè)行段2,3。對(duì)于行段1和3,由于1中數(shù)據(jù),分別與3中數(shù)據(jù),的橫坐標(biāo)相同,縱坐標(biāo)順序相連,因此1與3互為鄰接行段,而2與1,3中數(shù)據(jù)不相鄰,因此2沒(méi)有鄰接行段。由于行段間只在豎直方向才具有鄰接關(guān)系,因此將行段作為分支的基本單元能夠令分支間只在豎直方向存在鄰接關(guān)系。
圖3 行段與鄰接行段示意圖
為了能夠準(zhǔn)確地獲得分支,定義了一個(gè)基于信息熵的距離度量。對(duì)于任意類別C,如果存在與其具有鄰接關(guān)系的類別C,則使用下式計(jì)算兩者間的距離
其中,N為C在C方向上相鄰類的數(shù)量;N為C在C方向上相鄰類的數(shù)量,并且如果C水平方向存在相鄰類或豎直方向存在多個(gè)相鄰類,同時(shí)C是C豎直方向的相鄰類,則=1,否則=0。
本文使用層次聚類算法對(duì)數(shù)據(jù)集進(jìn)行聚類,并將數(shù)據(jù)集中的每個(gè)像素看作一個(gè)單獨(dú)的類,即={1,2,···,C},聚類后將中的每個(gè)類C看作一個(gè)分支B。層次聚類算法如下:
Algoritm: hierachical clustering based on information entropy Input: dataset D Define: dis(Ci,Cj) means calculating the distance between Ci and Cj using formula (1),Dis(i) includes the distance of Ci and other classes Key =true WhileKey Key=false fori from 1 to D_Class_Num Searching classes that adjacent to Ci and comprising D′ for j from 1 to D′_Class_Num =dis(Ci,Cj) end =min(Dis(i)); =argmin(Dis(i)); if =min()and =argmin() combing Ci and Cj, update D Key=true end end end Output: dataset D with Ci
1.1.2 多標(biāo)簽聚類
層次聚類之后,構(gòu)造聚類結(jié)果的鄰接空間,構(gòu)造過(guò)程中將每個(gè)分支看作一個(gè)“節(jié)點(diǎn)”,如果2分支間存在鄰接行段,則連接對(duì)應(yīng)的2個(gè)節(jié)點(diǎn)。本文利用該空間獲取與雙曲波具有相同鄰接空間的像素子集,并為各子集中的分支分配標(biāo)簽,屬于相同像素子集的分支具有相同的標(biāo)簽,由于鄰接空間的結(jié)構(gòu)復(fù)雜多樣,因此同一分支可能會(huì)被分配多個(gè)標(biāo)簽。如圖4所示,對(duì)圖4(a)中的數(shù)據(jù)進(jìn)行層次聚類,將聚類結(jié)果中的每類看作一個(gè)分支,圖4(b)展示了聚類得到的8個(gè)分支{1,2,···,8},根據(jù)分支的鄰接空間構(gòu)造多叉樹(shù)(圖4(c)),樹(shù)中共包含4個(gè)二叉分枝:{1,4,5},{1,4,6},{1,5,6},{4,7,8}。對(duì)于任意二叉分枝,如果其孩子節(jié)點(diǎn)的數(shù)據(jù)量之和與父節(jié)點(diǎn)數(shù)據(jù)量的比例小于,則提取此二叉分枝。閾值的作用是去除噪聲過(guò)多的數(shù)據(jù)集合,通常是一個(gè)較小的值,如{1,5,6}中5,6包含數(shù)據(jù)量與1的比值如果小于閾值,那么此二叉分枝的形狀更傾向于直線型,不符合雙曲波的形狀特性,對(duì)于降低計(jì)算量,提高運(yùn)算效率有重要意義。
值得注意的是,提取二叉分枝會(huì)受到大量的干擾,這些干擾可能來(lái)自于雜波和噪聲,也可能來(lái)自于其他雙曲波。
如圖5(a1)為2個(gè)有重疊部分的雙曲波,藍(lán)色區(qū)域表示提取到的二叉分枝。
圖5中紅色曲線為標(biāo)準(zhǔn)的擬合曲線,藍(lán)色曲線為最小二乘法的擬合結(jié)果,可以看出修整前數(shù)據(jù)的擬合誤差率較高(圖5(a2)),因?yàn)榫嚯x計(jì)算是根據(jù)數(shù)據(jù)與當(dāng)前迭代曲線的縱坐標(biāo)差值得到的。為了降低擬合誤差,使用單位矩陣修整各聚類結(jié)果,使用所有值等于1的單位矩陣,即
其中,矩陣的維度與分支中最底端行段所包含像素的數(shù)目相同,本文使用該矩陣與分支底端的像素進(jìn)行或運(yùn)算以完善雙曲波像素集合,修整結(jié)果如圖5(b2)所示,修整后數(shù)據(jù)的擬合曲線更接近于標(biāo)準(zhǔn)的擬合曲線。
使用多標(biāo)簽層次聚類獲取的像素子集與雙曲波鄰接空間的結(jié)構(gòu)相同,本文使用最小二乘法和灰度共生矩陣提取了各子集的形狀和紋理特征,并結(jié)合兩特征進(jìn)行雙曲波提取。由于雙曲波的形狀均是開(kāi)口向下的,可使用最小二乘法擬合像素子集,并利用擬合結(jié)果提取數(shù)據(jù)的形狀特征,即
擬合之后,以頂點(diǎn)所在列為中心,獲取其左右兩側(cè)到曲線之間都存在數(shù)據(jù)的行,記這些行的數(shù)據(jù)量之和為A。計(jì)算該數(shù)據(jù)集的置信度為
圖5 二叉分枝的修整效果比較((a1)和(a2)修整前的二叉分枝及其擬合結(jié)果;(b1)和(b2)修整后的二叉分枝及其擬合結(jié)果)
其中,()為曲線之間的各行的數(shù)據(jù)量之和與長(zhǎng)度之和的比例。
為了更準(zhǔn)確地計(jì)算雙曲波置信度,使用多級(jí)閾值分割候選數(shù)據(jù)所在的矩形區(qū)域,并對(duì)各分割結(jié)果使用如下公式進(jìn)行聚類。聚類時(shí)順序選擇分割結(jié)果中的數(shù)據(jù),其數(shù)據(jù)分配類別為
其中,p為當(dāng)前數(shù)據(jù);為3階單位陣;?為運(yùn)算。
其中,max()為最大類別值。
聚類結(jié)束之后,從每個(gè)分割結(jié)果中提取與候選數(shù)據(jù)存在交集的類以構(gòu)成多級(jí)閾值空間,空間的層數(shù)等于閾值個(gè)數(shù),每層的數(shù)據(jù)為各級(jí)閾值下提取的各個(gè)類。
計(jì)算空間中每層數(shù)據(jù)的置信度,取數(shù)據(jù)集的最終置信度為
從多級(jí)閾值空間提取的特征能夠有效地判斷數(shù)據(jù)集的形狀,為了進(jìn)一步降低復(fù)雜紋理對(duì)上述特征的影響,通過(guò)ZHENG等[20]利用灰度共生矩陣判斷紋理方向的方法提取了一個(gè)二維特征。對(duì)于任意數(shù)據(jù)子集′,首先獲取其頂點(diǎn),即
其中,N,N為滿足條件的數(shù)據(jù)量;P,P為頂點(diǎn)的橫縱坐標(biāo)。
以頂點(diǎn)為邊界,將數(shù)據(jù)切分為2個(gè)子數(shù)據(jù)集,計(jì)算其紋理方向?yàn)?/p>
當(dāng)提取的每個(gè)雙曲波屬于不同的連通區(qū)域,部分雙曲波可能存在結(jié)構(gòu)不完整、碎片化和形狀異常等現(xiàn)象。為此,在提取各雙曲波*對(duì)應(yīng)的擬合曲線并進(jìn)行膨脹操作時(shí),通過(guò)去除膨脹區(qū)域之外的雙曲波像素來(lái)修整雙曲波,并通過(guò)對(duì)修整后的目標(biāo)和膨脹區(qū)域進(jìn)行或運(yùn)算來(lái)提高雙曲波的完整性。
為驗(yàn)證MHCE算法的有效性,本文分析了MHCE每步的效果,并與其他算法進(jìn)行了性能比較。
使用實(shí)際應(yīng)用場(chǎng)景中采集的真實(shí)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)分析。所用數(shù)據(jù)由627道數(shù)據(jù)組成,每道采樣點(diǎn)個(gè)數(shù)為400 (圖6)。圖中共包含5個(gè)雙曲波,分別屬于3個(gè)不同的地下管道。
圖6 GPR圖像
預(yù)處理過(guò)程采用引導(dǎo)濾波處理GPR圖像,并使用最大類間方差法對(duì)濾波后的圖像進(jìn)行二值化。其中引導(dǎo)濾波的引導(dǎo)圖為其本身,局部窗口半徑為16,正則化參數(shù)為0.01。結(jié)果如圖7所示。
圖7 預(yù)處理結(jié)果
為驗(yàn)證多標(biāo)簽層次聚類算法的有效性,分別對(duì)算法中基于信息熵的層次聚類和多標(biāo)簽聚類2個(gè)模塊進(jìn)行了分析。
2.2.1 基于信息熵的層次聚類效果分析
圖8為預(yù)處理后數(shù)據(jù)的層次聚類結(jié)果,其中相鄰的分支由2種不同的顏色表示。可以看出,圖中的每個(gè)雙曲波各包含3個(gè)分支,其構(gòu)成的鄰接空間呈等腰三角形。
圖8 基于信息熵的層次聚類結(jié)果
2.2.2 多標(biāo)簽聚類效果分析
層次聚類之后,使用多標(biāo)簽聚類獲取鄰接空間呈等腰三角形的像素子集。圖9為部分區(qū)域的多標(biāo)簽聚類結(jié)果。圖9(a)為圖8中的部分像素子集的放大圖,其中包含15個(gè)分支,構(gòu)造的鄰接空間如圖9(b)所示,空間中共包含4個(gè)二叉分枝,提取并修整這些二叉分枝作為多標(biāo)簽聚類的結(jié)果(圖9(c)),可見(jiàn)本方法提取的雙曲波和非雙曲波像素子集在形狀上存在較大差異,這可以提高雙曲波提取步驟的準(zhǔn)確率。圖10為二叉分枝提取的整體效果,結(jié)果表明此過(guò)程可以成功提取所有雙曲波,且所提取雙曲波兩側(cè)包含的噪聲量很少,證明使用該方法可以降低對(duì)雙曲波半徑的擬合誤差。
得到二叉分枝之后,需要對(duì)其進(jìn)行修整以完善雙曲波像素集合和提高擬合精度,效果如圖11所示,對(duì)雙曲波進(jìn)行修整之后,其兩側(cè)分支的像素集合得到了一定的完善。越完整的像素集合對(duì)于數(shù)據(jù)分析、三維建模等操作的幫助越大,并且可以提高對(duì)雙曲波的擬合精度。
圖9 二叉分枝提取效果((a)多標(biāo)簽聚類結(jié)果;(b)鄰接空間;(c) 二叉分枝提取結(jié)果)
圖10 二叉分枝提取整體效果
圖11 二叉分枝修整效果((a1)和(b1)修整前效果;(a2)和(b2)修整后效果)
為了準(zhǔn)確地評(píng)估修整過(guò)程對(duì)于雙曲波擬合精度的貢獻(xiàn),使用最小二乘法比較了修整前后的擬合誤差,見(jiàn)表1,修整后的擬合誤差相對(duì)修整前有了一定幅度的降低,表明此過(guò)程可以提高對(duì)雙曲波的擬合精度。
此外,結(jié)果表明多標(biāo)簽層次聚類可以獲取雙曲波像素子集,并且受到鄰接空間的限制,兩側(cè)的噪聲對(duì)提取結(jié)果的影響很小,同時(shí)二叉分枝的修整過(guò)程可以完善像素集合,有助于數(shù)據(jù)分析、三維建模等操作,且擬合修整后的二叉分枝擁有更低的擬合誤差。
表1 二叉分枝修整擬合誤差(%)
圖12為MHCE算法提取到的初始雙曲波,可以看出圖中成功提取了5個(gè)雙曲波,但1號(hào)和3號(hào)區(qū)域中的雙曲波分別存在形狀異常和結(jié)構(gòu)不完整的情況。為此,在提取各雙曲波的擬合曲線時(shí),可利用擬合曲線處理雙曲波碎片化、結(jié)構(gòu)不完整和形狀異常等問(wèn)題。
圖12 MHCE提取的初始雙曲波
得到擬合曲線之后,使用膨脹后的擬合曲線完善結(jié)構(gòu)不完整、形狀異常的雙曲波,結(jié)果如圖13所示,1號(hào)和3號(hào)區(qū)域中雙曲波的形狀被規(guī)范化,此外,本文使用SHIHAB和AL-NUAIMY[21]提出的方法比較了規(guī)范化前后的擬合誤差,見(jiàn)表2。結(jié)果顯示規(guī)范化前后對(duì)雙曲波的擬合誤差不大,且部分規(guī)范化后的擬合誤差呈現(xiàn)出輕微的下降趨勢(shì),表明MHCE可以提取規(guī)范化的雙曲波,且規(guī)范化操作對(duì)擬合精度的影響較小。
圖13 MHCE的提取結(jié)果
為了更準(zhǔn)確地評(píng)價(jià)MHCE算法的性能。本文在預(yù)處理后的二值圖(圖7)中使用C3[15],OSCA[17],Hough[14]提取雙曲波,并與MHCE算法的性能進(jìn)行了比較。圖7中包含的5條雙曲波分別屬于4個(gè)不同的類型,如3號(hào)和4號(hào)雙曲波周圍只含有少量的噪聲。1號(hào)和2號(hào)雙曲波周圍含有較多的噪聲,其中1號(hào)周圍的噪聲多集中于上方和左側(cè),2號(hào)周圍的噪聲則主要分布在左右兩側(cè)。此外,5號(hào)雙曲波左側(cè)分支擁有的像素?cái)?shù)量較少,增加了雙曲波提取的難度。圖中雙曲波類型復(fù)雜多樣,因此使用該圖進(jìn)行評(píng)價(jià)有較強(qiáng)的說(shuō)服力。本節(jié)比較了各算法的擬合精度和相應(yīng)的運(yùn)行時(shí)間,為保證實(shí)驗(yàn)結(jié)果的有效性,所有算法均在同一臺(tái)計(jì)算機(jī)中完成,計(jì)算機(jī)使用的CPU為Intel i7,內(nèi)存為16 G。結(jié)果見(jiàn)表3,表中的空白區(qū)域表示對(duì)應(yīng)的算法沒(méi)有成功提取到相應(yīng)雙曲波。
在4種算法中Hough的擬合時(shí)間最長(zhǎng),圖14展示了設(shè)置曲率在[50,110]之間時(shí),擬合時(shí)間和步長(zhǎng)之間的關(guān)系(本實(shí)驗(yàn)設(shè)置Hough步長(zhǎng)為1)??梢钥闯鲭S著步長(zhǎng)的減小,擬合時(shí)間會(huì)逐漸增加。
表2 規(guī)范化前后的擬合誤差比較(%)
表3 MHCE與C3,OSCA和Hough方法的擬合誤差(%)及時(shí)間(s)比較
圖14 Hough步長(zhǎng)與擬合時(shí)間的關(guān)系
本節(jié)還比較了步長(zhǎng)和擬合誤差的關(guān)系,如圖15所示,結(jié)果表明擬合誤差與步長(zhǎng)之間不存在正(負(fù))相關(guān)關(guān)系,且擬合誤差對(duì)步長(zhǎng)比較敏感,同時(shí)設(shè)定一個(gè)擬合誤差較低的參數(shù),可能會(huì)導(dǎo)致較高的時(shí)間消耗,這增加了該方法在實(shí)際應(yīng)用中的難度。
圖15 Hough步長(zhǎng)與擬合誤差的關(guān)系
此外,根據(jù)表3中的擬合誤差可知,MHCE,C3和OSCA對(duì)3號(hào)和4號(hào)雙曲波的擬合精度均較高。但當(dāng)周圍存在較多噪聲時(shí),如1號(hào)和2號(hào)雙曲波,OSCA和C3的提取效果受到了較大影響,其中OSCA無(wú)法成功提取1號(hào)雙曲波,且C3和OSCA對(duì)1號(hào)和2號(hào)雙曲波的半徑擬合誤差較高,但MHCE可以成功提取這2個(gè)雙曲波,且半徑擬合誤差的增長(zhǎng)幅度小于OSCA與C3。這是由于OSCA在聚類過(guò)程中考慮了雙曲波間存在交集的情況,使得該算法在聚類過(guò)程中可以去除更多的雜波和噪聲,但當(dāng)噪聲增多時(shí)會(huì)影響所提取雙曲波的形狀,降低了擬合精度,并影響了該算法的識(shí)別率。C3算法根據(jù)列間的連接情況初步聚類,并從聚類結(jié)果的波谷處將其分裂為多個(gè)子類以提高聚類精確度,但當(dāng)雙曲波兩側(cè)存在噪聲且未形成波谷時(shí),部分噪聲會(huì)被誤識(shí)為雙曲波像素,降低了擬合精度。MHCE在聚類過(guò)程中根據(jù)鄰接空間的結(jié)構(gòu)獲取像素子集,降低了丟失目標(biāo)的幾率和子集中噪聲的比例,提高了算法的魯棒性和對(duì)提取結(jié)果的擬合精度,因此雙曲波兩側(cè)的噪聲對(duì)其識(shí)別率和擬合精度的影響較小。
最后,本節(jié)比較了C3,OSCA和MHCE的識(shí)別率和誤識(shí)數(shù)量,見(jiàn)表4。OSCA和C3出現(xiàn)了丟失目標(biāo)和誤識(shí)目標(biāo)的情況,但MHCE可以成功提取4種類型的雙曲波,且未將其他雜波或噪聲誤識(shí)為雙曲波。這是由于擁有相同鄰接空間的雙曲波和非雙曲波子集在形狀或紋理上差異較大,因此,本算法通過(guò)結(jié)合多標(biāo)簽層次聚類和紋理及形狀約束進(jìn)行雙曲波提取可以成功降低誤識(shí)數(shù)量并提高算法的識(shí)別率。
表4 MHCE與C3,OSCA的比較
針對(duì)真實(shí)環(huán)境中提取的雙曲波往往存在結(jié)構(gòu)不完整、碎片化和形狀異常等問(wèn)題,提出了一個(gè)基于多標(biāo)簽層次聚類的雙曲波提取方法MHCE。該方法將信息熵融入到層次聚類中,結(jié)合層次聚類的鄰接空間構(gòu)造了多標(biāo)簽層次聚類算法,并根據(jù)聚類結(jié)果的擬合形狀和紋理方向提取雙曲波。MHCE可以在真實(shí)GPR圖像中進(jìn)行雙曲波提取,擁有較高的準(zhǔn)確率且提取的雙曲波具有較完整的波形。該方法基于無(wú)監(jiān)督學(xué)習(xí)進(jìn)行雙曲波提取,相比準(zhǔn)確性和魯棒性較高的基于區(qū)域特征(如HOG,Haar等)的有監(jiān)督學(xué)習(xí)方法,MHCE節(jié)省了樣本準(zhǔn)備的時(shí)間消耗。同時(shí),該方法受鄰域范圍和形狀的影響較小,無(wú)需固定所提取的雙曲波形狀,降低了提取結(jié)果中的噪聲比例。此外,提取結(jié)果中不同的雙曲波屬于不同的連通區(qū)域,可直接利用最小二乘法擬合并獲得較準(zhǔn)確的雙曲波參數(shù)。
[1] BATRAKOV D O, ANTYUFEYEVA M S, ANTYUFEYEV O V, et al. GPR application for the road pavements surveys[C]//2017 IEEE Microwaves, Radar and Remote Sensing Symposium (MRRS). New York: IEEE Press, 2017: 81-84.
[2] SLOB E, SATO M, OLHOEFT G. Surface and borehole ground-penetrating-radar developments[J]. Geophysics, 2010, 75(5): 75A103-75A120.
[3] SOKOLOV K O, PRUDETCKII N D, FEDOROVA L, et al. GPR investigation of ice-filled cracks in loose deposits[C]//2018 17th International Conference on Ground Penetrating Radar (GPR). New York: IEEE Press, 2018: 1-4.
[4] 謝昭暉, 李金銘. 我國(guó)探地雷達(dá)的應(yīng)用現(xiàn)狀及展望[J]. 工程勘察, 2007, 35(11): 71-75. XIE Z H, LI J M. Application status and prospect of ground penetrating radar in China[J]. Engineering Survey, 2007, 35(11): 71-75 (in Chinese).
[5] SHEBALKOVA L, MARKOV M, ROMODIN V. Broadband antenna for ground penetrating radar application in soil[C]//2018 IOP Conference Series: Earth and Environmental Science (EES). England: IOP Publishing, 2018:012060.
[6] TERRASSE G, NICOLAS J M, TROUVE E, et al. Application of the curvelet transform for clutter and noise removal in GPR data[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(10): 4280-4294.
[7] TORRIONE P A, MORTON K D, SAKAGUCHI R, et al. Histograms of oriented gradients for landmine detection in ground-penetrating radar data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014, 52(3): 1539-1550.
[8] TBARKI K, BEN SAID S, KSANTINI R, et al. Landmine detection improvement using one-class SVM for unbalanced data[C]//2017 International Conference on Advanced Technologies for Signal and Image Processing (ATSIP). New York: IEEE Press, 2017: 1-6.
[9] GIOVANNESCHI F, MISHRA K V, GONZALEZ-HUICI M A, et al. Dictionary learning for adaptive GPR landmine classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2019, 57(12): 10036-10055.
[10] MISSAOUI O, FRIGUI H, GADER P. Land-mine detection with ground-penetrating radar using multistream discrete hidden Markov models[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(6): 2080-2099.
[11] ZHANG X P, BOLTON J, GADER P. A new learning method for continuous hidden Markov models for subsurface landmine detection in ground penetrating radar[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(3): 813-819.
[12] MANANDHAR A, TORRIONE P A, COLLINS L M, et al. Multiple-instance hidden Markov model for GPR-based landmine detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2014, 53(4): 1737-1745.
[13] MAAS C, SCHMALZL J. Using pattern recognition to automatically localize reflection hyperbolas in data from ground penetrating radar[J]. Computers & Geosciences, 2013, 58: 116-125.
[14] SHARMA P, KUMAR B, SINGH D, et al. Non-metallic pipe detection using SF-GPR: a new approach using neural network[C]//2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS). New York: IEEE Press, 2016: 6609-6612.
[15] DOU Q X, WEI L J, MAGEE D R, et al. Real-time hyperbola recognition and fitting in GPR data[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(1): 51-62.
[16] KAFEDZISKI V, PECOV S, TANEVSKI D. Target detection in SFCW ground penetrating radar with C3 algorithm and hough transform based on GPRMAX simulation and experimental data[C]//2018 25th International Conference on Systems, Signals and Image Processing (IWSSIP). New York: IEEE Press, 2018: 1-5.
[17] ZHOU X R, CHEN H H, LI J L. An automatic GPR B-scan image interpreting model[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(6): 3398-3412.
[18] HE K, SUN J, TANG X. Guided image filtering[C]// European Conference on Computer Vision. Heidelberg: Springer, 2010: 1-14.
[19] WANG Y. Improved OTSU and adaptive genetic algorithm for infrared image segmentation[C]//2018 Chinese Control and Decision Conference (CCDC). New York: IEEE Press, 2018: 5644-5648.
[20] ZHENG G, LI X F, ZHOU L Z, et al. Development of a gray-level Co-occurrence matrix-based texture orientation estimation method and its application in sea surface wind direction retrieval from SAR imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2018, 56(9): 5244-5260.
[21] SHIHAB S, AL-NUAIMY W. Radius estimation for cylindrical objects detected by ground penetrating radar[J]. Subsurface Sensing Technologies and Applications, 2005, 6(2): 151-166.
Hyperbola extraction method based on multi-label hierarchical clustering algorithm of GPR images
LI Wen-sheng, YUAN Da, MIAO Cui, WANG Dong-yu
(Key Laboratory of Intelligent Information Processing, Shandong Technology and Business University, Yantai Shandong 264005, China)
Hyperbola extraction in ground penetrating radar (GPR) images is an important feature to analyze the location and structure of underground objects. However, there are often some problems with the extracted hyperbola, such as incomplete structure, fragmentation, and shape anomalies, caused by the interference of noise and clutter that are typical of real environments. These issues are not conducive to the subsequent quantitative operations, such as data analysis and 3D modeling. In this context, this paper proposed a multi-label hierarchical clustering-based hyperbola extraction method (MHCE) for the hyperbola extraction of GPR images. Firstly, through evaluating the stability between pixel neighborhoods by the means of information entropy, an information entropy-based distance method was constructed to conduct the hierarchical clustering algorithm. Next, a multi-label clustering method was proposed based on the adjacency space of the clustering results, so as to reduce the influence of clutter and noise on hyperbola extraction. Finally, the hyperbola was extracted combined with the fitting shape and texture orientation of the multi-label clustering results. The experimental results show that this method is robust for GPR images and can be used to obtain the shape and position parameters of a normalized hyperbola.
ground penetrating radar image; hyperbola; information entropy; multi-label hierarchical clustering algorithm; robustness
TP 391
10.11996/JG.j.2095-302X.2020030399
A
2095-302X(2020)03-0399-10
2019-12-11;
2020-01-23
山東省重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2019GGX101040)
李文生(1994-),男,山東淄博人,碩士研究生。主要研究方向?yàn)樘降乩走_(dá)數(shù)據(jù)分析與模式識(shí)別。E-mail:1700812107@sdtbu.edu.cn
原 達(dá)(1968-),男,遼寧建昌人,教授,博士,碩士生導(dǎo)師。主要研究方向?yàn)樘降乩走_(dá)數(shù)據(jù)分析、數(shù)據(jù)可視化等。E-mail:ydccec@126.com