賈曉芬,郭永存,柴華榮,趙佰亭,黃友銳
(安徽理工大學(xué)省部共建深部煤礦采動(dòng)響應(yīng)與災(zāi)害防控國家重點(diǎn)實(shí)驗(yàn)室,232001,安徽淮南)
我國約有2.95萬億噸煤炭資源深埋在1 km以下,占煤炭資源總量的53%[1]。隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,在21世紀(jì)的煤炭開采中,我國將有大批礦井轉(zhuǎn)入深部開采[2]。深井的高溫高濕環(huán)境加上鹽堿水的侵蝕,井筒井壁砼會(huì)被慢慢地腐蝕。井壁承受的井筒周圍巖漿、泥漿膨脹引起的環(huán)壓會(huì)引起井壁上出現(xiàn)炸裂、鼓包等破損。必須及時(shí)檢測、修復(fù)破損才能有效保證井筒安全,防止井壁破裂的發(fā)生。
圖像是人類獲取、表達(dá)和傳遞信息的重要手段,人類獲取的外界信息中,約75%來自視覺[3]。美國哈佛商學(xué)院的最新研究數(shù)據(jù)表明,人的大腦接受的外部信息中約83%來自視覺。圖像含有豐富的信息,已經(jīng)成為人類獲取知識(shí)和數(shù)據(jù)的重要來源,井壁圖像能很好地傳遞井壁上出現(xiàn)的缺陷信息。圖像在采集、形成與傳輸?shù)倪^程中,會(huì)引入噪聲導(dǎo)致圖像質(zhì)量的下降[4]。復(fù)雜的深井環(huán)境必然導(dǎo)致獲取的井壁圖像中含有噪聲,要想利用井壁圖像實(shí)現(xiàn)缺陷的分類、預(yù)測,必須先去噪。本文結(jié)合井壁圖像特點(diǎn)提出一種卷積神經(jīng)網(wǎng)絡(luò)(CNN)去噪模型(ELU-CNN)。
立井多為鋼筋混凝土井壁,井壁圖像背景簡單,主要包括法蘭盤和砼,井壁檢測的主要目的是檢測砼上出現(xiàn)的裂縫,它是導(dǎo)致井壁破裂的主要因素。井壁裂縫一般有橫向、縱向、塊狀和網(wǎng)狀裂縫,表現(xiàn)為連續(xù)的線條型,由線段組成,具有一定的方向性。井壁裂縫顏色相對(duì)于背景的顏色較深,呈暗色特征,對(duì)應(yīng)的圖像像素值較小。深井環(huán)境復(fù)雜,井壁上的灰塵、腐蝕、高溫高濕引起的水霧等因素都會(huì)降低圖像質(zhì)量且增加去噪的難度。
利用圖像處理檢測井壁缺陷的研究較少,沒有專門針對(duì)井壁圖像去噪的方法,但是圖像去噪的思路相通、目的一致,只是不同應(yīng)用領(lǐng)域的圖像具備不同特征。好的去噪方法應(yīng)該具有通用性,可以處理不同背景、不同類型的含噪圖像?,F(xiàn)有文獻(xiàn)中的去噪方法多利用標(biāo)準(zhǔn)圖像測試去噪效果,實(shí)際圖像中含有的噪聲并不單一,難以評(píng)估噪聲水平和類型,其去噪的難度遠(yuǎn)高于去除標(biāo)準(zhǔn)圖像上加入的已知噪聲。因此,結(jié)合實(shí)際應(yīng)用設(shè)計(jì)出具有普適性的去噪方法才是研究的根本。
高斯噪聲和椒鹽噪聲是兩種最常見的圖像噪聲,前者服從高斯分布,嚴(yán)重影響圖像質(zhì)量,受到學(xué)者們關(guān)注。經(jīng)典且被廣泛認(rèn)可的去除高斯噪聲的方法,例如BM3D[5]、WNNM[6]、CSF[7]和TRND[8]等方法均取得了很好的去噪效果,但需要手動(dòng)修改參數(shù)。為了解決上述問題,研究者開始利用CNN方法進(jìn)行圖像去噪。例如,Zhang等提出了DnCNN去噪模型,將深層次的網(wǎng)絡(luò)體系結(jié)構(gòu)、殘差學(xué)習(xí)算法和批量歸一化應(yīng)用到圖像去噪中[9],在此基礎(chǔ)上Zhang又提出FFDNet模型實(shí)現(xiàn)盲高斯去噪[10];Isogawa等將軟收縮與deep-CNN結(jié)合,提出了SCNN高斯去噪模型[11]。
CNN去噪方法[9-11]能夠有效地利用圖像的全局特征,使去噪效果得到明顯提高,但隨著網(wǎng)絡(luò)深度的加深,CNN方法提取的特征越來越高級(jí),會(huì)逐層丟失大量的低級(jí)特征。CNN的層越低提取的低級(jí)特征越原始,例如顏色和邊緣線條等;高層提取的則是紋理細(xì)節(jié)等高級(jí)特征。為了更好地提取井壁圖像中組成裂縫的線條及呈現(xiàn)裂縫開裂程度的紋理特征,本文利用跳躍連接將低級(jí)特征傳遞到高層與高級(jí)特征合并,提出了ELU-CNN井壁圖像去噪模型。
圖1 ELU-CNN去噪模型
井壁圖像中的噪聲無法準(zhǔn)確衡量,應(yīng)用ELU-CNN模型實(shí)現(xiàn)去噪的關(guān)鍵是充分提取井壁圖像中的各種特征信息并傳遞到模型的輸出端。受稠密連接[12]的啟發(fā),設(shè)計(jì)了特征提取模塊,它能充分利用網(wǎng)絡(luò)的不同卷積層提取的不同特征信息。FEM模塊中包含5個(gè)卷積層和4個(gè)激活層,激活層的激活函數(shù)為ELU。每個(gè)FEM的輸出由其第1、3、5共3個(gè)卷積層的輸出及ELU-CNN模型的第1個(gè)卷積層的輸出串聯(lián)融合而成。
圖2 ReLU與ELU函數(shù)
常用的激活函數(shù)有sigmoid[13]、tanh[14]和ReLU[15]等,其中ReLU函數(shù)的應(yīng)用最廣泛。ELU[16]是改進(jìn)型的ReLU函數(shù),如圖2所示,超參數(shù)α取0.5,ELU融合了sigmoid和ReLU函數(shù)的特性,右側(cè)線性部分能夠緩解梯度消失,左側(cè)軟飽和性能使其對(duì)輸入噪聲更具魯棒性。ELU的輸出均值接近于零,收斂速度會(huì)更快。
(1)
圖1所示ELU-CNN的數(shù)學(xué)模型如下,其中第1個(gè)卷積層的輸出為
(2)
(3)
式中:ELU()是激活函數(shù),超參數(shù)α>0;xj和ωj分別表示式(2)中計(jì)算L1時(shí)局部感受野(3×3濾波窗口)內(nèi)的圖像像素值和對(duì)應(yīng)的權(quán)重系數(shù)。第2個(gè)特征提取模塊的輸入為
F2I=ELU(F1O)
(4)
(5)
(6)
(7)
F2O=concat[L7,L9,L11,L1]
(8)
式中:concat[]表示串聯(lián)融合。第3個(gè)特征提取模塊的輸入為
F3I=ELU(F2O)
(9)
(10)
(11)
ELU-CNN模型獲得式(11)的噪聲信息Γ后,
為了驗(yàn)證模型的去噪效果,訓(xùn)練ELU-CNN和ELU-CNNB兩個(gè)模型,分別實(shí)現(xiàn)在標(biāo)準(zhǔn)圖像上去除已知濃度的高斯噪聲和對(duì)實(shí)際圖像的盲去噪。選用400幅180×180像素的灰度圖像構(gòu)造訓(xùn)練集。通過對(duì)400幅圖像進(jìn)行隨機(jī)翻轉(zhuǎn)、任意角度旋轉(zhuǎn)后按照步長10裁剪成40×40像素的圖像,形成ELU-CNN模型的訓(xùn)練集。以相同的方法將旋轉(zhuǎn)后的圖像裁剪成50×50像素的圖像塊,形成ELU-CNNB模型的訓(xùn)練集。實(shí)驗(yàn)環(huán)境是Keras,在CPU Intel(R) Core(TM)i5-8300H CPU2.30 GHz的PC上進(jìn)行,利用Nvidia 1050 Ti GPU加速。
標(biāo)準(zhǔn)圖像測試選用的測試集為Berkeley的68幅圖像的BSD68圖像集[9-10]及如圖3所示被廣泛使用的12幅圖像的set12圖像集,其中圖3a~圖3g分辨率均為256×256像素,圖3h~圖3l分辨率均為512×512像素。在實(shí)際圖像上測試時(shí)選用深立井的井壁圖像。
圖3 set12圖像集中的12幅圖像
訓(xùn)練ELU-CNN模型時(shí)的參數(shù)設(shè)置為:每64個(gè)樣本更新一次模型參數(shù),迭代次數(shù)e=50,超參數(shù)α=0.1,Adam作為優(yōu)化器,初始學(xué)習(xí)效率是0.01,每10個(gè)e后學(xué)習(xí)效率降低一半,每個(gè)e訓(xùn)練2 000步。在標(biāo)準(zhǔn)圖像中加入濃度σ=(15,25,35,50,75)的高斯噪聲后,利用ELU-CNN模型與BM3D[5]、WNNM[6]、CSF[7]、TRND[8]、DnCNN-S[9]、FFDNet[10]和SCNN[11]7種被高度認(rèn)可的方法比較去噪效果。
表1給出了在BSD68上的測試結(jié)果,粗體表示最高的峰值信噪比(設(shè)為rPSNR)。顯然,4種CNN去噪方法的rPSNR遠(yuǎn)高于BM3D、WNNM、CSF和TRND方法,在各種噪聲濃度下,ELU-CNN模型均獲得了最高的rPSNR。σ=(15,25)時(shí),DnCNN-S方法的rPSNR高于FFDNet方法,在高濃度σ=(35,50,75)時(shí),FFDNet方法的去噪性能超越了DnCNN-S方法。
表2給出了ELU-CNN模型及各種去噪方法對(duì)圖3的12幅圖像的測試結(jié)果,可以看出,不同噪聲水平下,ELU-CNN模型在大多數(shù)圖像上都獲得最高的rPSNR,且均獲得了最高的平均rPSNR。DnCNN-S和FFDNet兩種網(wǎng)絡(luò)去噪模型獲得了較好的去噪結(jié)果,σ=(15,25)時(shí),前者表現(xiàn)優(yōu)秀,σ=(35,50,75)時(shí)后者獲勝,尤其對(duì)Parrot和Lena兩幅含有弧形特征的圖像表現(xiàn)優(yōu)異,均略勝ELU-CNN模型。對(duì)House和Barbara兩幅由規(guī)則和重復(fù)性結(jié)構(gòu)組成的圖像,ELU-CNN模型并不能總是獲得最高的rPSNR,而WNNM是一種非局部相似性去噪方法,它針對(duì)具有規(guī)則和重復(fù)紋理的圖像去噪具有優(yōu)勢(shì)?;诜蔷植肯嗨菩缘姆椒ㄍǔT诰哂幸?guī)則和重復(fù)結(jié)構(gòu)的圖像上去噪效果更好,而基于學(xué)習(xí)的方法通常在具有平滑區(qū)域或不規(guī)則紋理的圖像上產(chǎn)生更好的結(jié)果[17]。表2的結(jié)果與文獻(xiàn)[16]的理論相符。綜合表1、2的客觀指標(biāo)可知,ELU-CNN模型具有較好的去噪效果。
表1 BSD68圖像集上不同方法的平均峰值信噪比對(duì)比
表2 set12圖像集上每幅圖像的峰值信噪比
圖4給出了在set12圖像集的Couple圖像上隨機(jī)加入σ=25的高斯噪聲后,不同方法對(duì)其去噪后的局部放大結(jié)果。由圖4可知:CSF和TNRD方法的視覺效果最差,門框的左側(cè)豎直邊緣和墻面上的橫向紋理均模糊不清;BM3D、WNNM和DnCNN-S方法的紋理細(xì)節(jié)有所改善,對(duì)邊緣保護(hù)能力有所提高,但并不理想;FFDNet方法呈現(xiàn)出了邊緣的輪廓,視覺效果較好;ELU-CNN模型獲得了最好的去噪效果,能清晰地體現(xiàn)線條紋理,對(duì)線條特征的保護(hù)能力較強(qiáng),并能很好地呈現(xiàn)出圖像的輪廓特征。
(b)噪聲圖
(c)BM3D方法(rPSNR=29.72 dB)
(d)WNNM方法(rPSNR=29.82 dB)
(e)CSF方法(rPSNR=29.46 dB)
(f)TNRD方法(rPSNR=29.71 dB)
(g)DnCNN-S方法(rPSNR=30.12 dB)
(h)FFDNet方法(rPSNR=30.18 dB)
(i)FLU-CNN方法(rPSNR=30.25 dB)
ELU-CNNB模型的超參數(shù)α=0.05,其他的參數(shù)設(shè)置與ELU-CNN模型相同。圖像獲取、傳輸時(shí)有多種噪聲來源,無法準(zhǔn)確估計(jì)實(shí)際噪聲圖像的噪聲水平,且真實(shí)噪聲圖像對(duì)應(yīng)的干凈圖像也是未知的,無法衡量去噪后的客觀指標(biāo)。為了驗(yàn)證去噪效果,在井壁圖像上加入高斯噪聲,通過去噪后的視覺圖像衡量ELU-CNNB模型的盲去噪效果。
圖5給出了ELU-CNNB模型對(duì)含不同濃度高斯噪聲的井壁圖像去噪的結(jié)果,可以看出,各幅圖像在去除噪聲的同時(shí),均很好地保留了井壁上的裂縫、腐蝕、破損及法蘭盤等特征信息。ELU-CNNB模型在保護(hù)圖像紋理特征的同時(shí),能很好地保留圖像中的線條特征,是一種有效的盲去噪模型,可以用于實(shí)際井壁圖像去噪,為井壁裂縫檢測、定位等工作做好鋪墊。
(a)噪聲圖
(b)去噪結(jié)果
圖5 ELU-CNNB方法對(duì)含高斯噪聲井壁圖像的去噪結(jié)果
大霧伴有小雨的實(shí)際天氣,接近井下高溫高濕的自然環(huán)境,此環(huán)境下拍攝混凝土路面的圖像來模擬含水霧的井壁圖像,加入σ=(15,25,50)的高斯噪聲后,使用ELU-CNNB模型和DnCNN-B[9]方法去噪,結(jié)果如圖6所示,其中σ=50時(shí)噪聲圖里的方框內(nèi)顯示的是原圖的放大結(jié)果。由圖6可以看出,低噪聲時(shí)兩者的去噪效果相當(dāng),在高噪聲濃度σ=50時(shí),圓圈內(nèi)的裂縫在原圖中往上延伸,ELU-CNNB模型很好地保留了此特性,DnCNN-B方法丟失了這條向上延伸的線條特征。可見,在深立井的井壁圖像上,ELU-CNNB模型的去噪效果較好,能有效去除井壁圖像中含有的各種濃度的高斯噪聲,同時(shí)很好地保留井壁的破損特征,從而為缺陷檢測奠定了基礎(chǔ)。
CPU運(yùn)行時(shí)間是衡量去噪方法優(yōu)劣的重要方面。表3給出了不同方法對(duì)加入σ=25的高斯噪聲的圖像去噪需要的CPU運(yùn)行時(shí)間。分辯率為321×481像素(BSD68)、256×256像素(set12)和512×512像素(set12)的圖像是3幅標(biāo)準(zhǔn)圖像,640×480像素的圖像是井壁圖像,對(duì)應(yīng)盲去噪的運(yùn)行時(shí)間。顯然,3種CNN去噪方法的運(yùn)行速度高于BM3D、WNNM、CSF和TRND方法。與DnCNN-S和ELU-CNN模型相比,FFDNet方法的網(wǎng)絡(luò)深度最淺,運(yùn)行時(shí)間最短,但盲去噪時(shí)對(duì)紋理的保護(hù)能力稍弱。ELU-CNN模型沒有獲得最好的去噪效率,但是能夠滿足井壁圖像去噪的需要,也可以使用高性能的GPU來提高去噪效率。
井壁是深立井的咽喉,井壁圖像去噪是對(duì)井壁缺陷實(shí)現(xiàn)自動(dòng)檢測的關(guān)鍵步驟。本文提出的ELU-CNN模型是一種全卷積網(wǎng)絡(luò)模型,除最后一個(gè)卷積層外的每個(gè)卷積層均用64個(gè)大小為3×3的濾波器提取不同類型、不同層次的特征。模型中的5個(gè)特征提取模塊FEM與跳躍連接的結(jié)合能夠?qū)\層提取的低級(jí)圖像特征傳遞到高層,保證充分提取輸入圖像中的噪聲特征,確保模型通過端到端的訓(xùn)練后有效建立輸入和輸出之間的非線性映射。含噪圖像中的噪聲包含的信息量遠(yuǎn)小于信號(hào)的信息量,殘差學(xué)習(xí)的引入使得訓(xùn)練后的模型學(xué)習(xí)到的是噪聲,能夠降低模型的學(xué)習(xí)困難。激活函數(shù)ELU的軟飽和特性及輸出均值接近于零的特性,能夠提高模型的魯棒性、加速模型收斂。
(a)噪聲圖
(b)DnCNN-B方法
(c)ELU-CNNB方法
圖6 ELU-CNNB和DnCNN-B方法對(duì)加入高斯噪聲的含水霧井壁圖像的去噪結(jié)果
與DnCNN和FFDNet等方法相比,ELU-CNN模型在標(biāo)準(zhǔn)測試集及井壁圖像上去噪的主客觀指標(biāo)均有所提高,尤其在去除井壁圖像的盲噪聲時(shí),能很好地保留井壁的特征信息。ELU-CNN模型具有較強(qiáng)的線條保護(hù)能力,能很好地呈現(xiàn)出圖像的輪廓特征,保護(hù)井壁裂縫的線條信息。