胡利娜
(山西欣奧特自動化工程有限公司,山西 太原 030012)
隨著使用年限的增長,包括隧道、橋梁、水壩和摩天大樓在內(nèi)的民用基礎(chǔ)設(shè)施越來越容易失去其設(shè)計功能。這個不可避免的過程意味著存在緊急維護的問題。盡管這種擔(dān)憂促使人們定期檢查基礎(chǔ)設(shè)施的結(jié)構(gòu)安全,但由于人力資源有限,現(xiàn)場檢查仍需要關(guān)閉基礎(chǔ)設(shè)施系統(tǒng)或建筑結(jié)構(gòu)來對它們進行診斷。因此,許多研究小組提出了結(jié)構(gòu)健康監(jiān)測(SHM)技術(shù)[1]。盡管許多項目已經(jīng)實施了大規(guī)模的SHM以覆蓋大型結(jié)構(gòu),但是這些項目需要裝備密集的儀器,集成來自分布式源的數(shù)據(jù),以及補償需要環(huán)境影響。最后,在檢查傳感系統(tǒng)和結(jié)構(gòu),確認收集的數(shù)據(jù)是否實際上指示結(jié)構(gòu)損壞,感覺系統(tǒng)故障,噪聲信號等方面是有一定難度的。
現(xiàn)在,許多類型的人工神經(jīng)網(wǎng)絡(luò)(ANN)已經(jīng)開發(fā)并適用于科研和工業(yè)領(lǐng)域,尤其是卷積神經(jīng)網(wǎng)絡(luò)(CNN)已經(jīng)在圖像識別中取得一定的成果。CNN可以有效地捕獲圖像的網(wǎng)格狀拓撲,并且由于稀疏連接的神經(jīng)元和池化過程,它們無需過多的計算力。此外,CNN能夠區(qū)分更多的類別,這些方面使CNN成為有效的圖像識別方法。
在本研究中,我們使用CNN構(gòu)建分類器,用于檢測圖像中的隧道襯砌病害。基于CNN的隧道襯砌病害檢測的主要優(yōu)點與傳統(tǒng)方法相比,它不需要特征提取和計算。
本節(jié)對我們提出的框架的總體架構(gòu)進行了總結(jié)。圖1展示了該架構(gòu)的一般流程,包括訓(xùn)練步驟(實線)和測試步驟(虛線)。為了訓(xùn)練CNN分類器,使用線陣相機陣列從復(fù)雜的地鐵隧道中獲取具有各種圖像變化的襯砌表面的原始圖像,包括能夠觸發(fā)錯誤警報的照明,陰影等。本文中裂縫的定義是能夠通過肉眼在圖像中進行辨別的長條狀病害。訓(xùn)練樣本使用的一些圖像包含裂縫。
圖1 襯砌病害檢測的流程圖
這些圖像被手動注釋為裂縫或正常以生成訓(xùn)練樣本集。從樣本集中,隨機選擇小的裁剪圖像以生成訓(xùn)練和驗證集。將準備好的訓(xùn)練圖像集輸入CNN以構(gòu)建CNN分類器,用于從驗證集中分離裂縫與正常的具體圖像。當(dāng)通過樣本集中的驗證圖像集驗證CNN分類器時,由驗證的分類器拍攝并掃描55個附加具體圖像以生成裂縫損壞的報告。
圖2展示了CNN網(wǎng)絡(luò)的架構(gòu),它是隧道襯砌病害檢測的原始配置。第一層是256×256×3的3個通道的輸入層,其中每個維度分別指示高度,寬度和通道(例如,紅色,綠色和藍色)。輸入數(shù)據(jù)逐層通過卷積網(wǎng)絡(luò),并在L5處將空間尺寸減小到1×1×96。包含96個元素的向量被送入線性整流單元(ReLU)層。最后,softmax層預(yù)測在的卷積之后每個輸入數(shù)據(jù)是病害的或是完整的隧道襯砌表面。網(wǎng)絡(luò)中還使用不能可視化的批歸一化(Batch Normalization)和Dropout層。BN層位于L1,L3和L5之后,并且Dropout位于L5的BN層之后。
圖2 網(wǎng)絡(luò)結(jié)構(gòu)
卷積層在整個輸入張量中執(zhí)行以下三個操作。首先,它在輸入張量的小范圍內(nèi)和感知器之間執(zhí)行逐個元素的乘法(即點積)。感知器通常也稱為濾波器或卷積核。通常隨機生成感知器的初始權(quán)重值。偏差可以根據(jù)網(wǎng)絡(luò)的配置以多種方式設(shè)置。使用隨機梯度下降(SGD)算法在訓(xùn)練中調(diào)整這兩個值。子矩陣的大小始終等于感知器的大小,但感知器始終小于輸入矩陣。其次,將相乘的值相加,并將偏差加到求和值上。該層的另一個超參數(shù)是步幅。步幅定義了一定數(shù)量的感知器的列和行(像素)在輸入矩陣的寬度和高度上一次滑動。較大的步幅尺寸導(dǎo)致較少的感知器應(yīng)用和較小的輸出尺寸,這也降低了計算成本,但它也可能失去輸入數(shù)據(jù)的特征[2]。
CNN的另一個關(guān)鍵方面是池化層,它減小了輸入陣列的空間大小。此過程通常定義為下采樣。有兩種不同的池選項。最大池化從輸入數(shù)組的子數(shù)組中獲取最大值,而平均池化則獲取平均值[3]。圖3顯示了步長為2的池化方法,其中池化層輸出大小通過圖中的等式計算。有研究表明圖像數(shù)據(jù)集中的最大池化性能優(yōu)于平均池化[4]。本文驗證了具有最大池化層的體系結(jié)構(gòu)優(yōu)于具有平均池化層的體系結(jié)構(gòu)。因此本研究的所有匯集層都是最大池化層。
圖3 池化層的計算過程
在標準ANN中ReLU被引入作為非線性激活函數(shù),ReLU除了其負輸入值之外沒有有界輸出,直覺上,ReLU的梯度始終為零和1。與使用典型的非線性S形函數(shù)相比,這些特征有助于更快的計算,并實現(xiàn)更好的精度。
過擬合一直是機器學(xué)習(xí)領(lǐng)域的一個長期問題,為了解決這個問題,我們使用了Dropout層。訓(xùn)練具有大量神經(jīng)元的網(wǎng)絡(luò)通常會由于復(fù)雜的共同作用而導(dǎo)致過擬合。Dropout的主要思想是以一定的Dropout率隨機斷開連接層神經(jīng)元之間的連接。因此,網(wǎng)絡(luò)可以通過減少這些被丟棄的神經(jīng)元來更有效地概括訓(xùn)練樣本。
(1)
為了檢查上一節(jié)中經(jīng)過訓(xùn)練和驗證的CNN的性能,使用了55個未用于訓(xùn)練和驗證過程的原始圖像。這些圖像來自一條混凝土隧道。獲得的結(jié)果非常顯著,正確率為97%,值得注意的是,即使使用完全不同的圖像進行測試,經(jīng)過訓(xùn)練和驗證的CNN框架也顯示出幾乎相同的性能而不會降低精度。
為了比較新裂縫檢測方法與現(xiàn)有傳統(tǒng)方法的性能,我們選擇對比測試了兩種最著名的傳統(tǒng)方法Canny和Sobel邊緣檢測。使用正常的均勻照明,CNN提供了清晰的裂縫信息,雖然Sobel邊緣檢測提供了一些裂縫信息,但它沒有提供任何有意義的信息。Canny檢測方法沒有提供關(guān)于具有高水平噪聲的裂縫的有意義的信息。研究表明,Canny和Sobel邊緣檢測方法的性能在很大程度上取決于圖像條件;相反,CNN不受圖像條件的影響。
我們提出的CNN在檢測光照條件下的薄裂縫方面特別強大,這使得在使用傳統(tǒng)方法時難以檢測。該方法還顯示出比傳統(tǒng)方法更低的噪聲水平,并且提供了原始圖像結(jié)果,其允許區(qū)分噪聲和誤差。就一般的方法而言,CNN從大量訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征的能力是一個巨大的優(yōu)勢。然而,這也意味著CNN實現(xiàn)的方法需要大量訓(xùn)練數(shù)據(jù)來訓(xùn)練健壯的分類器。幾乎所有基于視覺的方法的一個常見限制,包括IPT和CNN的實現(xiàn),是由于攝影圖像的性質(zhì)而無法感知內(nèi)部特征。未來,CNN將開發(fā)用于檢測各種類型的表面損傷,如空隙,分層,剝落和混凝土和鋼結(jié)構(gòu)的腐蝕,以部分取代一年兩次的目視檢查,是目前最可靠的監(jiān)測方法結(jié)構(gòu)健康。這也將與自主無人機結(jié)合,以監(jiān)測隧道襯砌結(jié)構(gòu)的損壞。