杜翠
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司鐵道建筑研究所,北京 100081)
地質(zhì)雷達(dá)(Ground Penetrating Radar,GPR)技術(shù)作為一種快速、無(wú)損、高效的探測(cè)技術(shù),在鐵路路基檢測(cè)領(lǐng)域得到廣泛應(yīng)用。車載地質(zhì)雷達(dá)技術(shù)是鐵路路基檢測(cè)的主要手段[1-3]。采用車載GPR 技術(shù)進(jìn)行路基檢測(cè)時(shí),天線懸掛固定安裝在檢測(cè)車底部,與軌枕頂面保持相對(duì)固定的距離進(jìn)行快速檢測(cè)。由于車載GPR檢測(cè)速度可達(dá)100 km/h,長(zhǎng)距離檢測(cè)導(dǎo)致雷達(dá)數(shù)據(jù)的里程累積誤差較大,對(duì)病害解釋結(jié)果的空間準(zhǔn)確度有重要影響。因此,里程校正是鐵路路基GPR 檢測(cè)數(shù)據(jù)處理的必要步驟。
里程校正普遍采用的是橋梁標(biāo)記回歸計(jì)算的方法。數(shù)據(jù)處理人員從采集到的GPR 原始圖像中人工判讀橋梁,記錄其原始里程,與鐵路局相關(guān)部門提供的橋梁實(shí)際里程進(jìn)行回歸計(jì)算。由于鐵路路基檢測(cè)的數(shù)據(jù)量很大(3 條測(cè)線,每100 km 約12 GB),而人工判讀橋梁的效率較低,導(dǎo)致里程校正耗費(fèi)了大量的人力和時(shí)間,因此須研發(fā)快速、準(zhǔn)確的GPR 檢測(cè)數(shù)據(jù)里程校正方法。橋梁的識(shí)別效率是制約GPR 檢測(cè)數(shù)據(jù)里程校正效率的關(guān)鍵因素。近年來(lái),隨著計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,國(guó)內(nèi)外學(xué)者陸續(xù)開(kāi)展少量關(guān)于GPR 路基圖像識(shí)別的研究。主要以路基病害為識(shí)別目標(biāo),采用處理后的GPR 圖像,以單道波形為單位,提取若干個(gè)一維特征值,采用神經(jīng)網(wǎng)絡(luò)、稀疏表示、支持向量機(jī)(Support Vector Machine,SVM)等方法進(jìn)行分類識(shí)別[4-7]。但識(shí)別的病害類型較少,且一維特征值對(duì)路基特征的表征能力有限,識(shí)別效果不佳,尚未達(dá)到滿足工程實(shí)際應(yīng)用的水平。
本文基于對(duì)GPR 圖像特征的分析,提出一種鐵路路基GPR 檢測(cè)數(shù)據(jù)智能里程校正方法。首先,將GPR原始圖像進(jìn)行二維離散,分段提取二維特征值,建立初始特征向量。其次,采用主成分分析(Principal Component Analysis,PCA)方法進(jìn)行降維,得到降維后的特征向量。再次,采用適合小樣本數(shù)據(jù)的SVM 方法,建立橋梁的識(shí)別模型。然后,將識(shí)別到的橋梁同設(shè)備表進(jìn)行自動(dòng)匹配,同真實(shí)里程進(jìn)行回歸計(jì)算,建立GPR 檢測(cè)數(shù)據(jù)原始里程與實(shí)際里程的相關(guān)關(guān)系,進(jìn)而得出GPR 文件的實(shí)際起止里程和道間距。最后,從京九線路基檢測(cè)數(shù)據(jù)提取訓(xùn)練樣本和測(cè)試樣本,對(duì)本文提出的鐵路路基GPR 檢測(cè)數(shù)據(jù)智能里程校正方法的準(zhǔn)確性進(jìn)行了驗(yàn)證。
在處理后的GPR 圖像中,噪聲及干擾信號(hào)得到一定程度的去除,信噪比提高,與橋梁呈現(xiàn)相近特征的目標(biāo)反而增多,不利于橋梁的自動(dòng)識(shí)別。而在GPR 原始圖像中,能夠判別的目標(biāo)通常只有路基、橋梁、道岔3種,如圖1所示。GPR原始圖像更適合作為橋梁自動(dòng)識(shí)別的數(shù)據(jù)源類型。
針對(duì)路基、橋梁、道岔3種類型,各選取1道A-scan數(shù)據(jù)(采樣點(diǎn)為512)觀察單道波形,為便于觀察,將振幅歸一化到[-10,10]內(nèi)。如圖2 所示,波形能量集中于前100 個(gè)采樣點(diǎn),即淺層區(qū)域,橋梁波形的能量最強(qiáng),道岔與路基相近。3 種類型的目標(biāo)在A-scan 維度的差異主要體現(xiàn)在沿深度方向的能量和方差變化。
圖1 GPR原始數(shù)據(jù)主要類型
圖2 單道波形對(duì)比
綜合圖1、圖2,路基、道岔、橋梁的圖像特征差異主要為能量強(qiáng)弱、沿深度方向的分布以及紋理表征。因此,本文對(duì)GPR 圖像進(jìn)行二維離散,沿水平方向劃分為若干個(gè)識(shí)別單元,再將每個(gè)識(shí)別單元沿深度方向劃分為若干個(gè)子單元,每個(gè)識(shí)別單元的特征值由其所有子單元的特征值組成,其維度為子單元個(gè)數(shù)與特征值個(gè)數(shù)的乘積。選取能量、方差以及6 個(gè)反映圖像紋理的直方圖統(tǒng)計(jì)特征作為特征值[8]。
為檢驗(yàn)前文選取的特征值對(duì)路基、道岔、橋梁3種類型的表征性能,采用京九線實(shí)測(cè)數(shù)據(jù)進(jìn)行計(jì)算驗(yàn)證。以5 m 為單位劃分識(shí)別單元,每種類型各選2 個(gè)。將其沿深度方向分為5 個(gè)子單元,計(jì)算特征值并進(jìn)行歸一化處理。
特征值計(jì)算結(jié)果見(jiàn)圖3,各個(gè)特征值表征性能分析見(jiàn)表1。標(biāo)準(zhǔn)方差和三階矩可區(qū)分3種類型,而其他特征值則只能區(qū)分2類或不具有區(qū)分性能。方差與能量的表征是冗余的,熵與一致性的表征是冗余的。此外,特征值在不同深度的表征性能不同??傮w來(lái)說(shuō),具有有效表征能力的特征值約16個(gè)。
圖3 特征值曲線
表1 特征值表征性能分析
在2.1 節(jié)中構(gòu)建了40 維的特征向量,但存在一定的冗余,且并非所有特征值都具有較高的表征性能。此外,特征向量的維數(shù)過(guò)高還會(huì)增加計(jì)算的復(fù)雜度。因此,本文采用主成分分析(Principal Component Analysis,PCA)對(duì)原始特征向量進(jìn)行降維。
為了確定最終的特征向量的維度,以4維為步長(zhǎng),分別進(jìn)行PCA 降維,檢驗(yàn)降維后的數(shù)據(jù)集對(duì)原始數(shù)據(jù)集的表征性能。表征性能通過(guò)2個(gè)矩陣的均方根誤差來(lái)衡量,計(jì)算結(jié)果見(jiàn)圖4。隨著維度增高,均方根誤差呈指數(shù)降低趨勢(shì),20 維處為近似的拐點(diǎn),即降維至20維后,特征向量表征性能接近原始維度,同2.1節(jié)得出的具有有效表征能力的特征值約16 個(gè)的結(jié)論基本一致。
圖4 不同降維維度的重構(gòu)均方根誤差
SVM 是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來(lái)的新一代學(xué)習(xí)算法,通過(guò)把低維的復(fù)雜問(wèn)題轉(zhuǎn)換到高維空間,尋求一個(gè)最優(yōu)分類超平面,從而降低問(wèn)題的復(fù)雜度,尤其適用于訓(xùn)練樣本較小的數(shù)據(jù)分類問(wèn)題[9]。
核函數(shù)的選擇是SVM 的關(guān)鍵步驟,采用適當(dāng)?shù)暮撕瘮?shù)就可以實(shí)現(xiàn)從低維空間向高維空間的映射,從而實(shí)現(xiàn)某一非線性分類變換后的線性分類,并且沒(méi)有增加計(jì)算復(fù)雜度。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)RBF與Sigmoid核函數(shù)等。本文經(jīng)試驗(yàn)對(duì)比,選用徑向基核函數(shù)構(gòu)建SVM識(shí)別模型。
綜上所述,本文提出的鐵路路基GPR 檢測(cè)數(shù)據(jù)智能里程校正方法的流程如圖5 所示,其關(guān)鍵環(huán)節(jié)分述如下:
1)模型訓(xùn)練。對(duì)訓(xùn)練樣本進(jìn)行特征提取和PCA降維后,對(duì)降維后的特征向量集進(jìn)行訓(xùn)練,建立SVM識(shí)別模型。
2)橋梁智能識(shí)別。對(duì)待處理的GPR 檢測(cè)數(shù)據(jù)進(jìn)行特征提取和PCA 降維,再利用識(shí)別模型進(jìn)行自動(dòng)分類識(shí)別,將識(shí)別出的各個(gè)橋梁的中心里程作為橋梁標(biāo)記。
圖5 鐵路路基GPR檢測(cè)數(shù)據(jù)智能里程校正方法流程
3)里程回歸。利用橋梁標(biāo)記和設(shè)備表,根據(jù)長(zhǎng)度、前后橋梁的里程差等信息,將GPR 檢測(cè)數(shù)據(jù)中的橋梁與設(shè)備表中橋梁的自動(dòng)匹配,得到每個(gè)橋梁的實(shí)際中心里程。再將原始中心里程、實(shí)際中心里程進(jìn)行回歸計(jì)算。根據(jù)回歸公式,即可計(jì)算GPR 文件的實(shí)際起止里程與道間距。
從京九線路基檢測(cè)數(shù)據(jù)提取訓(xùn)練樣本和測(cè)試樣本,對(duì)本文的模型和方法進(jìn)行驗(yàn)證。數(shù)據(jù)采集參數(shù):中心頻率為400 MHz 的屏蔽天線,采樣時(shí)窗為64 ns,采樣點(diǎn)數(shù)為512,采集道間距為0.114 9 m。
試驗(yàn)的硬件環(huán)境:Intel(R)Xeon(R)Gold 5115 CPU@2.40 GHz,64 GB內(nèi)存。在Windows10 64 位系統(tǒng)下使用Visual Studio 2017+MySQL+ OpenCVSharp3.4編程實(shí)現(xiàn)算法。
樣本集構(gòu)建情況見(jiàn)表2。對(duì)各類樣本計(jì)算特征值后進(jìn)行歸一化處理,再通過(guò)PCA 方法降維至20 維。SVM 模型訓(xùn)練采用徑向基核函數(shù)RBF,得到82個(gè)支持向量,訓(xùn)練精度達(dá)到了98%。
表2 各類型樣本集構(gòu)建情況
各類型樣本識(shí)別結(jié)果見(jiàn)表3。可知,路基、橋梁、道岔3 類樣本的識(shí)別正確率分別為100%,94%,81%。識(shí)別錯(cuò)誤均為橋梁和道岔的錯(cuò)誤分類。
表3 各類型樣本識(shí)別結(jié)果
選取30 km 京九線路基檢測(cè)數(shù)據(jù),分別采用人工判讀和自動(dòng)識(shí)別的方法得出該區(qū)段的實(shí)際里程和道間距,驗(yàn)證自動(dòng)識(shí)別方法的誤差。為避免道岔的干擾,將橋梁長(zhǎng)度設(shè)置為不小于30 m。
人工判讀與自動(dòng)識(shí)別結(jié)果見(jiàn)表4??芍?,2種方法均識(shí)別出8 座橋梁,中心里程的誤差均低于0.005%。回歸計(jì)算后得出的里程起止范圍的誤差約2 m,道間距誤差低于1 mm,精度高,滿足鐵路路基檢測(cè)工程的實(shí)際需求。
表4 人工判讀與自動(dòng)識(shí)別結(jié)果
1)針對(duì)目前GPR 檢測(cè)數(shù)據(jù)里程校正效率低的問(wèn)題,提出了一種鐵路路基GPR 檢測(cè)數(shù)據(jù)智能里程校正方法。
2)本文提出的里程校正方法通過(guò)“二維離散+特征提取+PCA+SVM”的方法自動(dòng)識(shí)別橋梁、路基、道岔,對(duì)樣本的需求量小,且降維后計(jì)算復(fù)雜度降低,計(jì)算簡(jiǎn)便,不需要較高的硬件配置。
3)經(jīng)京九線路基檢測(cè)數(shù)據(jù)驗(yàn)證測(cè)試表明,基于SVM 的橋梁識(shí)別方法具有較高的精度,與人工判讀結(jié)果的誤差低于0.005%,最終里程校正的誤差約為2 m,滿足鐵路路基檢測(cè)工程的實(shí)際需求。