范鈺萍,唐權(quán)華,黃龍軍
江西師范大學(xué) 軟件學(xué)院,南昌 330022
現(xiàn)代鐵路運輸普遍使用電氣化設(shè)施,主要通過接觸網(wǎng)供電,接觸網(wǎng)安全是鐵路運輸安全的關(guān)鍵問題之一。威脅接觸網(wǎng)安全的一個主要因素是侵入鐵軌及其附屬設(shè)施區(qū)域的樹木,這類樹木被稱為危樹。危樹可能引起漏電、火災(zāi)、供電中斷等事故和災(zāi)害,需要及時地檢測和發(fā)現(xiàn)危樹。危樹產(chǎn)生是一個漸進的過程,因而危樹檢測也是一個長期不間斷的工作。由于鐵路線路長,經(jīng)常需要穿越無人地帶,危樹檢測需要耗費大量的人力物力,為提高效率、降低成本,必須探索危樹的自動檢測方法。危樹檢測過程主要對樹木與鐵路設(shè)施間的距離進行判斷,本質(zhì)上是對樹木區(qū)域識別和測距。圖像采集設(shè)備成本低,方便攜帶和安裝,且圖像包含了顏色信息,有利于危樹區(qū)域的識別,同時圖像中也包含了空間信息,可以用于測距,因此基于圖像處理的危樹檢測方法成為了首選方案。
基于圖像處理的危樹檢測首先需要對樹木區(qū)域進行分割和識別。區(qū)域分割是圖像內(nèi)容分析的基礎(chǔ)和前提,研究較為廣泛。現(xiàn)有區(qū)域分割技術(shù)主要包括閾值分割[1]、邊緣輪廓劃分[2-3]、聚類[4-5]、隨機場建模[6-7]等,最近的研究成果主要集中在隨機場建模和深度學(xué)習(xí)方法。基于隨機場建模的區(qū)域分割方法建立像素的概率分布模型,在數(shù)學(xué)理論上具有較好的支持,能較好體現(xiàn)樣本區(qū)域特征,對邊緣不明確的區(qū)域劃分效果有顯著優(yōu)勢,但建模速度較慢,結(jié)果劃分粒度相關(guān)。基于深度學(xué)習(xí)的區(qū)域劃分[8-9]方法訓(xùn)練區(qū)域分割的多層卷積神經(jīng)網(wǎng)絡(luò),具有一定的魯棒性,但對學(xué)習(xí)樣本有較大數(shù)量和質(zhì)量上的需求,劃分速度隨著劃分精度增加而降低。鐵路危樹檢測對區(qū)域劃分更注重計算的實時性,對精度要求相對較低,鐵路圖像拍攝是一個連續(xù)的過程,危樹檢測過程中需要利用前后兩幀對比信息,分割結(jié)果應(yīng)相對穩(wěn)定,而現(xiàn)有區(qū)域分割研究主要針對單幀圖像的應(yīng)用提高精度,有必要研究針對連續(xù)圖像的區(qū)域分割和識別方法。
危樹檢測的另一個任務(wù)是對樹木區(qū)域進行測距,現(xiàn)有圖像測距主要包括雙目視覺和參照物兩種方法。雙目視覺是指利用兩個攝像機拍攝同一目標(biāo)物體不同視角的兩幅圖像并對其進行立體匹配,由此計算得到視差圖算出目標(biāo)物體的位置,廣泛應(yīng)用于目標(biāo)測距[10-11]、定位[12-13]以及三維重建[14-15]等領(lǐng)域。視差圖是雙目視覺方法計算圖像深度和測距的主要依據(jù),視差估計也是近年研究的一個重點,現(xiàn)有視差估計方法包括局部估計、全局估計、合作和半全局估計等,視差估計在立體視頻[16]、3D重建[17]、自動駕駛[18]等領(lǐng)域應(yīng)用廣泛。雙目視覺測距方法有效解決了圖像中缺少深度信息的問題,但對拍攝設(shè)備、拍攝條件有較高的要求。圖像測距的另一條思路是利用測距對象上或測距環(huán)境中的特殊參照物,通過參照物的尺寸和距離來估計待測距離,參照物可以人為添加或利用現(xiàn)有圖形,這種方法在自動駕駛、手術(shù)導(dǎo)航等問題中得到有效應(yīng)用?;趨⒄盏臏y距方法計算簡單,精度較高,限制是需要在測距位置同一深度有合適的參照物,或方便添加人工參照物。鐵路危樹檢測圖像拍攝過程中震動較為嚴重,很難固定兩攝像機的拍攝角度,給雙目視覺測距帶來不便。鐵路兩側(cè)雖然有接觸網(wǎng)支架和軌道線可作為測距參照物,但支架存在位置不連續(xù),不能用于支架間的樹木區(qū)域測距;軌線深度連續(xù),但其高度僅限地面,對較高的樹木區(qū)域失去參考意義。
為解決鐵路危樹檢測中區(qū)域劃分、識別和測距的問題,本文設(shè)計了基于多顏色閾值的多尺度區(qū)域分割方法,嘗試基于顏色特征和分形維數(shù)對樹木區(qū)域進行識別,以連續(xù)拍攝的圖像的區(qū)域?qū)?yīng)及移動信息估計區(qū)域與攝像機的距離。通過對測試路段的視頻處理,證實本文的方法可以有效地對危樹區(qū)域進行檢測。
為識別樹木區(qū)域,發(fā)現(xiàn)危樹,首先要對圖像進行區(qū)域分割。樹木區(qū)域與山體、鐵路不一定存在明顯邊緣,樹木之間可能存在一定差異,因此很難通過邊緣輪廓或聚類的思路進行區(qū)域分割。在分割對象與背景環(huán)境有較為明顯顏色區(qū)分的場景中,基于顏色特征的圖像分割方法有著的廣泛應(yīng)用,例如在綠色植物、水果蔬菜等圖像識別與分割中的應(yīng)用,有研究學(xué)者利用綠色植物的顏色特征將其與土壤等環(huán)境背景進行分割,再通過顏色閾值分割得到綠色植物葉片的病害病斑部分[19]。樹木區(qū)域最突出的特征是顏色,實驗的鐵路圖像素材以樹木區(qū)域、鐵路、山體以及天空為基本組成,可根據(jù)樹木區(qū)域與其他組成部分之間存在的顏色差異,將基于顏色空間的閾值分割算法引入樹木區(qū)域的分割。根據(jù)識別和測距的需要,采用多顏色閾值對圖像進行區(qū)域分割。另外,基于顏色閾值的危樹的識別需要考慮區(qū)域間的包含和匹配的問題,有必要研究多尺度的區(qū)域分割和識別方法。最大類間方差法可以簡單快速地將圖像分割成前景和背景兩個部分,而分割后的區(qū)域?qū)⑦M一步閾值分割細分區(qū)域,即多尺度區(qū)域分割[20],細分得到的區(qū)域分割結(jié)果有利于下一步樹木區(qū)域的識別和匹配。
首先,對圖像進行預(yù)處理,即圖像灰度化后使用平滑濾波的方法對圖像進行增強和去噪,以免圖像噪聲對區(qū)域分割產(chǎn)生影響;其次,通過循環(huán)計算不同類別方差,選取使類間方差最大的灰度值為最優(yōu)閾值,將圖像分割為前景和背景,計算得到兩個區(qū)域的閾值T1、T2:
使用T1、T2可以將圖像分割為較大的區(qū)域,為測量區(qū)域距離,需要進一步細分區(qū)域。令已有閾值總數(shù)為max,應(yīng)用已有Ti計算新的閾值:
利用新的閾值對圖像進行區(qū)域分割,則可以比上次獲得更細的分割結(jié)果,并且與上次的分割結(jié)果形成包含關(guān)系。重復(fù)利用式(2)計算閾值進行區(qū)域分割,則可以獲得多組具有包含關(guān)系的區(qū)域分割結(jié)果,并將第k次分割的結(jié)果記錄為{Bi}k。
由于鐵路兩側(cè)包含草叢、灌木、喬木等不同種類的綠色植被,各類植物顯示不同的紋理特征,使得后續(xù)區(qū)域識別與匹配過程比較困難。通過多尺度的顏色閾值分割可以將圖片區(qū)域進一步細分,得到不同植被以及樹木分支結(jié)構(gòu)的區(qū)域分割,將植被區(qū)域的顏色特征與分形維數(shù)相結(jié)合,可以對樹木區(qū)域進行識別和匹配。
鐵路兩側(cè)一般種植四季常青的樹木,在冬天樹木凋零基本停止生長,不會產(chǎn)生新的危樹區(qū)域,因此只需要對綠色樹木進行識別,顏色成為識別樹木區(qū)域的明顯特征。傳統(tǒng)的RGB顏色模型中的顏色會受光照影響而改變,不便于進一步的樹木區(qū)域分割,而HSV顏色空間由色調(diào)、飽和度和亮度三個要素組成,可以比較直觀地反映事物的顏色,且應(yīng)用廣泛,利用HSV顏色空間對區(qū)域進行分割和識別成為一種常見的方法,廣泛應(yīng)用于人臉檢測、車牌識別等問題的研究中。危樹檢測過程中的樹木區(qū)域色調(diào)相近,因此可也采用HSV 顏色空間對區(qū)域進行判定。應(yīng)用拍攝樣本和網(wǎng)絡(luò)收集的樹木圖片分割和標(biāo)注,在保證不產(chǎn)生漏檢的情況下選取最小的顏色區(qū)間,獲得樹木區(qū)域的顏色判定條件為:
HSV 顏色空間判定可以將圖像區(qū)分為植物和非植物區(qū)域,但鐵路的路基上也可能會生長一些其他植物,接觸網(wǎng)支柱也可能因為苔蘚等因素顯現(xiàn)綠色,因此需要進一步對綠色區(qū)域進行識別。
樹木與一般植物的區(qū)別在于,單株樹木的體積較大,呈現(xiàn)明顯的分支結(jié)構(gòu),這種分支結(jié)構(gòu)在圖像區(qū)域展現(xiàn)為區(qū)域的層級包含關(guān)系。分形理論可以對樹木的這種分支結(jié)構(gòu)進行區(qū)分,且在圖像處理中已有成功案例,故引入分形理論識別樹木區(qū)域是一個自然選擇。分形維數(shù)是分形幾何理論的重要概念之一,廣泛應(yīng)用于圖像分割[21]、植物分形研究[22]等領(lǐng)域,分形維數(shù)反映事物分化時細節(jié)的增長速度,可以計算植物區(qū)域的分形維數(shù),然后根據(jù)區(qū)域分形維數(shù)值的對比對其加以區(qū)分,達到樹木區(qū)域分割和識別的目的。已有學(xué)者利用雙毯法計算樹木的分形維數(shù),從而確定圖像中的樹木區(qū)域[21]。雙毯法較精確地統(tǒng)計每個像素領(lǐng)域的分形維數(shù),對區(qū)域的劃分有較大幫助,但計算復(fù)雜度高,不利于實時運算。為提高分形維數(shù)的計算效率,本文利用多尺度區(qū)域分割的邊緣長度計算區(qū)域的分形維數(shù),計算公式如下:
其中,B指計算維數(shù)的區(qū)域,s指用于閾值分割的閾值尺度,即閾值間的最小距離,lgEB(s)指經(jīng)過尺度s的閾值分割后,區(qū)域B內(nèi)的邊緣總長度。
通過分形維數(shù)的計算與比較判斷得到不同的植物區(qū)域以及同一樹木的分支結(jié)構(gòu)區(qū)域,結(jié)合顏色特征的限定,即可得到樹木區(qū)域識別的綜合判別方法。令符合顏色值要求的區(qū)域集TC={Ti}C,樹木區(qū)域的維數(shù)范圍為Fd=(fmin,fmax),則最終獲得樹木區(qū)域為:
在獲得樹木區(qū)域后,測量它們與軌道間的距離是判定危樹區(qū)域的主要任務(wù)。由于成像過程中的透視效果,圖像中像素距離不能直接映射到現(xiàn)實距離,需要獲得成像點到相機的距離,即圖像的嘗試信息。為還原嘗試信息獲得目標(biāo)物體的實際位置,主流研究主要使用雙目視覺的計算方法。雙目視覺以兩個不同視點拍攝同一目標(biāo)物體,然后通過立體匹配和三角測量原理計算得到圖像像素間的位置偏差,即視差值,最后利用大小為單幀視頻圖像,元素值為視差值的視差圖來計算目標(biāo)物體的位置。鐵路目標(biāo)圖像的獲取是通過攝像機在列車行駛過程中所產(chǎn)生的一系列圖像,雙目視覺的雙目平行模型算法獲取目標(biāo)物體的圖像相似,然而雙目平行模型的測距是利用同一目標(biāo)物體在水平方向的兩張圖像像素間的位置變化來得到物體深度信息,樹木區(qū)域與鐵路安全區(qū)域之間的測距則需要根據(jù)圖像測量兩個目標(biāo)物體間的縱向距離。借鑒雙目平行模型的測距算法的思想,本文提出基于縱向視差的測距算法。
列車向前行駛,接觸網(wǎng)、鐵軌、樹木等背景相對靜止,背景區(qū)域在不同時刻從列車上觀察的位置產(chǎn)生相對變化,可以利用這些變化估計背景相對列車的絕對位置。在列車行駛過程中,由于攝像機移動,同一對象的成像產(chǎn)生變化。對成像物品上一點P(x),設(shè)它在成像面上的成像位置為I(XB) ,當(dāng)攝像機向前移動距離S后,物體成像到I(XF),其中X、XB、XF分別為P點及其成像到攝像機中心線的水平距離,攝像機焦距為F,物體與攝像機的初始距離為D,如圖1所示。
圖1 縱向視差與橫向距離
據(jù)三角形相似可得:
于是有:
上式與距離D無關(guān),XB、XF可以通過圖像測距獲得,焦距F攝像機固定參數(shù),攝像機移動的距離S可以通過攝像機移動速度和拍攝時間計算,因此成像物體與攝像機中心軸的距離可以通過上式計算。根據(jù)式(6),只要找到點P在不同時刻的成像,就可計算P與中心軸的距離。
與雙目視覺的計算相似,計算縱向視差的前提是對成像點進行匹配,圖像立體匹配首先需要考慮的是匹配的最小單元,即圖像點特征、線特征和塊特征等匹配基元的選取,根據(jù)匹配基元的不同可以分為基于區(qū)域、特征、相位的立體匹配算法;其次是對匹配范圍的確定,根據(jù)參與匹配的圖像像素范圍的大小可以將常用的立體匹配算法分為全局匹配、局部匹配和半全局匹配。由于鐵路圖像樹木區(qū)域顏色相近,列車高速運行中前后兩幀圖像會產(chǎn)生變形,很難通過傳統(tǒng)的匹配方式對像素進行匹配。為解決像素匹配問題,利用同一樹木區(qū)域包含關(guān)系不變的特點,設(shè)計多尺度的區(qū)域匹配方法,即首先對大的區(qū)域匹配,然后再對其子區(qū)域進行匹配,直到匹配區(qū)域無子區(qū)域,再對最小的區(qū)域進行形狀的拓普學(xué)對應(yīng),從而達到像素點的匹配。
圖像測距的精確度較低,攝像機焦距的誤差和抖動必然產(chǎn)生一定的測量誤差,很難用測距的絕對值判定危樹。所幸的是,鐵路兩邊的接觸網(wǎng)支架與鐵軌的距離固定,并限定了鐵路的安全區(qū)域,可以通過縱向視差計算支架的位置然后與實際位置進行對比,從而對縱向視差距離估計的結(jié)果進行評估和校正。接觸網(wǎng)支架在圖像中的突出特征是包含幾條位置相對固定的直線,可以先檢測直線,然后分析直線間的位置關(guān)系以檢測支架。圖像處理領(lǐng)域中,直線檢測的經(jīng)典方法是Hough 變換,對Hough變換的計算方法研究改進很多,如采用一種多約束的Hough變換提取特征線,并且利用概率表決估計消失點,然后用消失點約束特征線,最后多次迭代K-means聚類實現(xiàn)車道線檢測[23]。本文采用累計概率Hough 線變換算法識別并標(biāo)記圖像中的直線,由此識別出圖像中接觸網(wǎng)支柱、支架等線型模型,然后采用樸素貝葉斯分類器對Hough變換所檢測得到的線段進行判斷,從而識別接觸網(wǎng)支柱結(jié)構(gòu)。
令Hough 變換檢測到的線段集為L={li|i=1,2,…,N},將線段li與lj間的夾角表示為Aij,最近端點間相對距離(使用實際距離除以li與lj的最大長度為Dij,則三條線段li、lj、lk組成接觸網(wǎng)支架的事件P概率為:
因為Aij與Dij的變化主要是由于拍攝距離和角度引起,可以簡單地認為它們服從均勻分布,設(shè)置變化范圍,則可以計算P(R|Aij)與P(R|Dij)。支架檢測的結(jié)果如圖2所示。
圖2 接觸網(wǎng)支柱檢測結(jié)果
接觸網(wǎng)支架的位置不能直接用于樹木區(qū)域的估計,但可以通過支架位置的計算獲得視差計算的誤差,用于校正相鄰樹木區(qū)域位置估計可能存在的誤差,從而提高危樹檢測的準確性。
為驗證算法的有效性,對成都至達州的某段鐵路進行了拍攝和樹木區(qū)域測距實驗。實驗中拍攝圖片采用1 920×1 080 的分辨率,通過人工對樹木區(qū)域進行標(biāo)注和距離估計。實驗程序采用單線程在Dell M3800移動圖形工作站(Intel i7-4712HQ處理器,16 GB內(nèi)存)上運行,統(tǒng)計區(qū)域分割和測距誤差,部分結(jié)果如表1 所示。實驗中,利用正反樣本各10 000 張進行訓(xùn)練,正反樣本主要通過拍攝視頻及網(wǎng)絡(luò)收集的樣本進行切割和分選獲得,得到樹木區(qū)域的分形維數(shù)在開區(qū)間(1.315,1.422)內(nèi)。
實驗中以樹木區(qū)域距離匹配為目標(biāo),基于縱向視差估計樹木區(qū)域與鐵軌中心的距離,主要流程如圖3所示。
圖3 樹木區(qū)域距離估計流程
表1 中樹木區(qū)域總數(shù)指在進行最大類間方差分割后,選取包含樹木區(qū)域的部分灰度中間值進行第一次分割并識別的樹木區(qū)域數(shù)量,區(qū)域數(shù)誤差指由于區(qū)域分割和識別的誤差的樹木區(qū)域數(shù)量變化,距離最大指各區(qū)域測得距離與實測距離誤差的最大值,距離平均誤差指各區(qū)域測得距離與實測距離誤差的平均值。
表1 測距實驗結(jié)果
從表1所示的實驗結(jié)果看,程序計算每幀圖像所需要的時間平均在330 ms 左右,每秒可檢測2~3 幀,實際應(yīng)用中可以使用并行計算和調(diào)用GPU運算等手段進一步提高運行速度,在配置了8CPU的電腦每秒至少可檢測24 幀以上,按高鐵速度每秒行駛100 m 估計,檢測的間距為4 m左右,而實際拍攝圖像的可視范圍遠遠超過4 m,因此算法可以達到實時檢測的要求,并不會出現(xiàn)檢測遺漏區(qū)域。檢測過程中出現(xiàn)了一定的區(qū)域分割誤差,這個誤差主要存在較遠的區(qū)域,在后續(xù)檢測過程通??梢垣@得校正,不影響最終檢測的結(jié)果。檢測計算出的距離與人工估計的距離存在0.2 m 左右的誤差,主要是由于攝像機抖動所引起。
實際對危樹的判定應(yīng)以樹木區(qū)域與接觸網(wǎng)支架的距離(即鐵路的側(cè)面限界)對比為標(biāo)準,但由于目前相關(guān)路段對鐵路的維護,很難獲得存在危樹的實驗素材。為增加檢測精度,進一步通過側(cè)面限界對測量結(jié)果進行校正,即計算測量所得的側(cè)面限界數(shù)據(jù)與實際側(cè)面限界的偏差,測量所得的樹木區(qū)域距離與之相減的結(jié)果作為最終測量結(jié)果,改進的后估計流程如圖4所示。
實驗鐵路的實際側(cè)面限界為2.9 m,統(tǒng)計實驗結(jié)果的誤差概率分布如圖5所示。
圖5 表明,通過支架距離校正后測量誤差降低到0.15 m 以下,平均在0.07 m 左右,這一方面為進一步降低測量誤差奠定了基礎(chǔ),另一方面也證明了通過支架相對位置檢測危樹思路的正確性。
為分析測量誤差的來源,選取測量過程中誤差較大的兩幀圖片進行分析。圖6 分別展示了相鄰兩幀圖像及其區(qū)域分割、匹配的結(jié)果。
圖4 校正后的樹木區(qū)域距離估計流程
圖5 校正前后的誤差分布
圖6 區(qū)域分割與匹配的結(jié)果
圖6中的黃色為不同尺度所分割區(qū)域的輪廓,紅色小圓標(biāo)注了其中兩個樹木區(qū)域的匹配結(jié)果。從結(jié)果看,主要區(qū)域分割前后一致,匹配結(jié)果基本正確,但由于攝像機抖動,匹配點與攝像機中心的相對位置發(fā)生了一定變化,導(dǎo)致了測量誤差產(chǎn)生。
本文對基于圖像的鐵路危樹檢測方法進行了探索,設(shè)計了針對危樹檢測的區(qū)域分割方法、樹木區(qū)域的分形維數(shù)計算方法、區(qū)域多尺度匹配方法,通過圖像區(qū)域在前后兩幀中的位移和攝像機移動測量區(qū)域距離成像面中心的距離,通過對比樹木區(qū)域與接觸網(wǎng)支架的位置關(guān)系對危樹區(qū)域進行差別。實驗證明,本文所設(shè)計的方法具有良好的測量精確性,計算復(fù)雜度在可接受的范圍內(nèi)。為解決危樹判定過程中,樹木區(qū)域與鐵路安全區(qū)域的檢測易受攝像機抖動而產(chǎn)生較大誤差等問題,根據(jù)同一圖像中兩目標(biāo)物體相鄰兩幀的位置變化計算物體的實際距離,即對雙目視覺測距算法進行改進提出基于縱向視差的計算方法。由于真實鐵路維護的狀況良好,危樹的實驗素材采集困難,未能對實際的危樹視頻進行直接檢測,后續(xù)研究將通過布置模擬場景的方式獲得危樹的視頻以進一步證實算法的有效性。對于列車的高速行駛引起的圖像抖動,本文僅通過區(qū)域匹配等方法消除其影響,在后續(xù)研究中將結(jié)合去抖動等圖像穩(wěn)定技術(shù)增加測量的精度。