百色能源投資發(fā)展集團(tuán)有限公司輸電管理所 李宏偉
近年來(lái),無(wú)人機(jī)技術(shù)在電力系統(tǒng)的不同應(yīng)用中得到了大規(guī)模發(fā)展。使用裝有人工視覺(jué)系統(tǒng)的飛行器執(zhí)行檢查任務(wù)越來(lái)越普遍。處理和分析圖像的目的是檢測(cè)線路故障,通過(guò)使用分段檢測(cè)算法或具有并行約束的霍夫變換來(lái)檢測(cè)傳輸線。視覺(jué)工業(yè)檢測(cè)是無(wú)人機(jī)的一個(gè)重要應(yīng)用領(lǐng)域,因?yàn)槠涮峁┝嗽诶щy和危險(xiǎn)的區(qū)域捕獲圖像的功能。姿態(tài)的導(dǎo)航和控制對(duì)電力系統(tǒng)的應(yīng)用具有一定挑戰(zhàn),目前已經(jīng)研究了不同的解決方案,如卡爾曼濾波器和PID控制器。然而,以前的兩種技術(shù)都依賴于使用本體感覺(jué)傳感器,適合偏差[1-3]。
該檢測(cè)算法由三個(gè)階段組成:自適應(yīng)閾值、多任務(wù)學(xué)習(xí)、圖像檢測(cè),前兩個(gè)階段與預(yù)處理有關(guān),在最后的第三階段對(duì)預(yù)處理進(jìn)行了調(diào)整,以適應(yīng)核心線檢測(cè)算法。本文使用自適應(yīng)閾值來(lái)隔離不同光照條件下的輸電線路。
無(wú)人機(jī)可以在輸電線路上方的高度飛行,并且相對(duì)靠近進(jìn)行監(jiān)控拍攝,由于反射而具有良好亮度的輸電線容易被判斷。然而,偏遠(yuǎn)地區(qū)的輸電線在復(fù)雜的地形長(zhǎng)距離運(yùn)行,圖像或視頻背景可以從樹木和綠色斑塊到不同的平坦空間,如貧瘠的斑塊以及房屋和道路等其他物體。自適應(yīng)閾值算法根據(jù)鄰域中的像素強(qiáng)度為每幀中的每個(gè)像素使用不同的閾值,可以解決這些問(wèn)題。因此筆者設(shè)計(jì)了一種新的檢測(cè)算法,可檢測(cè)任何不同背景中的線條。
通過(guò)使用單個(gè)全局閾值,將電力線與強(qiáng)度變化的背景隔離變得具有挑戰(zhàn)性,此外在幀之間,捕捉到的輸電線本身的強(qiáng)度,根據(jù)無(wú)人機(jī)的位置而變化。最后,檢查可在一天中的任何時(shí)間段進(jìn)行,即不同的日光亮度條件,并且該算法能夠在所有條件下成功檢測(cè)。
自適應(yīng)閾值算法可解決圖像處理中的圖像二值化和分割問(wèn)題。在圖像二值化中,傳統(tǒng)的全局閾值算法將整個(gè)圖像使用一個(gè)固定的閾值進(jìn)行二值化,但對(duì)于光照不均勻或背景復(fù)雜的圖像,會(huì)產(chǎn)生較多的錯(cuò)誤分類。而自適應(yīng)閾值算法則能根據(jù)圖像的局部信息和特性,為不同區(qū)域或像素分配不同的閾值,提高二值化的準(zhǔn)確性和魯棒性,尤其在處理有光照變化或背景復(fù)雜的情況下效果更好。
在圖像分割中,自適應(yīng)閾值算法可根據(jù)圖像的特性和需要,將圖像中的前景對(duì)象從背景中分離出來(lái)。通過(guò)對(duì)圖像局部區(qū)域的像素信息進(jìn)行分析,可確定局部區(qū)域的特定閾值,并將符合條件的像素分配到前景或背景中。這在自動(dòng)化的圖像分析和對(duì)象識(shí)別中較為重要,能夠準(zhǔn)確地分割出精確的對(duì)象,為后續(xù)的圖像處理、分析和識(shí)別提供基礎(chǔ)。因此,自適應(yīng)閾值算法在圖像處理領(lǐng)域具有廣泛的應(yīng)用前景。
該算法采用模糊函數(shù)來(lái)計(jì)算鄰域強(qiáng)度,模糊功能的選擇取決于背景特性及其自定義調(diào)整。在本文的案例中,電源線只有2~3像素厚,背景綠化、房屋和道路分布在更多的像素上。因此,與任何其他類型或大小的內(nèi)核相比,使用高斯內(nèi)核,計(jì)算加權(quán)平均函數(shù),能夠抑制更多的背景,同時(shí)保留輸電線路圖像。這是因?yàn)閮?nèi)核是單個(gè)像素覆蓋了足夠的背景,一般覆蓋了2~3個(gè)像素的粗線。
考慮到卷積層,有幾種類型的內(nèi)核卷積圖像及其相應(yīng)的激活圖。在轉(zhuǎn)發(fā)階段,將生成一組新的激活映射。假設(shè)一幅二維圖像的濾波器權(quán)重為W,濾波泛化的公式可以簡(jiǎn)化為:Y=W×Im,其中:Y是計(jì)算矩陣,并且使用二維卷積運(yùn)算來(lái)表示行x和列中的條目,將J和K作為濾波器的尺寸,表示卷積的方程將得到如下結(jié)果:
對(duì)于子采樣階段,可使用池層來(lái)減少激活映射的維數(shù)以及網(wǎng)絡(luò)參數(shù)。此任務(wù)常用的方法是最大共享一般層。另一方面,完全連接的層通常分配在卷積網(wǎng)絡(luò)的最后階段,并對(duì)應(yīng)于大多數(shù)參數(shù)。
即使目標(biāo)是一項(xiàng)特定的分類任務(wù),學(xué)習(xí)其他目標(biāo)也可成為一種常見(jiàn)的做法,這也有利于主要任務(wù)執(zhí)行。多任務(wù)學(xué)習(xí)利用個(gè)體學(xué)習(xí)任務(wù)之間的內(nèi)在關(guān)系來(lái)提高分類性能。因此,在這項(xiàng)工作中,筆者不僅試驗(yàn)了基于單獨(dú)作業(yè)的單獨(dú)學(xué)習(xí)任務(wù),還試驗(yàn)了同時(shí)將兩項(xiàng)任務(wù)聯(lián)合起來(lái)的多任務(wù)學(xué)習(xí)。
在三個(gè)學(xué)習(xí)任務(wù)的各個(gè)情況下,要最小化的損失函數(shù)L是交叉熵,定義如下:對(duì)于N個(gè)觀測(cè)值和K個(gè)類,模型輸出每個(gè)觀測(cè)值i∈{1,…,N}和類k∈{1,…,K}的概率,這與真實(shí)標(biāo)簽yi,k形成對(duì)比,當(dāng)觀測(cè)值i屬于類k時(shí),k為1,否則為0。
在多任務(wù)的情況下,最終損失L'將材料L(m)和缺陷L(d)的兩個(gè)損失組合為簡(jiǎn)單的未加權(quán)和:。
自適應(yīng)閾值算法的輸出是二維值圖像,其中電源線像素厚度從原始圖像和某些明亮的背景補(bǔ)丁中保留。在頭頂跟蹤過(guò)程中,正面攝像頭電源線的透視圖會(huì)在圖像上產(chǎn)生不同厚度的線。線條在邊框底部邊緣附近最粗,在圖像頂部附近向地平線逐漸變細(xì)。
為了得到這樣均勻的線條,筆者使用了一種新的基于多數(shù)的侵蝕算子。該算子專門用于線檢測(cè),因?yàn)槠渫ㄟ^(guò)將線厚度減薄到單個(gè)像素來(lái)進(jìn)行操作。當(dāng)算子的核在圖像上移動(dòng)n×n的全一矩陣時(shí)。取或更小的SOP(總和乘積)作為有利的候選輸出,將中心像素設(shè)置為1或0。前提條件是,任何方向的線在n×n核中的總和乘積不能超過(guò)“n2”。
步驟如下:如果施加全1,n×n內(nèi)核后的總和乘積>n個(gè)像素,則前景包含電源線以外的其他圖像,其應(yīng)該被抑制;如果SOP=n,其有一條沿著核主對(duì)角線的任何旋轉(zhuǎn)相交的電源線,而沒(méi)有其他圖像,必須保留;若SOP<n,其有一條沿核的一個(gè)小對(duì)角線的任何旋轉(zhuǎn)相交的電源線,而沒(méi)有其他圖像,必須保留。
形態(tài)學(xué)算子用于保留二維值圖像中的線條并去除其他任何內(nèi)容,基本上是一個(gè)形狀保持器,在該應(yīng)用中,形狀是線條。前景面片的內(nèi)部將被刪除,僅保留其邊緣。運(yùn)算符的大小是根據(jù)行之間的間隔距離來(lái)選擇的,很明顯,對(duì)于n×n核,線條之間的距離應(yīng)該是最小的“n”像素所確定的距離,以便保留兩條線。圖像表明,大小為3×3的內(nèi)核最大限度地減少了假陰性,而大小為7×7的內(nèi)核最大限度地減少了偽陽(yáng)性,即折中。
眾所周知,金屬物體會(huì)反射其上的視覺(jué)波段中的大部分電磁輻射,因此除了典型的頭頂框架中地平線上方的可見(jiàn)視野外,框架內(nèi)的其他偽影都不會(huì)跟像素強(qiáng)度矩陣中捕捉到的那樣具有高強(qiáng)度。由于使用了侵蝕操作,可以容易捕捉天空畫面,因此在侵蝕后的框架中,電力線仍然是最明亮的。在試驗(yàn)中也觀察到了同樣的情況,作為處理的所有階段:從彩色圖像到HSV(顏色模型)表示的圖像,再到二維值圖像。具體而言,在圖像的HSV表示中,沿著所捕獲的細(xì)電源線的表面,電源線在值維度上始終顯示強(qiáng)度>65%。視頻中捕捉到的電源線是3個(gè)像素寬的。然而,在前置攝像頭拍攝的透視圖中,輸電線路的平行邊緣與地平線交匯。因此,線條厚度隨著其與攝影機(jī)的距離增加而逐漸變細(xì)。
上述性質(zhì)在侵蝕后也成立。侵蝕后,線條為單像素寬,由于相機(jī)CCD背板上的圖像捕獲網(wǎng)格的頭頂檢測(cè)和離散性,線條也具有預(yù)期的略微交錯(cuò)的外觀。較小的交錯(cuò),即向右或向左均勻傾斜1個(gè)像素,表現(xiàn)為以階梯方式一個(gè)接一個(gè)堆疊的小垂直線段。在架空檢測(cè)過(guò)程中,線路越垂直,線段的長(zhǎng)度就越大,抖動(dòng)越小。筆者使用這種一致的啟發(fā)式方法來(lái)追蹤線條,研究中也以不同的形式使用了這種啟發(fā)式方法。
在頭頂檢測(cè)中,電源線通常從圖像矩陣的底部延伸到頂部。追蹤這些線,首先必須確定其的起始位置,前置攝像頭可看到圖像底部最接近的線條。因此,圖像的底部具有在所有幀中最突出的線條,中間沒(méi)有破損。在侵蝕后矩陣的底部幾行中,注意所有1的垂直運(yùn)行。假設(shè)線之間相隔至少3個(gè)像素的距離,因此使用窗口來(lái)局部識(shí)別起始位置。一旦確定了起始位置,就繼續(xù)從下到上逐行掃描,重復(fù)地檢測(cè)和累積線路長(zhǎng)度,直到遇到線路中斷。
本文算法使用OpenCV軟件包實(shí)現(xiàn),該算法在大約800幀上進(jìn)行了測(cè)試,為了展示算法的有效性,本文中展示了兩個(gè)特定幀中的電力線跟蹤。這兩張照片的背景不同了,選擇其是為了表明所提出的方法在不同條件下都能較好地工作。圖1(a)的背景比圖2(a)的背景更為復(fù)雜,完成處理和跟蹤后的圖像分別如圖1(b)和圖2(b)所示。結(jié)果定性地表明,能夠檢測(cè)到大多數(shù)架空電力線,對(duì)于作為電力線檢查下一階段的故障來(lái)說(shuō),電力線檢測(cè)的初步成功至關(guān)重要。
圖1 樣本幀1中的線條檢測(cè)
為了以跟蹤線長(zhǎng)度的形式對(duì)結(jié)果進(jìn)行定量分析,提出了算法的最壞情況和平均情況分析。在進(jìn)行分析之前,討論以像素為單位的兩個(gè)連續(xù)幀捕獲之間需要跟蹤的線長(zhǎng)度的下限。無(wú)人機(jī)以大約10m/s的速度飛行,幀捕獲率為24幀/s。因此,在兩次幀捕捉之間,無(wú)人機(jī)飛行距離約為0.4m,對(duì)于根據(jù)網(wǎng)格設(shè)計(jì)相距100m的兩極,其之間的導(dǎo)線覆蓋圖像長(zhǎng)度的3/4,即360像素。因此,0.4m對(duì)應(yīng)于1.44像素的距離。在頭頂檢測(cè)中,幀間距離對(duì)直線跟蹤提出了重要的要求,這樣前置攝像頭正下方的線段的檢測(cè)效果會(huì)更好。
為了進(jìn)行統(tǒng)計(jì)分析,筆者選擇了281個(gè)樣本幀,其在真實(shí)視頻序列中均勻地間隔3幀放置。從對(duì)所有這些圖像幀的檢測(cè)長(zhǎng)度數(shù)據(jù)的分析中可看出,只有9/281幀具有很少的誤報(bào)。對(duì)于所有其他幀,再次看到檢測(cè)到的最小長(zhǎng)度是從幀底部起大約17個(gè)像素,每幀中的電源線大約有300個(gè)像素長(zhǎng)。然而,當(dāng)將其與要求進(jìn)行比較時(shí),即能夠從每幀底部跟蹤至少1.44個(gè)像素,那么即使在最壞的情況下,也可以實(shí)現(xiàn)。
轉(zhuǎn)到平均案例分析,通過(guò)對(duì)平均值周圍10%的變化進(jìn)行閾值處理,對(duì)每幀中的長(zhǎng)短線進(jìn)行分類。發(fā)現(xiàn)只有13%的線路具有小于檢測(cè)到的短線路數(shù)量。這意味著在大多數(shù)幀中,檢測(cè)到的行距足夠長(zhǎng)。此外,還獲得了所有幀中所有此類檢測(cè)線的全局平均值,在視頻中,真實(shí)線的300像素長(zhǎng)的表示中,179個(gè)像素的全局平均值不僅比要求的邊界好125倍,而且覆蓋了直到地平線的可見(jiàn)網(wǎng)格總長(zhǎng)度的60%。
在本文中,算法的設(shè)計(jì)基于一種新的形態(tài)學(xué)侵蝕算子,以及一種魯棒的圖像像素空間啟發(fā)式算法來(lái)提取電力線路圖像,覆蓋了直到地平線的60%的可見(jiàn)線長(zhǎng)度。因此,當(dāng)涉及重要線段時(shí)不會(huì)發(fā)生漏檢。目前,正致力于在兩個(gè)計(jì)數(shù)上進(jìn)一步提高每幀中檢測(cè)到的線路長(zhǎng)度的程度。每當(dāng)電力線下有一塊明亮的貧瘠斑塊時(shí),就會(huì)發(fā)現(xiàn)并提取。因此,總的來(lái)說(shuō)該電力線檢測(cè)算法足夠穩(wěn)健,具有良好的性能,因此也可應(yīng)用于任何其他真實(shí)戶外視頻中的任何線路檢測(cè)場(chǎng)景。