摘 要:目標檢測作為圖像處理中的一個重要應用領域,在軍民多領域都擁有重要的研究和應用價值。隨著網絡和傳感器技術的發(fā)展,圖像、視頻等多媒體媒介也與之俱增,為目標檢測提供了豐富的樣本數據。尤其是隨著深度學習方法的應用,目標檢測精度得以大幅提高并得到了廣泛應用。本文首先介紹了目標檢測技術;然后重點介紹了目前深度學習技術在遙感圖像目標檢測中的應用進展;最后討論了深度學習方法應用于目標檢測時存在的困難和挑戰(zhàn),并對今后的發(fā)展趨勢進行展望。
關鍵詞:目標檢測;深度學習;自動檢測;特征提取
DOI:10.12249/j.issn.1005-4669.2020.26.314
1 引言
目標檢測是計算機視覺領域中一個非常重要的研究問題。隨著通信網絡和傳感器技術的快速發(fā)展,生活中每時每刻都在產生大量的數字圖像數據,如何精確快速的對圖像中的目標進行識別檢測變得越來越重要。由于我們不僅關注對圖像的簡單分類,而且希望能夠準確獲得圖像中存在的感興趣目標及其位置,并將這些信息應用到現實任務中,因此目標檢測技術受到了廣泛關注。
目標檢測其主要目標是從給定的圖像或者視頻中定位感興趣的標并進行目標分類,這就需要從圖像中對目標進行特征提取從而進行目標分類,而且需要對目標進行邊界框的提取。近年來,隨著深度學習技術的發(fā)展及其在目標檢測領域的廣泛應用,目標檢測在速度和精度上都有了較大的進步。相比于人工設計的特征,通過模型自動提取和學習的特征可以更好的表達圖像中的目標。而且在傳統(tǒng)的方法中,手動提取的特征泛化能力較弱,不能很好的適應大規(guī)模的目標檢測任務。隨著深層次的卷積神經網絡的廣泛應用,通過多層級的卷積核,實現由低層次抽象到高層抽象的組合,從而將圖像的特征進行更精確的提取。即使在復雜背景下,深度學習依然可以高頻次的提取低層特征,比如邊界、輪廓、形狀、顏色、旋轉角等,同時深度學習還可以組合低層特征,得到更有區(qū)分性和魯棒性的特征。
2 應用進展
深度學習技術在遙感圖像目標檢測中的應用很廣泛,主要對土地覆蓋分類、道路提取、建筑物提取、小目標檢測、變化檢測等這幾個方面進行總結闡述。
1)土地覆蓋分類。利用深度學習做遙感影像的分割需要大量的標簽信息,但是這通常是一個耗時耗力的工作,為了克服缺少大量標簽數據的問題,Scott等人提出了通過模型微調和數據增強進行遷移學習,在土地利用分類中達到了97%-98%的分類精度。在土地利用分類中,針對樣本類別不均衡和錯誤標記的情況,Alexander等人在U-Net結構上,采用Lovasz-Softmax損失函數成功緩解了這些問題。Xiwei Yao等人更關注于在高分辨率衛(wèi)星影像上自動標注樣本,通過結合具有判別性的高級特征和弱監(jiān)督特征遷移提出了統(tǒng)一的標注框架,與完全的監(jiān)督分類方法表現的更有競爭力。
2)植被覆蓋分類。植被覆蓋制圖是監(jiān)測自然資源的必要任務,在農業(yè)方面可以輔助估算農作物產量。Zhang等在卷積神經網絡CNN的基礎上構造了由兩層構成的卷積編碼神經網絡,第一層由兩套卷積核分別提取耕地和林地特征,第二層由兩個編碼器組成,它們使用非線性函數來編碼學習的特征,將編碼結果映射到相應的類別號。該模型在GF-2影像的測試結果達到了0.91的精度。Kussul等采用深度學習的方法,做小麥、玉米、大豆等農作物類型的識別達到了85%以上的精度。
3)道路提取。道路信息對城市交通規(guī)劃,導航數據更新具有重要的作用。利用遙感影像提取道路是遙感領域的一項基本任務,在過去十年間一直是一個熱門話題。利用深度學習的技術提取道路相比于傳統(tǒng)方法具有很大的提高。在2018 CVPR DeepGlobe競賽中,Lichen Zhou等人提出了D-LinkNet的語義分割網絡,并獲得了第一的成績。D-LinkNet采用編碼器-解碼器結構,通過擴張卷積和預訓練編碼器進行道路提取任務,在一定程度上可以處理道路的窄、連通、復雜和跨度等問題,但是仍然有一些道路連通性的問題需要解決。
4)建筑物提取。遙感影像中建筑物提取也是一項基本任務,但是由于我國各個地方的建筑風格迥異,導致建筑物在遙感影像上呈現的形態(tài)各式各樣,對計算機自動提取是很大的挑戰(zhàn)。Bittner等人融合了多種數據源,提出了一種端到端的全卷積神經網絡,它能夠結合不同數據源的光譜和高度信息,自動生成建筑物的輪廓。在DeepGlobe建筑物提取挑戰(zhàn)賽中,Zhao等人使用基于Mask R-CNN的實例分割算法來提取建筑輪廓,但是提取的建筑邊界也實際不太相同,因此提出了Mask R-CNN與建筑物邊界規(guī)則化相結合的方法,得到了很好的可視化效果。
5)小目標檢測。近年來利用深度學習進行目標檢測已經達到了很高的精度,在飛機識別方面,Hu等驗證了Fast R-CNN模型和SSD模型可用于檢測高分辨率遙感影像中的飛機,在檢測速度上,SSD更有優(yōu)勢,但是對于小飛機來說R-CNN模型具有更大的優(yōu)勢,并且更適合于復雜場景的檢測。為了讓網絡更適應于密集的小目標檢測,Ding等采用多尺度改進和多種改進方案組合的密集卷積網絡,來增強VGG16網絡結構。通過實驗驗證,本方法對飛機和車輛的檢測精度分別達到了90.7%和87.9%。為了解決小目標檢測的問題,Chen等提出了混合深度神經網絡(HDNN),通過將DNN的最后卷積層和最大池化層劃分成可變感受野或最大池化大小的多個塊,使得HDNN能夠提取可變尺度特征,在檢測城市等復雜背景下的車輛表現優(yōu)異。
6)變化檢測。變化檢測在遙感中具有重要意義,高分辨率遙感圖像的出現大大提高了我們從空間監(jiān)測土地利用和土地覆蓋變化的能力,同時,高分辨率遙感影像相比于其他衛(wèi)星影像提出了新的挑戰(zhàn)。Wang等人將Faster R-CNN應用于變化檢測,得到了比傳統(tǒng)方法更高的精度。Zhao等人構造一個兩側具有相同耦合層數的近似對稱深度神經網絡,將兩幅圖像變換成相同的特征空間,使兩幅圖像的特征更具有區(qū)分性,通過逐像素比較特征配對可以生成差異圖像。
3 思考與展望
深度學習技術在目標檢測中的應用范圍迅猛發(fā)展,但是還是存在著一些無法忽視的困難:
1)目標的隱蔽性。鑒于目標隱蔽性的特點,深度學習技術作為一種計算機視覺工具,很多隱藏目標無法識別,還需要結合其他手段,使目標在圖像或視頻中凸顯出來。
2)深度學習在目標應用中的理論不完善。深度學習技術是近些年來人工智能的關鍵技術。在目標檢測中的應用尚不成熟,況且目標的敏感性比較高,在很多時候受到的限制比較多。
3)大規(guī)模數據樣本集缺乏。雖然來源于多種平臺、多源傳感器獲取的圖像、視頻等數據有很多,但是這些數據并不能直接提供需要的目標類別、位置信息,為明智決策提供情報。深度學習技術起初訓練數據的時候,需要大量的標記樣本數據集支持,但是鑒于數據的保密性,對于目標檢測模型,缺乏大量的多樣性標記樣本集。
針對不同的問題,解決的辦法不盡相同。鑒于目標的隱蔽性,結合不同的數據源將目標地物凸顯出來,然后進行樣本制作,用于訓練模型。結合傳統(tǒng)的目標檢測技術,彌補深度學習目標檢測技術理論的不完善,同時考慮虛擬環(huán)境下虛擬數據的大規(guī)模應用。標記樣本需要大量的人力物力,對于海量樣本支撐的目標檢測技術基本無法實現,所以無標記樣本的目標檢測技術會成為重點研究目標。
參考文獻
[1]李曉斌,江碧濤,楊淵博等.光學遙感圖像目標檢測技術綜述[J].光學遙感圖像目標檢測技術綜述,2019,0(4):95-104.
[2]王倫文,馮彥卿,張孟伯.光學遙感圖像目標檢測方法[J].系統(tǒng)工程與電子技術,2019(10):2163-2169.
作者簡介
趙明衍(1990-),男,山東濟南人,研究生,助教,火箭軍士官學校。