張 蕾, 喬 凱, 吳銀花, 李思遠
(1. 北京跟蹤與通信技術研究所,北京 100094;2. 西安工業(yè)大學,陜西 西安 710021;3. 中國科學院 西安光學精密機械研究所,陜西 西安710119)
高光譜成像技術作為多維信息獲取技術,能夠獲取高光譜分辨率、連續(xù)、窄波段的光譜圖像,豐富的空間和光譜信息使得原本在多光譜遙感中無法有效探測的地物得以探測,從而大幅提高精細信息的表達能力,在遙感、農(nóng)業(yè)、軍事、食品、環(huán)境、醫(yī)療等多個領域[1-6]得到了十分廣泛的應用。高光譜遙感也為目標檢測帶來了新的機遇,目前已有很多經(jīng)典算法[7-13]。大部分目標檢測中,目標是確定的,背景卻是變化的且難以估計目標所在背景的地物分布,即目標光譜已知,背景光譜未知。在這種情況下,常用的方法是假設在統(tǒng)計背景信息的時候不包括目標信息,然而實際情況中很難剔除目標。如經(jīng)典的約束能量最小化方法[14](Constrained Energy Minimization,CEM)在統(tǒng)計背景時直接將全圖的像元均作為背景統(tǒng)計,顯然背景的統(tǒng)計信息包含目標信息,這與前述的假設沖突,因此在抑制背景的同時也會抑制目標,進而影響目標檢測精度,且目標所占比例越大,檢測效果下降越明顯。
針對背景信息統(tǒng)計的問題,近年來國內(nèi)外學者們提出了相應的改進方法,如加權CEM 算法(weighted CEM)[15]。它通過在計算背景自相關矩陣時對每個像元乘以相應的加權系數(shù),降低目標對背景統(tǒng)計信息的干擾,其中加權系數(shù)是根據(jù)每個像元與目標光譜之間的距離、角度等計算。對于與目標光譜十分接近或者與目標光譜差異較大的像元,這種計算方法得到的加權系數(shù)較為可靠,而對于高光譜圖像中大量存在的混合像元,由于其光譜特性中有可能包含目標的部分光譜特性,這種計算方法得到的加權系數(shù)的準確性較低,進而影響目標檢測精度。針對高光譜成像中混合像元的問題,有學者利用光譜解混合進行目標檢測[16-17],即對光譜圖像進行解混合獲取目標對應端元,并計算該端元的豐度系數(shù)矩陣作為目標檢測結果或待去除的目標。這種方法存在的問題是有時光譜解混合后找不到目標對應端元,或光譜解混合獲取的目標端元與目標光譜有一定差異,加上噪聲干擾的影響,導致對應豐度系數(shù)矩陣不可靠,因此算法性能波動較大,穩(wěn)定性較差。
針對背景信息統(tǒng)計問題,本文在加權CEM算法的基礎上,結合光譜解混合和光譜角度填圖法提出了一種高光譜目標檢測算法,盡可能準確統(tǒng)計混合像元背景信息、抑制目標干擾的同時,有效提高算法的穩(wěn)定性。
CEM 算法是通過突出目標信息、抑制背景信息來達到檢測目標的效果,即:
其中:d是目標光譜,R是樣本自相關矩陣(用于統(tǒng)計背景信息,目標像元在內(nèi)的所有樣本參與R的計算),xi是當前檢測的第i個像元光譜,yi是當前第i個像元的目標檢測結果。yi越大,說明成為目標的概率越大,一般該值與給定閾值比較判定當前像元是否為目標。加權CEM 算法是在CEM 算法的基礎上,將其中起到背景抑制作用的樣本自相關矩陣改進為加權自相關矩陣,進而更加有效地統(tǒng)計背景,即計算自相關矩陣時每個樣本乘以相應的背景加權系數(shù):
其中:M表示樣本數(shù)量,xi是第i個樣本光譜,ki是第i個樣本對應的背景加權系數(shù)??梢姡尘凹訖嘞禂?shù)越大,對應樣本對背景統(tǒng)計的貢獻越大,反之亦然。因此,背景加權系數(shù)的準確性直接決定背景統(tǒng)計的有效性,進而影響加權CEM 算法的目標檢測結果。
根據(jù)高光譜圖像中混合像元的產(chǎn)生機理,每個像元可看成是由其中各個端元按照一定比例混合而成的混合像元,即某個像元光譜xi可表示為:
其中:N是高光譜圖像中端元數(shù)量,ej是第j個端元光譜,aji是像元光譜xi對應第j個端元的豐度系數(shù)。各個端元表示高光譜圖像中不同的地物種類,往往用包含某種地物比例最高的像元作為該種地物對應的端元。顯然,待檢測目標也可看作是待處理高光譜圖像中的一個端元,因此,高光譜圖像中每個像元對應該端元的豐度系數(shù)可視為各像元包含目標地物的比例。各個像元包含目標地物的比例越大,該像元成為背景的概率越低;反之,包含目標地物的比例越小,該像元成為背景的概率越高。因此,針對高光譜圖像中大量存在的混合像元問題,本文利用豐度系數(shù)生成背景加權系數(shù),以提高混合像元的背景統(tǒng)計有效性。具體步驟如下:
首先,需要對待處理高光譜圖像通過端元提取和豐度反演進行光譜解混合,獲取高光譜圖像中所有端元光譜e1,e2,e3,…,eN以及各端元對應的豐度系數(shù)矩陣a1,a2,a3,…,aN;
其次,利用光譜角度填圖法(Spectral Angle Mapping, SAM)進行目標相似性判斷,根據(jù)式(4)計算已知目標光譜d與光譜解混合所提取的各端元光譜ej之間光譜夾角θj,θj越小說明二者越相似,因此,選取與目標光譜之間光譜夾角最小的端元作為目標地物對應端元e(簡稱目標端元);
接著,由于目標端元e對應的豐度系數(shù)矩陣a中各元素表示對應空間位置像元包含目標地物的比例,其最大值往往小于1、最小值大于0,因此需要進行歸一化處理將最大最小值分別限定為1和0,再通過反向處理,使得含目標地物比例最小的像元對應系數(shù)為1、含目標地物比例最大的像元對應系數(shù)為0,如式(6)所示,此時各系數(shù)可看作當前像元成為背景的概率,即背景加權系數(shù)qi為:
最后,考慮到光譜解混合性能有一定的波動性,進而會導致豐度系數(shù)及由此生成的背景加權系數(shù)的波動,為了提高算法的魯棒性,這里將式(6)計算得出的背景加權系數(shù)qi和目前常采用的光譜角度填圖法計算得出的背景加權系數(shù)si(目標光譜d與各像元光譜xi之間的光譜夾角θi經(jīng)過整幅圖像范圍內(nèi)歸一化可得si)相結合,生成最終的背景加權系數(shù)并將其代入式(2)計算自相關矩陣R,即:
將式(7)代入式(1)實現(xiàn)加權CEM 目標檢測。
根據(jù)2.1 節(jié)中所述,目標端元對應的豐度系數(shù)可視為各像元包含目標地物的比例,各個像元包含目標地物的比例越大,不僅表示該像元成為背景的概率越低,也表示該像元成為目標的概率越大,反之亦然。因此,歸一化后的目標端元對應豐度系數(shù)qi′可直接視作初步的目標檢測結果,其表達式為:
同樣,光譜角度填圖法計算得出的背景加權系數(shù)si表示各像元成為背景的概率,經(jīng)過反向處理后可表示各像元成為目標的概率,因此si(已進行歸一化處理)經(jīng)過反向處理后得到的si′,也可直接視作初步的目標檢測結果,其表達式為:
雖然在目標檢測中已將光譜解混合獲取的目標端元對應豐度系數(shù)和光譜角度填圖法獲取的光譜夾角作為自相關矩陣的加權系數(shù),但此時目標檢測精度與CEM 算法性能相關??紤]到每一種算法往往都有其適合處理的數(shù)據(jù)分布特征范圍,即難以滿足所有類型的數(shù)據(jù)分布特征。為了進一步提高算法的魯棒性,本文先將歸一化目標端元對應豐度系數(shù)qi′和經(jīng)過反向處理的光譜夾角系數(shù)si′相結合作為初步的目標檢測結果,再將它與加權CEM 目標檢測結果相融合作為最終的目標檢測結果,即:
其中yi表示加權CEM 的目標檢測結果。
本文算法流程如圖1 所示,具體步驟如下:
步驟1:對待處理光譜圖像分別進行光譜解混合和光譜角計算以及相應的歸一化和反向操作,計算出背景加權系數(shù);
步驟2:利用背景加權系數(shù)進行加權CEM 目標檢測,獲取目標檢測結果;
步驟3:將步驟2 獲取的目標檢測結果與目標端元對應豐度系數(shù)和光譜夾角系數(shù)相融合,獲取最終的目標檢測結果。
本文分別利用模擬高光譜圖像和真實高光譜圖像進行實驗和分析,以驗證所提出高光譜目標檢測算法的可行性和有效性。
為了提高算法驗證的有效性和可行性,實驗中模擬高光譜圖像是由特征相近的4 條光譜曲線作為端元光譜,以一定的比例線性混合,并加以干擾和噪聲生成的高光譜圖像,它含有大量混合像元,信噪比為20 dB,空間尺寸為60 像元×60像元,共包含204 個光譜通道。模擬高光譜圖像的具體生成步驟如下:
步驟1:考慮到真實地物在圖像空間的分布特征,將60 像元×60 像元的空間區(qū)域分割為25個12 像元×12 像元的空間子塊,并將每個子塊隨機設定為4 個端元中的某一種端元,此時對于每個像元只有設定端元對應的豐度系數(shù)為1,其余端元對應的豐度系數(shù)為0;
步驟2:采用窗口尺寸為15×15、均值為0的高斯低通濾波器,對每一種端元對應的豐度系數(shù)矩陣進行濾波,從而模擬混合像元。根據(jù)高光譜圖像中混合像元的生成機理,對豐度系數(shù)進行歸一化,使得每個像元的4 個豐度系數(shù)之后為1;
步驟3:在步驟2 得到的模擬高光譜圖像數(shù)據(jù)中,添加信噪比SNR 為20 dB 的零均值高斯噪聲,以模擬實際數(shù)據(jù)采集時生成的各種噪聲和干擾。
圖2 是用于生成模擬高光譜圖像的4 條端元光譜曲線,圖3 是利用該4 條端元光譜,按照上述步驟生成的模擬高光譜圖像的單波段(第70 通道)灰度圖像,圖4 是模擬高光譜圖像中各像元對應端元的標記圖,其中端元序號按灰度由黑到白依次遞增。
圖4 模擬高光譜圖像端元標記圖Fig.4 Endmember labeled image of simulated hyperspetral image
為了保證數(shù)據(jù)多樣性,選用兩幅真實高光譜圖像,其中一幅是機載可見/紅外成像光譜儀(AVIRIS)采集的美國圣地亞哥市機場場景高光譜數(shù)據(jù)集中的一部分,具有189 個通道,覆蓋可見光到近紅外的光譜范圍,空間尺寸為50 像元×50像元。圖5 是由該高光譜圖像的RGB 彩色圖,圖6 是其中以飛機為目標的真值圖。
圖5 圣地亞哥機場RGB 彩色圖Fig.5 RGB color map of San Diego airport
圖6 圣地亞哥機場目標真值圖Fig.6 Target groundtruth of San Diego airport
另一幅真實高光譜圖像是利用實驗室基于線性漸變?yōu)V光器的高光譜成像系統(tǒng)所采集的高光譜圖像,場景主要有真樹枝樹葉和小迷彩車以模擬樹林中偽裝車輛,覆蓋450~900 nm,包含313 個通道,空間尺寸為500 像元×550 像元,圖7 是由該高光譜圖像的第38,87,135 通道組成的偽彩色圖,圖8 是其中以小迷彩車為目標的真值圖。
圖8 小迷彩車目標真值圖Fig.8 Target groundtruth of Camouflage vehicle
本文共進行了3 組仿真驗證實驗,其中光譜解混合過程采用頂點成分分析(Vertex Component Analysis,VCA)和全約束最小二乘法(Full Constrained Least Squares,F(xiàn)CLS)算法分別進行端元提取和豐度反演。VCA 算法是通過反復尋找正交向量并計算圖像矩陣在正交向量上的投影距離逐一提取端元,F(xiàn)CLS 算法是通過最小二乘法利用廣義逆矩陣定義求解各端元對應豐度系數(shù)矩陣。對各類算法的目標檢測結果使用ROC(Receiver Operating Characteristic)曲線和AUC (Area Under Curve) 值作為高光譜目標檢測性能評價指標。ROC 曲線中虛警概率是將背景像元誤判為目標的概率PFA,探測概率是將目標像元正確判斷為目標的概率PD,分別為:
其中:FP是被判斷為目標的背景像元數(shù)量,M是所有像元數(shù)量,TP是被判斷為目標的目標像元數(shù)量,P是所有目標像元數(shù)量。實驗數(shù)據(jù)中,模擬高光譜圖像中4 個端元依次作為目標、兩幅真實高光譜圖像中分別以飛機和迷彩車為目標進行仿真實驗和數(shù)據(jù)分析。
為了驗證基于光譜解混合的加權CEM 目標檢測算法,對模擬高光譜圖像和真實高光譜圖像,分別利用CEM、基于SAM 的加權CEM、基于豐度系數(shù)的加權CEM 和加權CEM 進行目標檢測,實驗結果如表1(對每個高光譜數(shù)據(jù),其最高的兩個AUC 值加粗表示)、圖9(第1~4 行)和圖10 所示。
表1 第1 組仿真實驗不同算法AUC 值Tab.1 AUC of different algorithms in experiment 1
圖9 不同算法的目標檢測結果Fig.9 Target detection results of different algorithms
從表1 可以看出:3 組加權CEM 算法的AUC值確實明顯高于傳統(tǒng)CEM 算法,說明有效的背景抑制有助于提高目標檢測精度;基于SAM 的加權CEM 算法的AUC 值波動較大,有時甚至低于CEM 算法,而基于豐度系數(shù)的加權CEM 算法的AUC 值較穩(wěn)定,且整體上優(yōu)于基于SAM 的加權CEM 算法,說明以光譜解混合獲取的豐度系數(shù)作為加權系數(shù)更加可靠;基于SAM 的加權CEM 算法的AUC 值偶爾會優(yōu)于基于豐度系數(shù)的加權CEM 算法,基于光譜解混合的加權CEM算法結合了二者,其AUC 值更加穩(wěn)定、波動更小,且對于圣地亞哥機場數(shù)據(jù)的綜合加權效果比任何一個單獨加權的效果都好。實驗結果表明,基于光譜解混合的加權CEM 目標檢測算法有效且可靠。
圖9 中第1~4 行分別是CEM 算法、基于SAM 的加權CEM 算法、基于豐度系數(shù)的加權CEM 算法和基于光譜解混合的加權CEM 算法的目標檢測結果。從圖9 可以看出,第1 行目標檢測效果明顯較差,第2~4 行差異不是很明顯,但能看出端元2、端元3 的第2 行目標檢測結果中目標與背景之間的對比度低于后兩行,這與表1數(shù)據(jù)相符合。從圖10 可以看出,對于不同數(shù)據(jù),上述4 種算法中基于光譜解混合的加權CEM 算法對應的ROC 曲線最接近或至少次最接近左上角,再次驗證了基于光譜解混合的加權CEM 目標檢測算法的可靠性和穩(wěn)定性。
第2 組仿真實驗主要用于驗證式(6)和式(7)計算得出的歸一化豐度系數(shù)qi′和經(jīng)過反向操作后光譜夾角系數(shù)si′相結合作為初步目標檢測結果的可行性。表2 是不同數(shù)據(jù)分別以si′,qi′,(qi′+si′)/2 作為目標檢測結果所計算的AUC 值,其中每組高光譜數(shù)據(jù)中最高的兩個AUC 值加粗表示。圖9 中第5 行對應si′,第6 行對應qi′,第7 行對應(qi′+si′)/2,對應的ROC 曲線如圖10 所示。
從表2 可以看出,歸一化豐度系數(shù)qi’作為目標檢測結果,其性能整體上明顯優(yōu)于反向操作后光譜夾角系數(shù)si′,但有時作為反向操作后光譜夾角系數(shù)si′的目標檢測結果更好,而將二者結合生成的初步目標檢測結果性能更加穩(wěn)定、波動更小,這與第1 組仿真實驗結果基本一致,驗證了(qi′+si′)/2 作為初步目標檢測結果的可行性。
從圖9 可以看出,反向操作后光譜夾角系數(shù)si′作為目標檢測結果時,端元1 體現(xiàn)目標較弱,端元2 和端元3 基本未能體現(xiàn)出目標,而迷彩車輛體現(xiàn)目標明顯;歸一化豐度系數(shù)qi′作為目標檢測結果時整體上均能較好體現(xiàn)出目標,但端元3 體現(xiàn)的目標中包含了大量的端元2;而(qi′+si′)/2 作為初步目標檢測結果時,從結果圖來看與第6 行差異不大,但對于端元3 和圣地亞哥機場數(shù)據(jù),目標和背景之間的對比度有所提高,這些均與表2數(shù)據(jù)相符合。從圖10 可以看出,(qi′+si′)/2 作為初步目標檢測結果時對應的ROC 曲線與基于光譜解混合的加權CEM 算法的ROC 曲線基本一致,有時還更接近左上角、性能略優(yōu)一些,因此SAM+豐度系數(shù)作為初步的目標檢測結果可行且合理。
第3 組仿真實驗是用于驗證在2.1 方法基礎上采用2.2 方法優(yōu)化的本文算法整體目標檢測性能。利用2.3 節(jié)中本文算法對模擬高光譜圖像和真實高光譜圖像進行目標檢測,實驗結果如表3、圖9 和圖10 所示。
表3 是本文算法目標檢測結果的AUC 值,對于不同數(shù)據(jù)其值均高于基于光譜解混合的加權CEM 算法結果和2.2 中初步目標檢測結果,說明本文2.1 方法基礎上采用2.2 方法優(yōu)化確實有效可行。綜合對比表1~表3,本文算法相比傳統(tǒng)CEM 算法的AUC 值平均提高了0.071 2,相比基于SAM 的加權CEM 算法的AUC 值平均提高了0.031 2,相比歸一化豐度系數(shù)作為目標結果的AUC 值平均提高了0.015 0。圖9 中第8 行是本文算法的目標檢測結果,相比前7 行圖片,對不同數(shù)據(jù)均能較好地提取出目標,目標與背景的對比度也比較明顯,與第9 行真值圖相符,算法性能穩(wěn)定且可靠。從圖9(e)和9(f)可以看出,前7 行目標檢測結果中第5,7 行較好地突出了目標,但同時背景也跟著突出,其余行較好地抑制了背景,但同時抑制了目標,而本文方法在抑制背景的同時較好地突出了目標。圖10 中加粗曲線是本文算法對應的ROC 曲線,可以看出,本文算法對不同數(shù)據(jù)的ROC 曲線最接近左上角,只有端元2 數(shù)據(jù)的ROC 位列第二,再次驗證了本文算法的性能優(yōu)勢。
為了提高高光譜圖像目標檢測中背景信息統(tǒng)計的準確度,本文利用光譜解混合獲取的目標端元對應豐度系數(shù)和光譜填圖法獲取的光譜夾角系數(shù),生成了準確合理的背景加權系數(shù),同時為了提高算法的穩(wěn)定性,再次利用目標端元豐度系數(shù)和光譜夾角系數(shù)進行目標檢測結果的優(yōu)化,最終提出了利用光譜解混合的目標檢測算法。實驗結果表明,本文算法對于多組不同高光譜圖像均得到了較好的目標檢測結果,算法魯棒性較強、性能波動較小,且有效提高了混合像元背景信息統(tǒng)計的準確度,進而有效提高了目標檢測精度。相比傳統(tǒng)CEM 算法,AUC 值平均提高了0.071 2;相比基于SAM 的加權CEM 算法,AUC值平均提高了0.031 2;相比歸一化豐度系數(shù)作為目標結果,AUC 值平均提高了0.015 0。
本文算法雖然具有較強的穩(wěn)定性,但在一定程度上仍然與光譜解混合性能相關,即光譜解混合結果越準確,背景信息統(tǒng)計準確度越高,進而目標檢測精度越高,且光譜解混合性能越穩(wěn)定,算法穩(wěn)定性越好。因此,下一步工作是開展光譜解混合算法優(yōu)化,以進一步提高背景信息統(tǒng)計的準確度以及算法穩(wěn)定性。