李 響,呂 勇
(北京信息科技大學(xué) 儀器科學(xué)與光電工程學(xué)院,北京 100192)
高光譜遙感(Hyperspectral remote sensing)經(jīng)過上世紀(jì)后幾十年的迅猛發(fā)展已取得了長足的進(jìn)步,因其是將光譜分析技術(shù)與成像技術(shù)相結(jié)合,以期達(dá)到獲取多維信息的技術(shù)手段,因此也被稱為成像光譜遙感[1-2]。目前的航空與航天高光譜遙感測量技術(shù)數(shù)據(jù)獲取途徑正在向多傳感器、多角度與多平臺(tái)的“三多”方向發(fā)展,而高光譜數(shù)據(jù)則向著高時(shí)間、空間分辨率以及高光譜分辨率的方向發(fā)展。因其所包含的豐富信息,高光譜遙感技術(shù)不僅被應(yīng)用于傳統(tǒng)的地質(zhì)學(xué)、地理學(xué)、農(nóng)業(yè)科學(xué)與植被監(jiān)測等遙感領(lǐng)域,在海洋學(xué)、大氣研究、生態(tài)學(xué)等環(huán)境領(lǐng)域也得到了廣泛的應(yīng)用與研究[3-5]。當(dāng)今世界,高光譜遙感已涵蓋了各個(gè)國家的航空、航天以及小范圍的地面觀測的多個(gè)層級與環(huán)節(jié),伴隨先進(jìn)探測技術(shù)、圖像處理技術(shù)、光譜分析技術(shù)、特征提取等多個(gè)學(xué)科、多個(gè)領(lǐng)域的定性/定量化研究的發(fā)展與進(jìn)步,高光譜分析技術(shù)在對地觀測遙感領(lǐng)域已占有不可取代的地位。
高光譜遙感技術(shù)能夠在探測過程中,同時(shí)獲取關(guān)注區(qū)域與目標(biāo)物的一維光譜數(shù)據(jù)與二維空間信息,形成所謂的“數(shù)據(jù)立方體”,“圖譜合一”的特點(diǎn)使得高光譜分析技術(shù)可以綜合利用光譜分析與圖像處理的優(yōu)勢,得到更精確與豐富的遙感信息[6-7]。高光譜數(shù)據(jù)立方體中的每個(gè)像素中儲(chǔ)存著探測視場內(nèi)至少十余個(gè)甚至能高達(dá)上百個(gè)連續(xù)光譜波段信息。常見的高光譜探測波長一般分布在400~2 500 nm范圍內(nèi),波長分辨率一般小于10 nm。
高光譜數(shù)據(jù)在包含空間幾何信息的同時(shí),也承載了光譜信息,因此僅使用單一的傳統(tǒng)圖像處理技術(shù)或光譜分析技術(shù)均顯得力所不及。對此,需要根據(jù)高光譜數(shù)據(jù)的機(jī)理與特點(diǎn)發(fā)展適合數(shù)據(jù)立方體的特征信息提取算法與技術(shù)。波段重多、數(shù)據(jù)量龐大,數(shù)據(jù)內(nèi)存在亞像元與混合像元,不同探測條件下“同物異譜”現(xiàn)象等問題在高光譜遙感中普遍存在,解決方法主要有以下4方面:數(shù)據(jù)降維與特征提取、目標(biāo)探測、圖像分類以及混合像元分解。在上述幾個(gè)方面中,數(shù)據(jù)降維與特征提取可謂重中之重,是后續(xù)各種定性與定量分析的前提與基礎(chǔ),同時(shí)也為龐大的高光譜數(shù)據(jù)的存儲(chǔ)與傳輸提供了便利。本文將拉普拉斯特征映射應(yīng)用于高光譜數(shù)據(jù),用以進(jìn)行降維與特征提取,并提出了一種改進(jìn)的樸素貝葉斯分類算法,對高光譜的目標(biāo)區(qū)域進(jìn)行了地物分類。
高光譜數(shù)據(jù)處理中的降維(Dimensionality reduction)是指利用具有較低的維度新數(shù)據(jù)來有效承載原始較高維高光譜數(shù)據(jù)中的信息,將龐大、冗余的數(shù)據(jù)量進(jìn)行壓縮,以便為后續(xù)處理環(huán)節(jié)提供有效的地物信息特征[8-9]的技術(shù)。
高光譜數(shù)據(jù)處理的降維技術(shù)主要分特征提取與波段選擇兩種。其中高光譜數(shù)據(jù)特征提取(Feature extraction)是指對原始高維高光譜數(shù)據(jù)空間或其部分子空間進(jìn)行特定算法的數(shù)學(xué)變換,構(gòu)建新的攜帶了大部分原始有效信息并且消除了冗余性的派生特征量,以便于后續(xù)環(huán)節(jié)中對高光譜信息具有更好的理解,從而實(shí)現(xiàn)信息綜合、特征增強(qiáng)和光譜減維的過程。由于多數(shù)情況是在進(jìn)行此數(shù)學(xué)變換后,數(shù)據(jù)集維度并未減小,而是結(jié)構(gòu)發(fā)生了優(yōu)化——少量的新變量攜帶了原始數(shù)據(jù)中的大部分信息,此時(shí)需要繼續(xù)進(jìn)行光譜特征選擇(Feature selection),針對數(shù)據(jù)特征與后續(xù)環(huán)節(jié)需求,選擇變換后的新特征空間中的一個(gè)數(shù)據(jù)子集[10-11]。此子集是包含了原數(shù)據(jù)集主要特征但縮小了維度的變量空間,從而實(shí)現(xiàn)降維的目的,過程如圖1所示。
圖1 高光譜數(shù)據(jù)特征的提取與降維Fig.1 Feature extraction and dimensionality reduction of hyperspectral data
波段選擇也是高光譜數(shù)據(jù)降維的一個(gè)重要手段,可直接選擇高光譜數(shù)據(jù)的一個(gè)波段子集,因包含了地物信息的主要光譜特征,能夠保證目標(biāo)區(qū)域的地物類別可分性。一般是設(shè)定一個(gè)評價(jià)函數(shù)作為目標(biāo),對其進(jìn)行優(yōu)化,最終形成一個(gè)最優(yōu)的波段組合。該評價(jià)函數(shù)的選取會(huì)直接決定最終的波段子集所攜帶信息的多寡。一般來講,需要對地物信息有一定的了解,以進(jìn)行有監(jiān)督的優(yōu)化。此外,相比于特征提取,波段如選擇與其相同的數(shù)據(jù)維度,往往會(huì)損失較多的信息,因而其應(yīng)用場景受限。
拉普拉斯特征映射(Laplacian Eigen mapping)屬于流形學(xué)習(xí)算法的一種,由Belkin最早提出[12-14]。拉普拉斯特征映射使用類似頻譜技術(shù)構(gòu)建鄰接矩陣的圖來進(jìn)行降維。該技術(shù)基于數(shù)據(jù)位于高維空間中的低維流形的假設(shè)。該算法不能嵌入采樣點(diǎn),但基于再生核希爾伯特空間正則化的技術(shù)增加了其降維能力。
與傳統(tǒng)技術(shù)主成分分析的相似之處在于,拉普拉斯特征映射也不會(huì)將數(shù)據(jù)的內(nèi)在幾何結(jié)構(gòu)作為主要考慮的問題,而會(huì)根據(jù)數(shù)據(jù)集的鄰域信息構(gòu)建圖,每個(gè)數(shù)據(jù)點(diǎn)用作圖的節(jié)點(diǎn),且節(jié)點(diǎn)之間的連接由鄰近點(diǎn)的鄰近度控制。由此產(chǎn)生的圖被認(rèn)為與高維空間中的低維流形的離散近似?;趫D的目標(biāo)函數(shù)的最小化確保流形上相互接近的點(diǎn)在低維空間中彼此接近,以保持局部距離。Laplace-Beltrami算子在流形上的本征函數(shù)作為嵌入維數(shù),這是因?yàn)樵跍睾蜅l件下,這個(gè)算子有一個(gè)可計(jì)算的譜,其為流形上平方可積函數(shù)的基礎(chǔ)。該算法的基本流程如下:
Step 1:利用K-最近鄰方法構(gòu)建圖;
Step 2:選用熱核函數(shù)來確定點(diǎn)與點(diǎn)之間的權(quán)重值Wij,如果樣本點(diǎn)xj與其互為近鄰則有:
(1)
或?qū)⑵浜喕癁閕與j相連時(shí),Wij=1,否則為0;
Step 3:進(jìn)行特征映射,計(jì)算拉普拉斯矩陣L的特征向量與特征值:
Ly=λDy
(2)
式中,Dy是對角矩陣,滿足Dii=∑jWij,且有L=D-W,稱為Laplacian矩陣,為對稱半正定矩陣。
流形學(xué)習(xí)的本質(zhì)是尋找原始數(shù)據(jù)集中所存在的內(nèi)在規(guī)律性,即從測得的原始數(shù)據(jù)表象中找出隱含在高維原始數(shù)據(jù)集中的低維光滑流形。從這一點(diǎn)不難推斷出,相比主成分分析[15-16],作為重在發(fā)現(xiàn)不同映射坐標(biāo)系下差異的算法,拉普拉斯特征映在對具有不同本質(zhì)的高光譜數(shù)據(jù)處理時(shí),一定會(huì)具有不弱于主成分分析的降維與特征提取能力。下面以公開的AVIRIS(Airborne Visible Infrared Imaging Spectrometer,機(jī)載可見光/紅外成像光譜儀)采集的Indian Pines數(shù)據(jù)集中的Grass-pasture-mowed與Stone-steel-towers兩類數(shù)據(jù)為例進(jìn)行說明,分別進(jìn)行兩種方法的預(yù)處理,僅采用各算法的前兩個(gè)新變量進(jìn)行比較,結(jié)果如圖2所示。從圖中可以明顯看出,主成分分析后的新變量下,兩種類別仍然混疊在一起,而拉普拉斯特征映射后的新變量下,不同類別能較好的分開,表明拉普拉斯特征映具有更好的效果。
在機(jī)器學(xué)習(xí)中,樸素貝葉斯分類器(Naive Bayes classifier,NBC)是“概率分類器”家族的一員,它簡單而行之有效,其本質(zhì)是基于貝葉斯定理在特征之間的強(qiáng)(樸素)獨(dú)立假設(shè)[17-18]。
樸素貝葉斯自20世紀(jì)50年代以來在文本檢索領(lǐng)域得到了廣泛地研究,至今仍然是一種流行的文本分類方法,如垃圾郵件判別,敏感內(nèi)容審查等,其后擴(kuò)展應(yīng)用至其他領(lǐng)域。在許多實(shí)例中,樸素貝葉斯分類器的分類精度均不低于目前的研究熱點(diǎn)——神經(jīng)網(wǎng)絡(luò)分類算法,尤其因其分類方法簡單,訓(xùn)練與識(shí)別只需花費(fèi)線性時(shí)間,無需其他很多類型的分類器所使用的費(fèi)時(shí)的迭代與逼近運(yùn)算,運(yùn)算速度快,更適于處理大型數(shù)據(jù),且能同時(shí)保證分類的準(zhǔn)確性[19-20]。
利用樸素貝葉斯分類算法對高光譜圖像進(jìn)行分類,首先定義數(shù)據(jù)集,每個(gè)像素處的高光譜數(shù)據(jù)定義為一個(gè)樣本,由一個(gè)多維向量X標(biāo)識(shí),X={x1,x2,… ,xm},其中xm可為原始光譜值,也可為經(jīng)過預(yù)處理后得到的特征值。當(dāng)由k個(gè)地物分類時(shí),分別記為A1,A2,…,Ak,對于一個(gè)未知地物類別標(biāo)號的像素點(diǎn)光譜樣本X,貝葉斯分類算法將判定未知類別的X為后驗(yàn)概率最高的地物類別,即當(dāng)1≤i≤k,且僅當(dāng)P(Ai|X)>P(Aj|X),樸素貝葉斯分類將未知的樣本X分配給類別Ai,其中1≤j,i≤k,j≠i,而其中P(Ci|X)最大的地物類別就是最大后驗(yàn)概率。
(3)
理論上,樸素貝葉斯模型與其他分類方法相比具有最小的誤差率,但實(shí)際上并非總是如此。這是因?yàn)闃闼刎惾~斯模型假設(shè)屬性之間相互獨(dú)立,這個(gè)假設(shè)在實(shí)際應(yīng)用中往往不成立,在屬性個(gè)數(shù)較多或者屬性之間相關(guān)性較大時(shí),分類效果不好。而在屬性相關(guān)性較小時(shí),樸素貝葉斯性能最為良好。因高光譜數(shù)據(jù)在進(jìn)行分類前,一般已經(jīng)進(jìn)行了拉普拉斯特征映射或PCA等預(yù)處理,這些預(yù)處理算法可以保證特征xi之間相互獨(dú)立,并可利用P(X|Ai)=∏P(X1|Ai)求得先驗(yàn)概率,而P(x1|Ai),P(x2|Ai),…,P(xm|Ai)可以利用訓(xùn)練樣本集求出。另外,樸素貝葉斯模型需要知道先驗(yàn)概率,且先驗(yàn)概率很多時(shí)候取決于假設(shè),假設(shè)的模型可以有很多種,因此在某些時(shí)候會(huì)由于假設(shè)先驗(yàn)?zāi)P偷脑驅(qū)е骂A(yù)測效果不佳。拉普拉斯特征映射是一種基于圖的降維算法,相比于常見的主成分分析方法,它不僅關(guān)注增加數(shù)據(jù)新屬性的差異程度,且更希望相互間有關(guān)系的樣本在降維后的空間中盡可能的靠近,因此更適于作為樸素貝葉斯分類模型的降維預(yù)處理方法。
為便于比對,本研究采用廣泛應(yīng)用的免費(fèi)公開的AVIRIS數(shù)據(jù)驗(yàn)證說明以上算法。AVIRIS的相關(guān)信息與部分?jǐn)?shù)據(jù)可在https://aviris.jpl.nasa.gov/上獲得。AVIRIS獨(dú)特的光學(xué)傳感器,可以在波長為380~2 500 nm的224個(gè)連續(xù)光譜通道(也稱為波段)中提供光譜輻射的校準(zhǔn)圖像[21]。每個(gè)檢測器的光譜分辨率約為10 nm,當(dāng)來自每個(gè)檢測器的數(shù)據(jù)被繪制在圖上時(shí),可產(chǎn)生完整的可見-近紅外高光譜數(shù)據(jù)立方體。
表1 Indian Pines場景中真實(shí)的地物信息Table 1 True ground informations of Indian Pines scene
AVIRIS項(xiàng)目包含多組數(shù)據(jù),限于篇幅本文僅以在印第安納州西北部的印度松樹(Indian Pines)測試場地上的采集數(shù)據(jù)為例進(jìn)行說明,本算法在其他測試數(shù)據(jù)上也取得了較好效果。本文所采用數(shù)據(jù)集由145×145像素和224個(gè)波長范圍為400~2 500 nm的光譜反射波段組成。這個(gè)場景是Pursue的Univeristy MultiSpec網(wǎng)站上更大的一個(gè)Indian Pines高光譜數(shù)據(jù)的子集,本子集在在http://www.ehu.eus/ccwintco/上免費(fèi)獲得。實(shí)驗(yàn)數(shù)據(jù)集中去除覆蓋吸水區(qū)域的部分波段,去除的波段為[104-108],[150-163],220。該場景下,其具體地物信息及所包含像素?cái)?shù)如表1所示。
印度松樹場景包含三分之二的農(nóng)業(yè)和三分之一的森林或其他天然多年生植被。有兩條主要雙車道高速公路,一條鐵路線,以及一些低密度住房、其他建筑結(jié)構(gòu)和較小的道路。由于6月份出現(xiàn)了部分作物,玉米、大豆處于早期增長階段,覆蓋率低于5%。可用的基本事實(shí)被分為16個(gè)類別,并不完全相互排斥。按真實(shí)地物信息(True ground)標(biāo)記各個(gè)地物類別,得到分布圖如圖3A所示,圖3B為相機(jī)所拍攝得到的目標(biāo)區(qū)域照片,后續(xù)以此為標(biāo)準(zhǔn)對本文算法進(jìn)行驗(yàn)證。上述16種地物種類的平均光譜如圖4所示。由圖4中可以看到,相比于普通遙感圖像,高光譜數(shù)據(jù)因具有不同地物像素點(diǎn)的光譜維度信息,更豐富的信息為更加準(zhǔn)確的地物分類提供了可能與基礎(chǔ)。
本研究所述實(shí)驗(yàn)利用PC計(jì)算機(jī)進(jìn)行驗(yàn)證,操作系統(tǒng)為Windows 10,處理器為I5-6700,8 GB內(nèi)存,利用MATLAB 2016A自行編寫程序。
使用“2.2”所述高光譜數(shù)據(jù)驗(yàn)證本研究所提出的算法,因本算法并未涉及各數(shù)據(jù)的圖像維度信息與關(guān)系,因此各像素點(diǎn)數(shù)據(jù)可作為獨(dú)立光譜樣本進(jìn)行分析,各類別分別隨機(jī)選取一半數(shù)據(jù)作為訓(xùn)練集,得到判別分析模型,剩余一半作為校驗(yàn)集,對算法與模型進(jìn)行驗(yàn)證。在“2.3”所述軟硬件環(huán)境下,對10 512個(gè)重復(fù)建立模型進(jìn)行20次計(jì)算,取平均值,不計(jì)特征提取時(shí)間,其訓(xùn)練時(shí)間僅為0.021 s,遠(yuǎn)遠(yuǎn)快于其他類型分類算法訓(xùn)練時(shí)間。而后對Indian Pines中的剩余10 513個(gè)樣本進(jìn)行分類,檢驗(yàn)該方法的有效性,重復(fù)進(jìn)行20次,取平均值,訓(xùn)練時(shí)間僅為0.009 s。分別選擇實(shí)用原始數(shù)據(jù)及經(jīng)典樸素貝葉斯算法,判別分析結(jié)果如表2所示。
表2 不同算法判別分析結(jié)果的比較Table 2 Comparison of discriminant analysis results of different algorithms
由上表可以得到,本方法的總體分類準(zhǔn)確率達(dá)到92.7%。相比于前兩種經(jīng)典方法,本方法的精度大幅提高。在圖2所示的預(yù)處理過程中也可以看到,應(yīng)用拉普拉斯特征映射明顯優(yōu)于廣泛應(yīng)用的PCA方法,且具有更高的分類準(zhǔn)確率。本研究所提出的方法在保持較高的準(zhǔn)確率之外,大幅縮短了計(jì)算時(shí)間,尤其是訓(xùn)練時(shí)間。
相比于傳統(tǒng)圖像遙感方法,高光譜數(shù)據(jù)分類具有明顯優(yōu)勢。拉普拉斯特征映射能夠在降維的同時(shí),很大程度上凸顯關(guān)注區(qū)域地物的本征特性。本文結(jié)合拉普拉斯特征映射預(yù)處理方法,通過獎(jiǎng)勵(lì)權(quán)重的方法對經(jīng)典樸素貝葉斯分類器進(jìn)行了改進(jìn),利用公開數(shù)據(jù)對算法進(jìn)行說明驗(yàn)證,判別地物信息準(zhǔn)確率可達(dá)到92.7%,相比于傳統(tǒng)方法,有大幅度提高,同時(shí)大幅縮短了計(jì)算所需時(shí)間。因此,本研究所述方法適用于需要對高光譜數(shù)據(jù)進(jìn)行快速處理的應(yīng)用場景。