趙春暉,尤 佳
(哈爾濱工程大學 信息與通信工程學院,哈爾濱 150001)
對于高光譜遙感圖像進行數(shù)據(jù)融合和分類是當前研究的熱點。文獻 [1]提出了基于有限脊波變換(FRIT)的遙感圖像融合算法,由于該變換存在 “折疊效應”,在脊波重構(gòu)中不可避免地引入環(huán)繞噪聲。針對有限脊波的這一缺點Donobo[2]等人構(gòu)造了基于真實脊函數(shù)的脊波,并用快速 Slant Stack算法將其進行了數(shù)字化。人工神經(jīng)網(wǎng)絡(luò) ( ANN)是實現(xiàn)高光譜圖像分類的一種有效手段[2],但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)(如:BP,RBF)存在著局部極小,收斂速度慢和初值敏感等缺陷,文獻 [3]提出了一種全新的神經(jīng)網(wǎng)絡(luò),并將其命名為樣條權(quán)神經(jīng)網(wǎng)絡(luò)(SWNN),由于該網(wǎng)絡(luò)的權(quán)值是輸入樣本的函數(shù),因此它包含有訓練樣本的特征信息;由于該網(wǎng)絡(luò)的計算量主要集中于線性方程組的求解,因此能很好地克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的缺點。本文將基于真實脊函數(shù)和快速Slant Stack算法的數(shù)字脊波和樣條權(quán)神經(jīng)網(wǎng)絡(luò)引入高光譜遙感圖像的融合分類中,結(jié)合局部信息熵(LIE)和主體投票(MV)規(guī)則實現(xiàn)了特征級和決策級的數(shù)據(jù)融合,結(jié)合AVIRIS圖像進行了地物分類,并給出了仿真試驗結(jié)果。
根據(jù)E.J.Candes提出的脊波變換模型,脊波變換是在Randon域進行的小波變換。實現(xiàn)脊波變換的數(shù)字化中最重要的一步就是Randon變換的數(shù)字化,其中較廣泛應用的方法之一就是采用有限Randon變換 (FRAT),由于這種方法是在代數(shù)直線上的求和,因此存在 “折疊效應 (wraparound effect)”,在具體實現(xiàn)中會產(chǎn)生環(huán)繞噪聲。文獻[4]提出了一種基于快速slant stack算法的數(shù)字化方案,由于該方法是在幾何直線上進行的求和運算,因此不存在 “折疊效應”的問題。Donoho等人將快速Slant Stack方法與脊波結(jié)合,建立了基于真實脊函數(shù)的數(shù)字脊波算法[5]。
它實際上是沿直線y=sx+z對(u,su+z)的n個值進行求和,求和的值不是來自圖像的原始空間,而是來自原始圖像在v上的插值得到的圖像?I1(u,y),其第一個變量離散取值,第二個變量則是連續(xù)的。沿變量y方向的插值運算由式(3)給出,令m=2n,定義m階Dirichlet核為:
則有插值圖像:
注意到這是一個內(nèi)插核,因此有:
交換變量x和y,定義關(guān)于基本垂直直線組的Randon變換為:
其中
Slant Stack算子S:L2(dx)→L2(dtdθ)定義如下:
對于θ∈[-π/4,π/4]
對于θ∈[π/4,3π/4]
其中截距t滿足-n≤t<n。
它將n×n的矩陣I映射為2n×2n的矩陣SI。文獻 [1]給出了相應的快速算法,并指出對于大小為n×n的圖像,其計算量為O(NlogN),其中N=n2。
設(shè)Ψj,k(t)≡Ψj,k(t;m)是m點離散周期Meyer小波,0≤k<2j。對作離散Fourier變換得:
再作Fourier逆變換,得:
定義分數(shù)微分的Meyer小波如下:
對于大小為n×n的圖像I(u,v),中心為(0,0),且-n/2≤u,v<n/2。定義滿足:
設(shè)n為給定的正整數(shù),數(shù)字脊波ρj,k,s,l是一個從Meyer小波構(gòu)造的n×n的脊函數(shù)矩陣,與Meyer小波的關(guān)系由式(14)給出:
定理1指出了數(shù)字脊波變換 R和離散Slant Stack變換S以及Meyer小波變換W之間的關(guān)系:
定理1[5]數(shù)字脊波變換等價于作Randon變換后關(guān)于變量t作一維小波變換,即:
其中<<.>>表示僅對變量t進行的內(nèi)積運算。且有下式成立:
張代遠提出了一種全新的人工神經(jīng)網(wǎng)絡(luò)[3],并將其命名為樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)。該神經(jīng)網(wǎng)絡(luò)與以往的經(jīng)典神經(jīng)網(wǎng)絡(luò)(如:BP,RBF神經(jīng)網(wǎng)絡(luò))存在著許多顯著的優(yōu)點:如訓練后的神經(jīng)網(wǎng)絡(luò)是輸入樣本的三次樣條函數(shù),而不是常數(shù),且能反映樣本的信息特征;拓撲結(jié)構(gòu)簡單,只有兩層(傳統(tǒng)神經(jīng)網(wǎng)絡(luò)至少為3層),且只有輸入層的權(quán)與神經(jīng)元互連,輸出層沒有權(quán);算法需要的神經(jīng)元個數(shù)與樣本數(shù)無關(guān),僅取決于輸入輸出的節(jié)點個數(shù);算法可將問題轉(zhuǎn)化為顯性方程組的求解,因而速度快,不存在傳統(tǒng)算法的局部極小,收斂速度慢,初值敏感等問題。
一般而言,可認為神經(jīng)網(wǎng)絡(luò)完成的工作是實現(xiàn)多維(m維)輸入到多維(n維)輸出之間的映射。即:
由上式可知,只要給定輸入 x,每個zi就確定了,即:
則一般來說,方程組(19)中的每一個方程都可以看成是給定區(qū)域的m+1維超曲線。對于給定參數(shù)t∈[ta,tb],xi(t)(i=1,2,…,m)在給定的區(qū)域有定義,則式 (19)中的每一個方程可以由以下參數(shù)方程表示:
考慮將zi(t)(i=1,2,…,n)分別向xj(j=1,2,…,m)投影,可以得到xjOzi平面上的投影柱面方程:
則參數(shù)方程(21)可以寫成:
其中
其中wij(xj)=ηjizi=ηjiuj(xj)=zji稱為理論權(quán)函數(shù),簡稱權(quán)函數(shù)。根據(jù)理論權(quán)函數(shù)的定義可以看出,它包含有投影曲線ui的信息,能在一定程度上反映原來空間曲線的特征,因此該權(quán)函數(shù)是具有真實物理意義的。由式(26)構(gòu)造的基于理論權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)見圖1。
神經(jīng)網(wǎng)絡(luò)訓練的目的是為了求得權(quán)函數(shù) wij (xj),一般來說,只有離散的有限樣本點是已知的,這就意味著要通過有限個已知的樣本點來求得理論權(quán)函數(shù),而這一般來說是不可能做到的,但是可以通過插值的方法求得近似的權(quán)函數(shù)。
對于圖1的結(jié)構(gòu),假設(shè)每個輸入由m維向量構(gòu)成,對于每個輸出樣本zi,共有N+2個需訓練的樣本,()表示對應第i個輸出的神經(jīng)元(由加法器Add構(gòu)成)與第j個輸入節(jié)點相連的理論權(quán)函數(shù)。由于有N+2個需要訓練的樣本,因此節(jié)點 xj將有N+2個輸入量,可構(gòu)成一個向量,記為:
圖1 基于理論權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)Fig.1 Neural network based on theoretical weight function
同樣,將其對應的目標向量組成一個N+2維向量
其中
按照理論權(quán)函數(shù)對目標樣本的分配方法,權(quán)函數(shù)wij(xj)的輸入量由式 (27)給出,輸出式由式(29)決定,所以對應的插值點為:
采用三次樣條插值,樣條函數(shù)為
其中,F0、F1、G0、G1為 Hermit插值公式的參數(shù),可以通過解線性方程組得到,結(jié)合具體的邊界條件,可以求得三次樣條函數(shù)的具體表達式,其詳細過程參見文獻 [2-3]。通過三次樣條插值得到的上述神經(jīng)網(wǎng)絡(luò)被稱為第一類樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò),其拓撲結(jié)構(gòu)如圖2所示。
由以上討論的基于快速Slant Stack算法的數(shù)字脊波變換和第一類樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)構(gòu)造的高光譜圖像融合系統(tǒng)可以實現(xiàn)特征層和決策層兩個較高層次的數(shù)據(jù)融合。
圖2 第一類樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)Fig.2 First class spline weight function neural network
特征級融合可以表述為FI-FO[6](Feature In -Feature Out),即實現(xiàn)由高維特征空間到低維特征空間的映射?;舅枷胧抢脭?shù)字脊波變換在不同分辨率的數(shù)據(jù)中提取特征信息,然后送入樣條權(quán)神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)輸出分類結(jié)果。其中特征提取是該層次融合的關(guān)鍵。由式(16)可知數(shù)字脊波變換實質(zhì)上是在Randon域進行的一維小波變換,因此本文提取的特征是基于一維小波變換后在不同分辨率水平上的局部信息熵。
窗口W(大小為M×Ni,Ni表示第i分辨率水平的步長)內(nèi)的局部信息熵LIE(Local Information Entropy)為:
其中pl(i)表示第l波段圖像局部窗口內(nèi)出現(xiàn)像素值為i的概率。
考慮到基于快速Slant Stack算法的數(shù)字脊波變換將N×N的原始圖像空間映射為2N×2N的像空間窗口選擇M=2,Ni=2N/(2i)=21-iN, i表示小波分解的第i層 (i=1,2,3)。
局部信息熵可以用來衡量經(jīng)小波變換得到的各低頻分量和細節(jié)分量包含的局部信息的大小。因此基于局部信息熵的特征融合算法是對于各低頻和細節(jié)分量根據(jù)其不同波段對應分量包含的信息量的大小給以不同的權(quán)值,信息量越大,權(quán)值越大。最終的融合權(quán)值還需要歸一化,即在式(32)的基礎(chǔ)上除以各波段同一位置局部信息熵之和。
以上可以實現(xiàn)高光譜圖像的基于數(shù)字脊波的特征級融合,采用相應的重構(gòu)算法即可實現(xiàn)圖像的重建。
上述融合過程實際上是一個數(shù)據(jù)降維的過程,將降維后的數(shù)據(jù)送入樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò),結(jié)合由代表各類特征的標定樣本訓練得到的三次樣條權(quán)就可以得到最終的分類結(jié)果。
決策級融合實現(xiàn)預分類器輸出結(jié)果到最終分類結(jié)果的映射,即DEI-DEO(Decision In-Decision Out)。設(shè)為高光譜圖像傳感器的輸出向量,將它分為N個波段組,則X=[]T,其中(i=1,…,N)可以表述為=[…,xi,di],di為第i個波段組包含的波段數(shù)。決策級融合分類原理框圖見圖3,先進行局部分類(Local Classification),然后將各局部分類器輸出結(jié)果進行決策融合,輸出最終分類結(jié)果。
圖3 決策融合系統(tǒng)框圖Fig.3 Decision level fusion system flowchart
考慮到所處理的高光譜圖像具有數(shù)據(jù)維數(shù)高的特點 (如AVIRIS圖像包含220個波段的數(shù)據(jù)),為使實現(xiàn)局部分類的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不至于太復雜和提高分類效率,在進行局部分類之前先將輸入數(shù)據(jù)進行降維。降維方法有波段選擇、自適應波段選擇[7](ABS)、自適應子空間分解[8](ASD)、數(shù)據(jù)融合等。本文采用基于像素層的數(shù)據(jù)融合方法實現(xiàn)數(shù)據(jù)降維,融合策略是對于經(jīng)過數(shù)字脊波變換的數(shù)據(jù)進行歸一化方差加權(quán)[9]。
本地分類器選用第一類樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò),其拓撲結(jié)構(gòu)見圖2,其輸入是經(jīng)融合降維后的脊波系數(shù),輸出是局部分類判別結(jié)果。由于數(shù)字脊波系數(shù)包含有偽極傅里葉域[2](Pseudopolar Fourier Domain)的信息,因此此處權(quán)函數(shù)反映了原始圖像在極坐標下的頻域信息。對于分M類的情況本地分類器進行預分類輸出結(jié)果ui=k(k=0,1,…,M-1),表示當前輸入樣本被判為屬于第k類。
決策融合策略采用文獻 [6]提出的基于主體投票法的思想:對于各本地分類器輸出的分類結(jié)果進行主體投票,加權(quán)融合后得到最終的分類結(jié)果。主體投票規(guī)則 (Majority Voting Rule)可以表述為:
其中p(xi|wk)表示當前輸入樣本在第i個波段組被判為第k類的概率密度函數(shù)。若
則該樣本被判為屬于第j類。
采用典型的AVIRIS高光譜遙感圖像作為實驗圖像,該圖像取自1992年6月拍攝于美國印第安納州西北部遙感實驗區(qū)松樹試驗場,它包含了農(nóng)作物和森林植被的混合區(qū),它共有220個波段,每個波段圖像大小為145行145列,其空間分辨率為20 m ×20 m,數(shù)據(jù)深度為16 bit。原始圖像50(R)、27 (G)、17(B)波段假彩色圖像見圖4。
圖4 假彩色圖像Fig.4 Pseudo-color picture
去掉噪聲和水汽吸收帶,實驗從220波段原始數(shù)據(jù)中選取200個波段作為研究對象,選取4類典型地物:大豆、玉米、草地、林地。所用訓練樣本和檢驗樣本數(shù)見表1,其中訓練樣本總數(shù)為630,檢驗樣本總數(shù)為1 406。
表1 類別及樣本的選取Table 1 Type and sample selection
對于特征級融合,將200波段圖像等間隔的分為5組,然后采用基于快速Slant Stack算法的數(shù)字脊波變換和局部信息熵進行融合。圖5是基于以上融合策略和采用文獻 [3]提出的基于局部對偶框架算法實現(xiàn)脊波重構(gòu)得到的5個特征級融合圖像之一。可以看出該圖像存在一定程度上的模糊,分析原因,除了計算過程數(shù)據(jù)的截斷誤差(由雙精度型數(shù)據(jù)直接轉(zhuǎn)化為16bit無符號數(shù)據(jù))這一主要原因外,另一方面也是由于特征降維帶來的信息的丟失所引起的。
圖5 數(shù)字脊波融合圖像Fig.5 Digital ridgelet fusion picture
圖6給出了基于特征級融合的不同方法得到的分類精度,所采用的訓練與檢驗樣本均相同。其中前4組是用作實驗對照,它們都選擇傳統(tǒng)的極大似然(ML)分類器,特征融合處理手段依次為決策邊界特征提取(DBFE)、文獻[7]采用的基于小波變換(DWT)的特征融合、基于有限脊波變換(FRIT)的特征融合、基于本文所提到的用快速Slant Stack算法實現(xiàn)數(shù)字脊波變換 (DRT)和局部信息熵的特征融合。最后一組是采用2.1節(jié)提出的基于數(shù)字脊波變換和樣條權(quán)神經(jīng)網(wǎng)絡(luò)(DRTSWNN)的特征級融合分類,其分類精度最高,可達到95.87%。以上分類精度的提高是以數(shù)據(jù)運算量的增大為代價的:對比第3組和第4組實驗,它們的不同之處僅在于第3組采用的是有限Randon變換,它存在 “折疊效應”,第4組采用快速Slant Stack算法實現(xiàn)幾何域的Randon變換,它避免了 “折疊效應”的出現(xiàn),不會有環(huán)繞噪聲的引入,但是處理數(shù)據(jù)量增大了4倍;對比第4組和第5組實驗,它們的差別僅在于分類器的選擇,第4組采用傳統(tǒng)的極大似然(ML)分類器,第5組采用樣條權(quán)神經(jīng)網(wǎng)絡(luò)(SWNN),前者結(jié)構(gòu)簡單分類的效率要高于后者。
另外,單從分類精度的數(shù)值結(jié)果上來看,文獻[6]提出的基于投影追蹤 (Projection Pursuit)算法的特征融合在較少的訓練樣本情況下分類精度可以達到96.2%,分析其原因,該方法充分考慮了樣本的先驗知識和真實地物空間信息,而本文提出的方法中均未加以考慮。
圖6 特征融合分類精度Fig.6 Feature fusion classification accuracy
決策級融合先將各波段信息等間隔分成5組,每組將40個波段信息進行像素層融合得到4組融合后的脊波系數(shù)圖像,然后將其送入局部分類器完成預分類。局部分類器選用第一類樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)。然后再用主體投票規(guī)則進行決策融合,得到最終的分類結(jié)果。局部分類器和決策中心分類器均采用與特征級融合分類相同的訓練樣本和檢驗樣本。
分類精度見圖7,其中第3組為本文采用的基于樣條權(quán)神經(jīng)網(wǎng)絡(luò)(SWNN)和主體投票(MV)規(guī)則得到的,其分類精度為92.65%。其余3組用作實驗對照:第1組為采用BP神經(jīng)網(wǎng)絡(luò)(BPNN)得到的結(jié)果,由于該方法效果與BP網(wǎng)絡(luò)的初值的選取有很大關(guān)系,且容易陷入局部極小,圖7中的結(jié)果是多次實驗得到的最佳值;第2組是單獨采用樣條權(quán)神經(jīng)網(wǎng)絡(luò)(SWNN)得到的結(jié)果,由于該方案權(quán)函數(shù)求解可以轉(zhuǎn)化為線性方程組求解來實現(xiàn),因此不存在局部極小,初值敏感和收斂速度慢等傳統(tǒng)神經(jīng)網(wǎng)絡(luò)存在的問題,因此該方法無論在分類精度的提高方面還是在計算復雜度上都明顯優(yōu)于第1組采用的BP神經(jīng)網(wǎng)絡(luò)的方法;第4組在預分類中選擇極大似然 (ML)分類器實現(xiàn)局部分類,然后采用主體投票法實現(xiàn)分類決策融合。對比第3組和第4組實驗,它們的不同之處僅在于局部分類器的選擇上,本文方法略優(yōu)于ML-MV方法,但其計算復雜度也要高于該方法。
對比圖6和圖7可以看出,以上決策級融合分類得到的分類精度較特征級融合分類有所下降,文獻 [6]指出了其原因:這是由于在決策級融合策略中本地分類器和決策融合中心采用了相同的訓練樣本,這樣容易使訓練得到的結(jié)果不太具有一般性。避免該問題的方法可以選擇不同的訓練樣本,但本文討論的都是在非常有限的訓練樣本下實現(xiàn)融合分類的情況,這樣做勢必增加所需的訓練樣本數(shù)。
圖7 決策級融合分類精度Fig.7 Decision level fusion classification accuracy
通過研究基于快速Slant Stack算法和真實脊函數(shù)的數(shù)字脊波變換和一種全新的樣條權(quán)神經(jīng)網(wǎng)絡(luò),本文提出了基于數(shù)字脊波變換和樣條權(quán)神經(jīng)網(wǎng)絡(luò)的高光譜遙感圖像融合分類的具體算法,實現(xiàn)了基于局部信息熵的特征級融合和基于樣條權(quán)神經(jīng)網(wǎng)絡(luò)和主體投票理論的決策級融合,并在此基礎(chǔ)上針對典型AVIRIS圖像進行了地物分類,用較少的訓練樣本獲得了良好的分類效果。實驗表明采用數(shù)字脊波變換和樣條權(quán)神經(jīng)網(wǎng)絡(luò)進行特征級和決策級融合是有效的。
以上方案均未考慮高光譜數(shù)據(jù)的先驗知識和真實地物空間信息,這在一定程度上制約了分類精度的進一步提高。若能將各種先驗知識也考慮進去進行多源數(shù)據(jù)融合必將獲得更好的融合和分類性能。關(guān)于多源、多層次數(shù)據(jù)融合的研究是今后該開展的工作之一。
另外,采用快速Slant Stack算法實現(xiàn)的Randon變換數(shù)字化方案是以數(shù)據(jù)冗余的增加為代價的,若能找到既不會引入數(shù)據(jù)冗余又不存在 “折疊效應”的數(shù)字脊波實現(xiàn)方案,將能更好的為高光譜圖像數(shù)據(jù)融合服務(wù)。數(shù)字脊波和樣條權(quán)神經(jīng)網(wǎng)絡(luò)的這種松散式結(jié)合很容易讓人聯(lián)想到小波和神經(jīng)網(wǎng)絡(luò)的緊致性結(jié)合構(gòu)成的小波神經(jīng)網(wǎng)絡(luò),將脊波的良好時頻局部特性和神經(jīng)網(wǎng)絡(luò)的良好自學習能力和容錯性進行結(jié)合構(gòu)造出脊波神經(jīng)網(wǎng)絡(luò),也將能很好的為高光譜圖像處理服務(wù)。尋求新的數(shù)字脊波實現(xiàn)方案和關(guān)于脊波和神經(jīng)網(wǎng)絡(luò)的緊致性結(jié)合也是下一步的研究內(nèi)容。
[1]Tao Chen,Junping Zhang.Remote Sensing Image Fusion Based on Ridgelet Transform[C]//Geoscience and Remote Sensing Symposium,2005:150-1 153.
[2]張代遠.神經(jīng)網(wǎng)絡(luò)新理論與方法[M].北京:清華大學出版社,2006.
[3]張代遠.樣條權(quán)函數(shù)神經(jīng)網(wǎng)絡(luò)的一種新算法 [J].系統(tǒng)工程與電子技術(shù),2006,(9):1 434-1 437.
[4]A.Averbuch,R.R.Coifman,D.L.Donoho,et al. Fast Slant Stack:A notion of Randon T ransform for Data in a Cartesian Grid which is Rapidly Computable, Algebraically Exact,Geometrically Faithful and Invertible[EB/OL].http://stat.stanford.edu/~donoho/reports.
[5]Donoho D L,Flesia A G.Digital Ridgelet Transform based on T rue Ridge Functions[EB/OL].http:// stat.stanford.edu/~donoho/reports.
[6] Luis O.Jimenez,Anibal M orales,Antonio Creus. Calssification of Hyperdimensional Data Based on Feature and Decision Fusion Approaches Using Projection Pursuit,Majority Voting,and Neural Networks[J]. IEEE Trans on Geoscience and Remote Sensing.1999, 37(3):1 360-1 366.
[7]Chunhong Liu,Chunhui Zhao,Wanghai Cheng.Hyperspectral Image Classification by Second Generation Wavelet Based on Adaptive Band Selection[C]// IEEE ICM A Proceedings.NiagaraFalls,Canada. 2005.
[8]Zhang Ye.Adaptive Subspace Decomposition for HyperspectralData Dimensionality Reduction[C]// ICIP99 Proceedings.1999:326-329.
[9]劉春紅,趙春暉.基于提升算法的超譜遙感圖像融合分類研究 [J].哈爾濱工程大學學報,2004,25(6): 794-798.