董江山,李成范,趙俊娟,尹京苑,沈 迪,薛 丹
(上海大學(xué)計(jì)算機(jī)工程與科學(xué)學(xué)院,上海 200111)
隨著傳感器技術(shù)的進(jìn)步,遙感已成為研究地球資源環(huán)境的重要手段之一,應(yīng)用也越來(lái)越廣泛。像元是構(gòu)成遙感影像的基本單元[1-2],每個(gè)像元中包含多種地物,即混合像元。傳感器獲取的絕大多數(shù)像元基本上都是混合像元[3]?;旌舷裨拇嬖谝疬b感分類誤差,導(dǎo)致分類精度下降,不能真實(shí)反映地表覆蓋狀況。如何對(duì)遙感圖像混合像元進(jìn)行有效處理一直是遙感圖像分析的難點(diǎn)和熱點(diǎn)[4-7],也是進(jìn)行遙感分類應(yīng)用研究的關(guān)鍵。
獨(dú)立分量分析(Independent Component Analysis,ICA)是近年來(lái)發(fā)展起來(lái)的一種信號(hào)處理方法。該方法在統(tǒng)計(jì)分布獨(dú)立的假設(shè)下,從多通道測(cè)量所得到的觀測(cè)信號(hào)出發(fā),將若干隱含在混合信號(hào)中的獨(dú)立信號(hào)源分離出來(lái)。但是,由于ICA模型的各成分之間獨(dú)立性條件和數(shù)據(jù)統(tǒng)計(jì)分布規(guī)律固定不變的假設(shè),以及模型估計(jì)本身所具有的不確定性,影響了ICA方法的性能,致使ICA無(wú)法完全對(duì)遙感圖像中的所有像元光譜特征進(jìn)行處理,至今ICA仍然不能夠完全解決遙感圖像中混合像元的問(wèn)題[8-9]。
在分析遙感圖像特點(diǎn)和ICA模型基礎(chǔ)上,本文提出了一種基于變分貝葉斯ICA(Variational Bayesian ICA,VBICA)的遙感圖像處理方法。與傳統(tǒng)方法相比,該方法通過(guò)引入貝葉斯推論和條件獨(dú)立性準(zhǔn)則來(lái)完成位置隱藏變量的學(xué)習(xí),并利用近似變分算法對(duì)其計(jì)算過(guò)程進(jìn)行簡(jiǎn)化處理,在一定程度上得到了盡可能簡(jiǎn)化、且結(jié)果逼近真實(shí)地表分布的最佳近似值,突破了傳統(tǒng)ICA方法的局限性,擴(kuò)展了ICA在遙感圖像分析中的應(yīng)用范圍,并取得了較好的分類效果。
由ICA模型可知,在含有噪聲的線性瞬時(shí)混合生成模型中,源信號(hào)與觀測(cè)信號(hào)的關(guān)系表示如下:
式中,x(t)是一個(gè)M維觀測(cè)信號(hào),s(t)是一個(gè)L維隱藏信號(hào)源,A是一個(gè)M×L維的混合矩陣,N(t)是M維的高斯噪聲,噪聲N(t)通常被認(rèn)為是零值或逆方差為A的對(duì)角矩陣。其中,觀測(cè)數(shù)據(jù)x(t)的概率可表示為
式中,M表示所選擇的具體模型,p(s|M)是信號(hào)源模型,p(x|M)是模型M的邊際概率。為了使所選取的概率模型與多光譜遙感光學(xué)圖像相一致,模型M選擇為高斯模型。
在高斯混合模型中,每一個(gè)模型都包含了t個(gè)高斯成分,并分別與每個(gè)源信號(hào)相對(duì)應(yīng),因此一個(gè)具有L個(gè)源信號(hào)的ICA模型中,就有L個(gè)高斯混合模型{t1,t2,…,tL},則源信號(hào) s的分布為
其中,θ=[θ1,θ2,…,θL]為源信號(hào)高斯模型的參數(shù)θi=[лi,μi,βi],лi為混合比例,μi和 βi分別表示第 i個(gè)源信號(hào)中第qi個(gè)成分的期望值和精度值。
先驗(yàn)概率確定后,就可以利用變分逼近算法進(jìn)行變分貝葉斯ICA模型的學(xué)習(xí)。貝葉斯推論的核心就是計(jì)算后驗(yàn)概率分布p(W|x,M)。在變分貝葉斯ICA網(wǎng)絡(luò)中,目標(biāo)函數(shù)就是最大化負(fù)變自由能F[x|θ]:
式中,W為貝葉斯網(wǎng)絡(luò)模型中隱藏變量和模型參數(shù)集合,W={Λ,Α,s,q,θ}。
在貝葉斯網(wǎng)絡(luò)中,多個(gè)變量之間并不相互獨(dú)立,難以計(jì)算。因此,常采用近似逼近方法得到p(W|x,M)的近似形式 p'(W|θ):
根據(jù)貝葉斯網(wǎng)絡(luò)的條件獨(dú)立性法則,p'(W|θ)又可表示為
式中,p'(W|θ)=p'(π)p'(μ)p'(β),p'(s|q)是由混合高斯模型決定;此時(shí),可以依次求p'(Wi|θ)對(duì)各參數(shù)的偏導(dǎo)數(shù)的極值。
利用信源模型中參數(shù)先驗(yàn)分布定義得到源信號(hào)的近似分布參數(shù)為
類似還可以推導(dǎo)其他隱藏變量和參數(shù)的后驗(yàn)分布,并以迭代的方式運(yùn)行直至收斂,最終得到源信號(hào)和不同分量的有效分離。
選用上海附近地區(qū)的多光譜遙感影像Landsat7 ETM+為數(shù)據(jù)源,成像時(shí)間為2000年7月14日,截取范圍為200×200像元(圖1)。TM影像中6頻段為熱紅外頻段,所以在實(shí)驗(yàn)中主要選用頻段1、2、3、4、5和7等頻段對(duì)VBICA方法進(jìn)行驗(yàn)證。此外,本實(shí)驗(yàn)中采用的計(jì)算平臺(tái)為MATLAB 6.5,所有的計(jì)算過(guò)程通過(guò)編程全部在該平臺(tái)中實(shí)現(xiàn)。經(jīng)FastICA方法和VBICA方法處理后的獨(dú)立分量分配如圖2和圖3所示。
圖1 Landsat7 ETM+原始影像Fig.1 The original Landsat7 ETM+image
圖2 FastICA方法處理后的獨(dú)立分量Fig.2 The independent components obtained by FastICA method
圖3 VBICA方法處理后的獨(dú)立分量Fig.3 The independent components obtained by VBICA method
從圖2和3中可以看出,首先,VBICA方法獲取的獨(dú)立分量分離程度要明顯高于FastICA方法獲取的獨(dú)立分量,獨(dú)立分量對(duì)比更明顯,目視效果較好;其次,F(xiàn)astICA和VBICA方法處理后獲取的6個(gè)獨(dú)立分量并不是按照信息量的大小依次排列的。
實(shí)驗(yàn)中我們采用均方根誤差、運(yùn)算時(shí)間、迭代次數(shù)、穩(wěn)定性和目視效果等5個(gè)指標(biāo)來(lái)衡量FastICA和VBICA方法的性能,結(jié)果如表1所示。
表1 FastICA和VBICA方法的性能比較Table 1 The performance comparison between FastICA and VBICA
從表1看出,完成TM遙感圖像的6個(gè)獨(dú)立分量分析,F(xiàn)astICA方法耗時(shí)58 s,迭代次數(shù)362次,VBICA方法耗時(shí)161 s,迭代次數(shù)82次。與FastICA方法相比,雖然VBICA方法運(yùn)算時(shí)間較長(zhǎng),但是該方法的均方根誤差最小,穩(wěn)定性最好,分離出的獨(dú)立分量目視效果也最好。
在提取獨(dú)立分量時(shí),一方面,VBICA方法運(yùn)算耗時(shí)較長(zhǎng),這主要是由于在變分貝葉斯學(xué)習(xí)中的運(yùn)算參數(shù)數(shù)目較多,并且一些參數(shù)在每次迭代過(guò)程中都參與造成的,而結(jié)果也證實(shí)了VBICA方法達(dá)到的是全局最小化而不是局部最小化;另一方面,對(duì)于FastICA和VBICA方法而言,提取出的獨(dú)立分量都是隨機(jī)產(chǎn)生的,并不按一定規(guī)則出現(xiàn)。例如,對(duì)于VBICA方法提取出的獨(dú)立分量而言,最好的獨(dú)立分量是第六分量,而不是第一分量,這是由于投影矩陣的初始化隨機(jī)造成的。
本文利用ENVI遙感軟件自帶的TM遙感圖像數(shù)據(jù),圖像大小為512×512像素,選取頻段為1、2、3、4、5和7頻段。TM原始影像如圖4(a)所示。根據(jù)研究區(qū)的實(shí)際情況,整幅圖像區(qū)域可以分為5類地物。
研究方法是將TM遙感圖像分為3組分別進(jìn)行分類研究。第一組:TM影像經(jīng)過(guò)VBICA方法處理后進(jìn)行分類;第二組:TM影像直接進(jìn)行最大似然法分類(Maximum Likelihood Classification,MLC);第三組:TM影像經(jīng)過(guò)獨(dú)立分量分析(Independent Principal Component Analysis,ICA)和 FastICA處理后進(jìn)行分類。最后將3組4種分類方法的分類結(jié)果進(jìn)行對(duì)比分析。
TM圖像經(jīng)過(guò)VBICA方法處理后,即可得到各個(gè)光譜相互獨(dú)立且各自分布方差相同的獨(dú)立分量,將各種干擾噪聲影響從圖像中徹底分離出來(lái),并且信息量相對(duì)集中于前幾個(gè)頻段分量之間。經(jīng)過(guò)VBICA處理后得到6個(gè)獨(dú)立成分圖像。從中選擇第一、四、六獨(dú)立分量進(jìn)行假彩色合成,采用最小距離分類法對(duì)合成的假彩色圖像進(jìn)行分類,結(jié)果如圖4(b)所示。
圖4 TM原始影像和VBICA方法的分類結(jié)果Fig.4 The original TM image and the classification results of VBICA method
將TM遙感圖像直接進(jìn)行MLC分類和ICA、FastICA處理后分類,結(jié)果如圖5所示。
圖5 分類結(jié)果Fig.5 The classification results
從圖4(b)和圖5中看出,在以上3組4種分類結(jié)果中,MLC分類結(jié)果中圖斑最為破碎,ICA、FastICA和VBICA處理后的分類圖像質(zhì)量有很大的改善,尤其是經(jīng)過(guò)VBICA處理后的分類結(jié)果圖像質(zhì)量最好,也最容易目視。
為了評(píng)價(jià)遙感圖像分類精度,本文采用混淆矩陣法來(lái)檢驗(yàn)分類的準(zhǔn)確性,結(jié)果如表2所示。
表2 分類結(jié)果精度對(duì)比Table 2 The accuracy comparison of classification results %
從表2中看出,ICA、FastICA和VBICA方法處理后的分類結(jié)果都具有較高的精度,明顯大于MLC分類的67.19%。這主要是由于MLC分類方法中圖像紋理特征較少,而經(jīng)過(guò)ICA、FastICA和VBICA方法處理后均不同程度地增加紋理信息特征,使得分類精度要遠(yuǎn)大于MLC。其中,經(jīng)過(guò)VBICA方法處理后的遙感圖像分類精度即平均分類精度達(dá)到了91.55%,F(xiàn)astICA處理后平均分類精度為86.92%,ICA的平均分類精度為81.41%。由此可知,VBICA的分類精度要優(yōu)于FastICA,而FastICA又優(yōu)于ICA方法。
通過(guò)對(duì)VBICA方法的實(shí)驗(yàn)以及對(duì)TM遙感圖像進(jìn)行分類可知:
(1)遙感圖像經(jīng)過(guò)VBICA方法處理后的分類精度最高,F(xiàn)astICA方法、ICA和MLC的分類精度依次下降,傳統(tǒng)的MLC分類精度最低,與VBICA的平均分類精度相差24.36%;
(2)從視覺(jué)上可以看出MLC分類圖中存在較多破碎圖斑,且不同地物間的界線明顯,實(shí)際上這種情況不能表達(dá)客觀事實(shí),而經(jīng)過(guò)VBICA方法處理后的分類圖中地物間過(guò)度緩和能夠表達(dá)地物的真實(shí)分布,這更加有助于進(jìn)行定量遙感研究;
(3)利用VBICA方法對(duì)中等分辨率的TM遙感圖像處理后進(jìn)行分類,不僅可以大大提高分類精度,而且還可以很好地表達(dá)地物之間的真實(shí)分布情況,因此,VBICA方法在遙感圖像分類中具有較好的應(yīng)用前景。
FastICA方法主要是基于非高斯信號(hào)源的高階統(tǒng)計(jì)。遙感圖像通常為單高斯模型,具有一階或二階統(tǒng)計(jì)特征。FastICA因?yàn)槠浼僭O(shè)與遙感圖像概率分布統(tǒng)計(jì)模型不一致而引起獨(dú)立分量提取效果下降。與此相反,VBICA方法中的高斯模型是所有遙感圖像的后驗(yàn)分布,與遙感圖像的概率分布相一致。于是,經(jīng)過(guò)VBICA方法處理后提取的獨(dú)立分量效果要比FastICA方法的明顯。但是,F(xiàn)astICA方法和VBICA方法提取出的獨(dú)立分量都是隨機(jī)產(chǎn)生的,并不是按照一定的規(guī)則出現(xiàn),這主要是因?yàn)橥队熬仃嚨某跏蓟请S機(jī)造成的。VBICA方法雖然計(jì)算耗時(shí)較長(zhǎng),但是該方法是基于變分貝葉斯概率模型的學(xué)習(xí),更易于對(duì)遙感圖像進(jìn)行處理和獨(dú)立分量提取。
雖然ICA在去除相關(guān)性方面具有一定的優(yōu)勢(shì),但是由于模型本身的不確定性和各成分之間的相關(guān)性,限制了ICA在遙感圖像分析中的應(yīng)用。本文提出利用VBICA方法對(duì)遙感圖像處理后進(jìn)行分類,既有效克服了ICA模型在遙感圖像分析中的局限性,又提高了分類精度和目視效果。實(shí)驗(yàn)結(jié)果表明,VBICA方法在頻段有限的中分辨率遙感圖像分類中具有較好的應(yīng)用前景。但是,VBICA方法提取獨(dú)立分量的計(jì)算耗時(shí)較長(zhǎng)且獨(dú)立分量是隨機(jī)出現(xiàn)的。目前,遙感技術(shù)向著高光譜分辨率和高空間分辨率的方向發(fā)展,這對(duì)應(yīng)用日益廣泛的高光譜遙感圖像來(lái)說(shuō),在提取出的眾多獨(dú)立分量中,如何選擇合適的獨(dú)立分量或?qū)Κ?dú)立分量進(jìn)行有效排序就是我們下一步的研究?jī)?nèi)容;另外,對(duì)于高空間分辨率遙感圖像來(lái)說(shuō),VBICA方法在其應(yīng)用中存在的問(wèn)題還有待以進(jìn)一步探討和優(yōu)化。
[1] 蘇禮坤,陳懷新.光學(xué)遙感圖像大氣校正的算法設(shè)計(jì)[J].電訊技術(shù),2009,49(1):8-12.SU Li-kun,CHEN Huai-xin.Algorithm design of atmospheric correction for optical remote sensing images[J].Telecommunication Engineering,2009,49(1):8 - 12.(in Chinese)
[2] 俞鴻波,劉永光.一種基于最小錯(cuò)分概率的遙感影像變化檢測(cè)算法[J].電訊技術(shù),2008,48(5):78-81.YU Hong-bo,LIU Yong-guang.A change detection algorithm based on minimal classifying error[J].Telecommunication Engineering,2008,48(5):78 -81.(in Chinese)
[3] Wang J,Chang C I.Application of independent component analysis in endmember extraction and abundance quantification for hyperspectral imagery [J].IEEE Transactions on Geoscience and Remote Sensing,2006,44(9):2601-2616.
[4] Kontoes C C,Raptis V.Thepotential of kernel classification techniques for land use mapping in urban areas using 5M -spatial resolution IRS-1C imagery[J].International Journal of Remote Sensing,2000,21(16):3142 -3151.
[5] Chang C L.Hyperspectral Imaging:Techniques for Spectral detection and classification[M].New York:Kluwer Academic/Plenum Publishers,2003.
[6] Lee T W,Girolami M,Sejnowski T J.Independent component analysis using an extended infomax algorithm for mixed subgaussian and supergaussian sources[J].Neural Computation,1999,11(2):417 -441.
[7] Chang C I,Plaza A.Fast iterative algorithm for implementation of pixel purity index[J].IEEE Transactions on Geoscience and Remote Sensing,2006,3(1):63 -67.
[8] 范濤,李志農(nóng),肖堯先.基于源數(shù)估計(jì)的機(jī)械源信號(hào)盲分離方法研究[J].機(jī)械強(qiáng)度,2011,33(1):15-19.FAN Tao,LI Zhi-nong,XIAO Yao-xian.Blind separation of mechanical source signals based on the estimation of source numbers[J].Journal of Mechanical Strength,2011,33(1):15 -19.(in Chinese)
[9] Li Chengfan,Yin Jingyuan,Bai Chunsong.Variational Bayesian independent component analysis for spectral unmixing in remote sensing image[J].Arabian Journal of Geosciences,2013,6(4):1119 -1129.