黃 杰,王光輝2,楊化超,胡高強(qiáng)3,李建磊,柴文慧
(1.中國礦業(yè)大學(xué),江蘇徐州221116;2.國家測(cè)繪地理信息局衛(wèi)星測(cè)繪應(yīng)用中心,北京100830;3.奉化市測(cè)繪院,浙江寧波315500)
結(jié)合偏最小二乘法和支持向量機(jī)的遙感影像變化檢測(cè)
黃杰1,王光輝2,楊化超1,胡高強(qiáng)3,李建磊1,柴文慧1
(1.中國礦業(yè)大學(xué),江蘇徐州221116;2.國家測(cè)繪地理信息局衛(wèi)星測(cè)繪應(yīng)用中心,北京100830;3.奉化市測(cè)繪院,浙江寧波315500)
針對(duì)多光譜遙感影像通道之間相關(guān)性影響難以消除及變化檢測(cè)的閾值難以確定的問題,提出了一種結(jié)合偏最小二乘法(PLS)和支持向量機(jī)(SVM)的遙感影像變化檢測(cè)方法。將兩個(gè)時(shí)相的多通道遙感影像視為兩組多元隨機(jī)變量,引入多元統(tǒng)計(jì)數(shù)據(jù)分析方法中的PLS理論,進(jìn)行成分提取并構(gòu)造差異影像;再通過SVM將差異影像分為變化與不變化兩類別;最后利用形態(tài)學(xué)算子對(duì)分類結(jié)果作處理。選取Landsat8多光譜遙感影像進(jìn)行試驗(yàn),結(jié)果表明該方法可以很好地實(shí)現(xiàn)多光譜影像的變化檢測(cè),對(duì)地理國情數(shù)據(jù)監(jiān)測(cè)具有重要意義。
多光譜影像;偏最小二乘法;支持向量機(jī);變化檢測(cè);多重相關(guān)性
多時(shí)相遙感影像變化檢測(cè)是從不同時(shí)刻針對(duì)同一地區(qū)獲取的遙感影像中定量地分析和確定各種地物變化的特征和過程的技術(shù),實(shí)質(zhì)是地物變化引起地表波譜反射特性的變化,進(jìn)而引起不同時(shí)相的遙感影像像元光譜響應(yīng)的變化[1-4]。隨著遙感和信息技術(shù)的發(fā)展,變化檢測(cè)已經(jīng)在不同領(lǐng)域得到廣泛應(yīng)用[5-6]。
差異影像的構(gòu)造和變化閾值的提取是變化檢測(cè)中的兩大難點(diǎn)問題。對(duì)于多光譜遙感影像而言,多通道間信息的相關(guān)與冗余會(huì)影響變化分析的效率與精度,給構(gòu)造差異影像帶來一定的困難。傳統(tǒng)變化檢測(cè)方法如算術(shù)運(yùn)算法(圖像差值、圖像比值),變化矢量分析法[7](CVA)等無法消除通道間相關(guān)性;主成分分析法(PCA)[8-9]利用降維的思想,將影像信息集中在少數(shù)幾個(gè)變量中,實(shí)現(xiàn)了變量間的去相關(guān)處理,但主成分變換依賴于各變量的測(cè)量尺度,檢測(cè)結(jié)果對(duì)不同時(shí)相影像間輻射差異比較敏感,并且不能真正解決變量間的多重共線性問題。對(duì)于變化閾值的設(shè)定,傳統(tǒng)的圖像分割方法如最大類間方差自動(dòng)分割、最佳熵自動(dòng)分割、矩不變自動(dòng)分割等不能取得良好的效果,而基于貝葉斯理論的最小錯(cuò)誤率確定閾值[10]等非監(jiān)督分類方法對(duì)差異影像直方圖擬合效果差,會(huì)降低整體檢測(cè)精度。針對(duì)這些問題,本文提出一種結(jié)合偏最小二乘法和支持向量機(jī)的遙感影像變化檢測(cè)方法。引入偏最小二乘法能夠同時(shí)對(duì)多時(shí)相多通道影像提取不相關(guān)的成分,去除冗余信息,有效地集中和突出不同時(shí)相之間的差異信息,再計(jì)算對(duì)應(yīng)成分的差值構(gòu)造差異影像;基于支持向量機(jī)的監(jiān)督型變化檢測(cè)能夠?qū)Χ嗑S數(shù)據(jù)進(jìn)行訓(xùn)練和二值分類,減少常規(guī)方法中閾值提取引起的不確定性,提高變化檢測(cè)的效率與精度;形態(tài)學(xué)算子處理分類結(jié)果可去除變化影像的椒鹽噪聲,能夠獲取更接近實(shí)況的變化影像。
1.PLS算法
PLS是一種新型的多元統(tǒng)計(jì)數(shù)據(jù)分析方法,近幾十年來,它在理論、方法和應(yīng)用方面都得到了迅速的發(fā)展。PLS可以同時(shí)實(shí)現(xiàn)回歸建模(多元線性回歸)、數(shù)據(jù)結(jié)構(gòu)簡化(主成分分析)、兩組變量間相關(guān)性分析(典型相關(guān)分析),能夠有效解決變量間多重共線性的問題[11-12]。
假設(shè)有p個(gè)自變量{ x1,x2,…,xp}和q個(gè)因變量{y1,y2,…,yq}。在n個(gè)樣本點(diǎn)組成的數(shù)據(jù)表 X= [x1x2…xp]n×p和Y=[y1y2…yq]n×q中研究自變量與因變量的統(tǒng)計(jì)關(guān)系。首先對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化后的自變量矩陣E0和因變量矩陣F0。在 E0和F0中提取第一對(duì)主成分t1和u1(t1是x1,x2,…,xp的線性組合,u1是y1,y2,…,yq的線性組合),t1和u1需滿足:
1)t1和u1盡可能多地概括原數(shù)據(jù)表的信息;
2)t1和u1的相關(guān)程度最大。
得到t1=E0w1,w1為E0的第一主軸,w1=F0/F0。分別實(shí)施E0和F0對(duì)t1的回歸
式中,E1、F1分別為兩個(gè)回歸方程的殘差矩陣;回歸系數(shù)向量p1和r1滿足
如果此時(shí)回歸方程已達(dá)到滿意的精度,則算法停止;否則將利用殘差矩陣E1、F1取代E0、F0。用同樣方法提取第二對(duì)成分。如此循環(huán)直到達(dá)到滿意的精度后不再提取成分,精度可通過交叉有效性進(jìn)行判斷。記yi為原始數(shù)據(jù),^yhi為使用全部樣本點(diǎn)取t1、t2、…、th成分回歸建模后第i個(gè)樣本點(diǎn)的擬合值,^yh(-i)為建模時(shí)刪去第i個(gè)樣本點(diǎn),取t1、t2、…、th成分回歸建模后,再用此模型計(jì)算得擬合值。
式中,SSh為全部樣本擬合的具有h個(gè)成分的方程擬合誤差;PRESSh為增加了一個(gè)成分th后回歸方程預(yù)測(cè)誤差平方和;為交叉有效性檢驗(yàn)值。越大,成分th對(duì)改善模型預(yù)測(cè)的能力越明顯。
根據(jù)交叉有效性,對(duì)多元數(shù)據(jù)提取 h對(duì)成分{t1,t2,…,th}與{u1,u2,…,uh},并由對(duì)應(yīng)成分的相關(guān)性求解自變量與因變量間的回歸模型。
2.SVM算法
SVM是在統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則基礎(chǔ)上,根據(jù)有限的樣本信息在模型復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中來獲得最佳的推廣能力。SVM的核心思想是把樣本通過非線性變換映射到高維核空間中,進(jìn)而在高維核空間求取最優(yōu)分類超平面[13-14]。
記樣本集為{(xi,yi),i=1,2,…,n},其中x為d維向量,y∈{1,-1}表示屬于哪個(gè)類別。設(shè)最優(yōu)超平面為wTxi+b=0,則權(quán)值向量w和分類閾值b滿足
式中,ξi≥0稱為松弛變量,對(duì)應(yīng)數(shù)據(jù)點(diǎn)xi允許偏離的量。SVM尋找ξi的總和最小的平面,即
式中,C為懲罰系數(shù),根據(jù)拉格朗日乘子法,將尋求最優(yōu)分類超平面轉(zhuǎn)化為以下約束問題
最后得到最優(yōu)分類函數(shù)為
式中,αi為拉格朗日因子;α*i為αi的最優(yōu)解;b*為分類閾值;K( xi,xj)為滿足Mercer定理的核函數(shù),常用的有線性核(Linear)、多項(xiàng)式核(Polynomial)、Sigmoid核與高斯徑向基核(RBF)4種。
算法流程如圖1所示。
結(jié)合PLS和SVM多光譜遙感影像變化檢測(cè)不是直接根據(jù)影像樣本信息來確定超平面并進(jìn)行二值分類,而是先用PLS進(jìn)行主成分提取構(gòu)造差異影像,然后利用SVM進(jìn)行二值訓(xùn)練,得到變化影像,具體步驟敘述如下。
1.影像預(yù)處理
為了盡量避免植物覆蓋、氣候變化等因素對(duì)真實(shí)變化的影響,選取不同年份同一月份的同一區(qū)域遙感影像作為研究對(duì)象。對(duì)多時(shí)相影像進(jìn)行幾何精校正與輻射歸一化校正,幾何校正使用二次多項(xiàng)式擬合,匹配精度控制在0.5個(gè)像素之內(nèi),輻射歸一化采用直方圖匹配法。
2.PLS成分提取
將兩個(gè)時(shí)相的多通道遙感影像視為兩組多元隨機(jī)變量,前時(shí)相為自變量{x1,x2,…,xp},后時(shí)相為因變量{ y1,y2,…,yq},p、q為前后時(shí)相影像波段數(shù),樣本大小為所選影像區(qū)域像素個(gè)數(shù)。利用PLS算法原理,根據(jù)交叉有效性選取h對(duì)成分{t1,t2,…,th}與{u1,u2,…,uh},h≤min(p,q)。這h對(duì)成分盡可能多地概括了原始波段的信息,去除了波段之間的多重相關(guān)性。
3.構(gòu)造差異影像
差異影像是多時(shí)相影像間的變化信息的集中表達(dá)。對(duì) PLS提取的 h對(duì)成分{t1,t2,…,th}與{u1,u2,…,uh}計(jì)算差值,得到差異影像
4.SVM二值檢測(cè)
利用SVM對(duì)兩類和多類數(shù)據(jù)分類的優(yōu)勢(shì),將其應(yīng)用于多時(shí)相多光譜影像變化檢測(cè)中。在差異影像上人工選取幾處明顯的變化樣本與非變化樣本,輸入到SVM二值訓(xùn)練器,結(jié)合SVM算法過程,將差異影像分為變化與非變化兩類,得到二值變化檢測(cè)結(jié)果圖。通常RBF核函數(shù)分類結(jié)果優(yōu)于其他核函數(shù),本文選取 RBF核函數(shù)完成二值分類。RBF核(Gaussian徑向基核)
式中,σ為函數(shù)寬度參數(shù),且σ〉0;x為樣本集。
5.形態(tài)學(xué)處理
SVM二值分類檢測(cè)結(jié)果影像會(huì)存在斑點(diǎn)或孔洞,使結(jié)果圖因缺乏空間的連續(xù)性而與地物的實(shí)況不一致。為了達(dá)到去除椒鹽現(xiàn)象的目的,本文運(yùn)用3×3形態(tài)學(xué)算子對(duì)影像進(jìn)行開、閉運(yùn)算,使處理后的變化檢測(cè)結(jié)果更加真實(shí)。
本次試驗(yàn)數(shù)據(jù)為徐州市新城區(qū)2014年和2015年的Landsat8衛(wèi)星OLI傳感器多光譜影像。影像大小為405×465像素,選取除全色波段(band8)和卷云波段(band9)的剩余7個(gè)波段(band1—band7),空間分辨率均為30 m。首先,對(duì)兩個(gè)時(shí)相的數(shù)據(jù)進(jìn)行配準(zhǔn),配準(zhǔn)誤差小于0.5像素,滿足遙感變化檢測(cè)要求,然后將2014年影像作為參考影像,對(duì)2015年影像利用直方圖匹配法進(jìn)行相對(duì)輻射校正。圖2所示為研究區(qū)2014年及2015年OLI傳感器432波段的真彩色合成影像。
圖2 OLI 4(R)3(G)2(B)真彩色合成影像
為了解決多光譜通道間的多重相關(guān)性,本文在SIMCA-P軟件中對(duì)多時(shí)相影像數(shù)據(jù)進(jìn)行偏最小二乘分析,≥0.097 5時(shí)認(rèn)為成分th對(duì)模型預(yù)測(cè)能力有顯著改善作用這一原則,提取了4組成分{t1,t2,t3,t4}與{u1,u2,u3,u4},分別為變量Xi、Yi(i= 1~7)的線性組合,其中xi、yi對(duì)應(yīng)前后時(shí)相影像第i個(gè)波段。每組成分對(duì)應(yīng)變量的系數(shù)如圖3所示。
圖3 成分對(duì)應(yīng)的變量系數(shù)
由式(11)構(gòu)造差異影像,圖4(a)為選取前3個(gè)波段組成的假彩色合成影像。選取訓(xùn)練樣本,變化區(qū)域506像素,非變化區(qū)域423像素。利用SVM對(duì)差異影像進(jìn)行二值分類,本文選取RBF核函數(shù),懲罰系數(shù)C取100,核函數(shù)系數(shù)γ取提取成分?jǐn)?shù)的倒數(shù)0.25,二值分類結(jié)果如圖4(b)所示。最后為去除影像椒鹽現(xiàn)象,運(yùn)用3×3形態(tài)學(xué)算子對(duì)分類后影像處理,處理結(jié)果如圖4(c)所示。從檢測(cè)結(jié)果可以看出,本文變化檢測(cè)方法結(jié)果能夠很好地檢測(cè)出耕地/荒地-建筑物、耕地/荒地-道路、植被覆蓋等變化。
圖4 結(jié)合PLS-SVM變化檢測(cè)結(jié)果
為了驗(yàn)證本文變化檢測(cè)方法的優(yōu)越性,將直接差值-SVM、PCA-SVM,以及文獻(xiàn)[8]提出的PCA-EM變化檢測(cè)方法加入對(duì)比試驗(yàn)。選取測(cè)試樣本(部分變化區(qū)域與未變化區(qū)域)進(jìn)行精度評(píng)定,變化檢測(cè)精度評(píng)價(jià)方法采用構(gòu)造混淆矩陣,計(jì)算總體精度指標(biāo)與Kappa系數(shù)來實(shí)現(xiàn)[5]。圖5顯示了不同變化檢測(cè)方法的檢測(cè)結(jié)果。
圖5 不同變化檢測(cè)方法的檢測(cè)結(jié)果
表1給出了不同方法的檢測(cè)精度。從表1可以看出,本文提出的結(jié)合PLS-SVM的變化檢測(cè)方法總體分類精度與Kappa系數(shù)最高。這是由于差值運(yùn)算法忽略了影像多通道間的相關(guān)性影響;PCA方法雖抑制了影像內(nèi)部相關(guān)性,但沒有考慮兩幅影像間的相關(guān)性,對(duì)多時(shí)相影像相對(duì)輻射校正結(jié)果有較高要求;而PLS方法考慮了自變量與因變量間的線性關(guān)系,提取相關(guān)程度最大的成分,消除了數(shù)據(jù)間的多重共線性,從而集中了前后時(shí)相影像的變化信息,提高了變化檢測(cè)正確率。另外,通過將SVM監(jiān)督型二值分類方法與EM(最大期望)非監(jiān)督型方法進(jìn)行對(duì)比,顯示SVM二值檢測(cè)效果更好,這是由于非監(jiān)督方法對(duì)差異影像直方圖擬合效果差,而SVM監(jiān)督型方法利用了樣本信息,減少了自動(dòng)閾值算法的不確定性。總之,本文方法可以很好地實(shí)現(xiàn)多光譜影像的變化檢測(cè)。
表1 不同方法變化檢測(cè)精度
本文針對(duì)多光譜影像的特點(diǎn)提出了一種結(jié)合偏最小二乘法和支持向量機(jī)的遙感影像變化檢測(cè)方法。該方法首先用PLS進(jìn)行主成分提取構(gòu)造差異影像,然后利用SVM進(jìn)行二值訓(xùn)練,得到變化影像。試驗(yàn)結(jié)果表明,本文方法對(duì)于絕大多數(shù)地物類別變化可以很好地完成檢測(cè),相比傳統(tǒng)的方法具有較高的檢測(cè)精度。需要指出的是,對(duì)于變化前后的地物類別判斷及變化趨勢(shì)的預(yù)測(cè)本文方法沒有涉及,這些內(nèi)容有待于進(jìn)一步研究。
[1] 李德仁.利用遙感影像進(jìn)行變化檢測(cè)[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2003,28(S1):7-12.
[2] SINGH A.Review Article Digital Change Detection Techniques Using Remotely-sensed Data[J].International Journal of Remote Sensing,1989,10(6):989-1003.
[3] 李亮,舒寧,王凱,等.融合多特征的遙感影像變化檢測(cè)方法[J].測(cè)繪學(xué)報(bào),2014,43(9):945-953.
[4] 肖化超,周詮,張建華.遙感衛(wèi)星在軌機(jī)場(chǎng)變化檢測(cè)方法[J].測(cè)繪通報(bào),2015(1):22-25.
[5] LU D,MAUSEL P.Change Detection Techniques[J]. International Journal of Remote Sensing,2004,25(12): 2365-2507.
[6] 鐘家強(qiáng),王潤生.基于自適應(yīng)參數(shù)估計(jì)的多時(shí)相遙感圖像變化檢測(cè)[J].測(cè)繪學(xué)報(bào),2006,35(4):331-336.
[7] 劉永進(jìn),喬德軍,鄭衛(wèi)華.基于植被覆蓋度序列的變化矢量分析[J].測(cè)繪通報(bào),2008(11):41-43.
[8] 吳柯,牛瑞卿,王毅,等.基于PCA與EM算法的多光譜遙感影像變化檢測(cè)研究[J].計(jì)算機(jī)科學(xué),2010,37(3):282-284.
[9] KWARTENG A Y,CHAVEZ J P S.Change Detection Study of Kuwait City and Environs Using Multi-temporal Landsat Thematic Mapper Data[J].International Journal of Remote Sensing,1998,19(9):1651-1662.
[10] 盛輝,廖明生,張路.基于典型相關(guān)分析的變化檢測(cè)中變化閾值的確定[J].遙感學(xué)報(bào),2004,8(5):451-457.
[11] 王惠文.偏最小二乘回歸方法及其應(yīng)用[M].北京:國防工業(yè)出版社,1999.
[12] 馬明德,馬學(xué)娟,謝應(yīng)忠,等.寧夏生態(tài)足跡影響因子的偏最小二乘回歸分析[J].生態(tài)學(xué)報(bào),2014,34 (3):682-689.
[13] 杜培軍,柳思聰,鄭輝.基于支持向量機(jī)的礦區(qū)土地覆蓋變化檢測(cè)[J].中國礦業(yè)大學(xué)學(xué)報(bào),2012,41 (2):262-267.
[14] MOUNTRAKIS G,IM J,OGOLE C.Support Vector Machines in Remote Sensing:A Review[J].ISPRS Journal of Photogrammetry and Remote Sensing,2011,66(3):247-259.
[15] VAN OORT P A J.Interpreting the Change Detection Error Matrix[J].Remote Sensing of Environment,2007,108(1):1-8.
Change Detection of Remote Sensing Image by Partial Least Squares and Support Vector Machine
HUANG Jie,WANG Guanghui,YANG Huachao,HU Gaoqiang,LI Jianlei,CHAI Wenhui
10.13474/j.cnki. 11-2246.2016.0219.
P237
B
0494-0911(2016)07-0035-04
2015-11-17;
2016-03-09
測(cè)繪地理信息公益性行業(yè)科研專項(xiàng)(201412007;201512027)
黃 杰(1992—),男,碩士,研究方向?yàn)檫b感影像信息提取。E-mail:hjhuangjie_jason@163.com
引文格式:黃杰,王光輝,楊化超,等.結(jié)合偏最小二乘法和支持向量機(jī)的遙感影像變化檢測(cè)[J].測(cè)繪通報(bào),2016(7):35-38.