(成都理工大學(xué) 地球科學(xué)學(xué)院,四川 成都 610000)
主成分分析(Principal Component Analysis,PCA),是一種統(tǒng)計(jì)方法,對(duì)于原先的所有變量,將重復(fù)的變量或者關(guān)系緊密的變量刪除,建立信息盡可能少的具有代表性的新變量,這些新變量也被稱為是主成分是不相關(guān)的,而在反映問題的方面盡可能保持原來的信息[1]。圖像的線性變換用以下公式來表達(dá):Y=TX
其中,X表示需要變換的原始矩陣,Y表示經(jīng)過處理后的矩陣,T表示產(chǎn)生線性變換的矩陣,如T是正交矩陣,則X為協(xié)方差矩陣[2]。具體步驟為需要求出協(xié)方差矩陣S,則要結(jié)合原始的矩陣X,其中X如以下公式:
其中m,n為矩陣中的行列數(shù),在遙感處理中相當(dāng)于圖像中的像元數(shù),而每一行的矢量則表示波段的數(shù)據(jù)。協(xié)方差矩陣S求法如下所示:
主成分變換之后的新向量可稱為第一主成分,第二主成分…,一般來說第一主成分(PC1)包含了所有波段中80%的方差信息,前三個(gè)主成分已經(jīng)包括了所有波段中95%的信息量。而數(shù)據(jù)無論從數(shù)量和維數(shù)已經(jīng)大大降低。
多光譜圖像的各波段之間經(jīng)常是高度相關(guān)的,它們的DN值以及視覺效果往往都很相似,這就使得產(chǎn)生了大量的冗余信息。我們希望有一種能夠去除波段之間的多余信息,將多波段的圖像信息壓縮到比原來波段更有效的少數(shù)幾個(gè)波段的方法。而主成分分析則可以做到這些要求。
(1)數(shù)據(jù)壓縮。在對(duì)多光譜遙感數(shù)據(jù)進(jìn)行處理時(shí),由于波段多且數(shù)據(jù)大的情況使得數(shù)據(jù)處理很復(fù)雜且低效。而在使用主成分分析后,將多光譜空間轉(zhuǎn)變成主分量,而一般第一二三主分量已經(jīng)包含了絕大多數(shù)的信息,則可以減少大量的冗余數(shù)據(jù)。方便處理運(yùn)算。
(2)圖像增強(qiáng)。在進(jìn)行主成分分析后,突出了關(guān)鍵數(shù)據(jù),去掉了冗余信息(噪聲),使得圖像質(zhì)量加強(qiáng)。
(3)信息提取。主成分分析還可以對(duì)例如地質(zhì)、植被、水體等研究信息進(jìn)行專門提取來進(jìn)行分析,應(yīng)用廣泛。
利用TM遙感影像數(shù)據(jù)進(jìn)行主成分分析。實(shí)驗(yàn)區(qū)選擇2008年7月的130034景子區(qū),在進(jìn)行輻射定標(biāo),大氣校正的數(shù)據(jù)處理之后。首先對(duì)各個(gè)波段進(jìn)行協(xié)方差計(jì)算,如表1所示:
表1 實(shí)驗(yàn)區(qū)TM協(xié)方差矩陣
在進(jìn)行正交變換后,將遙感數(shù)據(jù)X的信息映射到主成分坐標(biāo)空間Y中,則方程式為:
y1=0.258x1+0.337x2+0.518x3+0.212x4+0.478x5+0.526x7
y2=-0.121x1-0.071x2-0.196x3+0.975x4+0.076x5-0.158x7
y3=-0.379x1-0.378x2-0.442x3-0.148x4+0.585x5+0.394x7
y4=-0.643x1-0.269x2+0.514x3+0.085x4-0.387x5+0.303x7
y5=-0.277x1-0.068x2+0.423x3-0.105x4+0.524x5-0.672x7
y7=0.531x1-0.812x2+0.232x3+0.066x4+0.005x5+0.003x7
對(duì)研究區(qū)中所有分量進(jìn)行計(jì)算處理得到特征值,最后得出貢獻(xiàn)率和累計(jì)貢獻(xiàn)率。通過最后的主成分向量矩陣表可知,第一主成分量的貢獻(xiàn)率就已經(jīng)達(dá)到了88.16%,前三主成分分量的累計(jì)貢獻(xiàn)率已經(jīng)達(dá)到了99.5%?;揪鸵呀?jīng)表達(dá)了研究區(qū)中的所有的波段數(shù)據(jù)。此外在第一主成分變量中,對(duì)應(yīng)的原始7波段擁有最大的權(quán)重值,而在第二主成分變量中,4波段擁有最大值,其次為3波段等。這些信息在對(duì)于特殊遙感數(shù)據(jù)分析中是有非常大的參考作用的。
表2 實(shí)驗(yàn)區(qū)TM影像協(xié)方差特征向量矩陣
波段1 0.258 -0.121 -0.379 -0.643 -0.277 0.531波段2 0.337 -0.071 -0.378 -0.269 -0.068 -0.812波段3 0.518 -0.196 -0.442 0.514 0.423 0.232波段4 0.212 0.975 -0.148 0.085 -0.105 0.066波段5 0.478 0.076 0.585 -0.387 0.524 0.005波段7 0.526 -0.158 0.394 0.303 -0.672 0.003特征值 1540.976 145.713 32.548 4.629 3.009 0.797貢獻(xiàn)率 0.8816 0.0943 0.0201 0.0023 0.0021 0.0005總貢獻(xiàn)率 0.8816 0.9759 0.995 0.9977 0.9995 1.0000
在遙感技術(shù)的不斷發(fā)展中,多光譜和高光譜數(shù)據(jù)已經(jīng)成為遙感分析的常規(guī)數(shù)據(jù)。而其復(fù)雜冗余數(shù)據(jù)的問題也一直存在,所以需要我們?cè)谘芯恐腥コǘ沃g的多余信息,將多波段的圖像信息壓縮到比元波段更有效的幾個(gè)少數(shù)轉(zhuǎn)換波段的方法。因此通過主成分變換來達(dá)到所述目的就顯得十分重要。在通過對(duì)主成分分析的介紹、主成分在遙感數(shù)據(jù)處理中的應(yīng)用以及對(duì)研究區(qū)域的實(shí)際應(yīng)用中。表現(xiàn)出了主成分分析在遙感影像數(shù)據(jù)處理中減少數(shù)據(jù)量,刪除冗余信息且能夠保留絕大部分的有用信息,能夠達(dá)到加快處理計(jì)算效率,增強(qiáng)影像信息,對(duì)有關(guān)所需信息重點(diǎn)提取的優(yōu)點(diǎn)。從而使得其方法在遙感影像處理中得到廣泛應(yīng)用。