張向榮 于心源 唐 旭 侯 彪 焦李成
(西安電子科技大學(xué)人工智能學(xué)院,智能感知與圖像理解教育部重點(diǎn)實(shí)驗(yàn)室,國際智能感知與計(jì)算聯(lián)合研究中心 西安 710071)
極化SAR (PolSAR) 圖像地物分類在地質(zhì)勘探、地形分析以及災(zāi)害監(jiān)測等方面具有廣泛的應(yīng)用[1]。隨著理論水平的逐年提高,加上圖像處理領(lǐng)域的巨大需求,極化SAR圖像的分類問題成為了研究領(lǐng)域的熱點(diǎn)。
根據(jù)算法是否依賴于數(shù)據(jù)的先驗(yàn)樣本,極化SAR圖像分類算法可以具體地分為有監(jiān)督與無監(jiān)督兩大類。無監(jiān)督分類方法主要是利用極化數(shù)據(jù)的統(tǒng)計(jì)特征對(duì)同類型像素進(jìn)行分類,不需要進(jìn)行訓(xùn)練,因此當(dāng)訓(xùn)練樣本嚴(yán)重不足的情況下,采用無監(jiān)督分類方法的優(yōu)勢(shì)十分明顯。且無監(jiān)督方法的圖像分類過程簡單,充分利用了圖像的有效信息,適用范圍十分廣泛。無監(jiān)督的極化SAR分類主要分為兩類:基于地物目標(biāo)電磁散射特性和統(tǒng)計(jì)特性的分類法[2]以及基于聚類分析和圖像處理技術(shù)的分類法[3]。然而目前基于無監(jiān)督的方法大多從極化數(shù)據(jù)的統(tǒng)計(jì)特性和散射特性角度出發(fā),很少從圖像本身角度去考慮,不能充分利用極化數(shù)據(jù)的特征信息,無法全面地描述地面目標(biāo)的物理屬性。因此,如何深度挖掘極化SAR圖像的特征信息,采用高效的處理方法提高分類精度,是當(dāng)前極化SAR分類面臨的挑戰(zhàn),同時(shí)也是本文重點(diǎn)關(guān)注的問題。
譜聚類在分析復(fù)雜的數(shù)據(jù)結(jié)構(gòu)信息時(shí),通過得到數(shù)據(jù)點(diǎn)的不同相似圖來預(yù)測聚類標(biāo)簽,往往能夠顯示出其較強(qiáng)的聚類能力。將判別聚類方法應(yīng)用到極化SAR圖像的分類中有兩個(gè)優(yōu)點(diǎn):首先,判別聚類可以將有監(jiān)督的判別能力引入無監(jiān)督分類問題中,現(xiàn)有的監(jiān)督學(xué)習(xí)工具在弱監(jiān)督任務(wù)和無監(jiān)督任務(wù)中具有良好的重要性能;其次,判別聚類是一個(gè)通用框架,它允許將不同的判別損失函數(shù)或其他特定領(lǐng)域的約束合并到一個(gè)單一的損失函數(shù)中,適用于不同的應(yīng)用程序,并且具有很強(qiáng)的靈活性[4]。
但是,現(xiàn)有的聚類方法只是簡單地將數(shù)據(jù)中的信息組合在一起,產(chǎn)生的噪聲會(huì)大大降低聚類的性能。為了解決上述問題,本文提出一種基于馬爾科夫的判別譜聚類方法(Markov Discriminative Spectral Clustering,MDSC),具有低秩和稀疏分解的特點(diǎn)。在應(yīng)用本方法時(shí),首先需要構(gòu)造一個(gè)原始的概率轉(zhuǎn)移矩陣,然后用其恢復(fù)一個(gè)真實(shí)的低秩概率轉(zhuǎn)移矩陣作為標(biāo)準(zhǔn)馬爾科夫譜聚類方法的關(guān)鍵輸入。為了能夠?qū)O化SAR的數(shù)據(jù)信息進(jìn)行多層次利用,本文在目標(biāo)函數(shù)中引入了判別信息以提升聚類精度。
對(duì)于本方法中的目標(biāo)函數(shù)的優(yōu)化問題,在概率轉(zhuǎn)移矩陣上有一個(gè)低秩約束,同時(shí)在該矩陣的每一行上有一個(gè)概率單純形約束,本文提出了一種基于增廣拉格朗日乘子法的優(yōu)化方法來解決這個(gè)有難度的優(yōu)化問題。本文后續(xù)在各種實(shí)際數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明,本方法具有較好的準(zhǔn)確率,表現(xiàn)出了良好的分類性能。
由隨機(jī)游走理論分析,當(dāng)隨機(jī)游走到某個(gè)分類時(shí),在該類中停留的概率較大,游走到其他類的概率較小。由此,Meila等人[5]提出,譜聚類可以用圖結(jié)構(gòu)上的馬爾科夫隨機(jī)游動(dòng)框架來描述。馬爾科夫鏈狀態(tài)簇是根據(jù)每個(gè)狀態(tài)到平穩(wěn)態(tài)的距離進(jìn)行聚類的,可以在拓?fù)鋱D上的隨機(jī)游走框架中連接,狀態(tài)轉(zhuǎn)移概率圖可以看作是一個(gè)有向圖。由此將譜聚類的圖譜理論應(yīng)用于馬爾科夫鏈中,以達(dá)到聚類的目的。求解馬爾科夫隨機(jī)游動(dòng)的轉(zhuǎn)移概率矩陣的特征值問題可以用來確定圖上的歸一化分割。本文所用的標(biāo)準(zhǔn)馬爾科夫譜聚類算法流程如下:
步驟1 計(jì)算所有數(shù)據(jù)點(diǎn)的相似度,構(gòu)建相似度矩陣S;
步驟2 計(jì)算概率轉(zhuǎn)移矩陣P=D-1S以及它的平穩(wěn)分布π=Pπ;
步驟3 構(gòu)造拉普拉斯矩陣L=∏-1/2(∏P+PT∏),其中∏表示對(duì)角元素為π(i)的對(duì)角矩陣;
步驟4 對(duì)L進(jìn)行特征分解,得到前k個(gè)最小的特征向量;
步驟5 將這前k個(gè)特征向量作為矩陣的列向量構(gòu)建特征矩陣;
步驟6 將特征矩陣的每一行作為數(shù)據(jù)點(diǎn),利用k-均值算法對(duì)其進(jìn)行聚類。
在馬爾科夫判別譜聚類方法中,最為關(guān)鍵的一步是如何構(gòu)造一個(gè)精確的概率轉(zhuǎn)移矩陣。本文通過低秩和稀疏分解的方法,恢復(fù)真實(shí)的概率轉(zhuǎn)移矩陣,并將其用作標(biāo)準(zhǔn)馬爾科夫譜聚類方法的輸入,以獲得最終的聚類解決方案。
該方法的基本假設(shè)有兩個(gè):
(1) 無向加權(quán)圖G的特征足以發(fā)現(xiàn)大部分聚類信息;
(2) 提取的特征可能會(huì)被噪聲破壞,即這些噪聲可能會(huì)導(dǎo)致一小部分?jǐn)?shù)據(jù)點(diǎn)被分配到錯(cuò)誤的類。
圖1 真實(shí)的概率轉(zhuǎn)移矩陣構(gòu)造概圖Fig. 1 Real probability transfer matrix construction profile
在現(xiàn)實(shí)的譜聚類問題中,可以假設(shè)同一簇內(nèi)任意兩點(diǎn)之間的轉(zhuǎn)移概率較高,而不同簇內(nèi)兩點(diǎn)之間的轉(zhuǎn)移概率較低且近似為0,從而導(dǎo)致概率轉(zhuǎn)移矩陣的秩往往較低。綜上所述,根據(jù)這些觀察結(jié)果可以假設(shè),反映潛在真實(shí)聚類信息的概率轉(zhuǎn)移矩陣往往是低秩的。
誤差矩陣E表示了P和之間的差異。根據(jù)假設(shè),提取的特征足以識(shí)別大多數(shù)集群結(jié)構(gòu),所以P中的元素與中相應(yīng)的元素只有一小部分顯著不同,可以說誤差矩陣E趨于稀疏。
綜上所述,在低秩稀疏假設(shè)下,可以將真實(shí)的概率轉(zhuǎn)移矩陣構(gòu)造問題表示為,
由于原始概率轉(zhuǎn)移矩陣P的構(gòu)建中只考慮了數(shù)據(jù)點(diǎn)之間的相似度,為了對(duì)數(shù)據(jù)信息進(jìn)行多層次的充分利用,在目標(biāo)函數(shù)中引入表示判別信息的判別損失函數(shù)Ec
其中,Ec表示極化 SAR 圖像分類的判別損失函數(shù),1是全一向量,,表示非負(fù)平衡參數(shù),跡范數(shù)是的秩在譜范數(shù)的單位球上的凸包絡(luò),在實(shí)際問題中,最小化跡范數(shù)能夠得到理想的低秩結(jié)構(gòu)[6]。表示的每一行都是一個(gè)概率分布,這強(qiáng)制保證了一定是一個(gè)概率轉(zhuǎn)移矩陣。
判別聚類是一個(gè)將不同的判別損失函數(shù)或其他特定約束合并到一個(gè)損失函數(shù)中的通用框架。在進(jìn)行聚類的過程中,可以通過分析不同類別的樣本信息,得到各自的特點(diǎn)與規(guī)律,進(jìn)而構(gòu)建出更加準(zhǔn)確的判別準(zhǔn)則對(duì)數(shù)據(jù)進(jìn)行分類。本節(jié)將一種新的基于判別聚類的模型引入馬爾科夫譜聚類算法中,提高算法的信息利用率,改善分類精度。
本節(jié)根據(jù)SR模型[7]重新設(shè)計(jì)了判別損失函數(shù),它結(jié)合了判別聚類項(xiàng)和正則項(xiàng)。前一項(xiàng)負(fù)責(zé)利用判別信息構(gòu)建softmax損失函數(shù),后一項(xiàng)負(fù)責(zé)降低由噪聲和異常值引起的過擬合。
綜上所述,在判別聚類的基礎(chǔ)上,將判別損失函數(shù)定義為
其中,W表示分類器矩陣,L(P,W|X)是softmax損失函數(shù),R(W)表示正則項(xiàng)。引入softmax損失函數(shù)是為了解決由于不同類別的像素?cái)?shù)不同而導(dǎo)致的樣本不平衡問題,該函數(shù)度量了分類器W與原始的概率轉(zhuǎn)移矩陣之間的一致性。用交叉熵來定義softmax損失函數(shù)L(P,W|X)
其中,e是自然常數(shù),k表示類的個(gè)數(shù)。
引用正則項(xiàng)R(W)來降低由噪聲和異常值引起的過擬合。R(W)定義如下
判別損失函數(shù)Ec(P,W|X)雖然遵循SR模型的式,但本質(zhì)上是不同的。在softmax分類方法中,訓(xùn)練數(shù)據(jù)集中的ground-truth類標(biāo)簽為常量。而在判別方法中,類標(biāo)是在無監(jiān)督算法下需要通過聚類得到的變量。
在本節(jié)中將利用增廣拉格朗日乘子法[8]來解決上一節(jié)中低秩和概率單純形約束下的目標(biāo)函數(shù)優(yōu)化問題。與樸素拉格朗日方法相比,該方法提高了算法的魯棒性,并放寬了函數(shù)的強(qiáng)凸約束,使變換后的問題更易于求解。
下面根據(jù) Xia 等人[9]提出的魯棒多視角譜聚類(Robust Multi-view Spectral Clustering, RMSC)方法,對(duì),E,Ec進(jìn)行更新求解。
首先假設(shè)Ec是已知的,式(2)對(duì)應(yīng)的增廣拉格朗日函數(shù)為
其中,H是拉格朗日算子,μ>0是自適應(yīng)懲罰參數(shù)。
(1) 求解E固定時(shí),優(yōu)化問題可以簡化為
利用奇異值閾值法[10]可以得到E的近似解
(3) 求解Ec:根據(jù)式(10),由于可以通過迭代原始的概率轉(zhuǎn)移矩陣P得到,因此可以通過固定的P來最小化分類器W,并使用迭代優(yōu)化算法來解決這個(gè)問題。
對(duì)Ec進(jìn)行求導(dǎo),梯度可計(jì)算為
根據(jù)這個(gè)求導(dǎo)式,使用L-BFGS優(yōu)化算法[10]來最小化式。
綜上所述,真實(shí)的概率轉(zhuǎn)移矩陣構(gòu)建算法框架如下:
步驟2 根據(jù)式(8)更新E;
步驟5 使用L-BFGS優(yōu)化算法更新Ec;
得到真實(shí)的概率轉(zhuǎn)移矩陣后,即可按照表標(biāo)準(zhǔn)馬爾科夫譜聚類的算法流程,得到極化SAR圖像的最終分類結(jié)果,如圖2所示。
圖2 本文算法框架圖Fig. 2 Algorithm frame diagram
由于本文算法是在馬爾科夫譜聚類算法基礎(chǔ)上的改進(jìn)模型,對(duì)目標(biāo)函數(shù)的不足進(jìn)行優(yōu)化,并引入了判別信息。因此在實(shí)驗(yàn)中選取3個(gè)對(duì)比算法如下:
(1) 聯(lián)合正則譜聚類(Co-Regularized spectral clustering, Co-Reg)[11]:譜聚類的共正則化方法,Kumar于2011年提出;
(2) 混合馬爾科夫鏈(Mixture of Markov Chains, MMC)[12]:Zhou和Burges于 2007年提出的混合馬爾科夫鏈方法,這是與本文所提基于馬爾科夫鏈的判別譜聚類算法最相關(guān)的方法;
(3) SR-MO算法[13]:Haixia Bi提出的無監(jiān)督判別聚類方法,利用監(jiān)督Softmax 邏輯回歸 (Softmax logistic Regression, SR)模型和大量特征進(jìn)行無監(jiān)督分類并在分類過程中采用了馬爾可夫隨機(jī)場優(yōu)化算法(Markov random field Optimization, MO),且考慮了空間關(guān)系。
本節(jié)在荷蘭Flevoland地區(qū)小農(nóng)田和大農(nóng)田、德國Oberpfaffenhofen地區(qū)和西安地區(qū)這4幅真實(shí)的極化SAR數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),以上4種數(shù)據(jù)分別來自不同的成像系統(tǒng),包含不同的波段與數(shù)據(jù)類型,通過以上數(shù)據(jù)證明本文算法的有效性。仿真實(shí)驗(yàn)均是在主頻2.50 GHz的Intel(R) Core(TM) i5-7300HQ CPU, 8 G的內(nèi)存環(huán)境和Windows10操作系統(tǒng)中編程實(shí)現(xiàn)的。實(shí)驗(yàn)結(jié)果均為MATLAB R2017a的軟件環(huán)境中進(jìn)行10次實(shí)驗(yàn)的平均值。
本文實(shí)驗(yàn)主要用總體分類精度OA、平均分類精度AA以及Kappa系數(shù)作為分類的評(píng)價(jià)指標(biāo)。
本實(shí)驗(yàn)數(shù)據(jù)為NASA在1989年使用AIRSAR系統(tǒng)獲得的荷蘭Flevoland地區(qū)L波段的農(nóng)田小圖數(shù)據(jù),該組圖像的大小為300×270。圖像主要包含裸土、馬鈴薯、甜菜、大麥、豌豆、小麥6種農(nóng)作物。
Co-Reg, MMC以及SR-MO 3種不同對(duì)比算法和本文算法對(duì)Flevoland地區(qū)小農(nóng)田圖的總體分類精度OA、平均分類精度AA以及Kappa系數(shù)如表1所示;分類結(jié)果圖如圖3所示。
在圖3中,圖3(a)是荷蘭Flevoland地區(qū)農(nóng)田小圖的Pauli分解偽彩圖,圖3(b)是地物類標(biāo)圖,圖3(c)-圖3(e)分別是Co-Reg, MMC以及SR-MO算法的分類結(jié)果圖,圖3(f)是本文算法的分類結(jié)果圖。
從總體分類精度和平均分類精度來看,本文方法均為最高且總體分類精度達(dá)92.43%,分別比Co-Reg,MMC和SR-MO算法高出8.43%, 5.35%和1.13%。雖然MMC在馬鈴薯這一類的分類效果最好,對(duì)豌豆、小麥等大多數(shù)地物類別也更加準(zhǔn)確,但這也導(dǎo)致了將部分甜菜等地物錯(cuò)分為馬鈴薯,影響分類精度。這也說明了與單純馬爾科夫譜聚類算法相比,本文提出的引入判別信息的馬爾科夫譜聚類算法更有優(yōu)勢(shì)。并且在分類結(jié)果圖中,可以看出本文算法對(duì)不同的地物分類比較均衡,邊緣更清晰,孤立像素更少,顯示出算法的平滑效果,Kappa系數(shù)也是最高的,驗(yàn)證了本文方法的有效性。
本實(shí)驗(yàn)數(shù)據(jù)為德國國家宇航中心DLR使用ESAR系統(tǒng)拍攝的德國Oberpfaffenhofen地區(qū)L波段極化SAR數(shù)據(jù)的局部,400×450,分辨率為3×2.2 m。該區(qū)域主要分為農(nóng)田、居民區(qū)、林地、道路和其它地物5類。
Co-Reg, MMC和SR-MO 3種不同對(duì)比算法和本文算法對(duì)德國Oberpfaffenhofen地區(qū)的總體分類精度OA、平均分類精度AA以及Kappa系數(shù)如表2所示,分類的結(jié)果圖如圖4 所示。
在圖4中,圖4(a)是德國Oberpfaffenhofen地區(qū)的Pauli分解偽彩圖,圖4(b)是地物類標(biāo)圖,圖4(c)-圖4(e)分別是Co-Reg, MMC以及SR-MO算法的分類結(jié)果圖,圖4(f)是本文算法的分類結(jié)果圖。
從圖4中能夠看出,圖4(c)的雜點(diǎn)最多,區(qū)域一致性最差。圖4(d)整體分類效果較好,但和本文算法相比,對(duì)邊緣像素點(diǎn)的分類效果不太理想。圖4(e)和圖4(f)相比,圖4(e)將林地和開放型區(qū)域錯(cuò)分的像素點(diǎn)較多。圖4(d)錯(cuò)分的雜點(diǎn)較多,將大部分林地區(qū)域錯(cuò)分為開放型區(qū)域。對(duì)比算法的實(shí)驗(yàn)結(jié)果圖中,圖4(e)分類效果最好。
由實(shí)驗(yàn)結(jié)果表2可以得到本文算法的總體分類精度為79.74%,分別比Co-Reg, MMC和SR-MO方法高出6.11%, 5.03%和1.52%。Kappa系數(shù)和平均分類正確率也優(yōu)于對(duì)比方法。這說明了本文算法對(duì)德國Oberpfaffenhofen地區(qū)的分類效果較好,地物之間的分界較為清晰,能夠識(shí)別出農(nóng)田和道路,以及大部分的林地區(qū)域。同時(shí),可以看到本文算法在處理除過道路之外的區(qū)域時(shí),分類效果很好,且更加穩(wěn)定,尤其在圖中間的農(nóng)場區(qū)域,分類更為連貫平整,視覺效果好,雜點(diǎn)較少。Co-Reg方法對(duì)于道路的誤分現(xiàn)象較為嚴(yán)重,大部分道路沒有被識(shí)別。SR-MO方法能夠有效識(shí)別大部分的道路、郊區(qū)、林地,以及農(nóng)田,卻將大部分的農(nóng)田誤分為郊區(qū),分類效果也不夠理想,這是由于僅僅基于判別信息進(jìn)行分類,沒有反映極化數(shù)據(jù)的統(tǒng)計(jì)特征。不過這4類算法對(duì)中間道路的分類效果都不是很好,還有很大的改進(jìn)完善空間,但相對(duì)來說本文算法的道路邊界更為清晰平滑,視覺效果更好。
表1 4種算法對(duì)Flevoland小農(nóng)田圖的分類結(jié)果Tab. 1 Classification results of four algorithms for Flevoland small farmland map
圖3 荷蘭Flevoland地區(qū)農(nóng)田小圖的偽彩圖、類標(biāo)圖以及不同算法的分類結(jié)果圖Fig. 3 Pseudo-color map, class diagram and classification results of different algorithms for farmland maps in the Flevoland region of the Netherlands
表2 4種算法對(duì)德國Oberpfaffenhofen地區(qū)的分類結(jié)果Tab. 2 Classification results of four algorithms for the Oberpfaffenhofen region of Germany
本實(shí)驗(yàn)數(shù)據(jù)為由加拿大太空署RADARSAT-2系統(tǒng)獲取的西安地區(qū)極化SAR圖像,該圖像大小為512×512,主要有河流、城區(qū)、植被3種地物分類。
Co-Reg, MMC以及SR-MO 3種不同對(duì)比算法和本文算法對(duì)西安地區(qū)的總體分類精度OA、平均分類精度AA以及Kappa系數(shù)如表3所示;分類的結(jié)果圖如圖5所示。
在圖5中,圖5(a)是西安地區(qū)的Pauli分解偽彩圖,圖5(b)是地物類標(biāo)圖,圖5(c)-圖5(e)分別是Co-Reg, MMC以及SR-MO算法的分類結(jié)果圖,圖5(f)是本文算法的分類結(jié)果圖。
由表3可以看出本文算法的總體分類精度為85.03%,分別比Co-Reg, MMC和SR-MO高出11.03%, 8.33%和2.76%,尤其在城區(qū)和植被的分類中,本文算法均表現(xiàn)出了良好的性能。從圖5的視覺效果上分析,Co-Reg和MMC算法的分類效果較差,通常情況下某一區(qū)域內(nèi)的樣本點(diǎn)應(yīng)屬于同一類地物,但這兩幅結(jié)果圖的整個(gè)圖像充滿斑點(diǎn)點(diǎn),區(qū)域內(nèi)雜點(diǎn)過多。相比之下,SR-MO和本文算法的兩幅圖視覺效果很好,雜點(diǎn)較少,河流區(qū)域分類較好。相比與SR-MO算法,本文算法的城區(qū)部分分類較好,能較好地保持區(qū)域一致性。
圖4 德國Oberpfaffenhofen地區(qū)數(shù)據(jù)的偽彩圖、類標(biāo)圖以及不同算法的分類結(jié)果圖Fig. 4 Pseudo-color map, class diagram and data classification results of different algorithms in the Oberpfaffenhofen region of Germany
表3 4種算法對(duì)西安地區(qū)的分類結(jié)果Tab. 3 Classification results of four algorithms for Xi'an area
本節(jié)實(shí)驗(yàn)美國NASA/JPL AIRSAR系統(tǒng)于1989獲得的Flevoland地區(qū)四視L波段的大圖數(shù)據(jù),圖像大小為750×1024,分辨率為12.1×6.7 m。包含15類地物:蠶豆、油菜籽、裸地、土豆、甜菜、小麥2、豌豆、小麥3、苜蓿、大麥、小麥、草地、森林、水域和建筑物。設(shè)置Ns=15,K=9, 4種不同算法的總體分類精度OA、平均分類精度AA以及Kappa系數(shù)如表4所示,不同算法的結(jié)果圖如圖6所示。
從圖6中能夠看出,圖6(c)的雜點(diǎn)最多,區(qū)域一致性最差,油菜籽、甜菜和小麥等區(qū)域被大量誤分為水域,區(qū)域之間沒有明顯區(qū)分,分類效果較差。圖6(e)整體分類效果較好,但和本算法相比,對(duì)邊緣像素點(diǎn)的分類效果不太理想。和圖6(f)相比,圖6(d)與圖6(e)區(qū)域錯(cuò)分的像素點(diǎn)較多,小麥、草地和建筑物等區(qū)域均有較多雜點(diǎn)。對(duì)比算法的實(shí)驗(yàn)結(jié)果圖中,圖6(e)分類效果最好。
與對(duì)比算法相比,本文算法對(duì)Flevoland地區(qū)大農(nóng)田的農(nóng)作物分類的正確率都很高,穩(wěn)定性很好,沒有偏差,尤其在油菜籽、土豆、苜蓿、森林這幾類上,分類正確率明顯優(yōu)于其它3種算法。但是本章算法在處理草地和小麥區(qū)域時(shí),最終結(jié)果并沒有達(dá)到理想狀態(tài),還有進(jìn)一步提升的空間。但是整體來說,本文算法對(duì)比于其他對(duì)比算法的分類效果最好,區(qū)域一致性較好,邊界更清晰,錯(cuò)分點(diǎn)更少。
圖5 西安地區(qū)數(shù)據(jù)的偽彩圖、類標(biāo)圖以及不同算法的分類結(jié)果圖Fig. 5 Pseudo-color map, class diagram and data classification results of different algorithms in Xi'an area
表4 4種算法對(duì)荷蘭 Flevoland 地區(qū)大農(nóng)田圖的分類結(jié)果Tab. 4 Classification results of four algorithms for large farmland maps in the Flevoland region of the Netherlands
在本文方法中有兩個(gè)權(quán)衡參數(shù)λ,β和正則項(xiàng)參數(shù)ξ。通常的做法是在無監(jiān)督聚類中根據(jù)經(jīng)驗(yàn)設(shè)置參數(shù)。下面本節(jié)對(duì)荷蘭Flevoland小農(nóng)田、德國Oberpfaffenhofen和西安地區(qū)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),觀察不同值和對(duì)總體分類精度的影響,如圖7-圖10所示。可以觀察到:
綜上所述,本文算法在合適的區(qū)間內(nèi)對(duì)其參數(shù)相對(duì)不敏感,區(qū)間內(nèi)參數(shù)的變化對(duì)分類總精度影響較小,且參數(shù)的可調(diào)節(jié)的范圍較大。因此,本文所提方法有較好的參數(shù)穩(wěn)定性。這使得本文算法易于使用,無需進(jìn)行太多的權(quán)衡參數(shù)調(diào)優(yōu)。
本文提出一種基于馬爾科夫的低秩稀疏的判別譜聚類方法。首先構(gòu)造一個(gè)概率轉(zhuǎn)移矩陣用于恢復(fù)一個(gè)真實(shí)的低秩轉(zhuǎn)移概率矩陣作為標(biāo)準(zhǔn)馬爾科夫聚類方法的關(guān)鍵輸入。然后在目標(biāo)函數(shù)中引入判別信息,達(dá)到對(duì)數(shù)據(jù)信息的充分利用。本文采用基于增廣拉格朗日乘子法的優(yōu)化方法來求解低秩和概率單純形約束下的目標(biāo)函數(shù)。通過應(yīng)用4種典型的實(shí)驗(yàn)數(shù)據(jù),證明了本文算法在分類精度、參數(shù)敏感性等方面具有優(yōu)勢(shì),最終的分類效果也更好。
圖6 荷蘭 Flevoland 地區(qū)大農(nóng)田數(shù)據(jù)的偽彩圖、類標(biāo)圖以及不同算法的分類結(jié)果圖Fig. 6 Pseudo-color map, class diagram and classification results of different algorithms for large farmland data in the Flevoland region of the Netherlands
圖7 荷蘭小農(nóng)田中不同和下的分類結(jié)果圖Fig. 7 Classification results of different and below in small Dutch farmland
圖8 德國地區(qū)中不同和下的分類結(jié)果Fig. 8 Classification results for different and below in the German region
圖9 西安地區(qū)中不同和下的分類結(jié)果圖Fig. 9 Classification results of different and subordinates in Xi'an area
圖10 不同正則項(xiàng)參數(shù)的分類結(jié)果圖Fig. 10 Classification results of different regular item parameter