亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高光譜圖像分類(lèi)的ReliefF-RFE特征選擇算法構(gòu)建與應(yīng)用

        2022-10-09 08:15:02項(xiàng)頌陽(yáng)許章華張藝偉李一帆
        光譜學(xué)與光譜分析 2022年10期
        關(guān)鍵詞:分類(lèi)特征

        項(xiàng)頌陽(yáng),許章華, 張藝偉,張 琦,周 鑫,俞 輝,李 彬,李一帆

        1.福州大學(xué)地理與生態(tài)環(huán)境研究中心,福建 福州 350108 2.福州大學(xué)環(huán)境與安全工程學(xué)院,福建 福州 350108 3.福州大學(xué)數(shù)字中國(guó)研究院(福建),福建 福州 350108 4.福建省資源環(huán)境監(jiān)測(cè)與可持續(xù)經(jīng)營(yíng)利用重點(diǎn)實(shí)驗(yàn)室,福建 三明 365004 5.空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室, 福建 福州 350108 6.福州大學(xué)信息與通信工程博士后科研流動(dòng)站,福建 福州 350108

        引 言

        隨著計(jì)算機(jī)科學(xué)和光譜成像學(xué)的發(fā)展,高光譜圖像被廣泛應(yīng)用于精準(zhǔn)農(nóng)業(yè)、環(huán)境監(jiān)測(cè)和公共安全等諸多領(lǐng)域。高光譜圖像波段連續(xù)且數(shù)據(jù)量大,光譜和空間特征豐富,為地物解譯與圖像分類(lèi)提供了更多可用的信息。但是,直接使用高維度特征進(jìn)行地物分類(lèi)并不合適。高維數(shù)據(jù)中含有大量的冗余信息和噪聲,當(dāng)參與分類(lèi)的特征波段數(shù)不斷增加,分類(lèi)精度和特征數(shù)并不成正比,而是出現(xiàn)先上升再下降的“休斯(Hughes)現(xiàn)象”[1]。在保證地物分類(lèi)精度的情況下,如何從原始波段中析取相關(guān)性小、維數(shù)低、信息量大且冗余度小的高光譜數(shù)據(jù),解決維度災(zāi)難問(wèn)題是十分必要的[2]。特征提取和特征選擇是高光譜圖像的兩種主要降維方法。較之于特征提取,基于特征選擇的降維方法既能不改變既有的特征空間和特征值,保留原始地物信息,又能夠剔除大部分與實(shí)際地物不相關(guān)或冗余的特征,從而達(dá)到大量減少特征個(gè)數(shù),提高模型精度,減少運(yùn)算時(shí)間的目的[3]。

        為解決高光譜圖像分類(lèi)中存在的多維度、強(qiáng)相關(guān)和多冗余等問(wèn)題,學(xué)界圍繞特征選擇開(kāi)展了相關(guān)研究。特征選擇按照和學(xué)習(xí)器的不同結(jié)合方式,主要囊括了過(guò)濾式(Filter)、封裝式(Wrapper)、嵌入式(Embedded)和集成式(Ensemble)四種方法[4],其中,過(guò)濾式和封裝式已在高光譜圖像中得到較為有效的應(yīng)用。例如,Ren等[5]利用改進(jìn)的分區(qū)過(guò)濾式ReliefF算法,實(shí)現(xiàn)高光譜圖像的顯著降維;Ye等[6]采用跨域ReliefF(corss-domain ReliefF,CDRF)算法以特征權(quán)重的跨域更新規(guī)則來(lái)考慮源域和目標(biāo)域的跨場(chǎng)景特征選擇問(wèn)題,有效提高了跨場(chǎng)景高光譜數(shù)據(jù)集的分類(lèi)精度;張東彥等[7]利用ReliefF算法篩選對(duì)大豆識(shí)別最有效的特征,發(fā)現(xiàn)基于優(yōu)選特征提取精度明顯高于原始波段反射率,雖然略低于全部19個(gè)特征的分類(lèi)效果,但是數(shù)據(jù)量降低了63.16%;劉代超等[8]研究了封裝式特征遞歸消除算法(recursive feature elimination,RFE)與隨機(jī)森林分類(lèi)模型相結(jié)合方法對(duì)林地與非林地的識(shí)別潛力,發(fā)現(xiàn)特征選擇可以有效減少數(shù)據(jù)輸入維數(shù),并取得最高分類(lèi)精度。然而,單一的過(guò)濾式或封裝式算法并不能兼顧分類(lèi)精度和分類(lèi)效率。過(guò)濾式方法在進(jìn)行特征選擇時(shí),具有結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快、獨(dú)立于具體訓(xùn)練模型、易于設(shè)計(jì)和理解等優(yōu)點(diǎn),但因其并不考慮特征之間的相關(guān)性,故不能有效減小特征之間的冗余,其得到的特征子集也不是最優(yōu)的;而基于特征子集搜索的封裝式方法考慮了特征維之間的相互作用,有效去除特征之間的冗余,能選出最優(yōu)特征子集,但因搜索過(guò)程與分類(lèi)器緊密相關(guān),所以特征子集搜索時(shí)間復(fù)雜度較高[9]。

        將過(guò)濾式算法和封裝式算法結(jié)合能夠篩選出與地物類(lèi)別密切相關(guān)且相互之間冗余度最小的特征子集。Marwa等[10]提出了Filter與Wrapper的高維數(shù)據(jù)特征構(gòu)造的多目標(biāo)混合濾波器包裝進(jìn)化算法,結(jié)合兩者算法能夠優(yōu)勢(shì)互補(bǔ),在消除冗余特征方面效果顯著;Yuan等[11]將最大化特征空間與類(lèi)編碼空間之間的相關(guān)信息法與遞歸特征消除相結(jié)合,能夠有效地集成高維蛋白質(zhì)數(shù)據(jù);Lin等[12]提出了一種交互增益遞歸特征消除(IG-RFE)方法,該方法基于對(duì)稱(chēng)不確定性和歸一化交互增益相結(jié)合,迭代去除不重要的特征,能夠在生物數(shù)據(jù)分析中綜合特征個(gè)體的識(shí)別能力和特征之間的相互作用,可以更好地評(píng)估特征的重要性。

        針對(duì)高光譜圖像分類(lèi)中過(guò)濾式算法無(wú)法有效去除冗余特征和封裝式算法時(shí)間復(fù)雜度較高的問(wèn)題,提出一種結(jié)合過(guò)濾式和封裝式的ReliefF-RFE特征選擇算法,該算法可綜合過(guò)濾式算法訓(xùn)練速度快、結(jié)構(gòu)簡(jiǎn)單以及封裝式算法能有效去除特征之間冗余的優(yōu)點(diǎn)。嘗試運(yùn)用該算法對(duì)Indian pines,Salinas-A與KSC等3個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行特征選擇與分類(lèi),分析其分類(lèi)精度、特征維數(shù)及運(yùn)算時(shí)間,并將其與單一的ReliefF算法和RFE算法進(jìn)行比較,驗(yàn)證ReliefF-RFE算法在高光譜圖像分類(lèi)特征選擇中的綜合性能。

        1 實(shí)驗(yàn)部分

        1.1 ReliefF算法原理

        (1)

        式(1)中:Wi(fl)為第i個(gè)樣本中第l個(gè)特征f的權(quán)值;Hj(j=1, 2,…,k)為與Ri同類(lèi)的k個(gè)最近鄰樣本中的第j個(gè)樣本;P(C)為在訓(xùn)練樣本中屬于類(lèi)別C的樣本所占比值;P(label(Ri))為與同類(lèi)的樣本占總樣本的比值,其中l(wèi)abel(Ri)為Ri的標(biāo)簽;Mj(C)(j=1, 2, …,k)為與Ri不同類(lèi)的k個(gè)最近鄰樣本中的第j個(gè)樣本。距離計(jì)算公式為

        (2)

        式(2)中:diff(f,R1,R2)為樣本R1與R2在第f個(gè)特征上的歸一化距離,R1f和R2f分別為樣本R1和R2的第f個(gè)特征,max(f)和min(f)分別為所有樣本中對(duì)應(yīng)特征f的最大值和最小值。

        1.2 遞歸特征消除算法原理

        遞歸特征消除法是一種貪婪的優(yōu)化算法,是封裝式算法的代表。該算法的主要思想是反復(fù)創(chuàng)建模型,逐步剔除最不重要特征。該方法是一個(gè)循環(huán)過(guò)程,每個(gè)過(guò)程都包含以下3個(gè)步驟:(1)用當(dāng)前數(shù)據(jù)集訓(xùn)練分類(lèi)器,獲得與分類(lèi)器特征相關(guān)的信息即每個(gè)特征的權(quán)重;(2)根據(jù)事先制定的規(guī)則,計(jì)算所有特征的排序準(zhǔn)則分?jǐn)?shù);(3)在當(dāng)前數(shù)據(jù)集中移除對(duì)應(yīng)于最小排序準(zhǔn)則分?jǐn)?shù)的特征。該循環(huán)過(guò)程一直執(zhí)行到特征集合中剩余最后一個(gè)變量時(shí)結(jié)束,執(zhí)行的結(jié)果為獲得一列按照特征重要性排序的特征序號(hào)列表,這個(gè)迭代循環(huán)過(guò)程實(shí)際上是一個(gè)序列后向選擇的過(guò)程,它在整個(gè)循環(huán)過(guò)程中先是去除了與判別不相關(guān)的特征,保留了對(duì)判別相對(duì)重要的優(yōu)化特征子集,因而可以達(dá)到優(yōu)化特征子集選擇,提高判別精度的目的。然而,封裝式由于每次與特征子集的評(píng)價(jià)都要進(jìn)行分類(lèi)器的訓(xùn)練和測(cè)試,計(jì)算復(fù)雜度很高。因此,封裝式特征選擇的計(jì)算開(kāi)銷(xiāo)通常比過(guò)濾式特征選擇要大得多。

        1.3 ReliefF-RFE算法構(gòu)建與原理

        過(guò)濾式算法運(yùn)算高效,但是其并不考慮特征之間的相關(guān)性。然而,與類(lèi)相關(guān)性強(qiáng)的單個(gè)特征組合在一起并不一定有利于分類(lèi)[15],是因?yàn)橄嚓P(guān)特征中包含一些與其他相關(guān)特征具有相同分類(lèi)信息的特征,即“冗余特征”。這類(lèi)特征不僅會(huì)增加分類(lèi)器的計(jì)算復(fù)雜度,而且可能導(dǎo)致分類(lèi)器性能急劇下降。因此,需要尋找一種比較高效的特征搜索算法,從而獲得最佳的分類(lèi)特征子集。封裝式算法的特征選擇與具體分類(lèi)器緊密相關(guān),因直接使用分類(lèi)器的識(shí)別率來(lái)評(píng)價(jià)特征性能,并將選擇所得特征直接用于構(gòu)造最終的分類(lèi)模型,所以封裝模型相對(duì)于過(guò)濾模型具有更好的分類(lèi)識(shí)別性能。但是,由于每一次選擇都涉及到分類(lèi)器的建模計(jì)算,所以封裝式算法的運(yùn)算時(shí)間要比過(guò)濾式算法慢很多。綜合考慮過(guò)濾式算法和封裝式算法的優(yōu)缺點(diǎn),在過(guò)濾式ReliefF算法基礎(chǔ)上,選取考慮到特征之間相關(guān)性的封裝式RFE算法,構(gòu)建ReliefF-RFE算法。首先利用ReliefF算法對(duì)不同的特征賦予不同的權(quán)重,通過(guò)權(quán)重閾值有效剔除無(wú)關(guān)特征并保留有助于分類(lèi)的特征,減少后續(xù)特征子集搜索范圍,其次,將ReliefF算法篩選后留下的特征,利用RFE算法進(jìn)一步篩選出與特征間相關(guān)性最大且相互之間冗余性最小的最佳分類(lèi)特征子集。

        設(shè)輸入訓(xùn)練集x,最近鄰樣本個(gè)數(shù)k,步長(zhǎng)step,輸出xk為訓(xùn)練集x與目標(biāo)類(lèi)別有最大相關(guān)性且相互之間具有最小冗余性的特征子集,那么,ReliefF-RFE算法具體可分為以下8個(gè)主要步驟:

        (1)從訓(xùn)練集x中進(jìn)行隨機(jī)抽樣選擇一個(gè)樣本Ri;

        (3)根據(jù)與Ri不同類(lèi)樣本所占比值,最終計(jì)算出特征的權(quán)重Wi(fl);

        (4)篩選出權(quán)重系數(shù)總和達(dá)95%的特征子集,通過(guò)權(quán)重閾值剔除無(wú)關(guān)特征,得到ReliefF算法篩選后的特征子集xj;

        (5)將特征子集xj作為RFE算法的輸入,同時(shí)設(shè)置最優(yōu)特征子集xk為空,max=0;

        (6)在特征子集xj構(gòu)建隨機(jī)森林分類(lèi)器,并通過(guò)隨機(jī)森林的feature_importances_屬性獲得每個(gè)特征的重要性;

        (7)將特征子集xj中每個(gè)特征的重要性進(jìn)行排序, 根據(jù)步長(zhǎng)step從當(dāng)前的這組特征集合中修剪最不重要的特征,計(jì)算修剪后集合的Accuracy值。若Accuracy≥max,則max=Accuracy,且取當(dāng)前集合為最優(yōu)特征子集,否則max和最優(yōu)特征子集不變;

        (8)在修剪的集合上遞歸地重復(fù)該過(guò)程,逐次進(jìn)行迭代,直到找到Accuracy值最高的一組特征子集xk。

        1.4 數(shù)據(jù)與方法

        為驗(yàn)證算法的適用性,采用高光譜圖像分類(lèi)領(lǐng)域所公認(rèn)的Indian pines,Salinas-A及KSC等3個(gè)標(biāo)準(zhǔn)數(shù)據(jù)集,數(shù)據(jù)集中包含了許多地物類(lèi)別(圖1和圖2)。Indian pines數(shù)據(jù)集與Salinas-A數(shù)據(jù)集的地物類(lèi)別分別為16類(lèi)和6類(lèi),地物的分布比較規(guī)則,每類(lèi)地物的分布整體性好;而KSC數(shù)據(jù)集的地物類(lèi)別共13類(lèi),分布較為分散。各數(shù)據(jù)集描述如表1所示。

        圖1 各標(biāo)準(zhǔn)數(shù)據(jù)集的高光譜圖像

        圖2 各標(biāo)準(zhǔn)數(shù)據(jù)集的真實(shí)地物參考圖

        表1 高光譜數(shù)據(jù)集描述

        (1)Indian pines數(shù)據(jù)集是使用AVIRIS成像光譜儀獲取的美國(guó)印第安納州西北部地區(qū)的試驗(yàn)區(qū)域圖像,地表覆蓋類(lèi)型混合了林地、農(nóng)田、道路、房屋建筑等。標(biāo)記樣本分布不均衡,部分類(lèi)別樣本較少。各種農(nóng)作物基本都處于生長(zhǎng)初期,對(duì)地表的林冠覆蓋程度只有5%,裸地和作物殘?jiān)鼘?duì)植被像元分類(lèi)影響明顯。以上原因?qū)е聰?shù)據(jù)集類(lèi)間相似度非常高,分類(lèi)難度大大增加。Indian pines圖像大小145×145像素,波長(zhǎng)范圍0.4~2.5 μm,220個(gè)波段,空間分辨率20 m,去除壞波段和水體吸收后剩余200個(gè)波段。

        (2)Salinas-A數(shù)據(jù)集也是用AVIRIS成像光譜儀拍攝的,同Indian pines圖像相似,是對(duì)美國(guó)Salinas山谷進(jìn)行成像。它區(qū)別于Indian pines的是,Salinas-A數(shù)據(jù)集能夠達(dá)到3.7 m的空間分辨率。圖像原本包含的波段有224個(gè),對(duì)沒(méi)有水反射的108~112,154~167以及第224波段都需要剔除,剩余波段圖像有204個(gè)。

        (3)KSC數(shù)據(jù)集由佛羅里達(dá)肯尼迪航天中心的AVIRIS傳感器收集,包含224個(gè)波段。該數(shù)據(jù)集由512×614個(gè)像素組成,其中每個(gè)像素具有8 m的空間分辨率。同時(shí),光譜覆蓋范圍為0.4~2.5 μm,去除48個(gè)噪聲比較高的波段后,共使用了176個(gè)波段。

        為驗(yàn)證本算法的可靠性,將ReliefF-RFE算法及單一的ReliefF、RFE算法分別應(yīng)用于前述3個(gè)高光譜數(shù)據(jù)集,分析并比較3種算法的分類(lèi)效果,分類(lèi)器統(tǒng)一采用隨機(jī)森林分類(lèi)器。在進(jìn)行實(shí)驗(yàn)比較之前,先設(shè)置不同算法的參數(shù)。ReliefF算法通過(guò)隨機(jī)抽樣選擇樣本計(jì)算某個(gè)特征的權(quán)值,為了有效處理權(quán)重偏差,避免最終運(yùn)算結(jié)果的權(quán)重不同,對(duì)某一特征的不同權(quán)值,通過(guò)10次運(yùn)算求取平均值作為該特征的權(quán)值,設(shè)定最鄰近樣本數(shù)k為10,對(duì)大多數(shù)分類(lèi)任務(wù)最為可靠有效;隨機(jī)森林的最佳參數(shù)通過(guò)網(wǎng)格搜索交叉驗(yàn)證工具(GridSearchCV)進(jìn)行參數(shù)尋優(yōu)。隨機(jī)選取70%的樣本作為訓(xùn)練樣本,30%樣本作為驗(yàn)證樣本,統(tǒng)計(jì)十折交叉驗(yàn)證下最佳特征子集的總體精度(overall accuracy,OA)、F-measure、Kappa系數(shù)和篩選的最小特征維數(shù)以及特征選擇算法的運(yùn)算時(shí)間,各指標(biāo)的值越大,特征維數(shù)和運(yùn)算時(shí)間越少,說(shuō)明對(duì)應(yīng)特征選擇算法的性能越好,具體公式如式(3)—式(7)

        (3)

        (4)

        (5)

        (6)

        (7)

        式中:Precision表示精確度;Recall表示召回率;TP(true positive)表示被模型預(yù)測(cè)為正的正樣本;TN(true negative)表示被模型預(yù)測(cè)為負(fù)的負(fù)樣本;FP(false positive)表示被模型預(yù)測(cè)為正的負(fù)樣本;FN(false negative)表示被模型預(yù)測(cè)為負(fù)的正樣本;R為類(lèi)別數(shù);xii為第i行第i列上的數(shù)目;xi+為第i行的總數(shù)目;x+i為第i列的總數(shù)目;N為數(shù)據(jù)集總數(shù)目。

        2 結(jié)果與討論

        2.1 Indian pines數(shù)據(jù)集算法應(yīng)用分析

        分別將3種特征選擇算法與隨機(jī)森林分類(lèi)器相結(jié)合,對(duì)Indian pines數(shù)據(jù)集進(jìn)行分類(lèi),由此獲得該數(shù)據(jù)集的最佳特征子集。利用驗(yàn)證樣本計(jì)算混淆矩陣評(píng)價(jià)分類(lèi)精度,統(tǒng)計(jì)3種特征選擇算法的OA,F(xiàn)-measure和Kappa系數(shù)以及特征維數(shù)和運(yùn)算時(shí)間(表2)。結(jié)果表明,ReliefF算法的分類(lèi)精度最低且篩選出的特征維數(shù)最高,其原因可能與ReliefF算法篩選出來(lái)的特征仍存在冗余,增加了模型復(fù)雜度和過(guò)擬合的風(fēng)險(xiǎn),不利于提高模型可解釋性,使用的特征維數(shù)越多,并不意味分類(lèi)預(yù)測(cè)效果越好;RFE算法取得了較高的分類(lèi)精度,同時(shí)大幅降低了建模所需的特征數(shù)量,增強(qiáng)了模型的泛化能力,但是單獨(dú)采用RFE算法進(jìn)行特征選擇所需要的運(yùn)算時(shí)間較長(zhǎng),當(dāng)數(shù)據(jù)集規(guī)模足夠大時(shí),搜索最佳特征子集的運(yùn)算時(shí)間將不能夠被接受;較之于ReliefF算法,采用過(guò)濾式和封裝式相結(jié)合的ReliefF-RFE算法,其OA提高了0.75%,F(xiàn)-measure提高了0.85%,Kappa系數(shù)提高了0.008 2;在特征維數(shù)方面,ReliefF-RFE算法能夠去除ReliefF算法的冗余特征,其特征維數(shù)是ReliefF算法的29%;在運(yùn)算時(shí)間方面,ReliefF-RFE算法是RFE算法的85%,說(shuō)明ReliefF-RFE算法降低了封裝式算法的運(yùn)算時(shí)間,提升了模型的整體運(yùn)算效率。

        表2 Indian pines數(shù)據(jù)集最佳特征子集下的各評(píng)價(jià)指標(biāo)

        從3種特征選擇算法的分類(lèi)結(jié)果圖可知(圖3),部分地物存在一定的錯(cuò)分誤分現(xiàn)象,但總體上,各算法的分類(lèi)效果與真實(shí)地物參考圖基本接近。

        圖3 Indian pines數(shù)據(jù)集高光譜圖像3種特征選擇算法的分類(lèi)結(jié)果

        2.2 Salinas-A數(shù)據(jù)集算法應(yīng)用分析

        利用隨機(jī)森林分類(lèi)器結(jié)合3種特征選擇算法得到Salinas-A數(shù)據(jù)集的最佳特征子集,可以發(fā)現(xiàn),3種算法都取得了較好的預(yù)測(cè)效果(表3)。ReliefF算法的特征維數(shù)最高,RFE算法以較長(zhǎng)的運(yùn)算時(shí)間為代價(jià),用最少的特征數(shù)實(shí)現(xiàn)了和ReliefF算法相同的預(yù)測(cè)效果,這也說(shuō)明RFE算法能夠進(jìn)一步剔除冗余特征,減少數(shù)據(jù)集處理的復(fù)雜度。在分類(lèi)精度方面,ReliefF-RFE算法首先通過(guò)ReliefF算法初步篩選掉一批無(wú)相關(guān)特征,再利用RFE算法進(jìn)一步去除冗余特征,用較少規(guī)模的特征子集取得比單一ReliefF算法和RFE算法更好的分類(lèi)精度,其OA提高了0.07%,F(xiàn)-measure提高了0.06%,Kappa系數(shù)提高了0.000 8;在特征維數(shù)方面,ReliefF-RFE算法是ReliefF算法的39%,有效降低了特征維數(shù);在運(yùn)算時(shí)間方面,ReliefF-RFE算法的運(yùn)算時(shí)間是RFE算法的76%。

        表3 Salinas-A數(shù)據(jù)集最佳特征子集下的各評(píng)價(jià)指標(biāo)

        從3種特征選擇算法的分類(lèi)細(xì)節(jié)上來(lái)看(圖4),各地物的邊緣區(qū)域會(huì)存在錯(cuò)分情況,ReliefF-RFE算法在總體上的錯(cuò)分情況較少。

        圖4 Salinas-A數(shù)據(jù)集高光譜圖像3種特征選擇算法的分類(lèi)結(jié)果

        2.3 KSC數(shù)據(jù)集算法應(yīng)用分析

        參照Indian pines與Salinas-A數(shù)據(jù)集的步驟,利用KSC數(shù)據(jù)集,對(duì)3種算法進(jìn)行分析。結(jié)果發(fā)現(xiàn),ReliefF算法篩選的特征維數(shù)依然較大,冗余特征的存在在一定程度上影響了模型性能;RFE算法以特征遞歸消除的方式搜索最優(yōu)特征子集,具有更好的預(yù)測(cè)效果;ReliefF-RFE算法的降維效果最好,分別是ReliefF算法和RFE算法特征維數(shù)的44%和89%,并且在運(yùn)算時(shí)間上具有顯著的優(yōu)勢(shì),是RFE算法運(yùn)算時(shí)間的63%,在損失小部分分類(lèi)精度情況下,大幅降低了特征選擇算法的時(shí)間復(fù)雜度。

        在KSC數(shù)據(jù)集中,相較于前兩者算法,ReliefF-RFE算法的分類(lèi)精度最低(圖5),其原因可能在于:KSC數(shù)據(jù)集地物類(lèi)別精細(xì)、數(shù)量高達(dá)13類(lèi),如濕地地物類(lèi)別多達(dá)6種,然而其光譜曲線的可分性有限,同種地物類(lèi)別會(huì)有不同的群體狀況表現(xiàn),增加了分類(lèi)難度。

        表4 KSC數(shù)據(jù)集最佳特征子集下的各評(píng)價(jià)指標(biāo)

        圖5 KSC數(shù)據(jù)集高光譜圖像3種特征選擇算法的分類(lèi)結(jié)果

        2.4 3種算法特征選擇的綜合比較分析

        對(duì)比ReliefF-RFE算法與ReliefF,RFE算法對(duì)3個(gè)高光譜數(shù)據(jù)集分類(lèi)應(yīng)用結(jié)果可以發(fā)現(xiàn):其一,在分類(lèi)精度方面[圖6(a)],從總體分類(lèi)精度可以發(fā)現(xiàn),RFE算法最佳,其平均OA為93.04%、F-measure為92.91%,Kappa系數(shù)為92.06%;其次為ReliefF-RFE算法,其平均OA為92.94%、F-measure為92.81%,Kappa系數(shù)為91.94%;ReliefF算法最低,其平均OA為92.69%、F-measure為92.54%,Kappa系數(shù)為91.65%;從各數(shù)據(jù)集中可以發(fā)現(xiàn),ReliefF-RFE算法在Indian pines數(shù)據(jù)集上比ReliefF算法擁有更好的預(yù)測(cè)性能,其OA提高了0.75%,F(xiàn)-measure提高了0.85%,Kappa系數(shù)提高了0.008 2,在Salinas-A數(shù)據(jù)集上,其OA分別較其他兩種算法提高0.07%,F(xiàn)-measure提高0.06%,Kappa系數(shù)提高0.000 8。其二,在特征維數(shù)和運(yùn)算時(shí)間角度方面[圖6(b)],ReliefF算法在3個(gè)數(shù)據(jù)集上的特征維數(shù)均最高;ReliefF-RFE算法在3個(gè)高光譜數(shù)據(jù)集中篩選的特征維數(shù)遠(yuǎn)低于ReliefF算法,平均特征維數(shù)是ReliefF算法的37%,由此可以證明,高維數(shù)據(jù)集中含有與地物類(lèi)別無(wú)關(guān)的特征及互相關(guān)性較高的冗余特征,結(jié)合封裝式算法的特征選擇能夠去除過(guò)濾式算法中的冗余特征;RFE算法在3個(gè)數(shù)據(jù)集上擁有最高的時(shí)間復(fù)雜度,ReliefF-RFE算法在3個(gè)高光譜數(shù)據(jù)集中的運(yùn)算時(shí)間均遠(yuǎn)低于單一的RFE算法,平均運(yùn)算時(shí)間是RFE算法的75%,這是由于RFE算法每次都要結(jié)合分類(lèi)器進(jìn)行迭代,造成耗時(shí)過(guò)多,ReliefF-RFE算法則在ReliefF算法篩選結(jié)果的基礎(chǔ)上降低了數(shù)據(jù)集的特征數(shù),減小了特征子集的搜索范圍,從而大幅降低了時(shí)間復(fù)雜度??傮w而言,ReliefF-RFE算法能夠克服過(guò)濾式ReliefF算法無(wú)法有效減小特征之間冗余以及封裝式RFE算法時(shí)間復(fù)雜度較高的缺陷,在分類(lèi)精度、特征維數(shù)、運(yùn)算時(shí)間共3個(gè)方面擁有均衡的綜合性能。

        圖6 3種特征選擇算法的綜合對(duì)比

        3 結(jié) 論

        針對(duì)高光譜圖像波段連續(xù)且波段間相關(guān)性強(qiáng)的特點(diǎn),在波段信息重復(fù)率較大的情況下,如果直接將原始波段信息用于地物分類(lèi),可能存在較多與地物類(lèi)別不相關(guān)的冗余特征,由此引起“休斯現(xiàn)象”,影響模型的分類(lèi)性能。在保證分類(lèi)精度的情況下,本文提出一種將過(guò)濾式ReliefF算法和封裝式RFE算法結(jié)合的ReliefF-RFE算法,并采用Indian pines,Salinas-A與KSC等3個(gè)標(biāo)準(zhǔn)高光譜數(shù)據(jù)集進(jìn)行試驗(yàn)分析,結(jié)果表明:

        (1)在3個(gè)高光譜數(shù)據(jù)集中,ReliefF-RFE算法的平均總體精度(OA)為92.94%、F-measure為92.81%,Kappa系數(shù)為91.94%,優(yōu)于ReliefF算法但劣于RFE算法,總體精度良好。

        (2)較之于ReliefF算法,ReliefF-RFE算法繼承了RFE算法的降維優(yōu)勢(shì),能夠大幅降低特征維數(shù),其平均特征維數(shù)是ReliefF算法的37%。

        (3)較之于RFE算法,ReliefF-RFE算法繼承了ReliefF算法運(yùn)算效率高的特點(diǎn),運(yùn)算時(shí)間是RFE算法平均運(yùn)算時(shí)間的75%。

        綜合來(lái)看,本文所提出的ReliefF-RFE算法能夠發(fā)揮ReliefF和RFE的優(yōu)點(diǎn)并規(guī)避兩種算法的對(duì)應(yīng)不足,將其應(yīng)用于高光譜圖像分類(lèi)的特征選擇,能夠在保證分類(lèi)精度的情況下,克服過(guò)濾式ReliefF算法無(wú)法有效減小特征之間冗余以及封裝式RFE算法時(shí)間復(fù)雜度較高的缺陷,具有更為均衡的綜合性能。ReliefF-RFE算法能夠在特征選擇時(shí)間要求較高的情況下,用最小的代價(jià),處理大樣本的高光譜數(shù)據(jù)集。

        猜你喜歡
        分類(lèi)特征
        抓住特征巧觀察
        分類(lèi)算一算
        垃圾分類(lèi)的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        新型冠狀病毒及其流行病學(xué)特征認(rèn)識(shí)
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        分類(lèi)討論求坐標(biāo)
        數(shù)據(jù)分析中的分類(lèi)討論
        教你一招:數(shù)的分類(lèi)
        抓住特征巧觀察
        亚洲欧洲成人精品香蕉网| 亚洲AV成人无码久久精品老人| 久久青青草原亚洲AV无码麻豆| 亚洲AV无码国产精品久久l| 少妇一区二区三区精选| 成人做爰黄片视频蘑菇视频| 国产一区二区三区三区四区精品 | 欧美色五月| 亚洲国产精品色婷婷久久| 亚洲av日韩一区二区| www插插插无码视频网站| 醉酒后少妇被疯狂内射视频| 日本在线视频网站www色下载| 日本高清中文字幕二区在线 | 国产av区亚洲av毛片| 国内自拍愉拍免费观看| 亚洲一区二区三区影院| 被黑人猛躁10次高潮视频| 亚洲国产一区二区三区网| 午夜少妇高潮免费视频| 免费在线亚洲视频观看| 精品国产乱码久久久久久郑州公司| 全免费a级毛片| 男人天堂AV在线麻豆| 女同一区二区三区在线观看| 婷婷五月婷婷五月| 狠狠色狠狠色综合| 国内精品国产三级国产avx| 日本道色综合久久影院| 好男人日本社区www| 亚洲九九九| 男女性行为免费视频网站| 国产永久免费高清在线| 六月丁香久久| 久久国产女同一区二区| 麻豆最新国产av原创| 亚洲 欧美 日韩 国产综合 在线| 亚洲首页一区任你躁xxxxx| 国产日韩亚洲中文字幕| 日本妇女高清一区二区三区| 人人人妻人人澡人人爽欧美一区|