亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多核模糊粗糙集與蝗蟲優(yōu)化算法的高光譜波段選擇

        2020-06-07 07:07:00陳紅梅
        計(jì)算機(jī)應(yīng)用 2020年5期
        關(guān)鍵詞:蝗蟲粗糙集特征選擇

        張 伍,陳紅梅

        (西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,成都611756)

        (?通信作者電子郵箱hmchen@swjtu.edu.cn)

        0 引言

        高光譜遙感技術(shù)是現(xiàn)代衛(wèi)星遙感技術(shù)領(lǐng)域的重大突破。高光譜成像儀能對(duì)同一物體在幾百個(gè)光譜波段上同時(shí)成像,并構(gòu)成像素點(diǎn)的連續(xù)曲線。因?yàn)楦吖庾V波段圖像間相似性極高,產(chǎn)生了很多不必要的冗余,不便于存儲(chǔ)以及計(jì)算,甚至?xí)a(chǎn)生“HUGHES”問題[1],所以需要對(duì)其進(jìn)行降維處理。

        目前,高光譜圖像降維主要分為特征提取以及波段選擇兩種方式:特征提取是采用一些數(shù)學(xué)方法對(duì)屬性值進(jìn)行變換,將其重新映射為新值進(jìn)行降維,這樣做會(huì)破壞圖像原有的物理含義,不利于圖像的解譯;高光譜波段選擇是通過算法將波段進(jìn)行組合,使用一些重要的波段代表整個(gè)高光譜數(shù)據(jù)集。

        高光譜波段選擇算法根據(jù)是否利用地物真值信息,可以分為無監(jiān)督波段選擇算法以及有監(jiān)督波段選擇算法。劉雪松等[2]提出了使用相對(duì)熵間接衡量波段信息差異的最大信息量波段選擇方法;劉春紅等[3]提出了通過計(jì)算高光譜波段標(biāo)準(zhǔn)差以及與前后皮爾遜系數(shù)之和的比值,進(jìn)行優(yōu)先度排序的自適應(yīng)波段選擇算法;此外還有基于層次聚類[4]、密度峰值聚類[5]、k-means[6]聚類的高光譜波段選擇算法,它們從聚類簇中找出代表波段,形成波段子集;Zhang等[7]根據(jù)波段間的相關(guān)性遞增挑選高光譜波段。上述算法不需要地物真值信息,是無監(jiān)督的波段選擇算法。Liu等[8]提出基于鄰域粗糙集理論的高光譜波段選擇算法,并且設(shè)置擾動(dòng),分析算法穩(wěn)定性;Patra等[9]用粗糙集理論計(jì)算高光譜波段的相關(guān)性和重要度,定義了一個(gè)新的準(zhǔn)則,選擇相關(guān)性及重要度高的波段;Su等[10]提出了基于雙層粒子群的高光譜波段選擇算法,采用JM(Jeffreys-Matusita)距離及最小豐度方差估計(jì)(Minimum Estimated Abundance Covariance,MEAC)作為適應(yīng)值;Guo等[11]根據(jù)真實(shí)地物真值表與高光譜波段間的互信息進(jìn)行波段選擇。這些算法是有監(jiān)督波段選擇算法。

        目前絕大多數(shù)波段選擇算法均采用前向貪婪式的搜索方式,每次挑選當(dāng)前最優(yōu)解,通過不斷迭代直至選出最終解。貪婪算法具有較高的計(jì)算效率但很容易陷入局部最優(yōu)的情況。近些年來,部分學(xué)者嘗試將演化算法引入特征選擇領(lǐng)域來更好地選擇最優(yōu)特征子集。演化算法具有群體搜索策略和群體中個(gè)體之間信息交互的特性,不容易陷入局部最優(yōu)解。

        蝗蟲優(yōu)化算法[12]是Saremi等于2017年提出的一種元啟發(fā)式算法,它模仿蝗蟲群體中蝗蟲的行為探索目標(biāo)解,具有較強(qiáng)的探索和開發(fā)能力。隨后Mafarja等[13]提出了二進(jìn)制版本的蝗蟲特征選擇算法,將蝗蟲算法應(yīng)用于特征選擇問題。高光譜數(shù)據(jù)中不同地物類別對(duì)象間的分割區(qū)域蘊(yùn)含有大量不確定信息,核模糊粗糙集是不確定信息分析的新興范式。多核學(xué)習(xí)能考慮不同核函數(shù)間的互相影響,提高對(duì)不同數(shù)據(jù)分布情況的適應(yīng)性。本文通過多核模糊粗糙集對(duì)高光譜波段中的不確定信息進(jìn)行分析和度量,同時(shí)基于蝗蟲優(yōu)化算法探索波段組合。高光譜波段選擇旨在選擇出信息量大、相關(guān)度低、便于后續(xù)分類的波段子集。對(duì)應(yīng)考慮波段信息熵、波段相關(guān)性、模糊粗糙集波段依賴度構(gòu)建蝗蟲個(gè)體解的評(píng)價(jià)函數(shù)。本文算法與常用高光譜波段選擇算法相比,在獲取較少波段個(gè)數(shù)的同時(shí)具有較高的地物分類能力。

        1 相關(guān)基礎(chǔ)知識(shí)

        本章介紹蝗蟲優(yōu)化算法以及多核模糊粗糙集計(jì)算模型。

        1.1 蝗蟲優(yōu)化算法

        不同于粒子群算法中粒子根據(jù)當(dāng)前位置、個(gè)體歷史最佳位置、群體歷史最佳位置進(jìn)行更新,蝗蟲優(yōu)化算法的個(gè)體位置要根據(jù)群體內(nèi)的每一個(gè)個(gè)體位置進(jìn)行更新?;认x優(yōu)化算法流程如下。

        1.2 基于二進(jìn)制版本的蝗蟲特征選擇算法

        蝗蟲優(yōu)化算法在開發(fā)、探索、避免局部最優(yōu)及收斂速度方面有著優(yōu)秀的性能,該算法能較好地應(yīng)用基于包裹式的特征選擇算法中。根據(jù)特征選擇問題的性質(zhì),其中搜索空間可以用二進(jìn)制值0-1表示。Mafarja等[13]提出了二進(jìn)制版本的蝗蟲特征選擇算法。

        1.3 核模糊粗糙集

        Pawlak基于等價(jià)關(guān)系提出了經(jīng)典粗糙集理論,它能在不損失信息的情況下,獲取核心知識(shí)。但是在現(xiàn)實(shí)生活中,對(duì)象屬性值可能是數(shù)值型,并不能直接通過等價(jià)關(guān)系進(jìn)行比較。因而Dubois等[15]提出了基于模糊等價(jià)關(guān)系的模糊粗糙集理論,擴(kuò)展了經(jīng)典粗糙集理論。

        定義1[14]設(shè)U是論域,A:U→ [0,1],則稱A是U上的一個(gè)模糊集合,A(x)稱為模糊集合A的隸屬函數(shù)。對(duì)于任意的x∈U,A(x)表示x對(duì)A的隸屬度。U上全體模糊集的集合用F(U)表示,A∈F(U)意指A是U上的一個(gè)模糊集合。

        定義2[15]設(shè)U,V為兩個(gè)論域,當(dāng)滿足R∈F(U×V)時(shí),則稱R為U到V的一個(gè)模糊關(guān)系,隸屬度R(u,v)稱為(u,v)∈ (U×V)關(guān)于R的相關(guān)程度。

        定義3[14]設(shè)U是有限論域,U≠?,且R是U上的二元模糊關(guān)系,若x,y,z∈U,R滿足:

        自反性R(x,x)=1;

        對(duì)稱性R(x,y)=R(y,x);

        min-max傳遞性 min(R(x,y),R(y,z)) ≤R(x,z);則稱R是一個(gè)模糊等價(jià)關(guān)系。

        定義4[15]設(shè)R為論域U上的一個(gè)模糊等價(jià)關(guān)系,A是U的一個(gè)模糊子集,模糊集A∈F(U)的上、下近似定義為:

        在機(jī)器學(xué)習(xí)領(lǐng)域中,常常使用高斯核計(jì)算兩個(gè)對(duì)象間的相似性。下面介紹核模糊粗糙集和與之相關(guān)聯(lián)的一些概念。Hu等[16]給出了核模糊粗糙集的定義。高斯核函數(shù)為

        1.4 多核模糊粗糙集

        由于樣本數(shù)據(jù)分布情況不同,單一核函數(shù)并不能很好地適應(yīng)每一個(gè)數(shù)據(jù)集,故基于單核學(xué)習(xí)的方法受到了一定限制。傳統(tǒng)的核模糊粗糙集并沒有考慮不同核函數(shù)之間的影響,基于此,Hu等[19]提出可以采用組合核的方式構(gòu)建出一個(gè)新的核函數(shù)來進(jìn)行學(xué)習(xí)。常用的方法有線性組合以及非線性組合方法。

        其中:n是核函數(shù)的個(gè)數(shù),βm∈[0,1]是第m個(gè)核函數(shù)的權(quán)重。

        定義7 給定決策表U,C,D,RK是論域U上的多核模糊相似關(guān)系,則基于S-T算子的模糊空間多核?;?、上近似算子分別定義如下:

        定義8 給定決策表U,C,D,RK是論域U上的多核模糊相似關(guān)系。U在決策屬性上形成的劃分為{d1,d2,…,d i}。那么決策屬性D對(duì)B?C的模糊正域定義如下:

        定義9 給定決策表U,C,D,RK是論域U上的多核模糊相似關(guān)系。U在決策屬性上形成的劃分為{d1,d2,…,d i}。那么決策屬性D對(duì)B?C的屬性依賴度定義如下:

        2 基于多核模糊粗糙集與蝗蟲優(yōu)化算法的高光譜波段選擇

        本文根據(jù)Mafarja等提出的二進(jìn)制版本的蝗蟲特征選擇算法進(jìn)行波段搜索,同時(shí)綜合考慮波段信息熵、波段相關(guān)性、核模糊粗糙集屬性依賴度構(gòu)造適應(yīng)度函數(shù),評(píng)價(jià)每一個(gè)高光譜波段子集。

        2.1 基于模糊粗糙集的蝗蟲優(yōu)化算法適應(yīng)度函數(shù)

        本文構(gòu)建出一種新的適應(yīng)度函數(shù),先計(jì)算波段子集內(nèi)各波段的信息熵之和與依據(jù)該波段子集計(jì)算出的屬性依賴度的乘積,然后使用該乘積與波段子集內(nèi)各波段間相關(guān)系數(shù)的和的比值作為該波段子集的適應(yīng)度值。

        信息熵能用來表示信息的不確定性,本文把信息熵含量作為高光譜波段選擇的適應(yīng)度函數(shù)的一部分。信息熵公式定義如下:a

        其中PA(a)表示像素a出現(xiàn)的概率。圖1是去除水汽及噪聲污染的3.1節(jié)數(shù)據(jù)集中每個(gè)波段的信息熵變化。

        圖1 Indian Pines波段信息熵Fig.1 Information entropy in Indian Pines band

        給定決策系統(tǒng)U,B,D中,U={x1,x2,…,xn}是n個(gè)像元的集合,B={b1,b2,…,bm}是m個(gè)波段的集合,D是像元所對(duì)應(yīng)的地物真值類標(biāo)。將波段bi以及波段bj每個(gè)像素點(diǎn)的下近似之差取絕對(duì)值并且求和的方式計(jì)算兩個(gè)波段間的差異。

        設(shè)蝗蟲個(gè)體解所代表的波段子集為B={b1,b2,…,bn},高

        光譜圖像對(duì)象類別數(shù)為I,信息熵之和,波段間的相似度之和,以及波段子集所計(jì)算出的波段屬性依賴度

        由于蝗蟲優(yōu)化算法將最小的適應(yīng)度函數(shù)值設(shè)為最佳,故將相關(guān)性放置在分子,信息熵及粗糙集下近似的乘積放置在分母。這樣可以保證當(dāng)波段相關(guān)性總和較小,及波段子集信息熵之和與波段屬性依賴度乘積較大時(shí),整個(gè)適應(yīng)度函數(shù)的值較小。適應(yīng)度函數(shù)如下所示:

        技術(shù)路線如圖2所示。圖左側(cè)為適應(yīng)度函數(shù)的構(gòu)建思想,右側(cè)為迭代尋優(yōu)的步驟。

        圖2 技術(shù)路線Fig.2 Technical route

        2.2 蝗蟲優(yōu)化算法與模糊粗糙集結(jié)合的高光譜波段選擇算法

        蝗蟲優(yōu)化算法對(duì)優(yōu)化問題求解具有較強(qiáng)的探索和開發(fā)能力,多核模糊粗糙集模型能較好地分析類別與特征屬性間的依賴關(guān)系,因而本文將多核模糊粗糙集模型引入對(duì)高光譜波段子集的評(píng)價(jià)中,采用Majdi等提出了二進(jìn)制版本的蝗蟲特征選擇算法,提出了一種基于多核模糊粗糙集與蝗蟲優(yōu)化算法的高光譜波段選擇算法。算法偽代碼如下所示。

        算法2 基于蝗蟲優(yōu)化算法與模糊粗糙集的波段選擇算法。

        每一個(gè)蝗蟲個(gè)體對(duì)應(yīng)一張決策信息表,決策信息表的每一列中的值代表對(duì)應(yīng)波段下每一個(gè)像元的亮度值,最后一列代表每一個(gè)像元對(duì)應(yīng)的地物真值類別。當(dāng)蝗蟲個(gè)體的某一維度為1時(shí),代表該波段被進(jìn)行選擇;為0時(shí)代表該波段未被進(jìn)行選擇。通過該決策信息表,可以求得被選擇的每一列代表的波段信息熵,求得選擇后的波段間的波段相關(guān)性,以及地物信息與選取后的波段子集間的依賴度。通過式(12)即可求得該蝗蟲個(gè)體對(duì)應(yīng)的適應(yīng)度。信息圖如圖3所示。

        圖3 蝗蟲對(duì)應(yīng)信息Fig.3 Correspondinginformation of grasshoppers

        3 實(shí)驗(yàn)及結(jié)果分析

        3.1 實(shí)驗(yàn)數(shù)據(jù)集

        為了驗(yàn)證本文提出的模糊粗糙集蝗蟲優(yōu)化算法(Fuzzy Rough Set Grasshopper Optimization Algorithm,F(xiàn)RSGOA)的有效性,下載了Indian Pines數(shù)據(jù)集進(jìn)行測(cè)試。目前,國(guó)內(nèi)外高光譜數(shù)據(jù)的降維及分類實(shí)驗(yàn)常在此數(shù)據(jù)集上進(jìn)行測(cè)試。Indian Pines數(shù)據(jù)集采用機(jī)載成像儀AVIRIS于美國(guó)印第安納州采集。數(shù)據(jù)集包含16個(gè)地物類別,大小為145像素×145像素,圖像空間分辨率為25 m,波長(zhǎng)范圍為0.4~1.5μm,共有220個(gè)波段。該區(qū)域主要由植被及蔬菜覆蓋:蔬菜主要有玉米、麥子、大豆;植被有干草、樹木、草地等。

        數(shù)據(jù)集移除了水汽污染波段及噪聲波段。用剩余的[4~102],[113~147],[166~216]共 185 個(gè)波段進(jìn)行選擇。取數(shù)據(jù)的36,41,45號(hào)波段分別代表R、G、B三色合成的偽彩色圖見圖4。地物類型個(gè)數(shù)如表1所示。

        圖4 Indian Pines數(shù)據(jù)偽彩色圖Fig.4 Pseudo color chart of Indian Pines data

        3.2 實(shí)驗(yàn)結(jié)果與分析

        實(shí)驗(yàn)使用Java語(yǔ)言編寫實(shí)現(xiàn)了FS-GKA(Feature Selection based on Gaussian Kernel Approximations)[20]波段選擇算法、最大信息量(Max Information,MI)[2]波段選擇算法、標(biāo)準(zhǔn)化互信息(Normalized Mutual Information,NMI)[11]波段選擇算法、波段相關(guān)性分析(Band Correlation Analysis,BCA)[7]高光譜波段選擇算法以及本文的FRSGOA波段選擇算法。各方法的特點(diǎn)如表2所示。

        表1 Indian Pines數(shù)據(jù)中的地物類別Tab.1 Ground object categoriesof Indian Pines data

        表2 波段選擇算法技術(shù)特點(diǎn)Tab.2 Technical characteristicsof band selection algorithms

        由于本文算法具有隨機(jī)性,分類精度取5次計(jì)算后的平均分類精度。對(duì)于過濾式特征選擇算法,單一的分類器不能較好地衡量波段選擇后的波段子集,本文采用J48及K近鄰(K-Nearest Neighbor,KNN)兩種分類算法衡量波段子集評(píng)價(jià)特征選擇算法性能。分類算法采用WEKA的默認(rèn)接口,基于10折交叉驗(yàn)證確定這些特征子集的分類性能。本文在KNN分類器中,設(shè)置近鄰數(shù)為5。本文算法設(shè)置迭代數(shù)為50,蝗蟲個(gè)體數(shù)為90。核函數(shù)部分采用高斯核、指數(shù)核、二次有理核等權(quán)重進(jìn)行線性組合。設(shè)高斯核為k1、指數(shù)核為k2、二次有理核為k3、對(duì)象x和y,則基于線性方式的組合核由kl(x,y)=(k1(x,y)+k2(x,y)+k3(x,y))/3表示。

        由于不同核函數(shù)參數(shù)δ,會(huì)導(dǎo)致下近似值計(jì)算的差異,這樣會(huì)對(duì)本文算法生成的波段子集產(chǎn)生影響,本文測(cè)試不同核參數(shù)δ下選擇的波段子集。這里δ設(shè)置為0.10,0.22,0.32,0.50。實(shí)驗(yàn)結(jié)果如表3所示。

        從表3中可以發(fā)現(xiàn),在核參數(shù)δ為0.22時(shí),波段平均數(shù)為14.4,同時(shí)相較于其他3個(gè)核參數(shù),在J48及KNN分類器下具有最高的平均分類精度。其他3個(gè)核參數(shù),雖然獲得的平均波段個(gè)數(shù)較小,但是仍能具有較高的平均分類精度。

        本文使用FS-GKA、MI、NMI、BCA算法作為本文算法的對(duì)比實(shí)驗(yàn)算法。FS-GKA算法采用高斯核函數(shù),參數(shù)δ設(shè)置為0.22。NMI算法設(shè)置參數(shù)為按照原文設(shè)置。比較結(jié)果見表4。

        表3 不同核參數(shù)分類結(jié)果Tab.3 Classification resultsof different kernel parameters

        表4 各算法對(duì)Indian Pine數(shù)據(jù)平均分類精度Tab.4 Averageclassification accuraciesof different algorithmson Indian Pinedata

        從表4中可以發(fā)現(xiàn),本文算法與其他比較算法相比,能在波段子集更小的情況下取得更高的分類精度。這里BCA比MI、NMI及FS-GKA算法分類精度高,但是仍然不及本文算法的分類精度。

        4 結(jié)語(yǔ)

        本文提出一種基于核模糊粗糙集及蝗蟲優(yōu)化算法的高光譜波段選擇算法,它根據(jù)蝗蟲優(yōu)化算法較強(qiáng)的開發(fā)及探索能力搜索波段子集。針對(duì)數(shù)據(jù)分布情況難以預(yù)計(jì)對(duì)于單核學(xué)習(xí)的限制,采用多核模糊粗糙集的方式計(jì)算屬性依賴度,同時(shí)考慮波段子集信息含量及波段間相關(guān)性構(gòu)造出了適應(yīng)度函數(shù)。本文算法與大多數(shù)波段選擇算法相比,不需要提前確定波段個(gè)數(shù),直接選擇出波段子集,但所提算法有許多參數(shù)需要設(shè)置,而且這些參數(shù)會(huì)對(duì)于波段選擇有一定的影響,如何確定較好的參數(shù)仍有待進(jìn)一步研究。

        猜你喜歡
        蝗蟲粗糙集特征選擇
        你真的認(rèn)識(shí)蝗蟲嗎
        基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
        都2020年了,人類為啥還拿蝗蟲沒轍?
        人多勢(shì)眾的蝗蟲
        蝗蟲
        Kmeans 應(yīng)用與特征選擇
        電子制作(2017年23期)2017-02-02 07:17:06
        多?;植诩再|(zhì)的幾個(gè)充分條件
        雙論域粗糙集在故障診斷中的應(yīng)用
        聯(lián)合互信息水下目標(biāo)特征選擇算法
        兩個(gè)域上的覆蓋變精度粗糙集模型
        777精品出轨人妻国产| 亚洲综合一区二区三区蜜臀av| 久久精品天堂一区二区| 人妻少妇偷人精品免费看| 久久久国产精品黄毛片| 亚洲av无码乱码国产一区二区| 国产情侣久久久久aⅴ免费| 国产成人乱色伦区小说| 蜜桃在线观看视频在线观看| 日本人妻伦理在线播放| 国产精品毛片一区二区| 亚洲一区综合精品狠狠爱| 成年女人在线观看毛片| 亚洲一区二区三区精品久久| 精品人妻伦一二三区久久| 一本加勒比hezyo无码人妻| 国产精品 高清 尿 小便 嘘嘘| 国产精品女同久久免费观看| 亚洲熟少妇一区二区三区| 99无码熟妇丰满人妻啪啪| 亚洲综合无码一区二区三区 | 色噜噜狠狠色综合中文字幕| 青青草久久久亚洲一区| 国产无遮挡aaa片爽爽| 无码少妇一区二区三区| 亚洲无线码一区在线观看| 亚洲1区第2区第3区在线播放| 中国老熟妇506070| 国产精品第一二三区久久蜜芽| 国产一区二区三区av免费观看| 亚洲色图在线免费视频| 区二区三区玖玖玖| 91久久久久无码精品露脸 | 亚洲AV成人无码久久精品在| 亚洲一本二区偷拍精品| 国产成人av乱码在线观看| 国产午夜影视大全免费观看| 亚洲一区丝袜美腿在线观看| 亚洲国产综合精品一区最新| 东北少妇不戴套对白第一次| 国产欧美精品区一区二区三区|