亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于改進(jìn)支持向量機(jī)的水聲目標(biāo)-雜波不平衡分類研究

        2021-09-22 03:14:24李然威馮金鹿何榮欽
        應(yīng)用聲學(xué) 2021年5期
        關(guān)鍵詞:分類

        關(guān) 鑫 李然威 胡 鵬 馮金鹿 何榮欽

        (中國(guó)船舶第七一五研究所 杭州 310023)

        0 引言

        通常主動(dòng)聲吶較被動(dòng)聲吶具備探測(cè)距離優(yōu)勢(shì),但是,在工作過(guò)程中經(jīng)常伴隨著大量的雜波虛警,并且隨著水下目標(biāo)隱身降噪技術(shù)的發(fā)展,探測(cè)難度不斷加大[1],尤其是在淺海海域,分布著礁石、海底山脊、山峰和沉船等強(qiáng)散射體,主動(dòng)發(fā)射信號(hào)接觸這些散射體,會(huì)產(chǎn)生和目標(biāo)強(qiáng)度相近的回波,在探測(cè)畫面上出現(xiàn)大量類目標(biāo)雜波亮點(diǎn)。大量雜波的存在對(duì)主動(dòng)聲吶探測(cè)性能主要有兩方面的影響,第一,難以通過(guò)調(diào)整信噪比門限,在不損失檢測(cè)概率的同時(shí)降低虛警概率;第二,在自動(dòng)跟蹤端生成大量虛假航跡,影響航跡關(guān)聯(lián),加劇跟蹤系統(tǒng)的計(jì)算負(fù)擔(dān),甚至導(dǎo)致跟蹤系統(tǒng)癱瘓。因此,雜波抑制是主動(dòng)聲吶信號(hào)處理中的重要研究問(wèn)題,通過(guò)對(duì)目標(biāo)和雜波的分類判別,可以有效解決這個(gè)問(wèn)題[2]。

        隨著大數(shù)據(jù)時(shí)代的到來(lái),從海量數(shù)據(jù)中挖掘有效信息的需求推動(dòng)了機(jī)器學(xué)習(xí)的發(fā)展,Berg等[2]為了解決自主水下潛航器群(Autonomous underwater vehicles,AUVs)受制于有限的通信能力而不能共享大量主動(dòng)聲吶探測(cè)數(shù)據(jù)的問(wèn)題,研究了k 近鄰(k near neighbor,k-NN)、ID3、樸素貝葉斯(Naive Bayes)和神經(jīng)網(wǎng)絡(luò)(Neural network)等機(jī)器學(xué)習(xí)算法,通過(guò)對(duì)目標(biāo)和雜波的分類來(lái)縮減探測(cè)數(shù)據(jù)。Stender 等[3?4]指出在跟蹤階段,由海底地形特征物(海山、山脊等)產(chǎn)生的雜波和人造特征物(無(wú)人潛航器(Underwater unmanned vehicle,UUV)、潛艇等)產(chǎn)生的回波運(yùn)動(dòng)特性不同,建立了包含運(yùn)動(dòng)航跡和信噪比特征的數(shù)據(jù)集,訓(xùn)練機(jī)器學(xué)習(xí)模型,能夠準(zhǔn)確地從背景中發(fā)現(xiàn)人造特征物??梢?jiàn),機(jī)器學(xué)習(xí)能夠利用數(shù)據(jù)發(fā)現(xiàn)一些潛在的變化規(guī)律用來(lái)預(yù)測(cè)未知數(shù)據(jù),為水聲目標(biāo)和雜波的分類提供了一種新的解決思路。

        然而,以上研究[1?4]并未考慮水聲數(shù)據(jù)集的類不平衡特性,即主動(dòng)聲吶使用中海底/海面的不平整性、航船輻射噪聲等對(duì)水聲數(shù)據(jù)采集帶來(lái)大量的雜波干擾,一個(gè)水下目標(biāo)回波通常伴隨著數(shù)百個(gè)雜波。因而,相應(yīng)的機(jī)器學(xué)習(xí)分類問(wèn)題為不平衡分類問(wèn)題,即在一個(gè)分類問(wèn)題中某些類的樣本數(shù)量遠(yuǎn)多于其他類別的樣本數(shù)量[5]。一般的機(jī)器學(xué)習(xí)分類算法不適合處理類不平衡數(shù)據(jù)[6?7],因?yàn)闄C(jī)器學(xué)習(xí)算法在訓(xùn)練的過(guò)程中基于整體分類誤差最小構(gòu)建分類模型,導(dǎo)致多數(shù)類樣本的分類準(zhǔn)確率存在高于少數(shù)類樣本的趨勢(shì)[8],整體分類準(zhǔn)確率主要受前者影響而變高,但是少數(shù)類樣本的分類準(zhǔn)確率不能滿足實(shí)際需求。

        支持向量機(jī)(Support vector machine,SVM)是一種經(jīng)典的機(jī)器學(xué)習(xí)算法,具有堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)[8?12],為了探究其在不平衡數(shù)據(jù)中的分類性能,Lin等[10]建立了支持向量機(jī)和貝葉斯決策理論之間的關(guān)系,在貝葉斯決策理論中,貝葉斯最優(yōu)決策是最優(yōu)分類決策[11],他們從理論上證明了對(duì)于錯(cuò)分代價(jià)相同的類平衡樣本,SVM可在樣本數(shù)量趨于無(wú)窮時(shí)逼近貝葉斯最優(yōu)決策,但是對(duì)于不平衡數(shù)據(jù),SVM無(wú)法逼近貝葉斯最優(yōu)決策,即分類性能差。

        代價(jià)敏感支持向量機(jī)(Cost sensitive support vector machine,CS-SVM)由SVM結(jié)合代價(jià)敏感技術(shù)發(fā)展而來(lái),主要用來(lái)解決不平衡分類問(wèn)題[11?12]。不平衡分類問(wèn)題與代價(jià)敏感學(xué)習(xí)密切相關(guān),在代價(jià)敏感學(xué)習(xí)中每個(gè)類的錯(cuò)分代價(jià)不同,不平衡分類問(wèn)題中,少數(shù)類往往具有更高的錯(cuò)分代價(jià)[7,13],對(duì)于錯(cuò)分代價(jià)不同的類不平衡樣本,CS-SVM 理論上在樣本數(shù)量趨于無(wú)窮大時(shí)同樣可以逼近貝葉斯最優(yōu)決策[10]。然而實(shí)際中的樣本數(shù)量往往有限,導(dǎo)致CS-SVM的分類性能總是次優(yōu)的。

        針對(duì)CS-SVM 在有限不平衡樣本中難以逼近貝葉斯最優(yōu)決策的問(wèn)題,本文提出了一種基于能量統(tǒng)計(jì)法的En-SVM算法。利用能量距離量化少數(shù)類樣本在不完全采樣過(guò)程中的信息損失,使得少數(shù)類樣本在再生核希爾伯特空間(Reproducing kernel Hilbert space,RKHS)中可以為機(jī)器學(xué)習(xí)算法提供更多的分類信息,提高少數(shù)類樣本的分類精度。實(shí)驗(yàn)結(jié)果表明,該算法能夠有效地處理不平衡水聲數(shù)據(jù),同時(shí)獲得高檢測(cè)概率及較低的虛警概率,并且隨著不平衡比率的增加,仍能保持良好的性能。

        1 CS-SVM的貝葉斯最優(yōu)決策

        1.1 貝葉斯最優(yōu)決策

        水聲目標(biāo)-雜波分類是典型的二分類問(wèn)題,不失一般性,做如下約定,(X,Y)代表原始數(shù)據(jù)空間,X ∈Rd,Y ∈{?1,+1},(Xs,Ys)為樣本空間,Xs ∈Rd,Ys ∈{?1,+1},d表示數(shù)據(jù)維數(shù),“Ys=?1”代表負(fù)樣本,“Ys= +1”代表正樣本,正樣本為少數(shù)類樣本,具有更高的錯(cuò)分代價(jià),對(duì)應(yīng)水聲目標(biāo)。則來(lái)自(X,Y)的某一數(shù)據(jù)分為正類的貝葉斯后驗(yàn)概率為p(x)=Pr(Y=+1|X=x),如式(1)所示:

        其中,k+和k?分別為原始數(shù)據(jù)中正負(fù)樣本的分布概率,Pr(X=x|Y= +1)為正樣本條件概率,Pr(X=x|Y=?1)為負(fù)樣本條件概率,對(duì)于樣本空間也有類似的表述。在分類過(guò)程中,正類(正樣本)和負(fù)類(負(fù)樣本)具有不同的錯(cuò)分代價(jià),可用代價(jià)矩陣表示,如表1所示。

        表1 代價(jià)矩陣Table 1 Cost matrix

        表1 中C?為假負(fù)例(False negative instance,FN)的錯(cuò)分代價(jià),C+為假正例(False positive instance,FP)的錯(cuò)分代價(jià)。機(jī)器學(xué)習(xí)數(shù)據(jù)集的建立是對(duì)原始數(shù)據(jù)空間的不完全隨機(jī)采樣過(guò)程,正樣本和負(fù)樣本的采樣數(shù)量并非總是相同的,且正樣本和負(fù)樣本的重要性是不同的,比如具有不同錯(cuò)分代價(jià)的不平衡樣本。Lin等[10]通過(guò)貝葉斯決策理論證明了在有偏采樣和錯(cuò)分代價(jià)不同的條件下,機(jī)器學(xué)習(xí)算法在原始數(shù)據(jù)空間和樣本空間中的貝葉斯最優(yōu)決策存在差異。最高的分類準(zhǔn)確率在統(tǒng)計(jì)意義上對(duì)應(yīng)最小貝葉斯風(fēng)險(xiǎn):

        其中,I(·)為指示函數(shù),條件為真,I(·)=1,否則為0。使得式(2)最小的?B(x)即為貝葉斯最優(yōu)準(zhǔn)則:

        在原始數(shù)據(jù)空間中正類與負(fù)類滿足獨(dú)立同分布(Independent and identically distributed,IID)條件,此時(shí)錯(cuò)分代價(jià)趨于相等,可得貝葉斯最優(yōu)決策:

        式(4)中,sign(·)為符號(hào)函數(shù),然而對(duì)具有不同錯(cuò)分代價(jià)的不平衡樣本(Xs,Ys),貝葉斯最優(yōu)準(zhǔn)則為

        貝葉斯最優(yōu)決策變?yōu)?/p>

        由式(4)和式(6)可知,在原始數(shù)據(jù)空間中,后驗(yàn)概率p(x)只需和1/2 比較,而在有偏采樣和錯(cuò)分代價(jià)不同的樣本空間中,后驗(yàn)概率ps(·)和1/2 比較會(huì)產(chǎn)生不準(zhǔn)確的結(jié)果。因此,對(duì)于具有不同錯(cuò)分代價(jià)的不平衡樣本,為了獲得良好的分類效果,需要考慮貝葉斯最優(yōu)決策。

        1.2 代價(jià)敏感支持向量機(jī)

        對(duì)于不平衡樣本,負(fù)類樣本主導(dǎo)整體分類準(zhǔn)確率,超平面會(huì)向正類樣本偏移,導(dǎo)致具有更高錯(cuò)分代價(jià)的正類樣本分類準(zhǔn)確率下降,而整體準(zhǔn)確率很高。CS-SVM通過(guò)給少數(shù)類樣本和多數(shù)類樣本賦予不同的錯(cuò)分代價(jià)來(lái)處理不平衡樣本,它的求解等價(jià)于在再生核希爾伯特空間(RKHS)Hk中求解關(guān)于目標(biāo)函數(shù)的正則問(wèn)題,決策函數(shù)可寫為

        Zhang 證明了Hinge 損失在SVM 的求解中具有貝葉斯一致性(Bayesian consistency),因此,Hinge 損失常作為SVM 的目標(biāo)函數(shù)[14]。在SVM的基礎(chǔ)上,CS-SVM 引入了調(diào)節(jié)因子L(·),如式(8)所示:

        需要注意的是,SVM 的標(biāo)準(zhǔn)輸出為置信度?f(x),經(jīng)過(guò)Sigmoid 函數(shù)映射得到后驗(yàn)概率ps[15]。式(9)說(shuō)明了對(duì)于具有不同錯(cuò)分代價(jià)的不平衡樣本,CS-SVM 是貝葉斯最優(yōu)的。但是,實(shí)際樣本總是有限的,在獨(dú)立同分布的采樣過(guò)程中,k+和k?接近,而對(duì)于有限不平衡樣本,將k+s和k?s視為先驗(yàn)概率是不合適的,因?yàn)樵诓蓸舆^(guò)程中正類樣本存在信息損失,比如主動(dòng)聲吶探測(cè)過(guò)程中,受混響、多徑效應(yīng)等因素影響,目標(biāo)回波往往會(huì)發(fā)生畸變并伴有能量損失,導(dǎo)致目標(biāo)探測(cè)數(shù)據(jù)稀少。因此,正負(fù)樣本的信息不對(duì)稱使得式(9)有如下的修正:

        其中,Hshannon代表正類樣本采樣過(guò)程中丟失的信息,用香農(nóng)熵來(lái)表示,fH(·)為其度量準(zhǔn)則。基于這一思想,本文提出了改進(jìn)的CS-SVM。

        2 基于能量統(tǒng)計(jì)方法的En-SVM

        2.1 信息損失度量

        根據(jù)拉格朗日對(duì)偶性,式(8)的對(duì)偶問(wèn)題如下:

        式(11)中,K(·)為核函數(shù),可將非線性數(shù)據(jù)映射為希爾伯特空間中的線性數(shù)據(jù),因此,在RKHS 中認(rèn)為正負(fù)樣本線性可分,滿足0<αi

        從圖1(b)可知,正類支持向量的后驗(yàn)概率較小,具有較大的自信息(虛線同心圓表示),含有更多的分類信息,自信息的期望即為香農(nóng)熵,用來(lái)度量樣本整體的信息,可以發(fā)現(xiàn)多數(shù)類樣本整體包含的信息大于少數(shù)類樣本,導(dǎo)致CS-SVM 仍有錯(cuò)分的正類樣本。En-SVM 利用fH(Hshannon),可使分類結(jié)果對(duì)正類樣本更加有利,如圖1(c)所示,“0”號(hào)錯(cuò)分樣本獲得了一定的置信度。能量統(tǒng)計(jì)方法通過(guò)計(jì)算特征函數(shù)間的加權(quán)平方距離來(lái)表征不同分布之間的差異[16],少數(shù)類樣本經(jīng)原始數(shù)據(jù)空間不完全采樣得到,存在信息損失Hshannon,本質(zhì)上是其概率分布發(fā)生了變化,因此,可以用分布差異來(lái)度量信息損失,得到fH(Hshannon)近似解。能量距離表示如下:

        圖1 RKHS 中的不平衡分類Fig.1 Imbalance classification in RKHS

        式(12)中,p和p′分別表示有限樣本和原始數(shù)據(jù)的概率分布,φ(·)為其對(duì)應(yīng)的特征函數(shù),對(duì)于不同的概率分布,特征函數(shù)總是存在且收斂的,‖·‖表示歐幾里得范數(shù),Γ(·)為伽馬函數(shù),d表示特征向量x的維數(shù)。能量距離可以等效地表示為

        式(13)中,Ex~p表示服從概率密度p的期望,類別數(shù)只有兩類時(shí),k=[k+,k?]T,c為與k無(wú)關(guān)的常量,A為2×2 階對(duì)稱矩陣。對(duì)于少數(shù)類樣本,DE(p,p′)可表示為一個(gè)相當(dāng)于常量的k+的函數(shù):

        其中,μ為貝葉斯風(fēng)險(xiǎn)DE(p(x|y= 1),p(x|y=?1)),Ay,ˉy和σy可近似給出:

        結(jié)合式(14)~(19)可得到信息損失度量:

        2.2 En-SVM算法求解

        En-SVM 算法的核心在于利用少數(shù)類樣本不完全采樣過(guò)程的信息損失來(lái)補(bǔ)償分類模型在訓(xùn)練過(guò)程中所需的分類信息,使得分類結(jié)果對(duì)少數(shù)類樣本更加有利。記fH=fH(Hshannon),由此,可得En-SVM如下:

        RKHS理論保證了式(7)有如下的形式:為了減少待優(yōu)化參數(shù)的數(shù)量,需要利用拉格朗日對(duì)偶性得到原始問(wèn)題式(21)的對(duì)偶問(wèn)題[13]:

        式(23)中,α為對(duì)偶解,則原始問(wèn)題的解為

        選取一個(gè)滿足0<αi <(fHI(yi=1)+I(yi=?1))L(yi)的樣本,則根據(jù)KKT 條件(Karush-Kuhn-Tucker condition)可得

        3 海試數(shù)據(jù)處理結(jié)果及分析

        為驗(yàn)證本文算法,使用某海域的水下目標(biāo)歷史探測(cè)數(shù)據(jù)來(lái)構(gòu)建目標(biāo)-雜波數(shù)據(jù)集,由于數(shù)據(jù)集的樣本量較小,為了能夠得到有效的機(jī)器學(xué)習(xí)模型,采用“交叉驗(yàn)證(Cross validation)”方法來(lái)處理數(shù)據(jù)。

        3.1 評(píng)價(jià)指標(biāo)

        對(duì)于類別不平衡數(shù)據(jù),ROC曲線(Receiver operating characteristic curve)不易受到數(shù)據(jù)分布影響,是一種評(píng)價(jià)機(jī)器學(xué)習(xí)模型性能的常用方法[13]。ROC 曲線以真正率(True positive rate)為橫坐標(biāo),以假正率(False positive rate)為縱坐標(biāo),反映了檢測(cè)概率和虛警概率之間的制約關(guān)系。ROC 曲線下的面積被稱為Auc(Area of under curve)值,值越大表明分類效果越好。

        3.2 水聲目標(biāo)-雜波數(shù)據(jù)集

        不平衡樣本中,多數(shù)類樣本與少數(shù)類樣本的數(shù)量之比稱為不平衡率(Imbalanced rate,IR),本文所采用數(shù)據(jù)集(Xs,Ys)的IR≈245.3,數(shù)據(jù)維數(shù)為11(對(duì)應(yīng)11 類特征),即Xs ∈R11,Ys ∈{?1,+1},“?1”代表雜波,“+1”代表目標(biāo),為少數(shù)類樣本。在該數(shù)據(jù)集上做10 次3 折交叉驗(yàn)證[13],即每一次交叉驗(yàn)證前分別將雜波和目標(biāo)樣本隨機(jī)等分為3 份(每一份稱為一折),即Data1、Data2 和Data3,如表2所示,并形成3 組訓(xùn)練集和測(cè)試集:(1)訓(xùn)練集Data1 + Data2,測(cè)試集Data3;(2)訓(xùn)練集Data1 +Data3,測(cè)試集Data2;(3)訓(xùn)練集Data2 + Data3,測(cè)試集Data1。

        表2 水聲目標(biāo)-雜波樣本Table 2 Underwater acoustic target-clutter sample

        分別在(1)、(2)和(3)上訓(xùn)練并測(cè)試,重復(fù)進(jìn)行10次,以減小實(shí)驗(yàn)過(guò)程中的隨機(jī)性。

        3.3 實(shí)驗(yàn)結(jié)果及分析

        為便于比較,標(biāo)準(zhǔn)SVM、CS-SVM 和本文算法En-SVM 均采用徑向基核函數(shù),核自由參數(shù)δ取1,采用序列最小最優(yōu)化(Sequential minimal optimization,SMO)算法,由于涉及樣本間距離的計(jì)算,為防止受到具有過(guò)高特征值或過(guò)低特征值樣本的影響,輸入數(shù)據(jù)均做標(biāo)準(zhǔn)化處理。CS-SVM 和En-SVM 中的假負(fù)例FN 與假正例FP 的代價(jià)之比C?/C+取和IR 相同的值,算法在表2所示的數(shù)據(jù)集上做10次3折交叉驗(yàn)證。

        (1)算法性能比較

        為了有效比較標(biāo)準(zhǔn)SVM、CS-SVM 和En-SVM在貝葉斯最優(yōu)準(zhǔn)則(式(5))下的性能,始終以0.5 作為概率決策門限,即算法輸出的后驗(yàn)概率大于0.5時(shí),該樣本(x,y)被判斷為目標(biāo),否則為雜波。為了保證實(shí)驗(yàn)結(jié)果的可靠性,按照10 次3 折交叉驗(yàn)證的方式進(jìn)行,統(tǒng)計(jì)每次每折的分類后驗(yàn)概率預(yù)測(cè)值繪制ROC 曲線并通過(guò)梯度法計(jì)算Auc 值,有效地消除了ROC 曲線中的“鋸齒”,使得固定門限下的數(shù)值更加準(zhǔn)確。

        依照?qǐng)D例順序,圖2中所示曲線分別表示SVM、CS-SVM 和En-SVM 算法的ROC 性能,其中,每條曲線上會(huì)標(biāo)記一個(gè)與曲線同色的實(shí)心點(diǎn),該點(diǎn)表示決策門限值為0.5 時(shí),算法能夠達(dá)到的檢測(cè)概率和虛警概率。為了使得算法輸出結(jié)果具有一定的統(tǒng)計(jì)意義和可信度,本文將機(jī)器學(xué)習(xí)算法的輸出通過(guò)Sigmoid 函數(shù)統(tǒng)一映射為正樣本(目標(biāo))的后驗(yàn)概率值,即未知樣本數(shù)據(jù)是目標(biāo)的可能性,后驗(yàn)概率值越大,是目標(biāo)的可能性越大。對(duì)于一條ROC性能曲線,當(dāng)取不同的后驗(yàn)概率值作為決策門限時(shí),該門限將對(duì)應(yīng)一組不同的檢測(cè)概率和虛警概率,為了防止人為的先驗(yàn)知識(shí)對(duì)結(jié)果產(chǎn)生干擾,同時(shí),為了使得不同算法具有相同的衡量標(biāo)準(zhǔn),本文選取了概率值為0.5 處作為決策門限,大于0.5,則該未知樣本數(shù)據(jù)就是目標(biāo),否則是雜波,實(shí)現(xiàn)了從統(tǒng)計(jì)意義上的可能性向確定性決策的轉(zhuǎn)變。Auc值說(shuō)明了ROC性能曲線接近左上角的程度,而實(shí)心點(diǎn)處對(duì)應(yīng)的檢測(cè)概率和虛警概率則進(jìn)一步說(shuō)明了算法在統(tǒng)計(jì)意義上的優(yōu)劣。

        圖2 算法性能比較Fig.2 Algorithm performance comparison

        可以看到圖2 中SVM的ROC性能曲線上沒(méi)有出現(xiàn)實(shí)心點(diǎn),原因在于其實(shí)心點(diǎn)對(duì)應(yīng)的檢測(cè)概率小于50%,一般更加關(guān)注檢測(cè)概率大于90%時(shí)對(duì)應(yīng)的虛警概率,為了便于觀察不同算法性能曲線的差異,圖2中僅繪制出了檢測(cè)概率大于50%的部分。SVM算法的Auc 值低于CS-SVM 和En-SVM,且檢測(cè)概率低于50%,分類性能差。相較于CS-SVM算法,本文算法En-SVM 的Auc 值高出0.03,并且固定決策門限下的性能更靠近左上角,虛警概率降低了3.4個(gè)百分點(diǎn),檢測(cè)概率提高了5 個(gè)百分點(diǎn),分別達(dá)到了9.9%和95.6%,分類性能優(yōu)于CS-SVM,即En-SVM算法在獲得高檢測(cè)概率時(shí),可以排除約90.1%的雜波。實(shí)驗(yàn)結(jié)果表明,對(duì)于不平衡數(shù)據(jù)的分類問(wèn)題,本文算法En-SVM 因?yàn)榭紤]了少數(shù)類樣本不完全采樣過(guò)程中的信息損失,而具有更好的分類性能,更加接近貝葉斯最優(yōu)決策(式(9))。

        (2)數(shù)據(jù)集不平衡率對(duì)算法的影響

        本文算法En-SVM 的核心思想在于度量原始數(shù)據(jù)空間(X,Y)和樣本空間(Xs,Ys)正類樣本分布的能量距離來(lái)量化正類樣本不完全采樣過(guò)程中的信息損失,來(lái)補(bǔ)償CS-SVM 在RKHS 中正類樣本的香農(nóng)熵,使得正類樣本能在分類過(guò)程中為算法提供更強(qiáng)的分類信息,從而使En-SVM 能夠在有限樣本中逼近貝葉斯最優(yōu)決策,獲得更好的分類性能。為了進(jìn)一步驗(yàn)證算法效果,將數(shù)據(jù)集(表2所示)中的目標(biāo)數(shù)量(+1 表示)依次從105 隨機(jī)下采樣為90、60、30,對(duì)應(yīng)的不平衡率IR 從245.3 變?yōu)?86.2、429.3 和858.6,統(tǒng)計(jì)10 次3 折交叉的Auc 值,以“均值±標(biāo)準(zhǔn)差”的形式給出,并得到對(duì)應(yīng)的ROC曲線。

        由表3 可以看出,隨著IR 的增大,標(biāo)準(zhǔn)SVM的性能明顯下降,CS-SVM 性能也有所下降,而En-SVM的性能保持穩(wěn)定,Auc值高于其他兩者。

        表3 不平衡率對(duì)Auc 值的影響Table 3 Effect of unbalance rate on Auc value

        圖3~5 分別為SVM、CS-SVM 和En-SVM 在不同IR 數(shù)據(jù)下得到的ROC 曲線,可以看出,隨著數(shù)據(jù)IR 的增大,En-SVM 能夠保持良好的性能,且0.5 決策門限下的性能波動(dòng)程度比SVM 和CSSVM 小。實(shí)驗(yàn)結(jié)果表明,En-SVM 能夠充分利用少數(shù)類樣本不完全采樣過(guò)程中的信息損失,提升算法性能,并具有一定的穩(wěn)定性。

        圖3 標(biāo)準(zhǔn)SVM 的ROC 曲線Fig.3 ROC of Standard SVM

        圖4 CS-SVM 的ROC 曲線Fig.4 ROC of CS-SVM

        圖5 En-SVM 的ROC 曲線Fig.5 ROC of En-SVM

        4 結(jié)論

        本文針對(duì)少數(shù)類樣本在不完全采樣過(guò)程中存在信息損失,結(jié)合能量統(tǒng)計(jì)法提出了En-SVM算法,在處理水聲目標(biāo)-雜波不平衡數(shù)據(jù)中有著良好的分類效果。實(shí)際海試數(shù)據(jù)的處理結(jié)果表明,En-SVM算法能夠在有限樣本中更加逼近貝葉斯最優(yōu)決策,并且對(duì)樣本的不平衡率變化不敏感,驗(yàn)證了算法的有效性和穩(wěn)定性。本文采用的水聲數(shù)據(jù)集建立在高于最小可檢測(cè)閾6 dB 的數(shù)據(jù)上,未來(lái)將進(jìn)一步研究該算法在更低可檢測(cè)信噪比數(shù)據(jù)集上的不平衡分類效果。

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準(zhǔn)備好了嗎
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        avtt一区| 免费人妻无码不卡中文字幕系 | 新视觉亚洲三区二区一区理伦| 国产在线第一区二区三区| 色老板精品视频在线观看| 中国猛少妇色xxxxx| 亚洲欧洲日产国码久在线观看| 亚洲美女国产精品久久久久久久久| 黄片午夜免费观看视频国产| 日本午夜理论片在线观看| 韩国三级中文字幕hd| 国产精品亚洲欧美云霸高清| 人妖另类综合视频网站| 国产精品一区二区蜜臀av| 91精品国产乱码久久中文| 99精品人妻无码专区在线视频区| 久久亚洲私人国产精品| 日本一区不卡在线| 亚洲av午夜福利精品一区二区 | 中文字幕人妻在线少妇| 国产精品亚洲色婷婷99久久精品| 少妇人妻偷人精品视频| 在线天堂中文一区二区三区| av天堂手机在线看片资源| 97精品人人妻人人| 亚洲综合国产一区二区三区| 中文字幕久无码免费久久| 人妻系列少妇极品熟妇| 999zyz玖玖资源站永久| 极品av麻豆国产在线观看| 亚洲 欧美 综合 另类 中字| 中文字幕一二区中文字幕| 少妇人妻中文久久综合| 成人三级a视频在线观看| 香蕉国产人午夜视频在线观看| 中文字幕人妻av四季| 国产精品亚洲第一区二区三区| 性生交大全免费看| 在线免费观看韩国a视频| 久久精品亚洲乱码伦伦中文| 日本熟女精品一区二区三区|