亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        船舶輻射噪聲分類卷積神經(jīng)網(wǎng)絡(luò)的可視化分析和卷積核剪枝

        2024-01-27 07:20:32徐源超蔡志明孔曉鵬
        電子與信息學(xué)報(bào) 2024年1期
        關(guān)鍵詞:線譜正確率可視化

        徐源超 蔡志明 孔曉鵬 黃 炎

        (海軍工程大學(xué)電子工程學(xué)院 武漢 430033)

        1 引言

        船舶輻射噪聲分類是目前水聲目標(biāo)探測(cè)領(lǐng)域的重要課題之一。深度神經(jīng)網(wǎng)絡(luò),特別是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN),已在船舶輻射噪聲分類任務(wù)中得到廣泛研究[1-6]。CNN可直接用來提取時(shí)域信號(hào)中的船舶分類特征[1,2]。Gammatone濾波器組被用于初始化第一層卷積核,并構(gòu)建以時(shí)域信號(hào)為輸入的端到端的CNN,該方法結(jié)合了人耳聽覺原理設(shè)計(jì)分類模型[1]。不同尺寸的卷積核被用于處理時(shí)域信號(hào)并構(gòu)建CNN[3]。CNN也可從LOFAR中提取目標(biāo)特征信息[4,5]。卷積自編碼器可以無監(jiān)督地自動(dòng)提取目標(biāo)特征[4]。包括LOFAR在內(nèi)的多種譜融合特征被輸入到CNN中實(shí)現(xiàn)船舶分類[6]。然而由于水聲目標(biāo)數(shù)據(jù)集小樣本、非均衡等特點(diǎn),模型的泛化性能未見明顯改善。另外,數(shù)據(jù)驅(qū)動(dòng)得到的CNN模型的可解釋性較差,模型得到的知識(shí)難以人為掌握。可視化分析是觀察模型所學(xué)習(xí)到的“知識(shí)”的一種技術(shù)手段。基于領(lǐng)域知識(shí)并結(jié)合可視化結(jié)果為模型改進(jìn)提供了一條技術(shù)路徑。

        神經(jīng)網(wǎng)絡(luò)中權(quán)值的物理意義往往難以解釋。對(duì)于CNN模型,可直接可視化學(xué)習(xí)到的淺層卷積核權(quán)值。圖像任務(wù)中,淺層的卷積核組可以被解釋為一組Gabor濾波器[7]。然而這種可視化方法對(duì)深層的卷積核無能為力,因?yàn)樯顚訂卧妮斎胧窃驾斎氲膹?fù)雜的非線性變換。在輸入空間觀察模型是可視化分析的重要途徑,即基于模型重建輸入空間?;诜淳矸e網(wǎng)絡(luò)可以重建輸入空間[8]。對(duì)于一個(gè)給定的輸入樣本,反卷積網(wǎng)絡(luò)針對(duì)指定的神經(jīng)單元重建樣本。重建樣本反映此神經(jīng)單元在給定的輸入樣本中“觀察”到的東西。導(dǎo)向反向傳播(Guided Backward Propagation, GBP)方法改善了重建效果[9]。上述兩種重建輸入空間的方法是依賴樣本的。輸入空間優(yōu)化(Optimization in Input Space,OIS)方法則不依賴于樣本[10],此方法輸入一個(gè)隨機(jī)樣本,然后基于梯度下降優(yōu)化輸入空間,使指定神經(jīng)單元的響應(yīng)值最大化。反卷積網(wǎng)絡(luò)與輸入空間優(yōu)化的方法可以結(jié)合使用并相互印證[11]。

        LOFAR譜中包含豐富的船舶目標(biāo)信息。本文首先構(gòu)建了以對(duì)數(shù)譜為輸入的CNN網(wǎng)絡(luò)[12],并在DeepShip數(shù)據(jù)集[13]上訓(xùn)練。其次,提出一套用于船舶輻射噪聲分類的CNN可視化流程,基于GBP和OIS方法重建輸入空間,以分析CNN模型習(xí)得的知識(shí)。對(duì)CNN的某個(gè)深層卷積核,在訓(xùn)練集中尋找使其擁有最大激活值的若干噪聲記錄作為輸入,利用GBP方法重建輸入空間。提出的多幀特征對(duì)齊算法用于合并多條噪聲記錄。OIS作為GBP的輔助觀察手段??梢暬治霭l(fā)現(xiàn),同一個(gè)卷積核總是激活相似的輸入模式,這些輸入模式擁有相近的線譜結(jié)構(gòu)或其他模式特征。本文將深層卷積核歸納為兩類,即線譜模式與背景模式。相比船舶輻射噪聲中的背景特征,其中的線譜是船舶目標(biāo)分類的穩(wěn)健特征。基于此知識(shí),本文提出一種CNN剪枝方法,通過保留線譜模式卷積核而剔除背景模式卷積核,并重新訓(xùn)練全連接層,提升模型分類性能,降低過擬合風(fēng)險(xiǎn)。神經(jīng)網(wǎng)絡(luò)剪枝的目的通常是壓縮模型參數(shù)規(guī)模[14,15],且一般是數(shù)據(jù)驅(qū)動(dòng)的[16]。而本文提出的剪枝方法則是在對(duì)船舶輻射噪聲分類CNN的可視化分析基礎(chǔ)上實(shí)施的,其主要目的是提高模型泛化性能,是基于船舶線譜的物理知識(shí)進(jìn)行的人工剪枝。此外,針對(duì)船舶類別的GBP重建樣本可視化表明,剪枝后的CNN模型更加關(guān)注樣本中的線譜信息而相對(duì)忽略干涉條紋等背景信息,從而提升泛化性能。

        2 可視化分析

        2.1 基于導(dǎo)向反向傳播的輸入空間重建

        當(dāng)輸入樣本經(jīng)由神經(jīng)網(wǎng)絡(luò)產(chǎn)生輸出時(shí),信息逐層向前流動(dòng),這一過程稱為前向傳播(Forward Propagation)。相反地,當(dāng)信息在神經(jīng)網(wǎng)絡(luò)中逐層往回流動(dòng)時(shí)稱為反向傳播(Backward Propagation,BP),如模型訓(xùn)練時(shí)采用的梯度BP算法。可以利用BP算法來重建輸入空間:給定輸入x并執(zhí)行前向傳播過程至指定層;令感興趣的神經(jīng)單元的值為1,而該層其余單元的值為0,作為反向傳播的信息;執(zhí)行BP算法直至輸入空間,即是輸入樣本x在指定神經(jīng)元下的重建樣本?;贕BP的輸入空間重建方法[9]通過在信息反傳過程中經(jīng)過ReLU(Rectified Linear Unit)激活單元時(shí)將負(fù)值置零,提升了可視化效果。以下是GBP算法原理。輸入層變量x0前向傳播至指定的第L層得到輸出xL的過程為

        令xL中需要可視化的目標(biāo)單元的值為1,其余值為0,作為重建輸出空間的信息rL,執(zhí)行BP得到輸入空間r0的過程為

        對(duì)于傳統(tǒng)BP算法有

        其中I(·)為指示函數(shù)。那么,對(duì)于傳統(tǒng)BP算法有

        而在GBP算法中,rI+1中的負(fù)值被置零,即

        其中,ReLU(x)=max(0,x)為整流線性單元激活函數(shù)。

        2.2 基于輸入空間優(yōu)化的可視化

        GBP方法有賴于輸入樣本x0=x,而OIS方法則完全基于訓(xùn)練好的模型來重建輸入空間,其思路是尋找輸入樣本x*使得指定層指定神經(jīng)單元的響應(yīng)最大,即

        其中,ai為神經(jīng)網(wǎng)絡(luò)中指定單元i的關(guān)于輸入x的響應(yīng)值。使用梯度下降法求解x*,隨機(jī)初始化x,其迭代表達(dá)式為

        其中η為學(xué)習(xí)率。

        2.3 卷積神經(jīng)網(wǎng)絡(luò)

        2.3.1 輸入特征與CNN模型

        CNN通過卷積層和池化層,實(shí)現(xiàn)逐層提取樣本信息。本文以對(duì)數(shù)譜為輸入[12],構(gòu)建深層CNN用于船舶輻射噪聲分類。對(duì)數(shù)譜是頻率軸使用對(duì)數(shù)坐標(biāo)的功率譜,其優(yōu)點(diǎn)有二:一是放大低頻信息而壓縮高頻信息,二是保留同組諧波線譜在不同基頻下的間距結(jié)構(gòu)特征。一方面,船舶輻射噪聲的目標(biāo)類別信息主要集中于低頻段,特別是低頻線譜中[17]。另一方面,對(duì)數(shù)頻率坐標(biāo)下不同基頻的同一諧波線譜結(jié)構(gòu),契合CNN卷積層對(duì)平移變換的等變性。對(duì)平移變換的等變性是指當(dāng)輸入信號(hào)作平移變換時(shí),其輸出也作相同平移而響應(yīng)值相等。這有助于卷積層中的同一卷積核檢測(cè)相似的輸入特征。

        船舶噪聲記錄數(shù)據(jù)被處理成對(duì)數(shù)譜,然后輸入到CNN中。對(duì)數(shù)譜樣本尺寸為8×512,表示8幀512個(gè)頻點(diǎn),頻率范圍為8~2048 Hz,每倍頻程64個(gè)頻點(diǎn);相鄰幀之間滑動(dòng)時(shí)長(zhǎng)0.5 s。樣本幅值取對(duì)數(shù)后,線性縮放到[0, 1]區(qū)間。構(gòu)建的CNN包含7個(gè)卷積層,其中6個(gè)卷積層緊接最大池化層,卷積層后使用批正則化;網(wǎng)絡(luò)提取出1 024維特征后輸入3層全連接網(wǎng)絡(luò);全連接層使用Dropout(p=0.2)模型正則技術(shù)[18]。模型具體參數(shù)如表1所示,表中Conv2d, MaxPool2d和FC分別指2維卷積層、2維最大池化層、全連接層。

        表1 CNN模型參數(shù)

        2.3.2 數(shù)據(jù)集和模型訓(xùn)練

        DeepShip[13]數(shù)據(jù)集包含來自265艘船舶的609條噪聲記錄。DeepShip數(shù)據(jù)集的船舶輻射噪聲的采集時(shí)間為2016年5月2日至2018年10月4日,采集地點(diǎn)為喬治亞海峽附近海域。數(shù)據(jù)采集點(diǎn)位于太平洋東北海岸最繁忙的航線之一,靠近加拿大溫哥華港口,背景噪聲受到河流流量和潮汐影響,且該地區(qū)海洋生物活動(dòng)頻繁。該地區(qū)海底由淤泥和砂質(zhì)沉積物組成,水深300~400 m。噪聲由單水聽器在深度140~150 m處采集,當(dāng)水聽器2 km半徑范圍內(nèi)只有一艘船舶時(shí)進(jìn)行記錄。因?yàn)閿?shù)據(jù)采集橫跨四季,且包含一天的不同時(shí)段,水文條件變化比較豐富,所以在DeepShip數(shù)據(jù)集上驗(yàn)證分類算法具有一定普適性。船舶被分為4類:貨輪,客輪,油輪和拖船(分別用A, B, C和D指代)。船舶噪聲記錄的時(shí)長(zhǎng)為6秒至25分鐘不等,信號(hào)采樣率為32 kHz。每條噪聲記錄切片為若干對(duì)數(shù)譜樣本。對(duì)每種船舶類別,隨機(jī)選取80%的噪聲記錄作為訓(xùn)練集,20%的噪聲記錄作為測(cè)試集(確保訓(xùn)練集與測(cè)試集中的樣本切片不能來自同一條噪聲記錄,且訓(xùn)練集與測(cè)試集內(nèi)各類船舶樣本占比相等)。數(shù)據(jù)集樣本劃分情況如表2所示。訓(xùn)練時(shí)使用Adam優(yōu)化器,學(xué)習(xí)率設(shè)置為0.000 5;損失函數(shù)為交叉熵;訓(xùn)練批大小為128;迭代訓(xùn)練20輪,得到CNN模型在測(cè)試集上的正確率為69.49%?;谟?xùn)練好的模型進(jìn)行可視化分析研究。

        表2 DeepShip數(shù)據(jù)集樣本劃分

        3 船舶輻射噪聲分類CNN卷積核可視化流程

        3.1 卷積核可視化流程

        圖1和圖2分別為基于GBP和OIS的船舶輻射噪聲CNN卷積核可視化分析流程和各步驟輸出??梢暬鞒贪?個(gè)步驟:

        圖1 基于導(dǎo)向反向傳播(GBP)和輸入空間優(yōu)化(OIS)的船舶輻射噪聲CNN卷積核可視化流程

        (1) 在訓(xùn)練數(shù)據(jù)集中尋找對(duì)指定卷積核響應(yīng)最強(qiáng)的8條噪聲記錄。指定一個(gè)卷積核,訓(xùn)練集中擁有最強(qiáng)響應(yīng)的樣本能反映該卷積核的性質(zhì)。此處以分析第7卷積層(見表1,以下簡(jiǎn)稱Conv7)的卷積核為例。通過前向過程計(jì)算訓(xùn)練集中每個(gè)樣本的Conv7輸出;以同一條噪聲記錄中的樣本為一組,統(tǒng)計(jì)指定卷積核的最大輸出的平均值,計(jì)為該條噪聲記錄對(duì)該卷積核的響應(yīng)值。對(duì)每個(gè)卷積核,排序并可視化響應(yīng)值最大的8條噪聲記錄如圖2(a)所示(樣本切片數(shù)少于50的噪聲記錄不在統(tǒng)計(jì)范圍內(nèi))。

        (2) 對(duì)樣本執(zhí)行前向傳播算法并基于GBP算法重建樣本。對(duì)8條最強(qiáng)響應(yīng)噪聲記錄的樣本切片執(zhí)行前向傳播至Conv7層輸出。Conv7層的特征尺寸為128×1×8,128表示卷積核數(shù)(也稱通道數(shù)),時(shí)間和頻率方向尺寸分別為1和8;對(duì)應(yīng)輸入空間的接受域(receptive field)尺寸為8×192??紤]到Conv7中的池化層,特征中的每個(gè)單元僅是輸入空間8×160區(qū)域單元的響應(yīng)。換言之,Conv7層是作用于輸入的1組共128個(gè)濾波器;每個(gè)濾波器的窗口尺寸是8×160,濾波器沿頻率方向滑動(dòng)步長(zhǎng)為32;得到16個(gè)輸出后,每相鄰2個(gè)輸出取較大值。為了清晰可視化卷積核的最強(qiáng)響應(yīng)輸入,在原噪聲記錄中高亮顯示響應(yīng)區(qū)域如圖2(b)所示。

        初始化一個(gè)與Conv7輸出尺寸一致的張量,設(shè)置指定卷積核的最大響應(yīng)單元處的值為1,其余值為0,此張量即為GBP算法的輸入。根據(jù)式(1)和式(2)執(zhí)行GBP算法的重建樣本如圖2(c)。重建樣本中的非0連通區(qū)即為指定神經(jīng)單元的響應(yīng)區(qū)域。

        (3) 對(duì)各條記錄的GBP重建樣本進(jìn)行多幀特征對(duì)齊并求均值,得到卷積核的GBP可視化結(jié)果。CNN的池化層使得網(wǎng)絡(luò)具有局部平移不變性,即當(dāng)輸入的局部發(fā)生少量平移時(shí)輸出不變。由于CNN的局部平移不變性,濾波器對(duì)響應(yīng)窗口中的輸入特征容忍了一定程度的平移。如圖2(c)中響應(yīng)區(qū)域內(nèi)的諧波線譜基頻變化,線譜結(jié)構(gòu)發(fā)生平移。為了在可視化時(shí)消除這些平移的干擾,本文提出多幀特征對(duì)齊算法(見算法1),將同一噪聲記錄最強(qiáng)響應(yīng)區(qū)域中的各樣本對(duì)齊并求均值,將8條記錄的GBP結(jié)果并列后也進(jìn)行對(duì)齊,結(jié)果如圖2(c)所示。

        (4) 對(duì)8條記錄的響應(yīng)區(qū)間求均值。根據(jù)GBP重建結(jié)果得到輸入樣本的響應(yīng)區(qū)域,截取原樣本的響應(yīng)區(qū)域,對(duì)每條噪聲記錄執(zhí)行多幀特征對(duì)齊并求均值,合并為一個(gè)8×160的矩陣如圖2(d)所示。

        (5) 基于OIS重建輸入空間。根據(jù)指定的Conv7層卷積核,選取處于頻率軸中間的第4個(gè)單元;根據(jù)式(3)和式(4)迭代計(jì)算最優(yōu)的輸入樣本w*使該單元響應(yīng)最大化;截取8×160的響應(yīng)區(qū)域如圖2(e)所示。

        3.2 卷積核可視化結(jié)果

        圖3為卷積核的可視化報(bào)告樣例。前8列是該卷積核的最強(qiáng)響應(yīng)噪聲記錄,及其對(duì)應(yīng)的GBP重建樣本。第1行是原對(duì)數(shù)譜樣本(標(biāo)簽指示噪聲記錄類別和編號(hào)),高亮部分為卷積核的最強(qiáng)響應(yīng)區(qū)域;縱軸為頻率,頻率范圍為8~2 048 Hz,每倍頻程64個(gè)頻點(diǎn);橫軸為時(shí)間。第2行是GBP重建樣本,對(duì)應(yīng)上一行原樣本的高亮部分。除原樣本外,其余子圖的縱軸頻率范圍都是2.5個(gè)倍頻程、共160個(gè)頻點(diǎn)。圖3(a)為8條記錄的響應(yīng)區(qū)域?qū)R后求均值;圖3(c)為響應(yīng)區(qū)域經(jīng)GBP重建后對(duì)齊并求均值;圖3(d)為圖3(c)中8條記錄的平均,其中紅線值為0;圖3(b)為OIS結(jié)果。此卷積核檢測(cè)樣本中的一組諧波線譜,從圖3(c)和圖3(d)看出,此組諧波在2.5個(gè)倍頻程范圍內(nèi)有約20根線譜,其中較強(qiáng)線譜出現(xiàn)在響應(yīng)區(qū)域中段。圖3(b)的OIS結(jié)果也指示在響應(yīng)區(qū)域中段有2根較強(qiáng)線譜。

        圖3 Conv7中一個(gè)卷積核的可視化結(jié)果

        分析Conv7的128個(gè)卷積核可視化結(jié)果,將其歸納為兩類:線譜模式卷積核與背景模式卷積核。線譜模式是指卷積核只檢測(cè)輸入樣本中的線譜信息,包括多根諧波線譜和單根強(qiáng)線譜。背景模式是指卷積核檢測(cè)輸入樣本中的背景特征,包括干涉條紋和連續(xù)譜,這些背景可單獨(dú)出現(xiàn),也會(huì)伴隨線譜出現(xiàn)。圖3展示的即是卷積核檢測(cè)多根諧波線譜的模式。

        圖4集中展示了另外4種典型模式,各分塊含義參照?qǐng)D3,其中僅給出最強(qiáng)一條響應(yīng)噪聲記錄。圖4(a)的GBP卷積核檢測(cè)輸入樣本中的單根強(qiáng)線譜模式。圖4(b)卷積核檢測(cè)干涉條紋模式。需注意,多條記錄GBP對(duì)齊結(jié)果是1根很強(qiáng)亮線時(shí),其模式不一定是單根強(qiáng)線譜模式:如圖4(b)檢測(cè)的是干涉條紋背景。曲線圖中可以看出二者的區(qū)別,圖4(a)中峰值周圍的值在0附近,而圖4(b)中峰值周圍的值則大于0。結(jié)合對(duì)原噪聲記錄響應(yīng)區(qū)域的觀察或OIS的可視化結(jié)果也可區(qū)別圖4(a)與圖4(b)中的模式。圖4(a)的OIS指示響應(yīng)區(qū)域的低頻部分存在一根強(qiáng)線譜,而圖4(b)的OIS區(qū)域中段的亮斑則指示樣本中的非線譜模式。OIS的結(jié)果與GBP有一定的對(duì)應(yīng)關(guān)系,一定程度佐證了選出的8條響應(yīng)噪聲記錄具有代表性,但其本身不具有很強(qiáng)的物理解釋性。圖4(c)是卷積核檢測(cè)樣本中的線譜疊加連續(xù)譜的模式。圖4(d)是卷積核檢測(cè)樣本中高頻端的連續(xù)譜背景。

        圖4 卷積核的4種典型模式

        3.3 針對(duì)類別的GBP重建

        GBP重建也可對(duì)輸出層可視化,即針對(duì)類別可視化。網(wǎng)絡(luò)輸出層向量長(zhǎng)度等于類別數(shù)C。初始化長(zhǎng)度為C的one-hot向量作為GBP重建時(shí)的輸入,指定類別對(duì)應(yīng)位置等于1,其余位置為0。重建過程與可視化隱層單元一致。指定不同的類別相當(dāng)于選擇不同的濾波器,根據(jù)在訓(xùn)練數(shù)據(jù)中習(xí)得類別“知識(shí)”,濾波器輸出樣本中與此類目標(biāo)相關(guān)的特征。

        4 基于卷積核可視化的CNN剪枝

        4.1 剪枝方法

        背景特征往往反映海洋信道的信息,與之相比,船舶輻射噪聲的線譜特征較為穩(wěn)定且更具分辨力。本文根據(jù)可視化結(jié)果,對(duì)CNN網(wǎng)絡(luò)的Conv7層進(jìn)行剪枝,揀選并保留64個(gè)線譜模式卷積核;相應(yīng)地,輸入到后續(xù)全連接層的神經(jīng)單元數(shù)由1 024減少到512。復(fù)制原CNN中前6層網(wǎng)絡(luò)參數(shù)以及選中的64個(gè)卷積核參數(shù);重新隨機(jī)初始化全連接層參數(shù)并進(jìn)行訓(xùn)練。在訓(xùn)練過程中,凍結(jié)卷積層參數(shù),只訓(xùn)練全連接層參數(shù)(改進(jìn)的網(wǎng)絡(luò)記為CNN-L64)。訓(xùn)練迭代50輪,其他訓(xùn)練參數(shù)與前次試驗(yàn)一致。重復(fù)進(jìn)行5次試驗(yàn)。

        設(shè)置4組對(duì)照網(wǎng)絡(luò)模型。(1)CNN-B64:CNN中保留剩下的64個(gè)背景模式卷積核,裁剪掉線譜模式卷積核。需要說明,Conv7的128個(gè)卷積核中人工揀選出共80個(gè)線譜模式卷積核。此處為了對(duì)照試驗(yàn)將128個(gè)卷積核分為互不相交的2組。(2)CNN-128:CNN中保留所有的128個(gè)卷積核,凍結(jié)卷積層參數(shù),重新初始化全連接層。(3)CNN-64:CNN的Conv7為64個(gè)卷積核,所有參數(shù)隨機(jī)初始化后訓(xùn)練70輪。(4)P-CNN-64:利用“排序截短平均算法[19]”去除了對(duì)數(shù)譜中的連續(xù)譜成分,CNN結(jié)構(gòu)及訓(xùn)練過程均與CNN-64相同。排序截短平均算法中滑動(dòng)窗大小為11,排除窗內(nèi)的最大值,剩余10個(gè)頻點(diǎn)的平均功率譜值作為噪聲背景的估計(jì)。

        4.2 試驗(yàn)結(jié)果

        表3是模型平均正確率。雖然4個(gè)模型的訓(xùn)練正確率大體相當(dāng)(其中CNN-L64最低),但是CNNL64的測(cè)試正確率相比CNN-128提高了1.3%,而CNN-B64的測(cè)試正確率則降低了1%。CNN中只保留線譜模式卷積核時(shí),模型分類性能提升;反之則分類性能下降。CNN-64的結(jié)構(gòu)與CNN-B64, CNNL64是相同的,其測(cè)試正確率介于二者之間,等于69.05%。這證明了基于可視化方法挑選卷積核并進(jìn)行剪枝的有效性。雖然P-CNN-64的輸入去除了連續(xù)譜背景,但是其正確率卻低于CNN-64。這表明知識(shí)驅(qū)動(dòng)的傳統(tǒng)算法去除連續(xù)譜背景時(shí)帶來信息損失,其效果取決于算法參數(shù)的選取。而CNN則是基于數(shù)據(jù)驅(qū)動(dòng)隱式地提取功率譜中的有效分類特征。本文方法在數(shù)據(jù)驅(qū)動(dòng)的基礎(chǔ)上,結(jié)合關(guān)于背景和線譜的知識(shí)來提高分類性能。

        表3 各CNN模型分類正確率(%)

        定義樣本的最大線譜強(qiáng)度為樣本中譜值最大的線譜高于背景噪聲的分貝數(shù)(背景噪聲用譜峰左右各5個(gè)頻點(diǎn)的均值估計(jì))。統(tǒng)計(jì)測(cè)試集樣本的最大線譜強(qiáng)度,用16, 8, 4和2分位點(diǎn)將樣本劃分為8組,并計(jì)算各分組下的分類正確率,結(jié)果如表4和圖5所示(各分組的樣本數(shù)分別為546, 545, 1 090, 2 180,2 180, 1 090, 545, 546)。當(dāng)最大線譜強(qiáng)度為15.7~24.6 dB時(shí),CNN-L64的分類正確率都是最高的;當(dāng)最大線譜強(qiáng)度在14.0~15.7 dB時(shí),CNNL64分類正確率僅略低于CNN-128。這表明,當(dāng)最大線譜強(qiáng)度為14.0~24.6 dB時(shí),提出的算法是穩(wěn)健的且具有明顯優(yōu)勢(shì)。而當(dāng)最大線譜低于14.0 dB時(shí)(此部分樣本占比為1/8),5種算法的性能均明顯下降。當(dāng)最大線譜強(qiáng)度高于24.6 dB時(shí)(此部分樣本占比為1/16),5種算法的性能也均出現(xiàn)下降。

        圖5 線譜強(qiáng)度與分類正確率的關(guān)系

        表4 不同最大線譜強(qiáng)度(dB)下CNN模型分類正確率(%)

        圖6中每個(gè)點(diǎn)是同輪數(shù)的正確率均值,每個(gè)模型訓(xùn)練50輪。圖6表明,整個(gè)訓(xùn)練過程中,CNNL64分類性能始終優(yōu)于CNN-128,更優(yōu)于CNNB64。這說明,揀選出來的64個(gè)線譜模式卷積核充分保留了船舶類別信息,而背景模式卷積核則起反作用。圖6中,訓(xùn)練的最后幾輪里CNN-L64的訓(xùn)練正確率提升較慢;而CNN-128和CNN-B64的訓(xùn)練正確率雖然還在提升,但是測(cè)試正確率反而下降,這表明網(wǎng)絡(luò)中的背景模式卷積核過擬合了:CNNB64和CNN-128的訓(xùn)練正確率的提高來源于對(duì)背景信息的過分?jǐn)M合,這對(duì)船舶分類任務(wù)是不利的。從圖6中還可以看出CNN-L64的數(shù)據(jù)點(diǎn)分布更集中,表明CNN-L64的訓(xùn)練過程更加穩(wěn)定,更易收斂??傊?,經(jīng)過剪枝而只保留線譜模式卷積核的CNN-L64,其分類性能提高,訓(xùn)練過程更穩(wěn)定且更不易過擬合。

        圖6 卷積核剪枝前后CNN性能對(duì)比

        4.3 針對(duì)類別的GBP可視化分析

        圖7是3個(gè)模型的針對(duì)船舶類別的GBP重建結(jié)果。輸入的船舶噪聲記錄均來自測(cè)試集。GBP重建時(shí)指定類別為該記錄的真實(shí)類別。第1行為船舶噪聲記錄輸入,第2, 3, 4行分別為3個(gè)模型得到的GBP重建樣本。從圖7看出,CNN主要基于船舶線譜特征進(jìn)行目標(biāo)分類,樣本中較強(qiáng)的干涉條紋會(huì)影響分類器判別,而平滑的連續(xù)譜背景則被CNN忽略。指定不同類別的4維向量作為GBP輸入時(shí),可視化結(jié)果的差異并不顯著,只是GBP重建輸出的幅值大小不同(篇幅限制未給出圖);這表明,Deep-Ship數(shù)據(jù)集中4類船舶的區(qū)分度并不高。如圖7,比較剪枝前后的GBP重建樣本發(fā)現(xiàn),CNN-L64重建樣本中的干涉條紋等背景特征相比CNN-128減弱,而線譜特征特別是無條紋疊加的線譜特征增強(qiáng)了。相反的,CNN-B64重建樣本中的背景特征相比CNN-128增強(qiáng)了,如前所述,這帶來分類器泛化性能的降低。雖然CNN-L64的重建樣本中干涉條紋有所減弱,但是條紋并未完全消除,繼續(xù)裁剪Conv7層或其他層卷積核是否能繼續(xù)帶來性能提升還需進(jìn)一步研究。

        圖7 針對(duì)類別的GBP重建樣本

        5 結(jié)束語(yǔ)

        本文提出基于GBP和OIS的船舶輻射噪聲CNN可視化方法,分析表明船舶輻射噪聲分類CNN的深層卷積核包括線譜和背景兩種模式,它們?cè)诓煌l率位置上分別檢測(cè)輸入樣本中的線譜和背景特征。這兩類特征中,線譜是船舶分類的有效和穩(wěn)健特征,而背景特征則更多反映海洋信道信息。本文基于此知識(shí)提出的卷積核剪枝方法提高了CNN的分類性能。GBP分析表明,改進(jìn)的CNN更加注意樣本中的線譜信息。本文的可視化方法雖然定性解釋了CNN對(duì)船舶輻射噪聲譜分類時(shí)的機(jī)理,但缺少對(duì)卷積核性質(zhì)的定量分析,剪枝時(shí)需人工挑選卷積核,下一步將研究改進(jìn)方法。另外,由于數(shù)據(jù)集的波導(dǎo)條件比較單一,未來將開展更全面的數(shù)據(jù)試驗(yàn)以研究算法的適用條件,以及結(jié)合海洋信道特性改進(jìn)分類算法。

        猜你喜歡
        線譜正確率可視化
        基于CiteSpace的足三里穴研究可視化分析
        UUV慣導(dǎo)系統(tǒng)多線譜振動(dòng)抑制研究
        基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        門診分診服務(wù)態(tài)度與正確率對(duì)護(hù)患關(guān)系的影響
        基于CGAL和OpenGL的海底地形三維可視化
        “融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
        生意
        品管圈活動(dòng)在提高介入手術(shù)安全核查正確率中的應(yīng)用
        生意
        “”維譜在艦船輻射噪聲線譜提取中的應(yīng)用
        日本一级三级在线观看| 国产精品视频牛仔裤一区| 国产精品九九久久一区hh| 日本视频一区二区二区| 久久精品女人av一区二区| 国产精品99精品无码视亚| 国内大量揄拍人妻在线视频| 精品无码人妻久久久一区二区三区 | 亚洲无av码一区二区三区| 色婷婷av一区二区三区久久| 久久久久国产一区二区| 亚洲影院丰满少妇中文字幕无码| 久久色悠悠亚洲综合网 | 久久不见久久见免费影院| 亚洲乱码日产精品bd在线观看| 在线成人tv天堂中文字幕| 国产视频一区2区三区| 日本中国内射bbxx| 色偷偷一区二区无码视频| 无码人妻丰满熟妇区免费| 中文字幕精品一区二区的区别| 国产成+人+综合+亚洲欧美丁香花 欧美真人性野外做爰 | 极品视频一区二区三区在线观看| 91九色人妻精品一区二区三区| 西西大胆午夜人体视频| 亚洲人成精品久久久久| 美女把内衣内裤脱了给男人舔| 亚洲爆乳无码精品aaa片蜜桃 | 欧美性猛交xxxx乱大交丰满| 久久婷婷国产综合精品| 白白色发布会在线观看免费| 最新精品国偷自产在线| 国产精品毛片久久久久久l| 国产激情视频高清在线免费观看| 亚洲精品国精品久久99热| 天码av无码一区二区三区四区 | 国产农村乱辈无码| 99热成人精品国产免国语的| 亚洲性感毛片在线视频| 亚洲欧美色一区二区三区| 国产在线手机视频|