亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

利用高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)提升光譜分類性能研究

2022-03-14 02:01:46劉忠寶

光譜學(xué)與光譜分析 2022年3期

劉忠寶,王杰

1.北京語(yǔ)言大學(xué)信息科學(xué)學(xué)院，北京 100083 2.中國(guó)科學(xué)院新疆天文臺(tái)，新疆烏魯木齊 830011

引言

隨著海量光譜數(shù)據(jù)的不斷涌入，如何進(jìn)一步提高光譜分類性能引入廣泛關(guān)注。目前，國(guó)內(nèi)外有關(guān)恒星光譜分類的研究已有不少成果。Daniel等探討了降維技術(shù)在恒星光譜分類中的有效性問(wèn)題，他們引入局部線性嵌入技術(shù)，通過(guò)保持高維光譜數(shù)據(jù)在低維空間的局部結(jié)構(gòu)，進(jìn)而實(shí)現(xiàn)恒星光譜的自動(dòng)分類[1]。Navarro等利用人工神經(jīng)網(wǎng)絡(luò)對(duì)低信噪比的恒星光譜進(jìn)行分類[2]。Sanchez等試圖利用k-均值聚類算法對(duì)SDSS SEGUE和SEGUE-2恒星光譜進(jìn)行無(wú)監(jiān)督分類[3]。鑒于傳統(tǒng)分類方法具有較高的時(shí)間復(fù)雜度問(wèn)題，Liu等受協(xié)同管理思想啟發(fā)，提出非線性集成學(xué)習(xí)機(jī)，并將該模型應(yīng)用于恒星光譜分類[4]。Huertas-Company等在支持向量機(jī)的基礎(chǔ)上提出一種確定星系形態(tài)的非參數(shù)方法[5]；Peng等利用支持向量機(jī)從SDSS、UKIDSS等巡天項(xiàng)目獲得的光譜中搜尋類星體候選體[6]；Malek等在VIPERS數(shù)據(jù)集上利用SVM來(lái)將恒星、活動(dòng)星系核和星系區(qū)分開來(lái)[7]；Brice等在SDSS數(shù)據(jù)集上利用K近鄰算法和隨機(jī)森林算法進(jìn)行對(duì)恒星光譜進(jìn)行分類[8]。

此外，越來(lái)越多的研究人員將深度學(xué)習(xí)模型用于解決恒星光譜分類問(wèn)題。Liu等研究了基于一維卷積神經(jīng)網(wǎng)絡(luò)的恒星光譜分類方法[9]。王楠楠等探討了卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于恒星光譜分類的可行性問(wèn)題[10]。盡管實(shí)驗(yàn)結(jié)果表明上述模型較之傳統(tǒng)機(jī)器學(xué)習(xí)算法具有更優(yōu)的分類效率，然而受其工作機(jī)理限制，該模型在特征提取以及特征理解方面仍存在一定差距，嚴(yán)重影響了該模型分類效率的進(jìn)一步提升。幸運(yùn)的是，BERT(bidirectional encoder representation from transformers)模型的出現(xiàn)為解決上述問(wèn)題提供了可能。鑒于此，本工作提出高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN，試圖充分利用BERT模型和CNN模型在特征提取和自動(dòng)分類方面的優(yōu)勢(shì)，以期進(jìn)一步提高光譜分類性能。

1 高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN

BERT-CNN模型如圖1所示。該模型的工作流程為：首先，將恒星光譜數(shù)據(jù)依次輸入BERT模型；然后，利用BERT模型中的Transformer(圖1簡(jiǎn)寫為Trm)進(jìn)行特征提取，得到特征向量T1—TN；最后，在CNN模型中輸入上述特征向量并自動(dòng)分類，進(jìn)而得到恒星光譜的分類結(jié)果。

圖1 BERT-CNN模型Fig.1 The structure of BERT-CNN

(1)BERT模型

BERT模型采用了多層雙向Transformer編碼器，能夠更好地提取恒星光譜數(shù)據(jù)的深層次特征。Transformer編碼器(以下簡(jiǎn)稱Transformer)是BERT模型最重要的部分，其主要由多頭自注意力機(jī)制和全連接前饋神經(jīng)網(wǎng)絡(luò)層兩個(gè)子層組成。為了解決隨著網(wǎng)絡(luò)的加深而產(chǎn)生的性能退化等問(wèn)題，Transformer在兩個(gè)子層間加入了殘差網(wǎng)絡(luò)，并在每個(gè)子層后添加歸一化層來(lái)加速模型收斂。

Transformer基于自注意力機(jī)制，該機(jī)制更易捕獲光譜特征之間的內(nèi)在關(guān)系。其計(jì)算過(guò)程見式(1)，其中Q和K為維度為dk的Query矩陣和Key矩陣，V為維度為dv的Value矩陣。

(1)

MultiHead(Q,K,V)=Concat(head1,…,headh)Wo

(2)

(3)

層歸一化與前饋神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程見式(4)和式(5)。

(4)

FFN(x)=max(0,xW1+b1)W2+b2

(5)

式(4)中，μ和σ為輸入層的均值與方差，α和β為待學(xué)習(xí)的參數(shù)，ε的取值很小；式(5)中，前饋神經(jīng)網(wǎng)絡(luò)層以修正線性單元ReLU作為激活函數(shù)，x表示網(wǎng)絡(luò)的輸入，W和b為待訓(xùn)練的參數(shù)。

(2)卷積神經(jīng)網(wǎng)絡(luò)

CNN模型由輸入層、卷積層、池化層以及全連接層組成。輸入層為恒星光譜矩陣，矩陣中的每一行向量對(duì)應(yīng)一條恒星光譜。卷積層對(duì)輸入向量進(jìn)行卷積操作，進(jìn)而生成特征向量。卷積計(jì)算見式(6)和式(7)，其中l(wèi)為CNN的網(wǎng)絡(luò)層數(shù)，j為特征圖，k為卷積核，bC為偏置，Nj為特征向量集合，ReLU為激活函數(shù)。

(6)

(7)

池化層的作用是壓縮特征向量的規(guī)模，以期達(dá)到降低特征向量維度、減少參數(shù)規(guī)模的目的。該層經(jīng)過(guò)最大池化方法保存局部信息，以期得到池化后的特征向量。在全連接層，將池化后的特征向量進(jìn)行整合，最后通過(guò)softmax分類器獲得分類結(jié)果。softmax分類器的表達(dá)式見式(8)。

(8)

2 實(shí)驗(yàn)部分

將Python3.7作為的編程語(yǔ)言，并使用TensorFlow1.14作為深度學(xué)習(xí)模型框架。實(shí)驗(yàn)數(shù)據(jù)集為SDSS DR10中的K型、F型、G型恒星光譜數(shù)據(jù)，如表1(a)—(c)所示。K型恒星包含K1，K3，K5和K7次型，而這四種次型光譜的信噪比(signal noise ratio,SNR)區(qū)間均是(60,65)；F型光譜包括F2，F(xiàn)5和F9次型，其各次型光譜的信噪比區(qū)間分別為(50,65)，(65,70)，(75,80)；G型光譜包括G0，G2和G5次型，其各次型信噪比區(qū)間為(55,65)，(60,65)，(40,70)。

表1(a) K型恒星光譜數(shù)據(jù)集Table 1(a) The dataset of K stars

表1(b) F型恒星光譜數(shù)據(jù)集Table 1(b) The dataset of F stars

表1(c) G型恒星光譜數(shù)據(jù)集Table 1(c) The dataset of G stars

采用min-max標(biāo)準(zhǔn)化方法對(duì)恒星光譜數(shù)據(jù)進(jìn)行歸一化處理，該方法通過(guò)對(duì)恒星光譜數(shù)據(jù)進(jìn)行線性變換，使原始光譜數(shù)據(jù)保持在[0,1]區(qū)間。其計(jì)算公式為

其中，xNorm表示恒星光譜數(shù)據(jù)歸一化后的特征值，x表示原始恒星光譜數(shù)據(jù)，xmax和xmin分別表示每條恒星光譜數(shù)據(jù)的最大值和最小值。

通過(guò)與SVM、CNN等分類模型的比較來(lái)驗(yàn)證所提模型的有效性。引入網(wǎng)格搜索以及10折交叉驗(yàn)證來(lái)得到模型的實(shí)驗(yàn)參數(shù)。在SVM模型中，在網(wǎng)格{0.01,0.05,0.1,0.5,1,5,10}中搜索懲罰因子的最優(yōu)取值，多次實(shí)驗(yàn)表明，當(dāng)懲罰因子等于0.1時(shí)，模型的性能最優(yōu)。在CNN模型和BERT+CNN混合模型中，batch_size表示一次訓(xùn)練選取的樣本數(shù)，learning_rate表示模型的學(xué)習(xí)率大小，兩者均在網(wǎng)格{1×10-2,1×10-3,5×10-4,1×10-4,5×10-5,2×10-5,1×10-5}中選?。籬idden_units表示隱藏層神經(jīng)元數(shù)，在網(wǎng)格{64,128,256,512,1 024}中選??；dropout為丟棄率，在網(wǎng)格{0.1,0.2,0.4,0.5,0.6,0.8}中選取。表2給出了CNN、BERT-CNN等模型的實(shí)驗(yàn)參數(shù)設(shè)置。

表2 CNN，BERT-CNN模型參數(shù)設(shè)置表Figure 2 The parameters of CNN and BERT-CNN

當(dāng)訓(xùn)練數(shù)據(jù)集占比實(shí)驗(yàn)數(shù)據(jù)集的30%～70%且剩余數(shù)據(jù)集為測(cè)試數(shù)據(jù)集時(shí)，BERT-CNN模型的實(shí)驗(yàn)結(jié)果如表3(a)—(c)所示，其中括號(hào)前的值表示實(shí)驗(yàn)數(shù)據(jù)規(guī)模，括號(hào)中的值表示占比。

由表3(a)—(c)可以看出，BERT-CNN模型的精準(zhǔn)率P、召回率R、調(diào)和平均值F1隨訓(xùn)練樣本數(shù)的增加而提升。在相同規(guī)模的訓(xùn)練樣本條件下，BERT-CNN模型在K型數(shù)據(jù)集上的P，R和F1值均最高，其次是G型數(shù)據(jù)集，F(xiàn)型數(shù)據(jù)集上的分類效果較差。當(dāng)訓(xùn)練樣本數(shù)占比大于等于50%時(shí)，三類數(shù)據(jù)集上的P，R和F1值均超過(guò)0.91，這表明BERT-CNN模型適用于解決恒星光譜分類問(wèn)題。

表3(a) BERT-CNN模型在K型恒星數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 3(a) The experimental results of BERT-CNN on the K-type dataset

表3(b) BERT-CNN模型在F型恒星數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 3(b) The experimental results of BERT-CNN on the F-type dataset

表3(c) BERT-CNN模型在G型恒星數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 3(c) The experimental results of BERT-CNN on the G-type dataset

三類模型的對(duì)比實(shí)驗(yàn)結(jié)果由準(zhǔn)確率A來(lái)評(píng)價(jià)，準(zhǔn)確率是正確分類光譜數(shù)與總體測(cè)試光譜數(shù)的比值。實(shí)驗(yàn)數(shù)據(jù)集的70%作為訓(xùn)練數(shù)據(jù)集，剩余數(shù)據(jù)集作為測(cè)試數(shù)據(jù)集，實(shí)驗(yàn)結(jié)果如表4所示。

表4 實(shí)驗(yàn)結(jié)果比較Table 4 Comparison of experimental results

由表4可以看出，BERT-CNN模型分類效果最優(yōu)，其次是CNN模型，最后是SVM模型。具體而言，在K型數(shù)據(jù)集上，BERT-CNN模型比SVM模型的準(zhǔn)確率高0.081 3，比CNN模型高0.050 4；在F型數(shù)據(jù)集上，BERT-CNN模型比SVM模型的準(zhǔn)確率高0.079 4，比CNN模型高0.021 5；在G型數(shù)據(jù)集上，BERT-CNN模型比SVM模型的準(zhǔn)確率高0.052 5，比CNN模型高0.019 7。此外，BERT-CNN模型的平均準(zhǔn)確率均最高。這表明，BERT-CNN模型具有更優(yōu)的光譜分類性能。

3 結(jié) 論

為了進(jìn)一步提高以CNN模型為代表的深度學(xué)習(xí)模型恒星光譜分類效率，以恒星光譜為研究對(duì)象，充分利用BERT模型和CNN模型在特征提取和自動(dòng)分類方面的優(yōu)勢(shì)，提出高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN。SDSS數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明，所提模型有助于提升恒星光譜分類性能。上述結(jié)論在其他類型光譜上是否成立有待于進(jìn)一步研究。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

利用高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)提升光譜分類性能研究

引 言

1 高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN

2 實(shí)驗(yàn)部分

3 結(jié) 論

引言