亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)提升光譜分類性能研究

        2022-03-14 02:01:46劉忠寶
        光譜學(xué)與光譜分析 2022年3期
        關(guān)鍵詞:集上特征向量恒星

        劉忠寶,王 杰

        1.北京語(yǔ)言大學(xué)信息科學(xué)學(xué)院,北京 100083 2.中國(guó)科學(xué)院新疆天文臺(tái),新疆 烏魯木齊 830011

        引 言

        隨著海量光譜數(shù)據(jù)的不斷涌入,如何進(jìn)一步提高光譜分類性能引入廣泛關(guān)注。目前,國(guó)內(nèi)外有關(guān)恒星光譜分類的研究已有不少成果。Daniel等探討了降維技術(shù)在恒星光譜分類中的有效性問(wèn)題,他們引入局部線性嵌入技術(shù),通過(guò)保持高維光譜數(shù)據(jù)在低維空間的局部結(jié)構(gòu),進(jìn)而實(shí)現(xiàn)恒星光譜的自動(dòng)分類[1]。Navarro等利用人工神經(jīng)網(wǎng)絡(luò)對(duì)低信噪比的恒星光譜進(jìn)行分類[2]。Sanchez等試圖利用k-均值聚類算法對(duì)SDSS SEGUE和SEGUE-2恒星光譜進(jìn)行無(wú)監(jiān)督分類[3]。鑒于傳統(tǒng)分類方法具有較高的時(shí)間復(fù)雜度問(wèn)題,Liu等受協(xié)同管理思想啟發(fā),提出非線性集成學(xué)習(xí)機(jī),并將該模型應(yīng)用于恒星光譜分類[4]。Huertas-Company等在支持向量機(jī)的基礎(chǔ)上提出一種確定星系形態(tài)的非參數(shù)方法[5];Peng等利用支持向量機(jī)從SDSS、UKIDSS等巡天項(xiàng)目獲得的光譜中搜尋類星體候選體[6];Malek等在VIPERS數(shù)據(jù)集上利用SVM來(lái)將恒星、活動(dòng)星系核和星系區(qū)分開來(lái)[7];Brice等在SDSS數(shù)據(jù)集上利用K近鄰算法和隨機(jī)森林算法進(jìn)行對(duì)恒星光譜進(jìn)行分類[8]。

        此外,越來(lái)越多的研究人員將深度學(xué)習(xí)模型用于解決恒星光譜分類問(wèn)題。Liu等研究了基于一維卷積神經(jīng)網(wǎng)絡(luò)的恒星光譜分類方法[9]。王楠楠等探討了卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于恒星光譜分類的可行性問(wèn)題[10]。盡管實(shí)驗(yàn)結(jié)果表明上述模型較之傳統(tǒng)機(jī)器學(xué)習(xí)算法具有更優(yōu)的分類效率,然而受其工作機(jī)理限制,該模型在特征提取以及特征理解方面仍存在一定差距,嚴(yán)重影響了該模型分類效率的進(jìn)一步提升。幸運(yùn)的是,BERT(bidirectional encoder representation from transformers)模型的出現(xiàn)為解決上述問(wèn)題提供了可能。鑒于此,本工作提出高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN,試圖充分利用BERT模型和CNN模型在特征提取和自動(dòng)分類方面的優(yōu)勢(shì),以期進(jìn)一步提高光譜分類性能。

        1 高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN

        BERT-CNN模型如圖1所示。該模型的工作流程為:首先,將恒星光譜數(shù)據(jù)依次輸入BERT模型;然后,利用BERT模型中的Transformer(圖1簡(jiǎn)寫為Trm)進(jìn)行特征提取,得到特征向量T1—TN;最后,在CNN模型中輸入上述特征向量并自動(dòng)分類,進(jìn)而得到恒星光譜的分類結(jié)果。

        圖1 BERT-CNN模型Fig.1 The structure of BERT-CNN

        (1)BERT模型

        BERT模型采用了多層雙向Transformer編碼器,能夠更好地提取恒星光譜數(shù)據(jù)的深層次特征。Transformer編碼器(以下簡(jiǎn)稱Transformer)是BERT模型最重要的部分,其主要由多頭自注意力機(jī)制和全連接前饋神經(jīng)網(wǎng)絡(luò)層兩個(gè)子層組成。為了解決隨著網(wǎng)絡(luò)的加深而產(chǎn)生的性能退化等問(wèn)題,Transformer在兩個(gè)子層間加入了殘差網(wǎng)絡(luò),并在每個(gè)子層后添加歸一化層來(lái)加速模型收斂。

        Transformer基于自注意力機(jī)制,該機(jī)制更易捕獲光譜特征之間的內(nèi)在關(guān)系。其計(jì)算過(guò)程見式(1),其中Q和K為維度為dk的Query矩陣和Key矩陣,V為維度為dv的Value矩陣。

        (1)

        MultiHead(Q,K,V)=Concat(head1,…,headh)Wo

        (2)

        (3)

        層歸一化與前饋神經(jīng)網(wǎng)絡(luò)的計(jì)算過(guò)程見式(4)和式(5)。

        (4)

        FFN(x)=max(0,xW1+b1)W2+b2

        (5)

        式(4)中,μ和σ為輸入層的均值與方差,α和β為待學(xué)習(xí)的參數(shù),ε的取值很小;式(5)中,前饋神經(jīng)網(wǎng)絡(luò)層以修正線性單元ReLU作為激活函數(shù),x表示網(wǎng)絡(luò)的輸入,W和b為待訓(xùn)練的參數(shù)。

        (2)卷積神經(jīng)網(wǎng)絡(luò)

        CNN模型由輸入層、卷積層、池化層以及全連接層組成。輸入層為恒星光譜矩陣,矩陣中的每一行向量對(duì)應(yīng)一條恒星光譜。卷積層對(duì)輸入向量進(jìn)行卷積操作,進(jìn)而生成特征向量。卷積計(jì)算見式(6)和式(7),其中l(wèi)為CNN的網(wǎng)絡(luò)層數(shù),j為特征圖,k為卷積核,bC為偏置,Nj為特征向量集合,ReLU為激活函數(shù)。

        (6)

        (7)

        池化層的作用是壓縮特征向量的規(guī)模,以期達(dá)到降低特征向量維度、減少參數(shù)規(guī)模的目的。該層經(jīng)過(guò)最大池化方法保存局部信息,以期得到池化后的特征向量。在全連接層,將池化后的特征向量進(jìn)行整合,最后通過(guò)softmax分類器獲得分類結(jié)果。softmax分類器的表達(dá)式見式(8)。

        (8)

        2 實(shí)驗(yàn)部分

        將Python3.7作為的編程語(yǔ)言,并使用TensorFlow1.14作為深度學(xué)習(xí)模型框架。實(shí)驗(yàn)數(shù)據(jù)集為SDSS DR10中的K型、F型、G型恒星光譜數(shù)據(jù),如表1(a)—(c)所示。K型恒星包含K1,K3,K5和K7次型,而這四種次型光譜的信噪比(signal noise ratio,SNR)區(qū)間均是(60,65);F型光譜包括F2,F(xiàn)5和F9次型,其各次型光譜的信噪比區(qū)間分別為(50,65),(65,70),(75,80);G型光譜包括G0,G2和G5次型,其各次型信噪比區(qū)間為(55,65),(60,65),(40,70)。

        表1(a) K型恒星光譜數(shù)據(jù)集Table 1(a) The dataset of K stars

        表1(b) F型恒星光譜數(shù)據(jù)集Table 1(b) The dataset of F stars

        表1(c) G型恒星光譜數(shù)據(jù)集Table 1(c) The dataset of G stars

        采用min-max標(biāo)準(zhǔn)化方法對(duì)恒星光譜數(shù)據(jù)進(jìn)行歸一化處理,該方法通過(guò)對(duì)恒星光譜數(shù)據(jù)進(jìn)行線性變換,使原始光譜數(shù)據(jù)保持在[0,1]區(qū)間。其計(jì)算公式為

        其中,xNorm表示恒星光譜數(shù)據(jù)歸一化后的特征值,x表示原始恒星光譜數(shù)據(jù),xmax和xmin分別表示每條恒星光譜數(shù)據(jù)的最大值和最小值。

        通過(guò)與SVM、CNN等分類模型的比較來(lái)驗(yàn)證所提模型的有效性。引入網(wǎng)格搜索以及10折交叉驗(yàn)證來(lái)得到模型的實(shí)驗(yàn)參數(shù)。在SVM模型中,在網(wǎng)格{0.01,0.05,0.1,0.5,1,5,10}中搜索懲罰因子的最優(yōu)取值,多次實(shí)驗(yàn)表明,當(dāng)懲罰因子等于0.1時(shí),模型的性能最優(yōu)。在CNN模型和BERT+CNN混合模型中,batch_size表示一次訓(xùn)練選取的樣本數(shù),learning_rate表示模型的學(xué)習(xí)率大小,兩者均在網(wǎng)格{1×10-2,1×10-3,5×10-4,1×10-4,5×10-5,2×10-5,1×10-5}中選?。籬idden_units表示隱藏層神經(jīng)元數(shù),在網(wǎng)格{64,128,256,512,1 024}中選??;dropout為丟棄率,在網(wǎng)格{0.1,0.2,0.4,0.5,0.6,0.8}中選取。表2給出了CNN、BERT-CNN等模型的實(shí)驗(yàn)參數(shù)設(shè)置。

        表2 CNN,BERT-CNN模型參數(shù)設(shè)置表Figure 2 The parameters of CNN and BERT-CNN

        當(dāng)訓(xùn)練數(shù)據(jù)集占比實(shí)驗(yàn)數(shù)據(jù)集的30%~70%且剩余數(shù)據(jù)集為測(cè)試數(shù)據(jù)集時(shí),BERT-CNN模型的實(shí)驗(yàn)結(jié)果如表3(a)—(c)所示,其中括號(hào)前的值表示實(shí)驗(yàn)數(shù)據(jù)規(guī)模,括號(hào)中的值表示占比。

        由表3(a)—(c)可以看出,BERT-CNN模型的精準(zhǔn)率P、召回率R、調(diào)和平均值F1隨訓(xùn)練樣本數(shù)的增加而提升。在相同規(guī)模的訓(xùn)練樣本條件下,BERT-CNN模型在K型數(shù)據(jù)集上的P,R和F1值均最高,其次是G型數(shù)據(jù)集,F(xiàn)型數(shù)據(jù)集上的分類效果較差。當(dāng)訓(xùn)練樣本數(shù)占比大于等于50%時(shí),三類數(shù)據(jù)集上的P,R和F1值均超過(guò)0.91,這表明BERT-CNN模型適用于解決恒星光譜分類問(wèn)題。

        表3(a) BERT-CNN模型在K型恒星數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 3(a) The experimental results of BERT-CNN on the K-type dataset

        表3(b) BERT-CNN模型在F型恒星數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 3(b) The experimental results of BERT-CNN on the F-type dataset

        表3(c) BERT-CNN模型在G型恒星數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果Table 3(c) The experimental results of BERT-CNN on the G-type dataset

        三類模型的對(duì)比實(shí)驗(yàn)結(jié)果由準(zhǔn)確率A來(lái)評(píng)價(jià),準(zhǔn)確率是正確分類光譜數(shù)與總體測(cè)試光譜數(shù)的比值。實(shí)驗(yàn)數(shù)據(jù)集的70%作為訓(xùn)練數(shù)據(jù)集,剩余數(shù)據(jù)集作為測(cè)試數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果如表4所示。

        表4 實(shí)驗(yàn)結(jié)果比較Table 4 Comparison of experimental results

        由表4可以看出,BERT-CNN模型分類效果最優(yōu),其次是CNN模型,最后是SVM模型。具體而言,在K型數(shù)據(jù)集上,BERT-CNN模型比SVM模型的準(zhǔn)確率高0.081 3,比CNN模型高0.050 4;在F型數(shù)據(jù)集上,BERT-CNN模型比SVM模型的準(zhǔn)確率高0.079 4,比CNN模型高0.021 5;在G型數(shù)據(jù)集上,BERT-CNN模型比SVM模型的準(zhǔn)確率高0.052 5,比CNN模型高0.019 7。此外,BERT-CNN模型的平均準(zhǔn)確率均最高。這表明,BERT-CNN模型具有更優(yōu)的光譜分類性能。

        3 結(jié) 論

        為了進(jìn)一步提高以CNN模型為代表的深度學(xué)習(xí)模型恒星光譜分類效率,以恒星光譜為研究對(duì)象,充分利用BERT模型和CNN模型在特征提取和自動(dòng)分類方面的優(yōu)勢(shì),提出高性能混合深度學(xué)習(xí)網(wǎng)絡(luò)BERT-CNN。SDSS數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,所提模型有助于提升恒星光譜分類性能。上述結(jié)論在其他類型光譜上是否成立有待于進(jìn)一步研究。

        猜你喜歡
        集上特征向量恒星
        二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
        克羅內(nèi)克積的特征向量
        (18)刺殺恒星
        Cookie-Cutter集上的Gibbs測(cè)度
        鏈完備偏序集上廣義向量均衡問(wèn)題解映射的保序性
        恒星的演化
        恒星不恒
        奧秘(2018年10期)2018-10-25 05:38:56
        一類特殊矩陣特征向量的求法
        復(fù)扇形指標(biāo)集上的分布混沌
        EXCEL表格計(jì)算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
        a级毛片成人网站免费看| 丝袜美腿诱惑区在线播放| av日韩高清一区二区| 97日日碰曰曰摸日日澡| 亚洲成成品网站源码中国有限公司| 国产国拍亚洲精品福利| 久久婷婷综合激情亚洲狠狠| 午夜亚洲精品视频在线| 亚洲地区一区二区三区| 国产高清在线91福利| 精品日本一区二区视频| 看大陆男女真人草逼视频| 国产精品女主播福利在线| 国产午夜鲁丝片av无码| 国产91网| 中文字幕人成乱码中文| 九九综合va免费看| 国产成人综合亚洲精品| 亚洲三级在线播放| 美女被内射中出在线观看 | 麻豆成人精品国产免费| 亚洲色婷婷免费视频高清在线观看| 国产亚洲亚洲精品视频| 亚洲免费国产中文字幕久久久 | 亚洲综合网国产精品一区| 麻豆果冻传媒在线观看| 麻豆变态另类视频在线观看| 国产日本精品一区二区| 公与淑婷厨房猛烈进出| 日产无人区一线二线三线新版| 无码精品国产午夜| 国产一区二区三区在线大屁股| 中文字幕乱码亚洲精品一区| 亚洲欧美日韩中文在线制服| 岛国熟女一区二区三区| 中文字幕有码在线亚洲| 三级全黄的视频在线观看| 精品人妻无码视频中文字幕一区二区三区| 性色av手机在线观看| 欧美午夜理伦三级在线观看| 国产精品麻豆欧美日韩ww|