亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種星系形態(tài)分類的新方法

        2022-07-18 00:56:48王林倩羅阿理逯亞坤郭小雨
        天文研究與技術(shù) 2022年4期
        關鍵詞:星系透鏡準確率

        王林倩,邱 波*,羅阿理,孔 嘯,逯亞坤,郭小雨

        (1. 河北工業(yè)大學,天津 300401;2. 中國科學院國家天文臺,北京 100101)

        隨著天文觀測儀器的發(fā)展和觀測技術(shù)的進步,大型數(shù)字巡天計劃如斯隆數(shù)字巡天(Sloan Digital Sky Survey, SDSS)[1],COSMOS巡天(Cosmic Evolution Survey, COSMOS)[2],大口徑全天巡視望遠鏡(Large Synoptic Survey Telescope, LSST)[3]等逐步實施,星系觀測數(shù)據(jù)呈現(xiàn)爆炸式增長的趨勢。

        星系是眾多天體中的一類,主要由恒星、恒星遺骸、星際氣體、塵埃和暗物質(zhì)等組成,并受引力綁定。星系的形態(tài)與星系的形成、演化有著密切的聯(lián)系,是探究星系物理的重要參數(shù)。隨著機器學習和深度學習在各個領域的應用,星系形態(tài)的自動分類方法也迅速發(fā)展。文[4]用多個支持向量機(Support Vector Machine, SVM)對星系形態(tài)進行螺旋星系、橢圓星系和不規(guī)則星系的分類,最高分類準確率為96.8%。文[5]以5萬多幅星系圖片為訓練集,經(jīng)過100多次的嘗試,首次提出用卷積神經(jīng)網(wǎng)絡進行模型訓練,最終以均方根為0.074 92獲得了 “銀河動物園挑戰(zhàn)賽” 的冠軍。文[6]利用SDSS DR12中17 344幅恒星和47 656幅星系圖像,提出一個類似視覺幾何組(Visual Geometry Group, VGG)的11層深度卷積神經(jīng)網(wǎng)絡,實現(xiàn)了對恒星、星系的分類,測試集的準確率分別達到99.52%和99.48%。文[7]對來自EFIGI目錄的旋渦星系、橢圓星系、透鏡星系和不規(guī)則星系進行分類,提取星系圖像的顏色特征、紋理特征和形狀特征,并用二進制正弦余弦算法選擇最相關的特征,最后用K最鄰近(K-Nearest Neighbor, KNN)方法對4類星系分類的準確率分別為97.43%,100%,79.48%和100%,平均分類準確率為94.2%。文[8]提出了一種星系形態(tài)的分類網(wǎng)絡daMCOGCNN,該方法對不規(guī)則星系進行了數(shù)據(jù)增強,使用不同的激活函數(shù)構(gòu)建卷積神經(jīng)網(wǎng)絡,橢圓星系、旋渦星系和不規(guī)則星系分類準確率達到97%。文[9]結(jié)合數(shù)據(jù)增強技術(shù)和深度學習方法實現(xiàn)了對透鏡星系、橢圓星系和旋渦星系的分類,此模型的分類準確率達到90.2%,驗證準確率達到88.3%。文[10]提取星系圖像的非冗余色彩特征,并提出一種尋找最優(yōu)特征子集的方法,最后利用極端機器學習(Extreme Machine Learning, EML)對橢圓星系、旋渦星系、透鏡星系和不規(guī)則星系進行分類,總體分類準確率達到98%。

        然而,目前對于星系形態(tài)分類研究領域還存在分類類別少、分類樣本類間比例失衡等問題,此前研究多是對橢圓星系、渦旋星系、透鏡星系進行二分類或三分類。面對更多類型的星系形態(tài)數(shù)據(jù),當前的分類方法準確率比較低,因此迫切需要一種能準確區(qū)分更多星系形態(tài)的方法。我們的目標是找到一種方法能夠?qū)崿F(xiàn)旋渦星系、橢圓星系、透鏡星系以及不規(guī)則星系自動分類,甚至可以實現(xiàn)不同數(shù)據(jù)庫中4類不同形態(tài)星系的自動分類。如圖1,本文對來自不同數(shù)據(jù)庫中的星系圖像進行裁剪和下采樣,從而剔除質(zhì)量差的數(shù)據(jù),同時對數(shù)據(jù)進行去噪和增強,減小圖像噪聲和樣本類間比例失衡對分類模型的影響。之后我們提出了一種更高效的星系形態(tài)自動分類網(wǎng)絡GMC-net,回避了圖像特征提取和選擇、分類器選擇這些難題,從而實現(xiàn)了4類不同形態(tài)星系的高效分類。

        圖1 星系形態(tài)分類整體流程圖

        1 數(shù) 據(jù)

        本文主要使用SDSS DR16,Galaxy Zoo2和EFIGI目錄的數(shù)據(jù)。3個數(shù)據(jù)庫的測光數(shù)據(jù)都來源于斯隆數(shù)字巡天[11]。斯隆數(shù)字巡天得到的原始數(shù)據(jù)為u,g,r,i和z波段數(shù)據(jù),但u和z波段多是近紫外和近紅外波段,且包含的有用信息非常少。g,r和i波段數(shù)據(jù)已經(jīng)足夠還原比較真實的星系圖像,所以當前相關研究一般采用g,r和i波段數(shù)據(jù)合成的圖像[12-13]。

        1.1 數(shù)據(jù)獲取

        EFIGI目錄[14]中的測光和光譜數(shù)據(jù)是從SDSS DR5目錄獲得的,目錄中星系按形態(tài)主要分為橢圓形、透鏡狀、旋渦形、不規(guī)則形和矮形(Dwarf),這5類又分為不同的子類。利用星系形態(tài)參數(shù)T(T∈[-6, 11],T為整數(shù),分別代表不同形態(tài)星系的類型)可以篩選不同形態(tài)的星系,表1展示了各類星系的選擇標準,最終從EFIGI目錄獲得920幅旋渦星系、289幅橢圓星系、531幅透鏡星系和248幅不規(guī)則星系的圖像。

        星系動物園(Galaxy Zoo2)[15]包括11個任務和37個響應,同一個樣本超過20人對其分類才會統(tǒng)計,文[15]給出每個分類任務干凈樣本閾值范圍以及11個具體分類任務,為保證所選樣本更準確,此次設置的閾值均大于建議閾值,表1注釋部分對各個參數(shù)閾值設置進行了詳細解釋,最終在Galaxy Zoo2獲得3 095幅旋渦星系、4 208幅橢圓星系、1 805幅透鏡星系以及235幅不規(guī)則星系。

        本文采用最新發(fā)布的SDSS DR16[16]測光數(shù)據(jù),該數(shù)據(jù)星表可以在CasJobs[17]中通過星系specObjID與Galaxy星表交叉得到相應星系的赤經(jīng)和赤緯。除了表1所述的主要查詢標準限制,還有如下設置:所有圖像設置紅移下限為0.001、紅移上限為0.025,通量下限為50、通量上限為500及0.01的圖像縮放因子,設置提取前2 000個數(shù)據(jù)。目前不規(guī)則星系物理條件的限制未知,因此未得到不規(guī)則星系。DR16中各類星系數(shù)量分布不均,在此人工篩選去除了雙重的、合并的以及包含許多未知對象的圖像,最終得到913幅旋渦星系、1 956幅橢圓星系和805幅透鏡星系的圖像。

        表1 星系數(shù)據(jù)選擇標準

        1.2 星系圖像預處理

        卷積神經(jīng)網(wǎng)絡對尺寸小的數(shù)據(jù)學習能力更強,且訓練速度快[18]。為了減小圖像中存在的不必要相鄰信息對實驗結(jié)果的影響,我們首先對星系數(shù)據(jù)進行剪裁并下采樣[19]。以透鏡星系為例,如圖2,424 × 424 pixel的圖像剪裁成164 × 164 pixel,之后將圖像下采樣到80 × 80 pixel。

        圖2 星系剪裁及下采樣

        圖像在相機捕捉、信息傳輸、數(shù)字圖像轉(zhuǎn)化等過程中存在噪聲干擾,噪聲的疊加嚴重影響圖像質(zhì)量,進而導致圖像的本質(zhì)特征發(fā)生改變。對星系形態(tài)進行分類時,保存圖像中星系的外形輪廓和紋理信息至關重要,所以本文對圖像采用邊緣導向的非局部均值去噪方法[20]。首先,對圖像采用二階差分索貝爾(Sobel)算子抽取邊緣;其次,將邊緣信息與原有的噪聲圖像共同構(gòu)建一個非局部協(xié)同濾波框架;最后,將邊緣信息參與噪聲圖像的修復。去噪效果如圖3,由圖3可以看出,去噪之后星系周圍的噪聲點消失,且圖像有了更多、更明顯的邊緣紋理信息。

        圖3 圖像去噪效果

        數(shù)據(jù)集中不規(guī)則星系和透鏡星系的數(shù)量相對較少,數(shù)據(jù)集的類間比例失衡會影響模型的可靠性。所以本文采用數(shù)據(jù)增強的方法增加不規(guī)則星系和透鏡星系的個數(shù)。數(shù)據(jù)增強效果如圖4,數(shù)據(jù)增強方式為[21]

        圖4 數(shù)據(jù)增強效果

        旋轉(zhuǎn):星系圖像具有旋轉(zhuǎn)不變性,利用圖像的這一性質(zhì)對圖像進行隨機旋轉(zhuǎn),旋轉(zhuǎn)范圍設置為30°;

        縮放:縮放范圍為0.7~1.3倍;

        翻轉(zhuǎn):沿著垂直軸和水平軸隨機翻轉(zhuǎn)每幅圖像;

        平移:圖像中的對象可能不在幀中心,并且在不同方向有偏移,我們對每幅圖像進行水平和垂直隨機平移,平移范圍為0~10像素。

        2 分類網(wǎng)絡介紹

        2.1 GMC-net網(wǎng)絡構(gòu)架

        如圖5,典型的ConvNet[22]由輸入層、卷積層、池化層、全連接層和輸出層構(gòu)成。輸入層主要預處理初始化數(shù)據(jù),卷積層主要進行特征提取,池化層主要進行特征壓縮來減小過擬合,全連接層主要起到分類器的作用。

        圖5 卷積神經(jīng)網(wǎng)絡通用結(jié)構(gòu)

        本文受Lenet5網(wǎng)絡參數(shù)量少易訓練的啟發(fā),結(jié)合不同激活函數(shù)和批量標準化(Batch Normalization, BN)層的特點,搭建了GMC-net網(wǎng)絡。該網(wǎng)絡不僅訓練的參數(shù)量少,還因批量標準化層的加入大大提高了網(wǎng)絡的收斂速度,獲得了很高的分類準確率。

        圖6是GMC-net整體構(gòu)架圖,該網(wǎng)絡有1個輸入層、5個卷積層、1個全連接層和1個輸出層。表2是對GMC-net構(gòu)架中各層的參數(shù)設置。GMC-net網(wǎng)絡的卷積層后都有1個批量標準化層和最大池化層。批量標準化層可以加快收斂速度和訓練速度,池化層對卷積得到的特征進行特征壓縮來減小過擬合。此外,GMC-net網(wǎng)絡采用不同的激活函數(shù)相互協(xié)調(diào):為更好輸入到下一層,前兩層使用雙曲正切激活函數(shù)(Tanh)[23];為使模型的收斂速度穩(wěn)定、計算速度更快,中間第3和第4卷積層使用修正線性單元ReLU(Rectified linear unit)激活函數(shù)[24];為抑制神經(jīng)元死亡,第5卷積層采用Leaky ReLU激活函數(shù)[25]。經(jīng)過第5卷積層之后的特征由Flatten()函數(shù)展開為一維數(shù)組,并輸入第1全連接層,此處使用的激活函數(shù)為ReLU,輸出為1 600。由于該網(wǎng)絡是四分類模型,所以輸出層的神經(jīng)元設置為4,激活函數(shù)為softmax。

        表2 GMC-net體系結(jié)構(gòu)概述

        圖6 GMC-net整體構(gòu)架

        2.2 其他分類網(wǎng)絡介紹

        本文還用了文[5]提出的卷積神經(jīng)網(wǎng)絡、文[22]提出的AlexNet網(wǎng)絡、文[12]提出的ResNet-26網(wǎng)絡以及文[13]針對星系形態(tài)分類提出的C2分類網(wǎng)絡。

        表3分別對Dieleman網(wǎng)絡、AlexNet網(wǎng)絡、ResNet-26網(wǎng)絡以及C2網(wǎng)絡的整體結(jié)構(gòu)進行了簡單介紹,構(gòu)架圖中可以清楚地看到整體網(wǎng)絡的層數(shù)、每層所在的位置、每層濾波器數(shù)量及大小的設置參數(shù)、所用池化層的池化方式以及Dropout層的丟棄率等。此外4個分類網(wǎng)絡所有的卷積層采用ReLU激活函數(shù)。

        表3 其他分類網(wǎng)絡簡介

        3 實驗結(jié)果分析及討論

        在本節(jié)中,我們首先介紹評估模型的性能指標,之后用不同網(wǎng)絡對星系數(shù)據(jù)進行分類并與類似的研究進行對比。

        3.1 評價指標參數(shù)

        我們通過混淆矩陣(如表4)可以求得衡量分類模型的性能指標:準確率、精確率、召回率以及F1分數(shù)調(diào)和值。

        表4 混淆矩陣

        準確率(Accuracy)反映分類模型所有判斷正確的結(jié)果占總觀測值的比重;精確率(Precision)是模型預測為陽性的所有結(jié)果中,預測正確的比重;召回率(Recall)是在真實值為陽性的所有結(jié)果中,預測正確的比重;F1分數(shù)是精確率和召回率的調(diào)和平均數(shù)。準確率、精確率、召回率及F1分數(shù)的計算公式分別為

        (1)

        (2)

        (3)

        (4)

        3.2 訓練和驗證

        本文的程序采用Python編寫,運行在2.80 GHz Intel(R)Core(TM)i9-10900F CPU,16 GB內(nèi)存和64位Windows系統(tǒng)的桌面上,并使用RTX 2070 super GPU加速計算。在模型訓練過程中,由于批量大小取決于數(shù)據(jù)集大小以及圖形處理器的能力,綜合考慮我們將批量大小設置為64。

        本文首先對綜合數(shù)據(jù)集中(Galaxy Zoo2, SDSS DR16和EFIGI目錄)的4種不同形態(tài)星系進行分類測試。在模型訓練開始前,首先將數(shù)據(jù)集按7.5∶2.5分為訓練集和驗證集,并對兩者分別進行數(shù)據(jù)增強,最終數(shù)據(jù)集構(gòu)成如表5。

        表5中的數(shù)據(jù)集1(Data set 1)是來自SDSS DR16,Galaxy Zoo2和EFIGI目錄的綜合數(shù)據(jù)集。由于表1中透鏡星系和不規(guī)則星系數(shù)量相對其他兩類較少,為減少類間比例失衡問題對分類模型的影響,對透鏡星系和不規(guī)則星系進行數(shù)據(jù)增強。數(shù)據(jù)集2(Data set 2)是EFIGI目錄單獨構(gòu)成的數(shù)據(jù)集,原始數(shù)據(jù)為920幅旋渦星系、289幅橢圓星系、531幅透鏡星系和248幅不規(guī)則星系,為保持各類形態(tài)星系類間比例均衡,對每類星系也進行了不同程度的數(shù)據(jù)增強。最終數(shù)據(jù)集1中16 572幅圖像作為訓練集,5 522幅圖像作為測試集;數(shù)據(jù)集2中4 037幅圖像作為訓練集,1 226幅圖像作為測試集。

        表5 數(shù)據(jù)集信息

        在訓練及驗證過程中,我們對GMC_net網(wǎng)絡、C2網(wǎng)絡、AlexNet網(wǎng)絡和Dieleman網(wǎng)絡以及ResNet-26網(wǎng)絡的可訓練參數(shù)量進行了統(tǒng)計,如圖7。

        網(wǎng)絡可訓練參數(shù)量反映該網(wǎng)絡計算過程中的復雜程度,是決定模型訓練速度的重要因素。參數(shù)越多說明網(wǎng)絡越復雜,同一設備下訓練該網(wǎng)絡所消耗的時間越長,且越復雜的網(wǎng)絡對計算機性能的要求越高。從圖7可以看出,AlexNet網(wǎng)絡和ResNet-26網(wǎng)絡的可訓練參數(shù)遠遠大于其他3個網(wǎng)絡。其中Dieleman網(wǎng)絡的可訓練參數(shù)約362萬,C2網(wǎng)絡的約357萬,GMC_net網(wǎng)絡的約293萬。從可訓練參數(shù)量來看,GMC_net網(wǎng)絡的可訓練參數(shù)最少,在訓練速度上占了很大優(yōu)勢。

        圖7 各個網(wǎng)絡可訓練參數(shù)量統(tǒng)計

        圖8顯示了5種卷積神經(jīng)網(wǎng)絡架構(gòu)在訓練時,訓練集的準確率、驗證集的準確率隨訓練次數(shù)的變化趨勢(所有的權(quán)重和偏差在訓練開始時都是隨機的),我們展示了20個epochs與準確率的關系圖。從圖8可以看出,5個分類網(wǎng)絡的準確率都呈現(xiàn)迅速上升之后趨于穩(wěn)定的趨勢,其中,AlexNet網(wǎng)絡在訓練10次左右開始收斂,訓練集的準確率最高為92.3%,驗證集的準確率最高為90.0%;Dieleman網(wǎng)絡在訓練7次左右趨于穩(wěn)定,訓練集的準確率最高為96.3%,驗證集的準確率最高為95.2%;ResNet-26網(wǎng)絡在訓練16次左右趨于穩(wěn)定,收斂速度相對較慢,訓練集的準確率最高為98.2%,驗證集的準確率最高為97.8%;C2網(wǎng)絡在訓練6次左右趨于穩(wěn)定,訓練集的準確率最高為98.5%,驗證集的準確率最高為97.9%;GMC_net網(wǎng)絡在訓練4次左右趨于穩(wěn)定,訓練集的準確率最高為99.53%,驗證集的準確率最高為99.18%。從圖8可以看出,GMC_net網(wǎng)絡在訓練過程中準確率最高,在各個網(wǎng)絡訓練最佳的情況下,AlexNet網(wǎng)絡和ResNet-26網(wǎng)絡耗時最多,GMC_net網(wǎng)絡耗時最少。

        圖8 準確率與訓練次數(shù)關系曲線圖

        綜上,GMC_net網(wǎng)絡的可訓練參數(shù)最少,且訓練過程中訓練集和驗證集的準確率均能保持穩(wěn)定且高于其他網(wǎng)絡,在收斂速度上超過了其他網(wǎng)絡,總體來看,GMC_net表現(xiàn)最好。

        3.3 不同方法的分類結(jié)果對比

        表6是GMC_net對數(shù)據(jù)集1中驗證集測試得到的混淆矩陣,通過混淆矩陣可以計算得到相應的準確率、精確率、召回率和F1分數(shù)。

        由表6可以得出,本次實驗最終對旋渦星系的分類精確率為98.29%,召回率為98.44%,F(xiàn)1分數(shù)為98.36%;橢圓星系的分類精確率為98.49%,召回率為99.03%,F(xiàn)1分數(shù)為98.75%;透鏡星系的分類精確率為99.18%,召回率為98.89%,F(xiàn)1分數(shù)為99.03%;不規(guī)則星系的分類精確率為99.91%,召回率為99.34%,F(xiàn)1分數(shù)為98.36%;總體分類準確率為98.93%。

        表6 數(shù)據(jù)集1驗證集分類測試的混淆矩陣

        表7展示了數(shù)據(jù)集1中5 522幅驗證集在5個分類網(wǎng)絡的最終分類結(jié)果對比,表中的準確率、精確率以及召回率都是各個網(wǎng)絡多次重復驗證后的最佳結(jié)果。

        從表7可以看到,AlexNet和Dieleman的準確率、精確率和召回率均小于其他網(wǎng)絡,兩者的F1分數(shù)相比其他網(wǎng)絡也偏低;ResNet-26雖然精確率比C2網(wǎng)絡高,但是準確率、召回率和F1分數(shù)略低于C2網(wǎng)絡;GMC_net在5個網(wǎng)絡中獲得了最高的準確率,其精確率、召回率和F1分數(shù)也高。從最終分類效果來看,GMC_net的分類性能優(yōu)于其他網(wǎng)絡。

        表7 不同網(wǎng)絡驗證結(jié)果對比

        為進一步證明本文方法的可行性,我們針對表1中來自EFIGI目錄的星系重新利用GMC_net進行單獨訓練分類并與其他方法進行對比。為保持類間比例均衡,我們將來自EFIGI目錄的星系擴展為表5中的數(shù)據(jù)集2。根據(jù)文[7, 10]的數(shù)據(jù)描述,我們所選的數(shù)據(jù)集包含兩者所用的樣本(涉及的樣本類型均選取所有子類)。其中文[7]提取了星系圖像的顏色特征、紋理特征(灰度共生矩陣,其中包含熵、對比度、相關性、能量等信息)以及形狀特征,并用二進制正弦余弦算法選擇最相關的特征,之后用K最鄰近算法進行分類測試。文[10]是利用四元數(shù)極坐標復指數(shù)變換矩陣從星系彩色圖像中提取色彩特征并進行特征篩選,最終利用極限學習機進行分類。

        從表8可以看出,在都使用EFIGI目錄做數(shù)據(jù)集的前提下,文[7]對EFIGI目錄中的橢圓星系、旋渦星系、透鏡星系和不規(guī)則星系進行分類,效果最好的分類精確率為92.7%,F(xiàn)1分數(shù)為88.68%;文[10]對4類星系進行分類的最佳結(jié)果總體召回率為98.78%,F(xiàn)1分數(shù)為98.74%;未進行去噪處理時,GMC_no的召回率低于文[10]的召回率,去噪之后,GMC對EFIGI目錄中橢圓星系、旋渦星系、透鏡星系和不規(guī)則星系分類的總體分類準確率、精確率、召回率以及F1分數(shù)均有提高,且比文[7, 10]得到的準確率、精確率、召回率和F1分數(shù)都高。

        表8 與其他研究方法的對比結(jié)果

        其次,文[7, 10]中的方法一方面在特征選擇、分類器選擇上有很大困難,且處理、運算過程比較復雜;另一方面文[7, 10]存在星系分類樣本類間比例嚴重失衡的問題,導致模型更容易關注樣本數(shù)量多的類別,從而影響模型的魯棒性。而本文方法對圖像進行了預處理,一是用非局部均值去噪,減小噪聲對圖像的影響,二是我們對不同形態(tài)的星系分別進行了數(shù)據(jù)增強,減小了由于樣本量小、樣本類間比例分布不均對實驗結(jié)果的影響,最后采用GMC_net分類網(wǎng)絡完美避開了圖像特征提取和選擇、分類器的選擇難題,所以綜合來看本文的分類方法是非??尚械摹?/p>

        3.4 GMC_net網(wǎng)絡卷積特征可視化

        本文最后利用Grad-CAM[26]技術(shù)對GMC_net卷積特征進行了可視化解釋,Gard-CAM以熱力圖與原圖結(jié)合的方式展示各類形態(tài)星系經(jīng)過卷積之后的特征,Gard-CAM圖可以反映卷積神經(jīng)網(wǎng)絡對預測輸出的貢獻分布,分數(shù)越高表示原始圖像對應區(qū)域?qū)W(wǎng)絡的響應越高、貢獻越大。

        GMC_net不同卷積層所提取特征不同,最開始提取星系邊緣、角落等,之后邊緣檢測提取簡單形狀。在高層中,特征圖利用高級特征的組合識別抽象斑點。以旋渦星系為例,在第4卷積層中,圖9特征圖的合并圖中每個要素圖的可區(qū)分性更強,這正是分類模型所期望的。利用Gard-CAM對經(jīng)過4層卷積的特征進行可視化,圖中清楚地展現(xiàn)了其核心中間的突起及渦旋星系旋的臂狀結(jié)構(gòu),特征貢獻度由內(nèi)向外螺旋遞減,進一步清楚地展現(xiàn)了GMC_net在星系形態(tài)的星系輪廓特征、紋理特征提取及處理方面的高性能。

        圖9 旋渦星系經(jīng)GMC_net卷積后特征可視化

        4 總結(jié)與展望

        星系的形態(tài)與星系的形成、演化有著密切的聯(lián)系,是探究星系物理的重要參數(shù)。目前對于星系形態(tài)分類研究領域依然存在分類類別少、圖像特征選擇困難、各類形態(tài)星系樣本分布不均、分類的準確率較低等問題。針對以上問題,本文提出了一種基于卷積神經(jīng)網(wǎng)絡的星系形態(tài)分類方法,實現(xiàn)了對旋渦星系、橢圓星系、透鏡星系和不規(guī)則星系的高效分類。本文首先對星系圖像進行剪切、下采樣、去噪、數(shù)據(jù)增強等一系列處理,保證樣本的多樣性、均衡性,減小圖像噪聲和樣本類間比例失衡對分類模型的影響;其次,我們構(gòu)建了一個針對星系形態(tài)分類卷積神經(jīng)網(wǎng)GMC-net,此網(wǎng)絡可以自動提取星系圖像的特征,并根據(jù)形態(tài)進行自動分類,避開了特征提取和選擇、分類器選擇的難題。我們利用形態(tài)分類方法對綜合數(shù)據(jù)集(SDSS DR16,Galaxy Zoo2和EFIGI目錄組合)不同形態(tài)的星系進行了分類。從實驗分類結(jié)果來看,旋渦星系、橢圓星系、透鏡星系和不規(guī)則外形星系分類精確率分別為98.29%,98.49%,99.18%和99.91%,召回率分別為98.44%,99.03%,98.89%和99.34%;對來自EFIGI目錄中4種形態(tài)星系的分類平均準確率也達到了99.34%。實驗結(jié)果表明,形態(tài)分類方法比其他方法表現(xiàn)更好,可以更有效地用于星系的形態(tài)分類。

        本文雖然在一定程度上解決了星系形態(tài)分類的問題,取得了相應的進展,仍然存在一些不足之處有待進一步探索:(1)為保證所選數(shù)據(jù)樣本更準確,本文在Galaxy Zoo2中選擇的閾值偏大,對該數(shù)據(jù)集應用不夠充分。(2)在SDSS DR16中由于對不規(guī)則星系的物理參數(shù)還未有統(tǒng)計研究,本文未直接從DR16中得到不規(guī)則星系。星系形態(tài)分類需要大量的樣本,獲取數(shù)據(jù)的方式也很多,未來在數(shù)據(jù)方面可以從數(shù)據(jù)庫利用率以及五波段測光數(shù)據(jù)應用等方面進行研究。(3)本文構(gòu)建的GMC_net網(wǎng)絡可以自動提取星系形態(tài)特征,并自動對星系形態(tài)分類。從分類結(jié)果來看,分類準確率很高,但其中透鏡星系、橢圓星系及渦旋星系錯分的圖像相對多一點,且對錯分的樣本難以區(qū)分。所以在未來分類系統(tǒng)研究中可以嘗試構(gòu)建專家系統(tǒng)與神經(jīng)網(wǎng)絡相結(jié)合的混合模型,即神經(jīng)網(wǎng)絡專家系統(tǒng),以提升模型的分類性能。

        猜你喜歡
        星系透鏡準確率
        “透鏡及其應用”知識延伸
        跟著星系深呼吸
        迄今發(fā)現(xiàn)的最大星系
        軍事文摘(2022年10期)2022-06-15 02:29:38
        “透鏡”知識鞏固
        “透鏡及其應用”知識拓展
        “透鏡”知識鞏固
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
        2015—2017 年寧夏各天氣預報參考產(chǎn)品質(zhì)量檢驗分析
        高速公路車牌識別標識站準確率驗證法
        欧美人与禽交zozo| 欧美丰满大乳高跟鞋| av无码国产在线看免费网站| 国产综合无码一区二区辣椒| 深夜福利小视频在线观看| 亚洲视频在线看| 日日爽日日操| 亚洲av成人一区二区三区色| 国产精品亚洲在线播放| 国产日产久久高清ww| 亚洲熟妇无码av在线播放| 最新亚洲人成网站在线观看| 一本加勒比hezyo无码人妻| 狠狠久久久久综合网| 东京热加勒比日韩精品| 久久人妻精品免费二区| 人妻免费一区二区三区免费 | 狼狼综合久久久久综合网| 国产精品伦一区二区三级视频| 午夜精品久久久| 久久91精品国产91久久麻豆| 午夜宅男成人影院香蕉狠狠爱| 日本高清一区二区三区在线观看 | 亚洲中文字幕乱码在线视频| 加勒比日韩视频在线观看| √天堂资源中文www| 成人免费看片又大又黄| 伊人婷婷在线| 亚洲免费不卡av网站| 国产精品日韩av一区二区三区| 性xxxx18免费观看视频| 国产微拍精品一区二区| 成人日韩av不卡在线观看| 成人在线视频亚洲国产| 日韩人妻中文字幕高清在线| 黑人巨大精品欧美一区二区免费| 亚洲色欲久久久久综合网| 国产激情在观看| 亚洲视频在线视频在线视频| 久久av不卡人妻出轨一区二区| 日本又色又爽又黄的a片18禁|