亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        輕量化VGG-T3模型及巖樣分類應(yīng)用

        2023-05-11 08:58:34顧任遠劉立群
        軟件導(dǎo)刊 2023年4期
        關(guān)鍵詞:分類模型

        顧任遠,劉立群

        (甘肅農(nóng)業(yè)大學(xué) 信息科學(xué)技術(shù)學(xué)院,甘肅 蘭州 730070)

        0 引言

        巖石樣本識別是地質(zhì)學(xué)和礦業(yè)開采等工程中的重要環(huán)節(jié),傳統(tǒng)人工分析方式存在著效率低、費用高等各類問題,因此需要機器代替人工作業(yè)以提升效率。隨著深度學(xué)習(xí)的蓬勃發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)已能夠初步代替人類完成巖石樣本分類工作。

        卷積神經(jīng)網(wǎng)絡(luò)是機器視覺中的重要方法,繼神經(jīng)認知機[1]之后,LeNet[2]和AlexNet[3]的出現(xiàn)證明了其在圖像分類任務(wù)中的巨大潛力,張順等[4]、Simonyan 等[5]學(xué)者進一步肯定了其在機器視覺領(lǐng)域的價值。然而,訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型頗具挑戰(zhàn)性,存在諸如過擬合和網(wǎng)絡(luò)退化等問題[6-8],這些問題可通過引入正規(guī)化方法如隨機失活層[9]、批歸一化層等[10]得到解決。由于Yosinki 等[11]證明了遷移特征的可行性,通過遷移學(xué)習(xí)降低了訓(xùn)練開銷,隨著反向傳播[12]等深度學(xué)習(xí)技術(shù)的升級,卷積神經(jīng)網(wǎng)絡(luò)也能夠處理諸如巖石樣本分類等復(fù)雜圖像分類任務(wù)。

        根據(jù)劉建偉等[13]、孫志軍等[14]所述,深度學(xué)習(xí)在機器視覺領(lǐng)域得到了廣泛應(yīng)用。如陳德鋼等[15]使用改進的Xception 模型對野生菌種進行識別,實驗結(jié)果良好;馬俊等[16]通過訓(xùn)練遷移模型對網(wǎng)絡(luò)芯片進行分類,對芯片焊盤和焊球的識別效果良好。

        在巖石分類方面,陳鋼花等[17]利用卷積神經(jīng)網(wǎng)絡(luò)進行巖性識別,模型表現(xiàn)優(yōu)異,證明卷積神經(jīng)網(wǎng)絡(luò)在巖性識別任務(wù)中的適用性;程國建等[18]使用SqueezeNet 對5 類巖石圖像進行分類工作,利用神經(jīng)網(wǎng)絡(luò)輔助巖樣研究,但此模型參數(shù)量少,識別能力有限,難以進行復(fù)雜巖樣的精確分類。

        張野等[19]采用Inception-V3 模型和遷移學(xué)習(xí)方法對花崗巖、千枚巖和角礫巖進行分類,模型展現(xiàn)出神經(jīng)網(wǎng)絡(luò)優(yōu)秀的魯棒性,但此模型的層數(shù)較深,參數(shù)量較多,難以滿足輕量化移動平臺的使用需求;許振浩等[20]同樣采用遷移訓(xùn)練實現(xiàn)對30 種巖石樣本的分類,采用的模型原型為ResNet,分類準(zhǔn)確率高,但此類模型參數(shù)量較大,訓(xùn)練困難,也不適合在輕量化移動平臺上使用。

        綜上,巖石樣本分類的模型參數(shù)量普遍較大,計算機資源占用多,無法在輕量化平臺部署,訓(xùn)練難度大且速度有限。VGG 模型作為順序結(jié)構(gòu)模型,易于進行遷移訓(xùn)練。根據(jù)知識蒸餾的概念,數(shù)據(jù)集的知識有限[21],則模型超過一定規(guī)模后,規(guī)模不再影響性能。因此,為了實現(xiàn)巖石樣本的分類任務(wù),并滿足輕量化平臺的使用要求,需要對模型進行相應(yīng)的削減和修改。針對以上問題,本文提出通過修改VGG16 模型實現(xiàn)的VGG-T3 模型,使其能夠?qū)r石樣本進行準(zhǔn)確分類,同時滿足輕量化平臺的使用要求。

        1 卷積神經(jīng)網(wǎng)絡(luò)概述

        1.1 卷積神經(jīng)網(wǎng)絡(luò)

        神經(jīng)網(wǎng)絡(luò)由具有層級結(jié)構(gòu)的大量神經(jīng)元構(gòu)成,層層疊加以形成深層次的網(wǎng)絡(luò)模型,模型通過學(xué)習(xí)損失進行優(yōu)化擬合。其主要包括卷積層和池化層構(gòu)成的特征抽取部分,以及全連接層構(gòu)成的決策部分。

        其中,卷積層神經(jīng)元采用局部感受野、權(quán)值共享的方法削減了參數(shù)量,降低了計算開銷,池化層則僅參與對特征進行的有損壓縮,在保持一定特征的同時降低數(shù)據(jù)量,以提升模型效果,而全連接層保有的參數(shù)量最大,削減全連接層能夠有效減少模型參數(shù)。

        1.2 樣本歸一化

        深層模型具有較強的特征抽取能力,但也會產(chǎn)生過擬合問題,合理加入隨機失活層或批歸一化層,能有效提升其泛化能力。傳統(tǒng)的VGG 模型主要采用加入隨機失活層的方法抑制過擬合,同時也通過圖像變換擴充訓(xùn)練集的方法進行數(shù)據(jù)增強,有效避免大批次訓(xùn)練產(chǎn)生的Sharp Minima問題[22-24],保證模型的穩(wěn)定性。

        批歸一化層則能夠優(yōu)化總體方差和均值,使得數(shù)據(jù)分布更加合理,有效抑制飽和區(qū)漂移和過擬合[25]。在對單個維度的批歸一化操作中,計算樣本均值μβ,同時獲得方差:

        1.3 學(xué)習(xí)模式

        通過遷移學(xué)習(xí)[26],利用VGG16預(yù)訓(xùn)練模型具有的紋理和形態(tài)抓取能力提升訓(xùn)練效率。巖石分類任務(wù)需要修改模型以滿足輕量化目標(biāo),因此采用凍結(jié)訓(xùn)練,保持遷移部分模型參數(shù)不變,優(yōu)化修改部分初始參數(shù),降低訓(xùn)練時的反向傳播深度,隨后進行正常訓(xùn)練以提升模型的識別能力。

        為進一步提升訓(xùn)練效率,采用Softmax 函數(shù)[27]優(yōu)化輸出。Relu 作為激活函數(shù),可降低計算復(fù)雜度,抑制飽和區(qū)漂移[28-29]。采用交叉熵作為損失函數(shù)以滿足多分類任務(wù),優(yōu)化器采用Adam[30],相較于動量及自適應(yīng)等優(yōu)化方法[31],其訓(xùn)練更加穩(wěn)定。

        1.4 VGG模型遷移

        VGG 模型可分為A、A-LRN、B、C、D、E 6 個配置方案,相較于其他配置,D 型配置參數(shù)量適中、適用性廣,因此本文選用D 型配置進行遷移訓(xùn)練。

        VGG16 使用卷積層、池化層組合進行圖像特征提取,使用全連接層作為決策部分給出結(jié)果。連續(xù)的多個小型卷積核可等效于較大的卷積核,在提高網(wǎng)絡(luò)深度的同時降低了模型訓(xùn)練難度[5]。VGG16 采用深層次卷積抽取更為抽象的高級特征,而巖石樣本特征比較簡單,宜使用較淺層的網(wǎng)絡(luò)抽取。因此,削減卷積層、池化層組合,以更適應(yīng)輕量化目標(biāo)以及巖石分類任務(wù),同時降低訓(xùn)練難度。VGG16 全連接層采用4 096 個神經(jīng)元以實現(xiàn)千分類,對于類別較少的分類任務(wù),可削減神經(jīng)元數(shù)量以實現(xiàn)模型輕量化訓(xùn)練和部署。

        2 網(wǎng)絡(luò)模型構(gòu)建

        2.1 模型構(gòu)建

        由于原VGG 模型被應(yīng)用于千分類任務(wù),因此削減特征抽取部分,重構(gòu)決策部分。采用批歸一化層設(shè)計3 個模型,具體參數(shù)見表1。

        VGG 模型直接遷移產(chǎn)生VGG-T1,替換千分類為七分類輸出,作為典型遷移學(xué)習(xí)方案以供參考。VGG-T1 模型相對冗余,效率較低,計算資源開銷大。巖石樣本的形態(tài)結(jié)構(gòu)特征較為簡單,顏色特征和分布特征明顯,知識量小,易于抽取,因此應(yīng)降低網(wǎng)絡(luò)深度,構(gòu)建VGG-T2 模型和VGG-T3模型。

        Table 1 Model structure and parameters表1 模型結(jié)構(gòu)與參數(shù)

        VGG-T2 在VGG-T1 模型基礎(chǔ)上,刪除Conv4.x、Maxpooling4、Conv5.x、Maxpooling5,倍增Maxpooling3 池化核及其步長,且模型決策部分的神經(jīng)元減半。VGG-T2 模型層次較淺,易于訓(xùn)練。

        然而,卷積層采用局部感受野和權(quán)值共享方式,參數(shù)量較全連接層少,削減卷積層對模型參數(shù)的影響不大。因此,若需進一步降低參數(shù)量,則應(yīng)以全連接層參數(shù)的削減為先。VGG-T2 雖然降低了網(wǎng)絡(luò)深度,但是參數(shù)量沒有明顯下降。因此,構(gòu)建輕量化VGG-T3 模型,削減了Conv5.x、Maxpooling5,同時倍增Maxpooling4 池化核及其步長,模型決策部分神經(jīng)元減半,得到VGG-T3 模型的參數(shù)量為 63 244 615,相較于VGG-T1 以及VGG-T2,模型參數(shù)量幾乎減半。VGG-T3 相較于VGG-T2 更具有深度,VGG-T3模型結(jié)構(gòu)如圖1所示。

        2.2 訓(xùn)練方法

        模型學(xué)習(xí)率均采用階梯下降式,采用交叉熵計算損失,利用Adam 進行優(yōu)化,并將Batch Size 統(tǒng)一為32。首先對3 個模型各進行300 次迭代的凍結(jié)訓(xùn)練,學(xué)習(xí)率如表2所示,然后對最優(yōu)模型進行100 次迭代的正常訓(xùn)練,如表3所示。

        Fig.1 Structure of VGG-T3 model圖1 VGG-T3模型結(jié)構(gòu)

        2.3 性能分析

        VGG16 模型作為基礎(chǔ)模型,以卷積操作作為圖像抽取的主要方法,計算量主要來源于卷積運算,則可根據(jù)卷積運算的時間復(fù)雜度以及空間復(fù)雜度Space~O進行粗略估算。其中,對于輸出的特征圖M,K為卷積核,Cl-1為輸入通道數(shù),Cl則為輸出通道數(shù)??紤]到卷積步長以及卷積核大小K對于輸出特征圖M的影響,由公式(5)進行計算。

        Table 2 Learning rate of frozen training表2 凍結(jié)訓(xùn)練學(xué)習(xí)率

        Table 3 Learning rate of normal training表3 正常訓(xùn)練學(xué)習(xí)率

        其中,X為輸入的特征圖,Padding為進行邊緣卷積時所添加的填充,Stride為卷積步長。

        3 實驗與分析

        3.1 樣本數(shù)據(jù)集處理

        數(shù)據(jù)集含有高清巖石圖片數(shù)據(jù),巖石樣本根據(jù)性質(zhì)劃分為7 類。為最大限度保存巖石樣本的豐富信息,因此對圖像進行切分,利用縮放、鏡像、旋轉(zhuǎn)、亮度調(diào)節(jié)等方法生成大量數(shù)據(jù)集,以進行圖像增強學(xué)習(xí),預(yù)防模型過擬合。

        通過對圖像進行處理,生成的圖片樣本數(shù)據(jù)如表4 所示。通過圖像增強方法,可以使同一實體以不同狀態(tài)出現(xiàn)在不同圖片上,進一步增強了模型泛化能力。

        Table 4 Data of rock samples表4 巖石樣本數(shù)據(jù)

        3.2 凍結(jié)訓(xùn)練及分析

        凍結(jié)訓(xùn)練時的準(zhǔn)確率變化如圖2 所示,其中測試集準(zhǔn)確率相近,達到100%,而在驗證集中,模型表現(xiàn)略有差異。由圖2 可見,VGG-T1 驗證集的準(zhǔn)確率在50 次迭代后達到相對穩(wěn)定,接近70%,訓(xùn)練效果良好;VGG-T2 相較于VGG-T1 下降約5%,模型性能并不理想;VGG-T3 則相較于VGG-T1 略微下降,考慮其為輕量化模型,參數(shù)量遠少于VGG-T1,因此表現(xiàn)優(yōu)異。經(jīng)分析發(fā)現(xiàn),VGG-T2 削減的特征抽取部分較多,表現(xiàn)稍欠;VGG-T3 識別能力與VGGT1相近,且參數(shù)量少,適合當(dāng)前任務(wù)。

        3 種模型在訓(xùn)練集上的準(zhǔn)確率均為100%,在驗證集上的準(zhǔn)確率則保持在70%左右,其原因非過擬合,而是卷積層沒有進行訓(xùn)練,因而抽取特征的能力有限。VGG-T3 相較于VGG-T1 參數(shù)量少,識別能力強,為最優(yōu)的訓(xùn)練模型,可作為巖石樣本識別模型,通過進一步訓(xùn)練以增強其分類能力。

        3.3 正常訓(xùn)練及分析

        為進行快速訓(xùn)練,首次訓(xùn)練時采用凍結(jié)訓(xùn)練方法。由于卷積層抽取特征的能力有限,因此解凍VGG-T3 卷積、池化層組合,對VGG-T3 進一步作正常訓(xùn)練。訓(xùn)練效果如圖3所示。

        Fig.2 Accuracy rate change of models in frozen training圖2 凍結(jié)訓(xùn)練時模型準(zhǔn)確率變化

        在經(jīng)過凍結(jié)訓(xùn)練后,VGG-T3 模型具備較優(yōu)的初始參數(shù)。在正常訓(xùn)練中,準(zhǔn)確率逐步上升,最終的準(zhǔn)確率為訓(xùn)練集達到100%,驗證集達到97.81%。

        實驗結(jié)果證明,采用凍結(jié)訓(xùn)練對全連接層部分進行初值引導(dǎo),通過少量計算資源獲取了較好的全連接層初值,然后對模型解凍并進一步訓(xùn)練,以達到最終效果。其效率和穩(wěn)定性均優(yōu)于直接對模型進行訓(xùn)練,而且降低了計算資源開銷。對整個模型,尤其是具有深度的模型直接進行訓(xùn)練,容易導(dǎo)致過擬合問題,對計算資源需求量大,單次訓(xùn)練更新參數(shù)多,訓(xùn)練緩慢。

        Fig.3 Result of VGG-T3 model in normal training圖3 VGG-T3正常訓(xùn)練效果

        采用VGG-T3 對實際的巖石樣本測試集進行測試,結(jié)果表現(xiàn)優(yōu)異,準(zhǔn)確率達到97.74%。測試集共包含圖片700張,每種巖石樣本各有100 張圖片。其中,對黑色煤的分類準(zhǔn)確率最高,對灰黑色泥巖、灰色細砂巖、深灰色泥巖的分類準(zhǔn)確率略低。由于淺灰色細砂巖、灰色泥質(zhì)粉砂巖以及深灰色粉砂質(zhì)泥巖三者呈現(xiàn)的視覺特征相似,容易互相混淆,因此識別相對困難。

        3.4 模型比較

        采用AlexNet、VGG19 的典型遷移模型以及VGG-T3進行比較,所有模型均采用相同的訓(xùn)練方式,300 次迭代的凍結(jié)訓(xùn)練效果如圖4所示。

        Fig.4 Comparison of accuracy change graph in frozen training圖4 凍結(jié)訓(xùn)練時準(zhǔn)確率變化比較

        VGG-T3、VGG19 在訓(xùn)練集上能較快達到100%的準(zhǔn)確率,AlexNet 則較慢。然而,VGG19 在驗證集上表現(xiàn)不佳,因其模型過大,訓(xùn)練困難且易產(chǎn)生過擬合,而VGG-T3模型表現(xiàn)平穩(wěn),訓(xùn)練效果良好。最后進行100 次迭代的正常訓(xùn)練,最終結(jié)果如表6所示。

        Table 6 Comparison of AlexNet,VGG19 transfer model and VGGT3表6 AlexNet、VGG19遷移模型與VGG-T3比較

        VGG19 模型較為臃腫,訓(xùn)練存在一定困難,容易陷入過擬合狀態(tài),且迭代時因其參數(shù)量大,準(zhǔn)確率上升緩慢,因此在400 次迭代中未獲得較好結(jié)果。若需得到較好結(jié)果,則需要繼續(xù)訓(xùn)練。AlexNet 模型深度較淺,抽取特征的能力不足,分類能力有限,也沒有得到較好結(jié)果。通過對比實驗得出,VGG-T3模型在訓(xùn)練中表現(xiàn)優(yōu)異,能夠在較少次數(shù)的迭代中得到較好結(jié)果,且模型分類能力強。

        4 結(jié)語

        本文基于VGG16 模型提出輕量化VGG-T3 模型,該模型參數(shù)量少、識別效果好,訓(xùn)練過程中模型收斂穩(wěn)定,最終在訓(xùn)練集上可達到100%的準(zhǔn)確率,在驗證集上達到97.81%的準(zhǔn)確率,在實際測試集上達到97.74%的準(zhǔn)確率,模型準(zhǔn)確率較高。

        七分類的樣本知識量有限,因此可通過減少模型參數(shù)以提升其運行效率。通過實驗觀察得到,凍結(jié)訓(xùn)練可極大地減少計算資源的浪費。通過此方法,模型得以穩(wěn)定訓(xùn)練、快速收斂,其訓(xùn)練出的輕量化VGG-T3 模型能夠作為參考評價系統(tǒng),并實際應(yīng)用于巖石樣本分類。

        VGG-T3 模型較其余模型更能勝任巖石樣本分類任務(wù),但其模型參數(shù)量依舊偏多,可通過Teacher-Student 模型進一步壓縮模型,在保持識別能力的同時減少參數(shù),也可以采用殘差結(jié)構(gòu)的模型以提升模型訓(xùn)練的穩(wěn)定性及分類能力。另外,通過深層次的網(wǎng)絡(luò)模型配合全局平均池化也能構(gòu)建輕量化模型,深層次網(wǎng)絡(luò)模型的大量特征可避免全局平均池化大量壓縮信息而帶來的欠擬合問題。同時,采用全局平均池化替代全連接層,能極大地減少模型參數(shù)量。VGG-T3 模型可通過此類方法作修改,以進一步減少自身參數(shù)量,實現(xiàn)更加輕量化、更高效率的神經(jīng)網(wǎng)絡(luò)模型。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        亚洲一区二区三区乱码在线| 中国猛少妇色xxxxx| 亚洲综合色秘密影院秘密影院| 亚洲av永久久无久之码精| 国产极品大奶在线视频| 18禁黄网站禁片免费观看女女| 免费夜色污私人影院在线观看| 亚洲中文一本无码AV在线无码| 国产视频一区2区三区| 中文字幕人妻伦伦| 久久精品人妻一区二区三区| 国产精品欧美亚洲韩国日本| 精品久久一品二品三品| 亚洲乳大丰满中文字幕| 97一区二区国产好的精华液| 无码成人AV在线一区二区| 国产传媒精品成人自拍| 丰满多毛的大隂户毛茸茸| 国产中出视频| 国产在线拍91揄自揄视精品91 | 日韩精品综合一本久道在线视频| 国产成人精品电影在线观看| 亚洲爆乳大丰满无码专区| 久久久国产精品三级av| 国产av熟女一区二区三区| 99热久久这里只精品国产www| 美女裸体无遮挡黄污网站| 亚洲乱妇熟女爽到高潮视频高清| 日韩国产精品无码一区二区三区| 亚洲av无码一区二区二三区下载 | 国产欧美一区二区精品性色| 久久久精品人妻一区二区三区日本 | 亚洲精品无amm毛片| 成人激情四射网| 中文乱码字幕人妻熟女人妻| 亚洲情综合五月天| 这里有精品可以观看| 国产精品亚洲一区二区三区正片| 中文字幕日韩人妻少妇毛片| 国产精品igao视频| 人妻无码∧V一区二区|