亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于MobileNetV2的巖石薄片巖性識(shí)別

        2024-01-01 00:00:00王婷婷黃志賢王洪濤楊明昊趙萬(wàn)春

        摘要:巖石薄片的巖性識(shí)別是地質(zhì)分析中不可或缺的一環(huán),其精準(zhǔn)度直接影響后續(xù)地層巖石種類(lèi)、性質(zhì)和礦物成分等信息的確定,對(duì)于地質(zhì)勘探和礦產(chǎn)開(kāi)采具有重要意義。為了快速準(zhǔn)確地識(shí)別巖性,本文提出了一種改進(jìn)的MobileNetV2輕量化模型,通過(guò)選取5種巖石類(lèi)型共3 700張巖石薄片圖像進(jìn)行巖性識(shí)別。在MobileNetV2的倒殘差結(jié)構(gòu)中嵌入坐標(biāo)注意力機(jī)制,融合圖像中多種礦物的全局特征信息。此外,改進(jìn)MobileNetV2中的分類(lèi)器,降低模型的參數(shù)量和計(jì)算復(fù)雜度,從而提高模型的運(yùn)算速度和效率,并采用帶泄露線性整流函數(shù)(leaky rectified linear unit, Leaky ReLU)作為激活函數(shù),避免網(wǎng)絡(luò)訓(xùn)練中的梯度消失問(wèn)題。實(shí)驗(yàn)結(jié)果表明,本文提出的改進(jìn)后的MobileNetV2模型大小僅為2.30 MB,在測(cè)試集上的精確率、召回率、F1值分別為91.24%、90.18%、90.70%,具有較高的準(zhǔn)確性,相比于SqueezeNet、ShuffleNetV2等同類(lèi)型的輕量化網(wǎng)絡(luò),分類(lèi)效果最好。

        關(guān)鍵詞:巖石薄片圖像;輕量化神經(jīng)網(wǎng)絡(luò);MobileNetV2;坐標(biāo)注意力機(jī)制;巖性識(shí)別

        doi:10.13278/j.cnki.jjuese.20230106

        中圖分類(lèi)號(hào):P585.1;TP183

        文獻(xiàn)標(biāo)志碼:A

        Supported by the National Natural Science Foundation of China (52074088, 52174022, 51574088, 51404073), Heilongjiang Province Education Science Planning Project (GJB1422142), the Special Project of Northeast Petroleum University Characteristic Domain Team (2022TSTD03), the Project of Heilongjiang Postdoctoral Foundation (LBHQ20074, LBHQ21086) and the Fundamental Research Funds for Colleges and Universities in Heilongjiang Province (2022TSTD04)

        Rock Thin Slice Lithology Identification Based on MobileNetV2

        Wang Tingting1, 2, Huang Zhixian1, Wang Hongtao1, Yang Minghao1, Zhao Wanchun3

        1. School of Electrical Information Engineering, Northeast Petroleum University, Daqing 163318, Heilongjiang, China

        2. Key Laboratory of Network and Intelligent Control in Heilongjiang Province, Northeast Petroleum University, Daqing 163318, "Heilongjiang, China

        3. Institute of Unconventional Oil & Gas, Northeast Petroleum University, Daqing 163318, Heilongjiang, China

        Abstract: The lithology identification of rock thin sections is an indispensable part of geological analysis, and its precision directly affects the determination of the types, properties, mineral composition, and other microscopic information of subsequent stratigraphic rock, which is of great significance for geological exploration and mineral mining. In order to identify lithology quickly and accurately, an improved MobileNetV2 lightweight model is proposed to address the complex and diverse mineral composition in rock slices, which identifies lithology from a total of 3 700 rock slice images of five types of rocks. The coordinate attention mechanism is embedded in the inverse residual structure of MobileNetV2 to fuse global feature information of multiple minerals in the image. In addition, the classifier in MobileNetV2 is improved to reduce the number of parameters and computational complexity of the model, so as to improve the computing speed and efficiency of the model, and the leaky rectified linear unit (Leaky ReLU) is used as the activation function to avoid the problem of gradient vanishing in network training. Experimental results show that the improved MobileNetV2 model proposed in this paper has a size of only 2.30 MB, and the precision, recall rate, and F1 value on the test set are 91.24%, 90.18%, and 90.70%, respectively, which has high accuracy, and has the best classification effect compared with similar lightweight networks such as SqueezeNet and ShuffleNetV2.

        Key words: rock thin section image; lightweight neural network; MobileNetV2; coordinate attention mechanism; lithology identification

        0 引言

        巖石薄片顯微分析方法通過(guò)將巖石制成薄片(巖石薄片是將未風(fēng)化的巖石標(biāo)本切成玻片大小,再用磨片機(jī)磨成幾十微米厚的薄片),并借助顯微鏡對(duì)巖石薄片的顏色、結(jié)構(gòu)、礦物組成及其含量等方面進(jìn)行觀察,從而判斷出巖石的巖性[13]。這對(duì)鑒定人員的要求比較高,需要他們具備豐富的地質(zhì)知識(shí)和鑒定經(jīng)驗(yàn),而且易受主觀影響[45]。

        許多學(xué)者利用機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)巖石薄片圖像的巖性識(shí)別[6]。Singh等[7]利用多層感知機(jī)對(duì)玄武巖巖石薄片的圖像進(jìn)行了分類(lèi)識(shí)別,在測(cè)試集上得到了 90%的識(shí)別準(zhǔn)確率;但多層感知機(jī)的參數(shù)量較大,訓(xùn)練過(guò)程中需要耗費(fèi)大量的數(shù)據(jù)和計(jì)算資源。程國(guó)建等[8]使用支持向量機(jī)對(duì)巖石薄片圖像進(jìn)行分類(lèi),最終的識(shí)別準(zhǔn)確率為80%;但是支持向量機(jī)對(duì)于多分類(lèi)的任務(wù)效果不佳。傳統(tǒng)的機(jī)器學(xué)習(xí)方法需要人工設(shè)計(jì)特征提取方法,然后將其輸入分類(lèi)器進(jìn)行訓(xùn)練,才能實(shí)現(xiàn)巖石分類(lèi)。但由于機(jī)器學(xué)習(xí)需要人為提取巖石薄片圖像的特征,并且針對(duì)不同的任務(wù)需要選取不同的特征,不具備通用性,最終導(dǎo)致巖石薄片圖像識(shí)別模型的準(zhǔn)確率不高[9]。

        隨著深度學(xué)習(xí)的發(fā)展以及硬件設(shè)備的大幅度升級(jí),地質(zhì)研究者漸漸把目光從機(jī)器學(xué)習(xí)轉(zhuǎn)向深度學(xué)習(xí)[1011]。賈立銘等[12]利用數(shù)據(jù)增強(qiáng)方法將巖石薄片圖像數(shù)據(jù)集擴(kuò)充了10倍,將8類(lèi)巖石薄片圖像輸入ResNet(residual network)50[13]模型中進(jìn)行訓(xùn)練,訓(xùn)練完成后模型在測(cè)試集的準(zhǔn)確率達(dá)到96.8%;但是巖石薄片圖像只有747張,數(shù)據(jù)集數(shù)量較少,存在一定誤差。張野等[14]通過(guò)搭建InceptionV3[15]網(wǎng)絡(luò)模型,并結(jié)合遷移學(xué)習(xí)的方法對(duì)巖石圖像進(jìn)行分類(lèi),對(duì)巖石薄片圖像的識(shí)別準(zhǔn)確率為85%;但對(duì)于礦物成分多、圖像特征較為復(fù)雜的巖石圖像識(shí)別準(zhǔn)確率不高。程國(guó)建等[16]利用SqueezeNet[17]輕量型神經(jīng)網(wǎng)絡(luò)對(duì)巖石薄片圖像進(jìn)行快速分類(lèi),最終模型大小僅為4.7 MB,準(zhǔn)確率最高可達(dá)90.88%;但是模型的評(píng)價(jià)指標(biāo)較為單一。Liu等[18]使用Mask R-CNN(region-convolutional neural networks)[19]網(wǎng)絡(luò)模型并結(jié)合SMR(spectral mixture residuals)方法對(duì)巖石薄片圖像進(jìn)行識(shí)別,最終的模型準(zhǔn)確率達(dá)到93%;但是巖石薄片圖像的種類(lèi)較少,模型運(yùn)行速度慢。

        MobileNetV2[20]是2018年由Google提出的一種輕量級(jí)的卷積神經(jīng)網(wǎng)絡(luò)模型。馬睿等[21]將MobileNetV2用于實(shí)現(xiàn)對(duì)玉米籽粒圖像的快速鑒別,最終模型準(zhǔn)確率達(dá)到97.95%。易才鍵等[22]搭建MobileNetV2對(duì)生活垃圾圖像進(jìn)行分類(lèi),實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的MobileNetV2在生活垃圾分類(lèi)數(shù)據(jù)集上的分類(lèi)準(zhǔn)確率為90.58%。實(shí)驗(yàn)表明,輕量化的MobileNetV2不僅參數(shù)量低,而且在多分類(lèi)的任務(wù)中表現(xiàn)優(yōu)秀。

        本文將深度學(xué)習(xí)技術(shù)應(yīng)用于巖石薄片的巖性識(shí)別中,考慮到經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)對(duì)巖石薄片的識(shí)別具有計(jì)算量大、模型復(fù)雜和對(duì)設(shè)備要求高等問(wèn)題,本文選取輕量級(jí)神經(jīng)網(wǎng)絡(luò)MobileNetV2進(jìn)行改進(jìn),在網(wǎng)絡(luò)的頂部重新設(shè)計(jì)了分類(lèi)器,進(jìn)一步減少模型計(jì)算的復(fù)雜度;在網(wǎng)絡(luò)的倒殘差結(jié)構(gòu)中加入坐標(biāo)注意力(coordinate attention, CA)機(jī)制,強(qiáng)化網(wǎng)絡(luò)對(duì)全局信息的融合,提高模型對(duì)巖石薄片識(shí)別分類(lèi)的性能。

        1 MobileNetV2

        1.1 深度可分離卷積

        MobileNetV2采用深度可分離卷積,如圖1所示。深度可分離卷積首先對(duì)輸入的每個(gè)通道進(jìn)行單獨(dú)卷積操作,稱(chēng)為深度卷積操作,然后在每個(gè)通道上進(jìn)行逐點(diǎn)卷積,將深度卷積的結(jié)果進(jìn)行卷積核大小為1×1的卷積操作,得到最終的輸出。深度可分離卷積對(duì)比標(biāo)準(zhǔn)卷積的網(wǎng)絡(luò)模型,在精度略微下降的前提下,將模型的參數(shù)量降低為原來(lái)的九分之一,提高了模型的運(yùn)行速度。同時(shí),由于每個(gè)通道的卷積操作是獨(dú)立的,可以更好地提取不同通道的特征信息,從而提高模型的精度。

        隨著網(wǎng)絡(luò)層數(shù)的增加,MobileNetV2的倒殘差結(jié)構(gòu)使得網(wǎng)絡(luò)能夠更高效地進(jìn)行特征提取。倒殘差結(jié)構(gòu)由兩個(gè)深度可分離卷積組成,第一個(gè)深度可分離卷積用于擴(kuò)張通道數(shù),第二個(gè)深度可分離卷積用于恢復(fù)通道數(shù)。這樣可以將輸入特征圖的通道數(shù)擴(kuò)張到更多,從而增加了模型的表達(dá)能力;同時(shí),通過(guò)逐點(diǎn)卷積恢復(fù)通道數(shù),可以保持輸入和輸出通道數(shù)相同,避免信息的丟失。倒殘差結(jié)構(gòu)如圖2所示,只有當(dāng)步長(zhǎng)(stride)為1且輸入特征矩陣與輸出特征矩陣的維度相同時(shí),才有殘差連接。由于MobileNetV2網(wǎng)絡(luò)模型中的倒殘差結(jié)構(gòu)兩頭小中間大,所以模型最后輸出的是一個(gè)低維的特征信息;因此,在模型的最后一個(gè)卷積層使用線性激活函數(shù),避免模型輸出的低維特征信息大量丟失。

        1.2 坐標(biāo)注意力機(jī)制

        在使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類(lèi)或目標(biāo)檢測(cè)時(shí),往往需要對(duì)圖像中不同區(qū)域的特征進(jìn)行加強(qiáng),進(jìn)而更準(zhǔn)確地區(qū)分不同類(lèi)別。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)通常使用全局池化或全連接層來(lái)進(jìn)行特征提取和分類(lèi),但這種方法無(wú)法區(qū)分圖像中的哪些區(qū)域?qū)Ξ?dāng)前任務(wù)更為重要。注意力機(jī)制可以在圖像區(qū)域之間進(jìn)行加權(quán),使得模型更加準(zhǔn)確地關(guān)注與任務(wù)相關(guān)的圖像區(qū)域,從而提高模型提取重要特征的能力[2325]。

        巖石薄片中有多種礦物且結(jié)構(gòu)復(fù)雜,圖像的不同區(qū)域包含不同的礦物成分,因此本文加入了坐標(biāo)注意力機(jī)制來(lái)提高巖石薄片的識(shí)別效率。

        坐標(biāo)注意力通過(guò)坐標(biāo)信息對(duì)特征圖進(jìn)行注意力加權(quán),從而提高網(wǎng)絡(luò)對(duì)不同位置的特征提取能力。

        坐標(biāo)注意力的具體流程如圖3所示。首先通過(guò)自適應(yīng)平均池化操作獲取輸入特征圖行和列的平均值;然后將池化后的行、列特征分別通過(guò)一個(gè)卷積層進(jìn)行特征提取,得到對(duì)應(yīng)的注意力系數(shù);最后將輸入特征圖按行和列進(jìn)行拆分,使用注意力系數(shù)對(duì)它們進(jìn)行加權(quán),得到加強(qiáng)后的輸出特征圖。

        本文將坐標(biāo)注意力機(jī)制插入在MobileNetV2的倒殘差結(jié)構(gòu)中,將坐標(biāo)注意力機(jī)制放在深度可分離卷積之后(圖4),避免在每個(gè)空間位置上計(jì)算注意力權(quán)重帶來(lái)的計(jì)算量。因?yàn)樯疃瓤煞蛛x卷積已經(jīng)在每個(gè)空間位置上對(duì)每個(gè)通道進(jìn)行了獨(dú)立的卷積操作,因此坐標(biāo)注意力機(jī)制可以直接對(duì)每個(gè)通道計(jì)算注意力權(quán)重,再應(yīng)用到整個(gè)特征圖上,提高模型性能的同時(shí)減少計(jì)算量。

        1.3 改進(jìn)分類(lèi)器

        MobileNetV2能夠快速提取目標(biāo)特征,并通過(guò)頂部分類(lèi)器對(duì)最后一個(gè)瓶頸層的輸出進(jìn)行分類(lèi)識(shí)別。然而在實(shí)際應(yīng)用中,由于目標(biāo)數(shù)量的差異,調(diào)整最后一層神經(jīng)元數(shù)量難以高效地利用神經(jīng)網(wǎng)絡(luò)的特征識(shí)別能力。MobileNetV2最初設(shè)計(jì)用于處理ImageNet數(shù)據(jù)集,有1 000多個(gè)類(lèi)別目標(biāo),而本論文僅分類(lèi)5個(gè)類(lèi)別目標(biāo)。因此,在神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)多個(gè)瓶頸層之后,本文直接進(jìn)行分類(lèi)器的部分,而不再執(zhí)行升維操作。

        本文在選擇分類(lèi)器的激活函數(shù)時(shí),沒(méi)有使用MobileNetV2中的ReLU6(圖5a),而是采用了帶泄露線性整流函數(shù)(leaky rectified linear unit, Leaky ReLU,圖5b)。

        ReLU6的特點(diǎn)是當(dāng)輸入大于6時(shí),輸出固定為6(圖5a),這使得網(wǎng)絡(luò)在反向傳播時(shí)會(huì)出現(xiàn)梯度消失的問(wèn)題,也會(huì)導(dǎo)致網(wǎng)絡(luò)的輸出范圍被限制在一個(gè)較小的區(qū)間內(nèi),從而影響網(wǎng)絡(luò)的表達(dá)能力。Leaky ReLU在ReLU的基礎(chǔ)上增加了一個(gè)微小的斜率,即在輸入小于0時(shí)也會(huì)保留一定的輸出值;而當(dāng)輸入大于0時(shí),輸出與輸入相等,并且不會(huì)進(jìn)行截?cái)嗖僮鳎▓D5b)。由于Leaky ReLU在輸入小于0時(shí)依然保存了梯度,可以避免梯度消失的問(wèn)題,而且能夠保留輸入數(shù)據(jù)中的負(fù)值信息,因此可以適應(yīng)不同的數(shù)據(jù)分布。

        本文采用兩種不同尺度的卷積核替代原始分類(lèi)器中的單個(gè)卷積核,以進(jìn)行特征圖的壓縮轉(zhuǎn)換操作。第一個(gè)卷積核的大小為1×1,用于特征圖的降維與壓縮,并將通道數(shù)降至192,以避免信息丟失;第二個(gè)卷積核的大小為3×3,用于特征圖的尺寸壓縮,讓網(wǎng)絡(luò)適應(yīng)不同大小的特征信息,提高模型的泛化能力,并且將通道數(shù)繼續(xù)削減到64,向最后的巖石薄片種類(lèi)過(guò)渡。然后通過(guò)1×1的卷積降維到目標(biāo)種類(lèi),用全局池化操作提取特征圖像最終信息,最終輸出分類(lèi)結(jié)果。改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。

        2 巖石薄片圖像數(shù)據(jù)集

        巖石薄片是取自巖樣的小塊巖片磨制而成的幾十微米厚的薄片,通過(guò)偏光顯微鏡觀察圖像,確定巖樣的礦物成分、結(jié)構(gòu)和構(gòu)造等特征,并判斷巖石巖性。為了便于觀察巖樣的內(nèi)部孔隙、喉道及其相應(yīng)的聯(lián)通特征,可將彩色膠體或樹(shù)脂注入巖石內(nèi)部,制成鑄體薄片。

        本文使用的薄片圖像部分來(lái)源于中國(guó)實(shí)物地質(zhì)資料網(wǎng),部分來(lái)源于網(wǎng)絡(luò)上公開(kāi)的數(shù)據(jù)集,經(jīng)過(guò)地質(zhì)專(zhuān)業(yè)人員進(jìn)行辨認(rèn)篩選后制成所需的數(shù)據(jù)集。本文最終選定花崗巖、石英砂巖、玄武巖、片巖和片麻巖等5種常見(jiàn)的薄片類(lèi)型作為實(shí)驗(yàn)數(shù)據(jù)集(表1)。

        3 實(shí)驗(yàn)過(guò)程與分析

        3.1 實(shí)驗(yàn)設(shè)備

        實(shí)驗(yàn)的軟硬設(shè)備如表2所示。

        3.2 分類(lèi)評(píng)價(jià)指標(biāo)

        為了更全面地評(píng)估本文改進(jìn)的模型,將本文模型與其他模型進(jìn)行對(duì)比,用精確率、召回率、特異度和F1值進(jìn)行綜合評(píng)價(jià)。

        在處理二分類(lèi)任務(wù)時(shí),繪制混淆矩陣如下:

        N=NTPNFPNFNNTN。(1)

        式中:NTP為正樣本被分類(lèi)為正的數(shù)量;NFN為正樣本被分類(lèi)為負(fù)的數(shù)量;NFP為負(fù)樣本被分類(lèi)為正的數(shù)量;NTN為負(fù)樣本被分類(lèi)為負(fù)的數(shù)量。

        精確率(P)是指在圖片分類(lèi)過(guò)程中,判斷為陽(yáng)性樣本中真陽(yáng)性所占的比例:

        P=NTPNTP+NFP。(2)

        召回率(R)是指圖片分類(lèi)過(guò)程中,實(shí)際陽(yáng)性樣本中真陽(yáng)性所占的比例:

        R=NTPNTP+NFN。(3)

        特異度(S)是指圖片分類(lèi)過(guò)程中,實(shí)際陰性樣本中真陰性所占的比例:

        S=NTNNFP+NTN。(4)

        F1 值綜合了精確率和召回率的表現(xiàn),取值范圍

        是[0, 1],數(shù)值越大代表模型的性能越好、泛化能力越強(qiáng)。F1值計(jì)算公式為

        F1=2P·RP+R。(5)

        3.3 實(shí)驗(yàn)過(guò)程

        本文使用的數(shù)據(jù)集按照巖性分類(lèi)可以分為花崗巖、石英砂巖、玄武巖、片巖和片麻巖,共計(jì)3 700張圖片,均在正交偏光10倍的光源下拍攝。前3類(lèi)巖石薄片圖像每一類(lèi)為1 000張,后兩類(lèi)巖石薄片圖像每一類(lèi)為350張,在實(shí)驗(yàn)中隨機(jī)劃分其中的80% 作為訓(xùn)練集,20%作為測(cè)試集。通過(guò)剪裁、旋轉(zhuǎn)、中心化等預(yù)處理后再輸入到模型中進(jìn)行訓(xùn)練。批量大小為32,學(xué)習(xí)率為0.000 1,優(yōu)化器選擇Adam(adaptive moment estimation),訓(xùn)練輪次(Epoch)為200。

        3.4 消融實(shí)驗(yàn)

        為了探究各項(xiàng)改進(jìn)對(duì)網(wǎng)絡(luò)性能的提升效果,分別對(duì)坐標(biāo)注意力機(jī)制和改進(jìn)的分類(lèi)器進(jìn)行消融實(shí)驗(yàn),實(shí)驗(yàn)的混淆矩陣如圖7所示。

        在圖7中:每一列之和代表該列對(duì)應(yīng)類(lèi)別的實(shí)際樣本總數(shù),反映了各類(lèi)別樣本的實(shí)際數(shù)量分布;對(duì)角線上的數(shù)值表示被正確分類(lèi)的樣本數(shù)量,它們是模型對(duì)各類(lèi)別的正確預(yù)測(cè)結(jié)果,數(shù)值越大,說(shuō)明模型在該類(lèi)別上的分類(lèi)準(zhǔn)確度越高;對(duì)角線以外的數(shù)值表示被錯(cuò)誤分類(lèi)的樣本數(shù)量,即實(shí)際屬于某一類(lèi)別但被預(yù)測(cè)為另一類(lèi)別的樣本數(shù),體現(xiàn)了模型的誤分類(lèi)情況,數(shù)值越小越好,意味著模型在該類(lèi)別上的誤分類(lèi)率越低。通過(guò)分析混淆矩陣,可以清晰地了解模型在各類(lèi)別上的分類(lèi)性能。

        不同優(yōu)化方法對(duì)模型的影響如表3所示。MobileNetV2在改進(jìn)了分類(lèi)器后,模型的浮點(diǎn)運(yùn)算量下降5.9%,參數(shù)量減少0.06 MB,加快了模型的訓(xùn)練速度,但會(huì)降低模型的性能;在MobileNetV2的倒殘差結(jié)構(gòu)中加入坐標(biāo)注意力機(jī)制,模型的精確率和召回率分別提高了4.98%、4.70%,但模型的參數(shù)量和浮點(diǎn)運(yùn)算量增加,導(dǎo)致模型運(yùn)行速度降低;綜合分析模型的評(píng)價(jià)指標(biāo),應(yīng)在提高模型性能的同時(shí),加快模型的運(yùn)行速度,因此本文算法在MobileNetV2的倒殘差結(jié)構(gòu)中加入坐標(biāo)注意力機(jī)制的基礎(chǔ)上再對(duì)分類(lèi)器進(jìn)行改進(jìn),相比原網(wǎng)絡(luò)精確率和召回率分別提高了3.12%、2.82%,計(jì)算復(fù)雜度下降了4.0%,本文算法在巖石薄片圖像巖性識(shí)別上具有較好的分類(lèi)效果。

        3.5 輕量化網(wǎng)絡(luò)模型對(duì)比

        模型對(duì)比實(shí)驗(yàn)對(duì)SqueezeNet、ShuffleNetV2、MobileNetV2和改進(jìn)后的MobileNetV2等4種輕量化網(wǎng)絡(luò)進(jìn)行綜合比較。4種模型在測(cè)試集上的準(zhǔn)確率曲線如圖8所示,精確率、召回率和F1值如表4所示。

        從圖8中可以看到:ShuffleNetV2在約100輪后趨于收斂,之后準(zhǔn)確率曲線趨于平穩(wěn),波動(dòng)較?。籑obileNetV2收斂時(shí)間也在100輪左右,準(zhǔn)確率曲線趨于平穩(wěn);SqueezeNet收斂時(shí)間稍晚一些,大約在150輪左右;而改進(jìn)后的網(wǎng)絡(luò)在80輪左右基本達(dá)到了最高值,隨后達(dá)到了收斂狀態(tài)。改進(jìn)后的模型收斂速度明顯更快,并且在測(cè)試集的準(zhǔn)確率上明顯高于另外3種輕量化網(wǎng)絡(luò),模型的最終準(zhǔn)確率達(dá)到了90.8%。

        測(cè)試集的準(zhǔn)確率是模型性能評(píng)估中的一個(gè)重要指標(biāo)。然而,單獨(dú)使用準(zhǔn)確率無(wú)法全面反映模型的性能。為了更好地理解模型的優(yōu)劣,本文計(jì)算了4種模型的精確率、召回率和F1值(表4)。由于ShuffleNetV2采用了通道混洗的操作,提高了特征的交叉性,因此分類(lèi)的各項(xiàng)指標(biāo)都高于SqueezeNet。MobileNetV2采用了深度可分離卷積,能夠更好地提取特征,提升模型的性能,因此優(yōu)于ShuffleNetV2。本文則在MobileNetV2的基礎(chǔ)上嵌入了坐標(biāo)注意力機(jī)制,對(duì)比原網(wǎng)絡(luò)的精確率、召回率、F1值分別提高了3.12%、2.82%、2.96%,與其他網(wǎng)絡(luò)相比均是最佳,因此本文改進(jìn)的MobileNetV2識(shí)別效果最好。

        為顯示改進(jìn)后的模型對(duì)各類(lèi)巖石薄片圖像的識(shí)別性能,計(jì)算了改進(jìn)后的MobileNetV2對(duì)各類(lèi)別巖石的分類(lèi)結(jié)果,結(jié)果如表5所示。

        由圖7d與表5可以看出:改進(jìn)后的模型對(duì)石英砂巖的分類(lèi)效果最好,200張石英砂巖全部預(yù)測(cè)為石英砂巖類(lèi)別,召回率達(dá)到100%;片麻巖的效果也極好,在80張片麻巖的圖片中有77張預(yù)測(cè)正確,召回率達(dá)到96.20%。改進(jìn)后的模型對(duì)石英砂巖和片麻巖的識(shí)別效果都較好,F(xiàn)1值分別是98.98%和95.03%,因?yàn)閮烧咴陲@微鏡下的特征非常明顯,石英砂巖中有大量的石英砂粒和較少的黏土礦物,而片麻巖則有規(guī)則排列的斜長(zhǎng)石和云母晶體?;◢弾r和玄武巖之間容易誤認(rèn),誤認(rèn)概率為12.6%,因?yàn)榛◢弾r和玄武巖在形態(tài)上有相似之處,例如它們的顆粒大小、晶體結(jié)構(gòu)等有一定重合,這使得它們?cè)谝恍┬螒B(tài)上的表現(xiàn)比較相似,因此容易混淆。此外,模型在測(cè)試集的各類(lèi)別巖石的特異度都在90%以上,說(shuō)明模型能夠有效排除非目標(biāo)樣本,也從側(cè)面體現(xiàn)了改進(jìn)后的模型魯棒性較好。

        3.6 可視化

        研究卷積神經(jīng)網(wǎng)絡(luò)的性能和優(yōu)化方法時(shí),需評(píng)估模型對(duì)不同類(lèi)別的響應(yīng)情況,以便更好理解模型的決策過(guò)程以及改進(jìn)后模型的性能??梢暬療崃D作為一種可視化方法,能夠直觀地展示出模型對(duì)不同區(qū)域的響應(yīng)程度和影響,從而使實(shí)驗(yàn)人員更好地理解模型的決策過(guò)程和優(yōu)化方向。

        本文將改進(jìn)網(wǎng)絡(luò)模型的最后一層特征圖利用熱力圖進(jìn)行可視化輸出,結(jié)果如圖9所示??梢钥闯?,相比于MobileNetV2,改進(jìn)后的模型對(duì)礦物特征的感知范圍更大,模型對(duì)巖石薄片圖像中的顏色、紋理以及所含礦物的結(jié)構(gòu)特征更為敏感,這也從側(cè)面說(shuō)明坐標(biāo)注意力機(jī)制能夠使模型注意到不同位置的礦物特征。因此,本文提出的基于改進(jìn)MobileNetV2的巖石薄片識(shí)別方法對(duì)巖石薄片特征的提取能力非常高效。

        4 結(jié)論

        本文基于MobileNetV2,利用5類(lèi)巖石共3 700張巖石薄片,通過(guò)嵌入坐標(biāo)注意力機(jī)制,構(gòu)建了一種改進(jìn)的MobileNetV2巖石薄片巖性識(shí)別模型,實(shí)現(xiàn)了對(duì)巖石薄片的高效準(zhǔn)確識(shí)別。通過(guò)實(shí)驗(yàn),得到了以下結(jié)論:

        1)通過(guò)對(duì)MobileNetV2的不斷改進(jìn),最終的測(cè)試集分類(lèi)準(zhǔn)確率達(dá)到了90.8%,精確率達(dá)到了91.24%,對(duì)巖石薄片的巖性實(shí)現(xiàn)了高效的分類(lèi)識(shí)別。由于巖石薄片圖像的質(zhì)量存在差異,巖性類(lèi)別多樣,往后的研究需要在不同數(shù)據(jù)集和環(huán)境下對(duì)模型的泛化能力進(jìn)行評(píng)估,進(jìn)一步增強(qiáng)模型的魯棒性。

        2)由于加入了坐標(biāo)注意力機(jī)制,本文最終的模型能夠有效捕捉圖像的全局特征。在一些需要綜合考慮圖像上下文信息進(jìn)行識(shí)別和分類(lèi)的領(lǐng)域,本文模型能夠發(fā)揮優(yōu)秀的性能。

        3)本文改進(jìn)的模型具有高效的計(jì)算能力和輕量級(jí)的結(jié)構(gòu),其參數(shù)量為2.30 MB,浮點(diǎn)運(yùn)算量也僅為301.70×106,因此,即使在內(nèi)存受限的嵌入式設(shè)備中也能高效部署,并勝任各種任務(wù)。

        4)后續(xù)的研究需要繼續(xù)優(yōu)化模型,探索更適用于巖石薄片圖像的特征提取方法。同時(shí)對(duì)模型進(jìn)行遷移學(xué)習(xí)、知識(shí)蒸餾等特征學(xué)習(xí)方法研究,進(jìn)一步提高模型的學(xué)習(xí)能力。

        參考文獻(xiàn)(References):

        [1] 郭超,劉燁. 多色彩空間下的巖石圖像識(shí)別研究[J]. 科學(xué)技術(shù)與工程,2014, 14(18): 247251,255.

        Guo Chao, Liu Ye. Recognition of" Rock Images Based on Multiple Color Spaces[J]. Science Technology and Engineering, 2014, 14(18): 247251, 255.

        [2] 趙鵬大. 大數(shù)據(jù)時(shí)代數(shù)字找礦與定量評(píng)價(jià)[J]. 地質(zhì)通報(bào), 2015,34 (7): 12551259.

        Zhao Pengda. Digital Mineral Exploration and Quantitative Evaluation in the Big Data Age[J]. Geological Bulletin of China, 2015, 34(7): 12551259.

        [3] 張貴山,彭仁,邱紅信. 掃描儀在巖礦鑒定與巖相學(xué)研究中的應(yīng)用:薄片掃描法[J]. 礦物學(xué)報(bào),2020,40(1): 18.

        Zhang Guishan, Peng Ren, Qiu Hongxin. Application of Scanner for the Rock-Mineral Identification and Petrography: Thin Section Scanning Method[J]. Acta Mineralogica Sinica, 2020, 40(1): 18.

        [4] 熊越晗,劉東燕,劉東升,等. 基于巖樣細(xì)觀圖像深度學(xué)習(xí)的巖性自動(dòng)分類(lèi)方法[J]. 吉林大學(xué)學(xué)報(bào)(地球科學(xué)版) 2021, 51(5): 15971604.

        Xiong Yuehan, Liu Dongyan, Liu Dongsheng, et al. Automatic Lithology Classification Method Based on Deep Learning of Rock Sample Meso-Image[J]. Journal of Jilin University (Earth Science Edition), 2021, 51(5): 15971604.

        [5] 嚴(yán)光生,薛群威,肖克炎,等. 地質(zhì)調(diào)查大數(shù)據(jù)研究的主要問(wèn)題分析[J]. 地質(zhì)通報(bào), 2015, 34(7): 12731279.

        Yan Guangsheng, Xue Qunwei, Xiao Keyan, et al. An Analysis of Major Problems in Geological Survey Big Data[J]. Geological Bulletin of China, 2015, 34(7): 12731279.

        [6] 白林,魏昕,劉禹,等. 基于VGG模型的巖石薄片圖像識(shí)別[J]. 地質(zhì)通報(bào), 2019, 38(12): 20532058.

        Bai Lin, Wei Xin, Liu Yu, et al. Rock Thin Section Image Recognition and Classification Based on VGG Model[J]. Geological Bulletin of China, 2019, 38(12): 20532058.

        [7] Singh N, Singh T N, Tiwary A, et al. Textural Identification of Basaltic Rock Mass Using Image Processing and Neural Network[J]. Computational Geosciences, 2010, 14: 301310.

        [8] 程國(guó)建,殷娟娟. 基于SVM的巖石薄片圖像分類(lèi)[J]. 科技創(chuàng)新與應(yīng)用,2015(1): 38.

        Cheng Guojian, Yin Juanjuan. Rock Thin Section Image Classification Based on SVM[J]. Science and Technology Innovation and Application, 2015(1): 38.

        [9] 朱世松,楊文藝,侯廣順,等. 一種巖石薄片智能分類(lèi)識(shí)別方法[J].礦物學(xué)報(bào),2020,40(1): 106.

        Zhu Shisong, Yang Wenyi, Hou Guangshun, et al. An Intelligent Classification and Recognition Method for Rock Thin Sections[J]. Acta Mineralogica Sinica, 2020, 40(1): 106.

        [10] 尹生陽(yáng),曾維,王勝,等.基于聲波信號(hào)的巖性智能分類(lèi)方法[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版), 2022, 52(6): 20602070.

        Yin Shengyang, Zeng Wei,Wang Sheng, et al. Lithology Intelligent Classification Method Based on Acoustic Signal[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(6): 20602070.

        [11] 李忠潭,薛林福,冉祥金,等.基于卷積神經(jīng)網(wǎng)絡(luò)的智能找礦預(yù)測(cè)方法:以甘肅龍首山地區(qū)銅礦為例[J].吉林大學(xué)學(xué)報(bào)(地球科學(xué)版), 2022, 52(2): 418433.

        Li Zhongtan, Xue Linfu, Ran Xiangjin, et al. Intelligent Prospect Prediction Method Based on Convolutional Neural Network: A Case Study of Copper Deposits in Longshoushan Area, Gansu Province[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(2): 418433.

        [12] 賈立銘, 梁少華. 一種基于Resnet的巖石薄片識(shí)別方法[J].電腦知識(shí)與技術(shù), 2021, 7(28): 107109.

        Jia Liming, Liang Shaohua. A Resnet-Based Recognition Method of Rock Slices[J]. Computer Knowledge and Technology, 2021, 7(28): 107109.

        [13] He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston:Computer Vision Foundation, 2016: 770778.

        [14] 張野,李明超,韓帥. 基于巖石圖像深度學(xué)習(xí)的巖性自動(dòng)識(shí)別與分類(lèi)方法[J]. 巖石學(xué)報(bào), 2018, 34(2): 333342.

        Zhang Ye, Li Mingchao, Han Shuai. Automatic Identification and Classification in Lithology Based on Deep Learning in Rock Images[J]. Acta Petrologica Sinica, 2018, 34(2): 333342.

        [15] Fu J. Application of Modified Inception-ResNet and Condensenet in Lung Nodule Classification[C]// 3rd International Conference on Computer Engineering, Information Science amp; Application Technology. [S. l.]: Atlantis Press, 2019: 186194.

        [16] 程國(guó)建,李碧,萬(wàn)曉龍,等. 基于SqueezeNet卷積神經(jīng)網(wǎng)絡(luò)的巖石薄片圖像分類(lèi)研究[J]. 礦物巖石,2021, 41(4):94101.

        Cheng Guojian, Li Bi, Wan Xiaolong, et al. Research on Classification of "Rock" Section Image" Based on SqueezeNet Convolutional Neural Network [J]. Mineralogy and Petrology, 2021, 41(4): 94101.

        [17] Iandola F N, Han S, Moskewicz M W, et al. SqueezeNet: AlexNet-Level Accuracy with 50x Fewer Parameters and lt;0.5 MB Model Size[J/OL]. [20230302]. https://doi.org/ 10.48550/arXiv.1602.07360.

        [18] Liu T, Li C, Liu Z, et al.Research on Image Identification Method of Rock Thin Slices in Tight Oil Reservoirs Based on Mask R-CNN[J]. Energies, 2022, 15(16): 5818.

        [19] He K, Gkioxari G, Dollár P, et al. Mask R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision. Venice: IEEE, 2017: 29612969.

        [20] Sandler M, Howard A, Zhu M, et al. Mobilenetv2: Inverted Residuals and Linear Bottlenecks[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston: Computer Vision Foundation, 2018: 45104520.

        [21] 馬睿,王佳,趙威,等.基于改進(jìn)MobileNetV2的玉米籽粒圖像品種的快速鑒別研究[J].中國(guó)糧油學(xué)報(bào),2023,38(9):204209.

        Ma Rui, Wang Jia, Zhao Wei,et al. Rapid Identification of Maize Seed Images Based on Improved MobileNetV2[J]. Journal of the Chinese Cereals and Oils Association, 2023, 38(9): 204209.

        [22] 易才鍵,陳俊,王師瑋. 基于輕量型卷積神經(jīng)網(wǎng)絡(luò)的生活垃圾圖像分類(lèi)[J].軟件工程,2023,26(3):4145.

        Yi Caijian, Chen Jun, Wang Shiwei. Domestic Garbage Image Classification" Based on Lightweight Convolutional Neural Network [J]. Software Engineering, 2023, 26(3): 4145.

        [23] 崔博,賈兆年,姬鵬,等.基于改進(jìn)EfficientNetV2網(wǎng)絡(luò)的腦腫瘤分類(lèi)方法[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2023,61(5):11691177.

        Cui Bo, Jia Zhaonian, Ji Peng, et al. Brain Tumor Classification Method Based on Improved EfficientNetV2 Network [J]. Journal of Jilin University (Science Edition), 2023, 61(5): 11691177.

        [24] 季泊男,張永剛.基于注意力機(jī)制歸納網(wǎng)絡(luò)的小樣本關(guān)系抽取模型[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2023,61(4):845852.

        Ji Bonan, Zhang Yonggang. Few-Shot Relation Extraction Model Based on Attention Mechanism Induction Network [J]. Journal of Jilin University (Science Edition), 2023, 61(4): 845852.

        [25] 蒲秋梅,田景龍,邢容暢,等.基于改進(jìn)Inceptionv3網(wǎng)絡(luò)的肺炎檢測(cè)方法[J].東北師大學(xué)報(bào)(自然科學(xué)版),2023,55(4):6776.

        Pu Qiumei, Tian Jinglong, Xing Rongchang, et al. Pneumonia Detection Method Based on Improved Inceptionv3 Network[J]. Journal of Northeast Normal University (Natural Science Edition), 2023, 55(4): 6776.

        亚洲在线一区二区三区四区| 国产精品免费观看久久| 精品国产黑色丝袜高跟鞋| 日本久久精品免费播放| 国产91成人自拍视频| 日本妇人成熟免费2020| 免费人成再在线观看视频 | 2022Av天堂在线无码| 日本成人三级视频网站| 日本免费一区二区三区影院| 芒果乱码国色天香| 99国产超薄丝袜足j在线观看| 国产一区二区在线观看视频免费 | 99精品国产99久久久久久97| 亚洲色AV性色在线观看| 国产av熟女一区二区三区蜜臀| 熟女一区二区三区在线观看| 好看的欧美熟妇www在线| 亚洲av美女在线播放啊| 人妻露脸国语对白字幕| 久久99精品久久久久久清纯| 午夜精品久久久久久久久久久久| 在线观看一区二区女同| 亚洲精品国产av成拍色拍| 领导边摸边吃奶边做爽在线观看| 欧美国产日韩a在线视频| 中文字幕第一页在线无码一区二区| 麻豆久久91精品国产| 777精品久无码人妻蜜桃| 国产婷婷丁香久久综合| 中文字幕丰满人妻有码专区| 洲色熟女图激情另类图区| 久久精品人人做人人综合| 久久中文字幕久久久久| 男女啪啪啪的高清视频| 香蕉免费一区二区三区| 亚洲av无码一区二区二三区下载 | 亚洲最大在线精品| 人妻丰满精品一区二区| 夜夜躁狠狠躁日日躁视频| 一个人看的www免费视频中文|