摘要:巖石薄片的巖性識別是地質(zhì)分析中不可或缺的一環(huán),其精準度直接影響后續(xù)地層巖石種類、性質(zhì)和礦物成分等信息的確定,對于地質(zhì)勘探和礦產(chǎn)開采具有重要意義。為了快速準確地識別巖性,本文提出了一種改進的MobileNetV2輕量化模型,通過選取5種巖石類型共3 700張巖石薄片圖像進行巖性識別。在MobileNetV2的倒殘差結(jié)構(gòu)中嵌入坐標注意力機制,融合圖像中多種礦物的全局特征信息。此外,改進MobileNetV2中的分類器,降低模型的參數(shù)量和計算復雜度,從而提高模型的運算速度和效率,并采用帶泄露線性整流函數(shù)(leaky rectified linear unit, Leaky ReLU)作為激活函數(shù),避免網(wǎng)絡訓練中的梯度消失問題。實驗結(jié)果表明,本文提出的改進后的MobileNetV2模型大小僅為2.30 MB,在測試集上的精確率、召回率、F1值分別為91.24%、90.18%、90.70%,具有較高的準確性,相比于SqueezeNet、ShuffleNetV2等同類型的輕量化網(wǎng)絡,分類效果最好。
關(guān)鍵詞:巖石薄片圖像;輕量化神經(jīng)網(wǎng)絡;MobileNetV2;坐標注意力機制;巖性識別
doi:10.13278/j.cnki.jjuese.20230106
中圖分類號:P585.1;TP183
文獻標志碼:A
Supported by the National Natural Science Foundation of China (52074088, 52174022, 51574088, 51404073), Heilongjiang Province Education Science Planning Project (GJB1422142), the Special Project of Northeast Petroleum University Characteristic Domain Team (2022TSTD03), the Project of Heilongjiang Postdoctoral Foundation (LBHQ20074, LBHQ21086) and the Fundamental Research Funds for Colleges and Universities in Heilongjiang Province (2022TSTD04)
Rock Thin Slice Lithology Identification Based on MobileNetV2
Wang Tingting1, 2, Huang Zhixian1, Wang Hongtao1, Yang Minghao1, Zhao Wanchun3
1. School of Electrical Information Engineering, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
2. Key Laboratory of Network and Intelligent Control in Heilongjiang Province, Northeast Petroleum University, Daqing 163318, "Heilongjiang, China
3. Institute of Unconventional Oil & Gas, Northeast Petroleum University, Daqing 163318, Heilongjiang, China
Abstract: The lithology identification of rock thin sections is an indispensable part of geological analysis, and its precision directly affects the determination of the types, properties, mineral composition, and other microscopic information of subsequent stratigraphic rock, which is of great significance for geological exploration and mineral mining. In order to identify lithology quickly and accurately, an improved MobileNetV2 lightweight model is proposed to address the complex and diverse mineral composition in rock slices, which identifies lithology from a total of 3 700 rock slice images of five types of rocks. The coordinate attention mechanism is embedded in the inverse residual structure of MobileNetV2 to fuse global feature information of multiple minerals in the image. In addition, the classifier in MobileNetV2 is improved to reduce the number of parameters and computational complexity of the model, so as to improve the computing speed and efficiency of the model, and the leaky rectified linear unit (Leaky ReLU) is used as the activation function to avoid the problem of gradient vanishing in network training. Experimental results show that the improved MobileNetV2 model proposed in this paper has a size of only 2.30 MB, and the precision, recall rate, and F1 value on the test set are 91.24%, 90.18%, and 90.70%, respectively, which has high accuracy, and has the best classification effect compared with similar lightweight networks such as SqueezeNet and ShuffleNetV2.
Key words: rock thin section image; lightweight neural network; MobileNetV2; coordinate attention mechanism; lithology identification
0 引言
巖石薄片顯微分析方法通過將巖石制成薄片(巖石薄片是將未風化的巖石標本切成玻片大小,再用磨片機磨成幾十微米厚的薄片),并借助顯微鏡對巖石薄片的顏色、結(jié)構(gòu)、礦物組成及其含量等方面進行觀察,從而判斷出巖石的巖性[13]。這對鑒定人員的要求比較高,需要他們具備豐富的地質(zhì)知識和鑒定經(jīng)驗,而且易受主觀影響[45]。
許多學者利用機器學習方法實現(xiàn)巖石薄片圖像的巖性識別[6]。Singh等[7]利用多層感知機對玄武巖巖石薄片的圖像進行了分類識別,在測試集上得到了 90%的識別準確率;但多層感知機的參數(shù)量較大,訓練過程中需要耗費大量的數(shù)據(jù)和計算資源。程國建等[8]使用支持向量機對巖石薄片圖像進行分類,最終的識別準確率為80%;但是支持向量機對于多分類的任務效果不佳。傳統(tǒng)的機器學習方法需要人工設計特征提取方法,然后將其輸入分類器進行訓練,才能實現(xiàn)巖石分類。但由于機器學習需要人為提取巖石薄片圖像的特征,并且針對不同的任務需要選取不同的特征,不具備通用性,最終導致巖石薄片圖像識別模型的準確率不高[9]。
隨著深度學習的發(fā)展以及硬件設備的大幅度升級,地質(zhì)研究者漸漸把目光從機器學習轉(zhuǎn)向深度學習[1011]。賈立銘等[12]利用數(shù)據(jù)增強方法將巖石薄片圖像數(shù)據(jù)集擴充了10倍,將8類巖石薄片圖像輸入ResNet(residual network)50[13]模型中進行訓練,訓練完成后模型在測試集的準確率達到96.8%;但是巖石薄片圖像只有747張,數(shù)據(jù)集數(shù)量較少,存在一定誤差。張野等[14]通過搭建InceptionV3[15]網(wǎng)絡模型,并結(jié)合遷移學習的方法對巖石圖像進行分類,對巖石薄片圖像的識別準確率為85%;但對于礦物成分多、圖像特征較為復雜的巖石圖像識別準確率不高。程國建等[16]利用SqueezeNet[17]輕量型神經(jīng)網(wǎng)絡對巖石薄片圖像進行快速分類,最終模型大小僅為4.7 MB,準確率最高可達90.88%;但是模型的評價指標較為單一。Liu等[18]使用Mask R-CNN(region-convolutional neural networks)[19]網(wǎng)絡模型并結(jié)合SMR(spectral mixture residuals)方法對巖石薄片圖像進行識別,最終的模型準確率達到93%;但是巖石薄片圖像的種類較少,模型運行速度慢。
MobileNetV2[20]是2018年由Google提出的一種輕量級的卷積神經(jīng)網(wǎng)絡模型。馬睿等[21]將MobileNetV2用于實現(xiàn)對玉米籽粒圖像的快速鑒別,最終模型準確率達到97.95%。易才鍵等[22]搭建MobileNetV2對生活垃圾圖像進行分類,實驗結(jié)果表明,改進后的MobileNetV2在生活垃圾分類數(shù)據(jù)集上的分類準確率為90.58%。實驗表明,輕量化的MobileNetV2不僅參數(shù)量低,而且在多分類的任務中表現(xiàn)優(yōu)秀。
本文將深度學習技術(shù)應用于巖石薄片的巖性識別中,考慮到經(jīng)典卷積神經(jīng)網(wǎng)絡對巖石薄片的識別具有計算量大、模型復雜和對設備要求高等問題,本文選取輕量級神經(jīng)網(wǎng)絡MobileNetV2進行改進,在網(wǎng)絡的頂部重新設計了分類器,進一步減少模型計算的復雜度;在網(wǎng)絡的倒殘差結(jié)構(gòu)中加入坐標注意力(coordinate attention, CA)機制,強化網(wǎng)絡對全局信息的融合,提高模型對巖石薄片識別分類的性能。
1 MobileNetV2
1.1 深度可分離卷積
MobileNetV2采用深度可分離卷積,如圖1所示。深度可分離卷積首先對輸入的每個通道進行單獨卷積操作,稱為深度卷積操作,然后在每個通道上進行逐點卷積,將深度卷積的結(jié)果進行卷積核大小為1×1的卷積操作,得到最終的輸出。深度可分離卷積對比標準卷積的網(wǎng)絡模型,在精度略微下降的前提下,將模型的參數(shù)量降低為原來的九分之一,提高了模型的運行速度。同時,由于每個通道的卷積操作是獨立的,可以更好地提取不同通道的特征信息,從而提高模型的精度。
隨著網(wǎng)絡層數(shù)的增加,MobileNetV2的倒殘差結(jié)構(gòu)使得網(wǎng)絡能夠更高效地進行特征提取。倒殘差結(jié)構(gòu)由兩個深度可分離卷積組成,第一個深度可分離卷積用于擴張通道數(shù),第二個深度可分離卷積用于恢復通道數(shù)。這樣可以將輸入特征圖的通道數(shù)擴張到更多,從而增加了模型的表達能力;同時,通過逐點卷積恢復通道數(shù),可以保持輸入和輸出通道數(shù)相同,避免信息的丟失。倒殘差結(jié)構(gòu)如圖2所示,只有當步長(stride)為1且輸入特征矩陣與輸出特征矩陣的維度相同時,才有殘差連接。由于MobileNetV2網(wǎng)絡模型中的倒殘差結(jié)構(gòu)兩頭小中間大,所以模型最后輸出的是一個低維的特征信息;因此,在模型的最后一個卷積層使用線性激活函數(shù),避免模型輸出的低維特征信息大量丟失。
1.2 坐標注意力機制
在使用卷積神經(jīng)網(wǎng)絡進行圖像分類或目標檢測時,往往需要對圖像中不同區(qū)域的特征進行加強,進而更準確地區(qū)分不同類別。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡通常使用全局池化或全連接層來進行特征提取和分類,但這種方法無法區(qū)分圖像中的哪些區(qū)域?qū)Ξ斍叭蝿崭鼮橹匾?。注意力機制可以在圖像區(qū)域之間進行加權(quán),使得模型更加準確地關(guān)注與任務相關(guān)的圖像區(qū)域,從而提高模型提取重要特征的能力[2325]。
巖石薄片中有多種礦物且結(jié)構(gòu)復雜,圖像的不同區(qū)域包含不同的礦物成分,因此本文加入了坐標注意力機制來提高巖石薄片的識別效率。
坐標注意力通過坐標信息對特征圖進行注意力加權(quán),從而提高網(wǎng)絡對不同位置的特征提取能力。
坐標注意力的具體流程如圖3所示。首先通過自適應平均池化操作獲取輸入特征圖行和列的平均值;然后將池化后的行、列特征分別通過一個卷積層進行特征提取,得到對應的注意力系數(shù);最后將輸入特征圖按行和列進行拆分,使用注意力系數(shù)對它們進行加權(quán),得到加強后的輸出特征圖。
本文將坐標注意力機制插入在MobileNetV2的倒殘差結(jié)構(gòu)中,將坐標注意力機制放在深度可分離卷積之后(圖4),避免在每個空間位置上計算注意力權(quán)重帶來的計算量。因為深度可分離卷積已經(jīng)在每個空間位置上對每個通道進行了獨立的卷積操作,因此坐標注意力機制可以直接對每個通道計算注意力權(quán)重,再應用到整個特征圖上,提高模型性能的同時減少計算量。
1.3 改進分類器
MobileNetV2能夠快速提取目標特征,并通過頂部分類器對最后一個瓶頸層的輸出進行分類識別。然而在實際應用中,由于目標數(shù)量的差異,調(diào)整最后一層神經(jīng)元數(shù)量難以高效地利用神經(jīng)網(wǎng)絡的特征識別能力。MobileNetV2最初設計用于處理ImageNet數(shù)據(jù)集,有1 000多個類別目標,而本論文僅分類5個類別目標。因此,在神經(jīng)網(wǎng)絡經(jīng)過多個瓶頸層之后,本文直接進行分類器的部分,而不再執(zhí)行升維操作。
本文在選擇分類器的激活函數(shù)時,沒有使用MobileNetV2中的ReLU6(圖5a),而是采用了帶泄露線性整流函數(shù)(leaky rectified linear unit, Leaky ReLU,圖5b)。
ReLU6的特點是當輸入大于6時,輸出固定為6(圖5a),這使得網(wǎng)絡在反向傳播時會出現(xiàn)梯度消失的問題,也會導致網(wǎng)絡的輸出范圍被限制在一個較小的區(qū)間內(nèi),從而影響網(wǎng)絡的表達能力。Leaky ReLU在ReLU的基礎(chǔ)上增加了一個微小的斜率,即在輸入小于0時也會保留一定的輸出值;而當輸入大于0時,輸出與輸入相等,并且不會進行截斷操作(圖5b)。由于Leaky ReLU在輸入小于0時依然保存了梯度,可以避免梯度消失的問題,而且能夠保留輸入數(shù)據(jù)中的負值信息,因此可以適應不同的數(shù)據(jù)分布。
本文采用兩種不同尺度的卷積核替代原始分類器中的單個卷積核,以進行特征圖的壓縮轉(zhuǎn)換操作。第一個卷積核的大小為1×1,用于特征圖的降維與壓縮,并將通道數(shù)降至192,以避免信息丟失;第二個卷積核的大小為3×3,用于特征圖的尺寸壓縮,讓網(wǎng)絡適應不同大小的特征信息,提高模型的泛化能力,并且將通道數(shù)繼續(xù)削減到64,向最后的巖石薄片種類過渡。然后通過1×1的卷積降維到目標種類,用全局池化操作提取特征圖像最終信息,最終輸出分類結(jié)果。改進后的網(wǎng)絡結(jié)構(gòu)如圖6所示。
2 巖石薄片圖像數(shù)據(jù)集
巖石薄片是取自巖樣的小塊巖片磨制而成的幾十微米厚的薄片,通過偏光顯微鏡觀察圖像,確定巖樣的礦物成分、結(jié)構(gòu)和構(gòu)造等特征,并判斷巖石巖性。為了便于觀察巖樣的內(nèi)部孔隙、喉道及其相應的聯(lián)通特征,可將彩色膠體或樹脂注入巖石內(nèi)部,制成鑄體薄片。
本文使用的薄片圖像部分來源于中國實物地質(zhì)資料網(wǎng),部分來源于網(wǎng)絡上公開的數(shù)據(jù)集,經(jīng)過地質(zhì)專業(yè)人員進行辨認篩選后制成所需的數(shù)據(jù)集。本文最終選定花崗巖、石英砂巖、玄武巖、片巖和片麻巖等5種常見的薄片類型作為實驗數(shù)據(jù)集(表1)。
3 實驗過程與分析
3.1 實驗設備
實驗的軟硬設備如表2所示。
3.2 分類評價指標
為了更全面地評估本文改進的模型,將本文模型與其他模型進行對比,用精確率、召回率、特異度和F1值進行綜合評價。
在處理二分類任務時,繪制混淆矩陣如下:
N=NTPNFPNFNNTN。(1)
式中:NTP為正樣本被分類為正的數(shù)量;NFN為正樣本被分類為負的數(shù)量;NFP為負樣本被分類為正的數(shù)量;NTN為負樣本被分類為負的數(shù)量。
精確率(P)是指在圖片分類過程中,判斷為陽性樣本中真陽性所占的比例:
P=NTPNTP+NFP。(2)
召回率(R)是指圖片分類過程中,實際陽性樣本中真陽性所占的比例:
R=NTPNTP+NFN。(3)
特異度(S)是指圖片分類過程中,實際陰性樣本中真陰性所占的比例:
S=NTNNFP+NTN。(4)
F1 值綜合了精確率和召回率的表現(xiàn),取值范圍
是[0, 1],數(shù)值越大代表模型的性能越好、泛化能力越強。F1值計算公式為
F1=2P·RP+R。(5)
3.3 實驗過程
本文使用的數(shù)據(jù)集按照巖性分類可以分為花崗巖、石英砂巖、玄武巖、片巖和片麻巖,共計3 700張圖片,均在正交偏光10倍的光源下拍攝。前3類巖石薄片圖像每一類為1 000張,后兩類巖石薄片圖像每一類為350張,在實驗中隨機劃分其中的80% 作為訓練集,20%作為測試集。通過剪裁、旋轉(zhuǎn)、中心化等預處理后再輸入到模型中進行訓練。批量大小為32,學習率為0.000 1,優(yōu)化器選擇Adam(adaptive moment estimation),訓練輪次(Epoch)為200。
3.4 消融實驗
為了探究各項改進對網(wǎng)絡性能的提升效果,分別對坐標注意力機制和改進的分類器進行消融實驗,實驗的混淆矩陣如圖7所示。
在圖7中:每一列之和代表該列對應類別的實際樣本總數(shù),反映了各類別樣本的實際數(shù)量分布;對角線上的數(shù)值表示被正確分類的樣本數(shù)量,它們是模型對各類別的正確預測結(jié)果,數(shù)值越大,說明模型在該類別上的分類準確度越高;對角線以外的數(shù)值表示被錯誤分類的樣本數(shù)量,即實際屬于某一類別但被預測為另一類別的樣本數(shù),體現(xiàn)了模型的誤分類情況,數(shù)值越小越好,意味著模型在該類別上的誤分類率越低。通過分析混淆矩陣,可以清晰地了解模型在各類別上的分類性能。
不同優(yōu)化方法對模型的影響如表3所示。MobileNetV2在改進了分類器后,模型的浮點運算量下降5.9%,參數(shù)量減少0.06 MB,加快了模型的訓練速度,但會降低模型的性能;在MobileNetV2的倒殘差結(jié)構(gòu)中加入坐標注意力機制,模型的精確率和召回率分別提高了4.98%、4.70%,但模型的參數(shù)量和浮點運算量增加,導致模型運行速度降低;綜合分析模型的評價指標,應在提高模型性能的同時,加快模型的運行速度,因此本文算法在MobileNetV2的倒殘差結(jié)構(gòu)中加入坐標注意力機制的基礎(chǔ)上再對分類器進行改進,相比原網(wǎng)絡精確率和召回率分別提高了3.12%、2.82%,計算復雜度下降了4.0%,本文算法在巖石薄片圖像巖性識別上具有較好的分類效果。
3.5 輕量化網(wǎng)絡模型對比
模型對比實驗對SqueezeNet、ShuffleNetV2、MobileNetV2和改進后的MobileNetV2等4種輕量化網(wǎng)絡進行綜合比較。4種模型在測試集上的準確率曲線如圖8所示,精確率、召回率和F1值如表4所示。
從圖8中可以看到:ShuffleNetV2在約100輪后趨于收斂,之后準確率曲線趨于平穩(wěn),波動較??;MobileNetV2收斂時間也在100輪左右,準確率曲線趨于平穩(wěn);SqueezeNet收斂時間稍晚一些,大約在150輪左右;而改進后的網(wǎng)絡在80輪左右基本達到了最高值,隨后達到了收斂狀態(tài)。改進后的模型收斂速度明顯更快,并且在測試集的準確率上明顯高于另外3種輕量化網(wǎng)絡,模型的最終準確率達到了90.8%。
測試集的準確率是模型性能評估中的一個重要指標。然而,單獨使用準確率無法全面反映模型的性能。為了更好地理解模型的優(yōu)劣,本文計算了4種模型的精確率、召回率和F1值(表4)。由于ShuffleNetV2采用了通道混洗的操作,提高了特征的交叉性,因此分類的各項指標都高于SqueezeNet。MobileNetV2采用了深度可分離卷積,能夠更好地提取特征,提升模型的性能,因此優(yōu)于ShuffleNetV2。本文則在MobileNetV2的基礎(chǔ)上嵌入了坐標注意力機制,對比原網(wǎng)絡的精確率、召回率、F1值分別提高了3.12%、2.82%、2.96%,與其他網(wǎng)絡相比均是最佳,因此本文改進的MobileNetV2識別效果最好。
為顯示改進后的模型對各類巖石薄片圖像的識別性能,計算了改進后的MobileNetV2對各類別巖石的分類結(jié)果,結(jié)果如表5所示。
由圖7d與表5可以看出:改進后的模型對石英砂巖的分類效果最好,200張石英砂巖全部預測為石英砂巖類別,召回率達到100%;片麻巖的效果也極好,在80張片麻巖的圖片中有77張預測正確,召回率達到96.20%。改進后的模型對石英砂巖和片麻巖的識別效果都較好,F(xiàn)1值分別是98.98%和95.03%,因為兩者在顯微鏡下的特征非常明顯,石英砂巖中有大量的石英砂粒和較少的黏土礦物,而片麻巖則有規(guī)則排列的斜長石和云母晶體?;◢弾r和玄武巖之間容易誤認,誤認概率為12.6%,因為花崗巖和玄武巖在形態(tài)上有相似之處,例如它們的顆粒大小、晶體結(jié)構(gòu)等有一定重合,這使得它們在一些形態(tài)上的表現(xiàn)比較相似,因此容易混淆。此外,模型在測試集的各類別巖石的特異度都在90%以上,說明模型能夠有效排除非目標樣本,也從側(cè)面體現(xiàn)了改進后的模型魯棒性較好。
3.6 可視化
研究卷積神經(jīng)網(wǎng)絡的性能和優(yōu)化方法時,需評估模型對不同類別的響應情況,以便更好理解模型的決策過程以及改進后模型的性能??梢暬療崃D作為一種可視化方法,能夠直觀地展示出模型對不同區(qū)域的響應程度和影響,從而使實驗人員更好地理解模型的決策過程和優(yōu)化方向。
本文將改進網(wǎng)絡模型的最后一層特征圖利用熱力圖進行可視化輸出,結(jié)果如圖9所示??梢钥闯?,相比于MobileNetV2,改進后的模型對礦物特征的感知范圍更大,模型對巖石薄片圖像中的顏色、紋理以及所含礦物的結(jié)構(gòu)特征更為敏感,這也從側(cè)面說明坐標注意力機制能夠使模型注意到不同位置的礦物特征。因此,本文提出的基于改進MobileNetV2的巖石薄片識別方法對巖石薄片特征的提取能力非常高效。
4 結(jié)論
本文基于MobileNetV2,利用5類巖石共3 700張巖石薄片,通過嵌入坐標注意力機制,構(gòu)建了一種改進的MobileNetV2巖石薄片巖性識別模型,實現(xiàn)了對巖石薄片的高效準確識別。通過實驗,得到了以下結(jié)論:
1)通過對MobileNetV2的不斷改進,最終的測試集分類準確率達到了90.8%,精確率達到了91.24%,對巖石薄片的巖性實現(xiàn)了高效的分類識別。由于巖石薄片圖像的質(zhì)量存在差異,巖性類別多樣,往后的研究需要在不同數(shù)據(jù)集和環(huán)境下對模型的泛化能力進行評估,進一步增強模型的魯棒性。
2)由于加入了坐標注意力機制,本文最終的模型能夠有效捕捉圖像的全局特征。在一些需要綜合考慮圖像上下文信息進行識別和分類的領(lǐng)域,本文模型能夠發(fā)揮優(yōu)秀的性能。
3)本文改進的模型具有高效的計算能力和輕量級的結(jié)構(gòu),其參數(shù)量為2.30 MB,浮點運算量也僅為301.70×106,因此,即使在內(nèi)存受限的嵌入式設備中也能高效部署,并勝任各種任務。
4)后續(xù)的研究需要繼續(xù)優(yōu)化模型,探索更適用于巖石薄片圖像的特征提取方法。同時對模型進行遷移學習、知識蒸餾等特征學習方法研究,進一步提高模型的學習能力。
參考文獻(References):
[1] 郭超,劉燁. 多色彩空間下的巖石圖像識別研究[J]. 科學技術(shù)與工程,2014, 14(18): 247251,255.
Guo Chao, Liu Ye. Recognition of" Rock Images Based on Multiple Color Spaces[J]. Science Technology and Engineering, 2014, 14(18): 247251, 255.
[2] 趙鵬大. 大數(shù)據(jù)時代數(shù)字找礦與定量評價[J]. 地質(zhì)通報, 2015,34 (7): 12551259.
Zhao Pengda. Digital Mineral Exploration and Quantitative Evaluation in the Big Data Age[J]. Geological Bulletin of China, 2015, 34(7): 12551259.
[3] 張貴山,彭仁,邱紅信. 掃描儀在巖礦鑒定與巖相學研究中的應用:薄片掃描法[J]. 礦物學報,2020,40(1): 18.
Zhang Guishan, Peng Ren, Qiu Hongxin. Application of Scanner for the Rock-Mineral Identification and Petrography: Thin Section Scanning Method[J]. Acta Mineralogica Sinica, 2020, 40(1): 18.
[4] 熊越晗,劉東燕,劉東升,等. 基于巖樣細觀圖像深度學習的巖性自動分類方法[J]. 吉林大學學報(地球科學版) 2021, 51(5): 15971604.
Xiong Yuehan, Liu Dongyan, Liu Dongsheng, et al. Automatic Lithology Classification Method Based on Deep Learning of Rock Sample Meso-Image[J]. Journal of Jilin University (Earth Science Edition), 2021, 51(5): 15971604.
[5] 嚴光生,薛群威,肖克炎,等. 地質(zhì)調(diào)查大數(shù)據(jù)研究的主要問題分析[J]. 地質(zhì)通報, 2015, 34(7): 12731279.
Yan Guangsheng, Xue Qunwei, Xiao Keyan, et al. An Analysis of Major Problems in Geological Survey Big Data[J]. Geological Bulletin of China, 2015, 34(7): 12731279.
[6] 白林,魏昕,劉禹,等. 基于VGG模型的巖石薄片圖像識別[J]. 地質(zhì)通報, 2019, 38(12): 20532058.
Bai Lin, Wei Xin, Liu Yu, et al. Rock Thin Section Image Recognition and Classification Based on VGG Model[J]. Geological Bulletin of China, 2019, 38(12): 20532058.
[7] Singh N, Singh T N, Tiwary A, et al. Textural Identification of Basaltic Rock Mass Using Image Processing and Neural Network[J]. Computational Geosciences, 2010, 14: 301310.
[8] 程國建,殷娟娟. 基于SVM的巖石薄片圖像分類[J]. 科技創(chuàng)新與應用,2015(1): 38.
Cheng Guojian, Yin Juanjuan. Rock Thin Section Image Classification Based on SVM[J]. Science and Technology Innovation and Application, 2015(1): 38.
[9] 朱世松,楊文藝,侯廣順,等. 一種巖石薄片智能分類識別方法[J].礦物學報,2020,40(1): 106.
Zhu Shisong, Yang Wenyi, Hou Guangshun, et al. An Intelligent Classification and Recognition Method for Rock Thin Sections[J]. Acta Mineralogica Sinica, 2020, 40(1): 106.
[10] 尹生陽,曾維,王勝,等.基于聲波信號的巖性智能分類方法[J].吉林大學學報(地球科學版), 2022, 52(6): 20602070.
Yin Shengyang, Zeng Wei,Wang Sheng, et al. Lithology Intelligent Classification Method Based on Acoustic Signal[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(6): 20602070.
[11] 李忠潭,薛林福,冉祥金,等.基于卷積神經(jīng)網(wǎng)絡的智能找礦預測方法:以甘肅龍首山地區(qū)銅礦為例[J].吉林大學學報(地球科學版), 2022, 52(2): 418433.
Li Zhongtan, Xue Linfu, Ran Xiangjin, et al. Intelligent Prospect Prediction Method Based on Convolutional Neural Network: A Case Study of Copper Deposits in Longshoushan Area, Gansu Province[J]. Journal of Jilin University (Earth Science Edition), 2022, 52(2): 418433.
[12] 賈立銘, 梁少華. 一種基于Resnet的巖石薄片識別方法[J].電腦知識與技術(shù), 2021, 7(28): 107109.
Jia Liming, Liang Shaohua. A Resnet-Based Recognition Method of Rock Slices[J]. Computer Knowledge and Technology, 2021, 7(28): 107109.
[13] He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston:Computer Vision Foundation, 2016: 770778.
[14] 張野,李明超,韓帥. 基于巖石圖像深度學習的巖性自動識別與分類方法[J]. 巖石學報, 2018, 34(2): 333342.
Zhang Ye, Li Mingchao, Han Shuai. Automatic Identification and Classification in Lithology Based on Deep Learning in Rock Images[J]. Acta Petrologica Sinica, 2018, 34(2): 333342.
[15] Fu J. Application of Modified Inception-ResNet and Condensenet in Lung Nodule Classification[C]// 3rd International Conference on Computer Engineering, Information Science amp; Application Technology. [S. l.]: Atlantis Press, 2019: 186194.
[16] 程國建,李碧,萬曉龍,等. 基于SqueezeNet卷積神經(jīng)網(wǎng)絡的巖石薄片圖像分類研究[J]. 礦物巖石,2021, 41(4):94101.
Cheng Guojian, Li Bi, Wan Xiaolong, et al. Research on Classification of "Rock" Section Image" Based on SqueezeNet Convolutional Neural Network [J]. Mineralogy and Petrology, 2021, 41(4): 94101.
[17] Iandola F N, Han S, Moskewicz M W, et al. SqueezeNet: AlexNet-Level Accuracy with 50x Fewer Parameters and lt;0.5 MB Model Size[J/OL]. [20230302]. https://doi.org/ 10.48550/arXiv.1602.07360.
[18] Liu T, Li C, Liu Z, et al.Research on Image Identification Method of Rock Thin Slices in Tight Oil Reservoirs Based on Mask R-CNN[J]. Energies, 2022, 15(16): 5818.
[19] He K, Gkioxari G, Dollár P, et al. Mask R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision. Venice: IEEE, 2017: 29612969.
[20] Sandler M, Howard A, Zhu M, et al. Mobilenetv2: Inverted Residuals and Linear Bottlenecks[C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston: Computer Vision Foundation, 2018: 45104520.
[21] 馬睿,王佳,趙威,等.基于改進MobileNetV2的玉米籽粒圖像品種的快速鑒別研究[J].中國糧油學報,2023,38(9):204209.
Ma Rui, Wang Jia, Zhao Wei,et al. Rapid Identification of Maize Seed Images Based on Improved MobileNetV2[J]. Journal of the Chinese Cereals and Oils Association, 2023, 38(9): 204209.
[22] 易才鍵,陳俊,王師瑋. 基于輕量型卷積神經(jīng)網(wǎng)絡的生活垃圾圖像分類[J].軟件工程,2023,26(3):4145.
Yi Caijian, Chen Jun, Wang Shiwei. Domestic Garbage Image Classification" Based on Lightweight Convolutional Neural Network [J]. Software Engineering, 2023, 26(3): 4145.
[23] 崔博,賈兆年,姬鵬,等.基于改進EfficientNetV2網(wǎng)絡的腦腫瘤分類方法[J].吉林大學學報(理學版),2023,61(5):11691177.
Cui Bo, Jia Zhaonian, Ji Peng, et al. Brain Tumor Classification Method Based on Improved EfficientNetV2 Network [J]. Journal of Jilin University (Science Edition), 2023, 61(5): 11691177.
[24] 季泊男,張永剛.基于注意力機制歸納網(wǎng)絡的小樣本關(guān)系抽取模型[J].吉林大學學報(理學版),2023,61(4):845852.
Ji Bonan, Zhang Yonggang. Few-Shot Relation Extraction Model Based on Attention Mechanism Induction Network [J]. Journal of Jilin University (Science Edition), 2023, 61(4): 845852.
[25] 蒲秋梅,田景龍,邢容暢,等.基于改進Inceptionv3網(wǎng)絡的肺炎檢測方法[J].東北師大學報(自然科學版),2023,55(4):6776.
Pu Qiumei, Tian Jinglong, Xing Rongchang, et al. Pneumonia Detection Method Based on Improved Inceptionv3 Network[J]. Journal of Northeast Normal University (Natural Science Edition), 2023, 55(4): 6776.