亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ResNet50和遷移學(xué)習(xí)的巖性識(shí)別與分類研究*

        2022-01-15 06:24:14趙曉暉梁乃川張永新
        關(guān)鍵詞:分類模型

        劉 晨 趙曉暉 梁乃川 張永新

        (1.山東師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 濟(jì)南 250358)(2.聊城高級(jí)財(cái)經(jīng)職業(yè)學(xué)校 聊城 252000)

        1 引言

        巖石樣本的巖性識(shí)別與分類問題是地質(zhì)分析中的重要研究方向,是固體金屬礦產(chǎn)資源勘探和油藏描述中的關(guān)鍵步驟。傳統(tǒng)的巖性識(shí)別方法主要有重磁、遙感、電磁、巖石薄片分析等,這些方法往往受限于實(shí)驗(yàn)設(shè)備的專業(yè)性和研究人員的地質(zhì)經(jīng)驗(yàn),存在識(shí)別準(zhǔn)確率低、分類結(jié)果受主觀因素影響較大等問題。目前,地質(zhì)數(shù)據(jù)呈指數(shù)式增長(zhǎng),基礎(chǔ)地質(zhì)、礦產(chǎn)地質(zhì)、災(zāi)害地質(zhì)的調(diào)查、勘查產(chǎn)生了大量的數(shù)據(jù)。在巖石樣本巖性識(shí)別方面面臨著專業(yè)知識(shí)不足和數(shù)據(jù)量巨大的問題。

        近年來,隨著計(jì)算機(jī)技術(shù)和圖像處理技術(shù)的發(fā)展,深度學(xué)習(xí)被廣泛應(yīng)用于各種圖像分類問題上。采用深度學(xué)習(xí)的方法建立巖石圖像智能識(shí)別與分類模型是一條新的途徑,可以減少對(duì)于專業(yè)知識(shí)和設(shè)備的依賴,快速且準(zhǔn)確的識(shí)別。此前不少學(xué)者嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用到巖性識(shí)別與分類問題上。程國(guó)建等[1]使用來自鄂爾多斯盆地的3類共4800個(gè)樣品對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,實(shí)現(xiàn)了對(duì)顯微鏡下巖石薄片樣本的分類,在測(cè)試數(shù)據(jù)上表現(xiàn)出98.5%的分類準(zhǔn)確率。其圖像數(shù)據(jù)是在偏光顯微鏡下拍攝的巖石鑄體薄片,數(shù)據(jù)集的制作相對(duì)復(fù)雜,不容易獲取。張野等[2]基于Inception-v3網(wǎng)絡(luò)模型,利用遷移學(xué)習(xí)建立了巖石圖像的分類模型,可對(duì)花崗巖、角礫巖、千枚巖三類特征明顯的巖石進(jìn)行識(shí)別分類,測(cè)試數(shù)據(jù)準(zhǔn)確率達(dá)到85%以上。白林、姚鈺等[3]基于卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建巖石識(shí)別深度學(xué)習(xí)模型,在網(wǎng)絡(luò)上搜集或?qū)嵨锱恼盏脕淼?000張巖石圖片上訓(xùn)練,達(dá)到了63%的識(shí)別準(zhǔn)確率。其證明了卷積神經(jīng)網(wǎng)絡(luò)可以有效提取礦物成分特征。白林、魏昕等[4]使用VGG網(wǎng)絡(luò)模型建立了巖石薄片圖像識(shí)別模型,可對(duì)花崗巖、白云巖等6種常見巖石的巖石薄片圖像進(jìn)行分類,識(shí)別準(zhǔn)確率達(dá)到了82%。綜上,雖然深度學(xué)習(xí)技術(shù)在巖石的巖性識(shí)別與分類問題中取得了一些成果,但仍存在一些不足之處:1)識(shí)別準(zhǔn)確率較低,若巖性識(shí)別與分類模型的識(shí)別準(zhǔn)確率低將導(dǎo)致其無法應(yīng)用到實(shí)際工作中去。2)用于分類的數(shù)據(jù)大多為標(biāo)準(zhǔn)的巖石薄片圖像,而非更復(fù)雜直接的巖屑、巖心圖像。巖石薄片的制作過程較為復(fù)雜,導(dǎo)致數(shù)據(jù)集不容易獲取。對(duì)此,本文提出了一種基于深度學(xué)習(xí)的巖性識(shí)別與分類方法,通過卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)自動(dòng)對(duì)巖石圖像進(jìn)行特征提取并改進(jìn)了原網(wǎng)絡(luò)的分類器。同時(shí)利用了遷移學(xué)習(xí)加快模型的訓(xùn)練速度。利用錄井現(xiàn)場(chǎng)拍攝的巖屑和巖心圖像對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,建立了巖石樣本的智能識(shí)別與分類模型,克服了傳統(tǒng)方法受主觀因素影響較大等問題。經(jīng)測(cè)試,模型擁有較高的識(shí)別準(zhǔn)確率且具有較好的泛化能力和魯棒性。

        2 模型及改進(jìn)

        2.1 技術(shù)路線

        本文所提方法的技術(shù)路線如圖1所示。方法分為以下幾個(gè)步驟。

        圖1 技術(shù)路線

        1)數(shù)據(jù)預(yù)處理:為了擴(kuò)充和平衡數(shù)據(jù)集,需要將原始巖石圖片進(jìn)行切分和數(shù)據(jù)增強(qiáng)。

        2)特征提取與分類:通過ResNet50殘差網(wǎng)絡(luò)進(jìn)行特征提取,并引入了一個(gè)全連接網(wǎng)絡(luò)以增強(qiáng)分類性能。

        3)模型訓(xùn)練:使用預(yù)處理后的數(shù)據(jù)集對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,建立巖性識(shí)別與分類模型。

        2.2 模型介紹

        2.2.1 基于ResNet50的特征提取

        更深層的網(wǎng)絡(luò)可以提取更高層次的特征。加深網(wǎng)絡(luò)層數(shù)可以提高網(wǎng)絡(luò)性能,但是隨著網(wǎng)絡(luò)層數(shù)的增加,會(huì)出現(xiàn)梯度彌散、梯度爆炸以及網(wǎng)絡(luò)的退化等問題。He等[5]提出的殘差網(wǎng)絡(luò)(Residual Network),在卷積層之間添加了跳躍連接,允許信息可以跨越多個(gè)隱含層傳播[6],有效緩解了深度神經(jīng)網(wǎng)絡(luò)出現(xiàn)的梯度消失和網(wǎng)絡(luò)退化問題,使得網(wǎng)絡(luò)深度可以達(dá)到幾十層甚至上百層。

        殘差網(wǎng)絡(luò)的主要結(jié)構(gòu)是殘差單元,其結(jié)構(gòu)如圖2所示。殘差單元中有一個(gè)恒等映射,使得輸入特征圖可以不經(jīng)過卷積直接傳遞到輸出,即使增加網(wǎng)絡(luò)深度,誤差也不會(huì)增加。由網(wǎng)絡(luò)自行學(xué)習(xí)并選擇梯度如何傳播,文獻(xiàn)[7]通過實(shí)驗(yàn)驗(yàn)證101層殘差網(wǎng)絡(luò)中大部分梯度來自淺層網(wǎng)絡(luò)。文獻(xiàn)[8]指出了在殘差網(wǎng)絡(luò)的反向傳播中通過擺脫偏導(dǎo)數(shù)連乘有效解決了梯度彌散和梯度爆炸問題。

        圖2 殘差單元

        ResNet廣泛應(yīng)用于人臉識(shí)別、自動(dòng)駕駛等領(lǐng)域。常 用 的ResNet網(wǎng) 絡(luò) 模 型 有ResNet18、ResNet50、ResNet101等,網(wǎng)絡(luò)結(jié)構(gòu)如表1所示。本文綜合考量模型的參數(shù)量以及訓(xùn)練效果,選擇使用ResNet50作為特征提取網(wǎng)絡(luò)。

        表1 ResNet體系結(jié)構(gòu)

        2.2.2 分類模塊的改進(jìn)

        特征提取模型使用ResNet50殘差網(wǎng)絡(luò),原網(wǎng)絡(luò)的分類模塊是經(jīng)過特征提取后利用全局平均池化(Global Average Pooling)將最后一個(gè)卷積層輸出的特征圖轉(zhuǎn)化為2048維向量,最后經(jīng)過輸出層并通過SoftMax回歸輸出各個(gè)類別的概率值。

        使用全局平均池化代替全連接層可以有效減少網(wǎng)絡(luò)的參數(shù)量,同時(shí)可以顯著提高小樣本學(xué)習(xí)的效果。但是全局平均池化代替全連接層的方法在遷移學(xué)習(xí)上的效果不佳,考慮是因?yàn)樵谶w移學(xué)習(xí)中,卷積層的參數(shù)大多被凍結(jié)不進(jìn)行訓(xùn)練或只訓(xùn)練最后幾層。若使用全局平均池化遷移到不同的任務(wù)中,相當(dāng)一部分卷積層參數(shù)要重新調(diào)整,而使用全連接網(wǎng)絡(luò)進(jìn)行分類,參數(shù)大多調(diào)整在全連接層。所以在遷移學(xué)習(xí)中使用全連接層搭建分類模塊往往有更好的效果。

        本文對(duì)原網(wǎng)絡(luò)的分類器進(jìn)行了改進(jìn),在全局平均池化層后加入了一個(gè)全連接網(wǎng)絡(luò),其由兩個(gè)全連接層組成,使用ReLU函數(shù)作為激活函數(shù)并加入了BN層。BN層可以加速網(wǎng)絡(luò)訓(xùn)練和收斂速度,抑制過擬合。ReLU函數(shù)具有單邊抑制特性,有計(jì)算簡(jiǎn)單、不存在梯度飽和的優(yōu)點(diǎn)[9]。網(wǎng)絡(luò)第一層的輸出節(jié)點(diǎn)數(shù)為2048,第二層的輸出節(jié)點(diǎn)數(shù)為120,最后通過SoftMax回歸輸出各個(gè)類別的概率。改進(jìn)后的網(wǎng)絡(luò)模型如圖3所示。

        圖3 網(wǎng)絡(luò)結(jié)構(gòu)

        2.2.3 遷移學(xué)習(xí)

        從零開始訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò)是一項(xiàng)極其耗時(shí)的任務(wù)。模型的訓(xùn)練需要大量已標(biāo)注的樣本,而且網(wǎng)絡(luò)要從紋理細(xì)節(jié)、邊緣輪廓開始學(xué)習(xí),隨著網(wǎng)絡(luò)層數(shù)加深不斷提取更加抽象的特征,學(xué)習(xí)的過程漫長(zhǎng)且復(fù)雜。這里引入遷移學(xué)習(xí)(Transfer Learning)[10]的概念,遷移學(xué)習(xí)的目標(biāo)是利用模型在某個(gè)領(lǐng)域上學(xué)習(xí)到的知識(shí),應(yīng)用到不同但是相關(guān)的領(lǐng)域中。從先前任務(wù)中學(xué)到的知識(shí),僅需要進(jìn)行微小的改動(dòng)即可應(yīng)用到相關(guān)的任務(wù)中,對(duì)于一些基本的規(guī)則,模型無需重新學(xué)習(xí),大大降低了時(shí)間成本。ImageNet數(shù)據(jù)集[11]包含1000類約120萬張圖片,使用在如此大的數(shù)據(jù)集上預(yù)訓(xùn)練好的網(wǎng)絡(luò)模型,可以有效的遷移到各種不同的圖像分類任務(wù)中[12]。本研究使用在ImageNet數(shù)據(jù)集上訓(xùn)練好的ResNet50殘差網(wǎng)絡(luò)進(jìn)行巖石圖像的特征提取。

        3 實(shí)驗(yàn)與結(jié)果分析

        3.1 數(shù)據(jù)集及預(yù)處理

        研究使用的公開數(shù)據(jù)集來源于第九屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽B題。圖片為使用工業(yè)相機(jī)在錄井現(xiàn)場(chǎng)拍攝的巖屑或巖心照片,部分樣本如圖4所示。

        數(shù)據(jù)集包含7類共315張巖石圖片,圖片初始尺寸多為4096像素×3000像素,少量含有背景的圖片尺寸為2448像素×2048像素。巖石圖像的類別與數(shù)量分布如表2所示。

        表2 巖石圖像數(shù)量分布

        由于原始圖像分辨率過大,若將圖片直接縮放到網(wǎng)絡(luò)模型的輸入尺寸會(huì)造成圖片失真,喪失部分信息,影響最終分類效果。因此,本文首先對(duì)圖片進(jìn)行切分以達(dá)到縮小圖片尺寸和擴(kuò)充數(shù)據(jù)集兩個(gè)目的。

        數(shù)據(jù)集中有部分含有背景的巖石圖片,如果直接切分會(huì)產(chǎn)生大量只含背景的圖片。為防止神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到背景特征,決定先使用等長(zhǎng)寬比裁剪的方式將部分背景去除,再將圖片尺寸縮放到4096像素×3000像素,將處理后的圖片進(jìn)行等分切割。

        本文將4096像素×3000像素大小的原始圖片切分成3×3份,切分后圖片尺寸為1365像素×1000像素。切分效果如圖5所示。

        圖5 圖片切分

        由于過小的樣本不足以捕捉到足夠的數(shù)據(jù)模式[13],本文還對(duì)樣本數(shù)據(jù)進(jìn)行了數(shù)據(jù)增強(qiáng)以提高模型的泛化能力和減少網(wǎng)絡(luò)的過擬合現(xiàn)象。數(shù)據(jù)增強(qiáng)(Data Augmentation)[14]是指在數(shù)據(jù)集樣本不足的情況下通過對(duì)其中部分圖片進(jìn)行變換并加入到數(shù)據(jù)集中,使得數(shù)據(jù)集更加健壯。一般數(shù)據(jù)增強(qiáng)的方法有隨機(jī)旋轉(zhuǎn)圖像、隨機(jī)平移、改變圖像亮度、改變色度、改變銳度、鏡像翻轉(zhuǎn)、添加高斯噪聲或椒鹽噪聲等[15]。

        原始數(shù)據(jù)集中每類巖石圖像的數(shù)量不同,例如淺灰色細(xì)砂巖圖像有85張,而灰色細(xì)砂巖圖像只有18張。本文進(jìn)行數(shù)據(jù)增強(qiáng)既可以擴(kuò)充數(shù)據(jù)集又可以使得7類圖片數(shù)量分布更加均勻。本文采取隨機(jī)平移、隨機(jī)旋轉(zhuǎn)、改變亮度、鏡像翻轉(zhuǎn)等方法對(duì)巖石圖片進(jìn)行數(shù)據(jù)增強(qiáng),部分效果如圖6所示。經(jīng)過上述的數(shù)據(jù)預(yù)處理步驟,并按照8.5∶1∶0.5的比例劃分為訓(xùn)練集、驗(yàn)證集、測(cè)試集。

        圖6 數(shù)據(jù)增強(qiáng)示例

        3.2 損失函數(shù)及評(píng)價(jià)指標(biāo)

        本文所構(gòu)建模型使用交叉熵作為損失函數(shù),其計(jì)算公式為

        其中M為類別總數(shù),yic為指示變量,若該類別與樣本i的類別相同則為1,否則為0;pic為樣本i屬于類別c的預(yù)測(cè)概率。交叉熵?fù)p失函數(shù)是凸函數(shù),可求導(dǎo)得到全局最優(yōu)值。

        實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)為準(zhǔn)確率(Accuracy),即正確預(yù)測(cè)的樣本個(gè)數(shù)所占的比例,計(jì)算公式為

        3.3 實(shí)驗(yàn)結(jié)果分析

        本文進(jìn)行的實(shí)驗(yàn)基于Python3.7及Tensor-Flow2.4.1實(shí)驗(yàn)的部分超參數(shù)設(shè)置如表3所示。

        表3 部分超參數(shù)設(shè)置

        實(shí)驗(yàn)設(shè)置初始學(xué)習(xí)率為0.001,訓(xùn)練迭代50次后模型收斂,若繼續(xù)訓(xùn)練將導(dǎo)致驗(yàn)證集準(zhǔn)確率下降,判斷為網(wǎng)絡(luò)過擬合。模型訓(xùn)練過程的損失和準(zhǔn)確率曲線如圖7所示。最終模型在測(cè)試集上的準(zhǔn)確率達(dá)到93.93%。

        圖7 網(wǎng)絡(luò)訓(xùn)練過程損失曲線和準(zhǔn)確率曲線

        本文還設(shè)計(jì)實(shí)驗(yàn)比較了1)直接將特征圖打平后經(jīng)過全連接層分類(FC)。2)全局平均池化后直接到輸出層進(jìn)行分類(GAP)。3)全局平均池化后再使用全連接層進(jìn)行分類(GAP+FC)。以驗(yàn)證本文分類模型的效果。三種分類方式驗(yàn)證數(shù)據(jù)準(zhǔn)確率的變化曲線如圖8所示??梢姡苯訉⑤敵鎏卣鲌D打平后使用全連接網(wǎng)絡(luò)進(jìn)行分類的效果最差,驗(yàn)證集準(zhǔn)確率為85.95%。全局平均池化后直接到輸出層進(jìn)行分類的效果略有提升,準(zhǔn)確率為86.86%,但相比前者只提升了0.91%,意義不大。本文所用的分類模型結(jié)合了全局平均池化參數(shù)量少和全連接網(wǎng)絡(luò)表達(dá)能力強(qiáng)的特點(diǎn),使得驗(yàn)證數(shù)據(jù)準(zhǔn)確率相比前兩種方法得到一定提升,準(zhǔn)確率達(dá)到了92.87%,顯著的提升了模型的性能。

        圖8 三種分類器的準(zhǔn)確率曲線

        4 結(jié)語(yǔ)

        綜上,本文提出了一種基于ResNet50網(wǎng)絡(luò)模型和遷移學(xué)習(xí)的巖性識(shí)別與分類方法,首先對(duì)數(shù)據(jù)集進(jìn)行圖片切分和數(shù)據(jù)增強(qiáng),再利用ResNet50殘差網(wǎng)絡(luò)進(jìn)行特征提取并在原網(wǎng)絡(luò)模型的基礎(chǔ)上引入了一個(gè)全連接網(wǎng)絡(luò),準(zhǔn)確率對(duì)比原模型提高了6.01%。經(jīng)實(shí)驗(yàn)驗(yàn)證,模型在測(cè)試集上的識(shí)別準(zhǔn)確率可達(dá)93.93%,具有較好的泛化能力和魯棒性,實(shí)現(xiàn)了巖石樣本的巖性智能識(shí)別與分類。另外,由于巖屑的顆粒較小而ResNet50網(wǎng)絡(luò)中部分卷積層的感受野較大,無法提取較為細(xì)微的特征,下一步研究將從縮小部分卷積層的感受野入手,并加入通道注意力機(jī)制進(jìn)一步提高識(shí)別準(zhǔn)確率。

        猜你喜歡
        分類模型
        一半模型
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        3D打印中的模型分割與打包
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        久久国产免费观看精品3| 国产av综合影院| 同性男男黄g片免费网站| 日韩一二三四精品免费| 国产91精品清纯白嫩| 国产在线观看91一区二区三区| 毛片无码国产| 国产黄页网站在线观看免费视频 | 亚洲午夜精品久久久久久人妖| 亚洲中文字幕无码卡通动漫野外| 亚洲中文字幕在线精品2021| 亚洲精品国产第一综合色吧| 国产av丝袜旗袍无码网站| 国产精品三级一区二区按摩| 亚洲女同恋中文一区二区| 日本xxxx色视频在线观看免费 | 欧美黑人乱大交| 国产内射视频在线播放| 亚洲美女性生活一级片| 少妇被按摩出高潮了一区二区| 久久久无码精品亚洲日韩蜜臀浪潮 | 无码天堂在线视频| 亚洲精品久久蜜桃av| 亚洲成av人片在www| 在线一区不卡网址观看| 日韩精品免费一区二区中文字幕| 国产香蕉视频在线播放| 3d动漫精品一区二区三区| 国产精品深夜福利免费观看| 亚洲国产91高清在线| 激情综合色五月丁香六月欧美| 亚洲一区二区观看播放| 中文字幕在线一区乱码| 亚洲码专区亚洲码专区| 99999久久久久久亚洲| 天天做天天爱天天综合网| 亚洲综合色婷婷七月丁香| 少妇人妻中文久久综合| 国产97在线 | 免费| 无码吃奶揉捏奶头高潮视频| 在线观看午夜视频国产|