江佳霖, 鐘寶榮
(長江大學(xué)計算機科學(xué)與技術(shù)學(xué)院, 荊州 434023)
砂巖是沉積巖的一種,砂巖顆粒經(jīng)過水千百年的沖蝕變得十分堅固,逐漸沉淀堆積在河床上[1]。后來地球地殼運動,形成了如今的礦山。砂巖亦是油氣田的主要儲集層類型。對砂巖圖像的分割與識別、巖性定名,分析砂巖的結(jié)構(gòu)特征,是一種研究地球運動演化的手段,對于預(yù)測和開發(fā)地下油氣具有重要的實際意義。如果使用傳統(tǒng)的方法,請地質(zhì)專家對巖石樣品進行定量數(shù)據(jù)分析和巖性定名,不僅會上漲大量的成本,而且還會耗費大量的精力和時間。因此,采用一種自動準(zhǔn)確地分割砂巖顆粒圖像的方法尤為重要。
傳統(tǒng)砂巖等顆粒分割方法是重點分析圖像的空間、紋理和顏色等特征[2]。出于計算能力的約束,傳統(tǒng)的分割算法,如:閾值分割算法[3]、決策樹分類算法[4]和基于像素級別的聚類分割算法[5]等,都是對灰度圖像提取初步的特征,然后再分割識別出物體。Zhan等[6]提出了一種基于直方圖累積矩的礦石圖像分割算法,通過計算灰度的累積矩來對減少圖像背景和噪聲引起的誤差,但對于小礦石顆粒仍然存在漏檢的情況。張建立等[7]引入了遺傳算法,結(jié)合最佳閾值分割來對礦石圖像分割,并研究了礦石的粒度分布。馮小雨[8]提出了改進的分水嶺算法對礦石圖像進行分割,利用圖像的脊線圖和連通域來計算礦石的個數(shù),但無法準(zhǔn)確地對堆疊狀態(tài)下的礦石顆粒做到精確檢測。Yang等[9]采用超像素圖像分割技術(shù),結(jié)合二維小波變換用于圖像降噪和非局部多尺度分?jǐn)?shù)微分來增強了暗圖像的紋理,使圖像能夠滿足爆破裝碎石粒度的統(tǒng)計研究。
隨著深度學(xué)習(xí)的不斷發(fā)展,巖石顆粒的識別分割已由傳統(tǒng)分割方法向深度學(xué)習(xí)識別分割方法過渡。Saxena等[10]使用Deeplab V3和ResNet-18對10類二元孔隙物分割(包含石英、長石、碳酸鹽顆粒等)。Wang等[11]提出了一種基于U-Net的新型多任務(wù)學(xué)習(xí)網(wǎng)絡(luò),改進模型解碼器,包括用于邊界檢測的邊界子網(wǎng)和用于掩碼分割的掩碼子網(wǎng)。李鴻翔等[12]提出一種基于GAN-UNet的分割方法,采用生成對抗網(wǎng)絡(luò)進行圖像分割,同時將判別器和生成器誤差通過加權(quán)方式引入網(wǎng)絡(luò)中訓(xùn)練。Das等[13]開發(fā)了深度語義粒度分割網(wǎng)絡(luò)DSGSN解決相鄰晶粒和基質(zhì)之間模糊的問題。覃本學(xué)等[14]針對巖屑圖像設(shè)計了一種巖屑分割網(wǎng)絡(luò)Debseg-net,結(jié)合深度可分離卷積保留圖像更多細節(jié)信息。湯翔中等[15]采用Transformer模塊解決長距離依賴的問題,結(jié)合注意力與多尺度空洞卷積提升網(wǎng)絡(luò)對金礦石邊緣特征的提取能力。闞玉達[16]提出了一種基于U-Net和改進分水嶺算法的露天礦爆堆礦石圖像分割算法,以實現(xiàn)大塊的精準(zhǔn)統(tǒng)計。Manzoor等[17]使用SegNet深度網(wǎng)絡(luò)實現(xiàn)對黏土、安克石和皓石等礦物進行分割。
隨著計算機視覺和深度學(xué)習(xí)的快速發(fā)展,相關(guān)地質(zhì)專家開始將神經(jīng)網(wǎng)絡(luò)的方法應(yīng)用到巖石的識別與分割領(lǐng)域。綜上調(diào)查研究,目前巖石礦物的分割與識別仍然停留在語義分割的層面,鮮有利用實例分割的方法來對砂巖等顆粒進行分割識別。在此類顆粒圖像中,考慮到很難獲取到足量的數(shù)據(jù)樣本進行訓(xùn)練。為了設(shè)計出更適合于砂巖顆粒的小樣本分割與識別模型,在Mask R-CNN[18]基礎(chǔ)上提出DGC-Mask R-CNN模型,使用數(shù)據(jù)增強技術(shù),添加預(yù)訓(xùn)練模型,改進特征融合網(wǎng)絡(luò),以期能夠更好地提高砂巖圖像的分割精度與識別數(shù)量。
實驗數(shù)據(jù)主要由探井實地采集了128張砂巖顆粒圖片,數(shù)據(jù)集劃分為訓(xùn)練集、驗證集、測試集,比例為6∶1∶1,樣圖如圖1所示。
圖1 高密度砂巖顆粒圖片F(xiàn)ig.1 Picture of high-density sandstone particles
Mask R-CNN模型是在Faster R-CNN[19]網(wǎng)絡(luò)的擴展,與物體邊界框Boundary box檢測并行的增加了一個預(yù)測分割物體輪廓Object mask的分支,本質(zhì)是先進行物體目標(biāo)檢測,再對物體進行語義分割,從而達到了實例分割的效果。該算法模型中主要是由ResNet50特征提取骨干網(wǎng)絡(luò)、特征融合網(wǎng)絡(luò)(feature pyramid network,FPN),區(qū)域候選網(wǎng)絡(luò)(region proposal network,RPN)、Head network頭部網(wǎng)絡(luò)[20]4個部分組成,網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。其中ResNet50是整個Mask R-CNN的特征提取骨干網(wǎng)絡(luò)backbone,主要用于特征提取并防止梯度消失,網(wǎng)絡(luò)由卷積模塊與殘差模塊兩個基本模塊組成。利用特征提取網(wǎng)絡(luò)將輸入的圖片進行卷積,得到4種特征,然后輸入FPN網(wǎng)絡(luò)中。
圖2 Mask R-CNN結(jié)構(gòu)圖Fig.2 Mask R-CNN structure diagram
對于FPN特征融合模塊,使用特征金字塔技術(shù),結(jié)合上采樣的方式將特征融合,得到一個完整有效的特征層傳入?yún)^(qū)域候選網(wǎng)絡(luò)。對于RPN區(qū)域候選網(wǎng)絡(luò),通過特征層,計算出可能的預(yù)測框,實現(xiàn)對目標(biāo)對象的基本篩選。利用區(qū)域特征聚集方式形成局部特征層,解決感興趣區(qū)域(region of interest,ROI)Pooling操作中兩次量化造成的區(qū)域不匹配的問題。局部特征層傳入回歸分類的分支中檢測物體的目標(biāo)框,有效特征層傳入全卷積網(wǎng)絡(luò)(fully convolutional network,FCN)得到物體的輪廓,實現(xiàn)語義分割。
Mask R-CNN在通用場景下已取得良好的分割識別的檢測效果,但針對少樣本高密度下的砂巖顆粒的分割與識別還存在一些不足。
當(dāng)訓(xùn)練樣本較少的情況下,模型訓(xùn)練會出現(xiàn)過擬合的情況;無法更有效地進行特征提取,仍然使用的較為傳統(tǒng)的基礎(chǔ)卷積算法(convolutional neural network,CNN);訓(xùn)練圖片的尺度過于單一;沒有針對性地解決砂巖顆粒在高度密集情況下分割識別的問題;沒有針對性地考慮小目標(biāo)下物體的分割與識別。
針對上述問題,DGC-Mask R-CNN模型主要改進思想如下。
(1)使用albumentations(Albu)數(shù)據(jù)庫[21]進行圖像增強來解決過擬合的問題。
(2)結(jié)合自監(jiān)督預(yù)訓(xùn)練模型Barlow Twins[22]來優(yōu)化圖像特征提取。
(3)改進特征融合網(wǎng)絡(luò)FPN,在FPN層中將傳統(tǒng)卷積替換為可變卷積(deformable convolution network,DCN)[23];添加注意力機制全局上下文模塊(global context block,GCB)[24]讓模型能夠更好地注意到高度密集的砂巖顆粒邊緣,來解決圖像目標(biāo)高密度的問題;并使用上采樣算子CARAFE(content-aware reassembly of features)[25]來解決小目標(biāo)識別與分割的問題。
DGC-Mask R-CNN通過ResNet50進行卷積操作,得到4個特征圖(C2~C5),通過特征融合網(wǎng)絡(luò)融合得到新的特征圖(P2~P5),DGC-Mask R-CNN網(wǎng)絡(luò)結(jié)構(gòu),如圖3所示。
圖3 改進的DGC-Mask R-CNN結(jié)構(gòu)圖Fig.3 Improved DGC-Mask R-CNN structure diagram
深度學(xué)習(xí)網(wǎng)絡(luò)往往需要大量的訓(xùn)練數(shù)據(jù)才能夠獲取良好的結(jié)果,并防止過度擬合。在高密度條件下,為每張圖片標(biāo)記的人工成本非常高,想要收集足夠的數(shù)據(jù)變得非常困難甚至不可能。因此在訓(xùn)練之前,可以使用Albu來進行圖像增強處理,來增強擴充數(shù)據(jù)集,得到的新樣本。
圖像增強是從現(xiàn)有樣本中,創(chuàng)建新樣本的過程。按照一定的概率,選擇將原始圖像進行平移,然后提高亮度,提高對比度,改變RGB 3個通道的值,改變色調(diào)飽和度,降低圖像質(zhì)量,隨機重新排列輸入RGB圖像通道,使用隨機大小的內(nèi)核模糊輸入圖像,從而得到一個新的完整的圖像。通過Albu圖像增強的圖片效果如圖4所示。
圖4 Albu增強的高密度砂巖顆粒圖片F(xiàn)ig.4 Albu enhanced high-density sandstone particle image
深度學(xué)習(xí)在計算機視覺領(lǐng)域,實現(xiàn)了圖像分割的自動化。但為了完成這一目標(biāo),往往需要使用大量的數(shù)據(jù)集及其對應(yīng)的標(biāo)簽。面對如此龐大的數(shù)據(jù),也同樣需要大量人工為其完成標(biāo)簽,這是一項煩瑣而昂貴的任務(wù),同時也容易受到人為誤差的影響。
針對這一問題,使用Mask R-CNN結(jié)合Barlow Twins自監(jiān)督學(xué)習(xí)模型,可讓少量數(shù)據(jù)集提取圖像特征更精確。受霍雷斯·巴洛(Horace Barlow)提出有效編碼假說的啟發(fā),神經(jīng)元通過旨在減少神經(jīng)元之間冗余的尖峰編碼進行通信。Zbonfar等[22]提出了一種基于冗余減少,用于自監(jiān)督學(xué)習(xí)。使每個神經(jīng)元滿足產(chǎn)生特征表示的兩個條件:①在不同的圖形增強下,兩個增強圖像的特征向量趨于相似;②同時最小化地減少這些向量的分量之間的冗余,從而獨立于其他神經(jīng)元。整體Barlow Twins框架如圖5所示。
圖5 Barlow Twins算法流程圖Fig.5 Barlow Twins algorithm flowchart
原始圖像A通過數(shù)據(jù)增強G,生成增強圖像BM和BN,利用兩個相同的編碼網(wǎng)絡(luò)Yμ,共享相同的參數(shù)和權(quán)重,分別生成特征向量EM和EN,生成互相關(guān)特征矩陣C。最后,為了滿足上述兩個條件,對模型進行微調(diào),通過損失函數(shù)LossBT,使矩陣C盡可能地趨近于單位矩陣,公式為
(1)
CNN是固定的幾何結(jié)構(gòu),利用多次卷積疊加來學(xué)習(xí)圖像的特征,然而該結(jié)構(gòu)限制了模擬幾何的轉(zhuǎn)變,卷積固定,池化無法自適應(yīng)調(diào)整空間特征,進而難以適應(yīng)不同形狀大小的檢測目標(biāo)。傳統(tǒng)的卷積操作,是對feature map上的一塊小區(qū)域進行加權(quán)平均,再輸出相應(yīng)值,形狀是規(guī)則的方形,假設(shè)一組卷積中R為采樣網(wǎng)格中的所有像素的集合,其中,中心像素相對于整個特征圖x的坐標(biāo)位置為p0,其他像素距中心像素的一個偏移的相對位置坐標(biāo)為pn,x(p0+pn)代表的為取出的每個像素的像素值,w(pn)為每個像素位置的權(quán)重,最后累加起來得到對應(yīng)位置的卷積值為y(p0),公式為
(2)
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)的感受野太規(guī)則,不能很好地捕捉特征,所以,引入可變卷積,在傳統(tǒng)卷積的基礎(chǔ)上對卷積后的特征點增加了一個浮點型可學(xué)習(xí)的偏置Δpn,公式為
(3)
引入了兩個模塊來加強CNN轉(zhuǎn)變模擬能力,稱之為可變卷積和可變ROI池化。這兩個模塊都沒有額外監(jiān)督,通過一定的偏移量使圖片中的空間采樣位置的感受野更大,并能夠從目標(biāo)檢測中學(xué)習(xí)并修改偏移量。新模塊可以替換傳統(tǒng)的CNN中對應(yīng)的模塊,并且能通過標(biāo)準(zhǔn)的反向傳播進行端到端訓(xùn)練,從而產(chǎn)生可變卷積網(wǎng)絡(luò),可變卷積網(wǎng)絡(luò)的結(jié)構(gòu)形式如圖6所示。
圖6 可變卷積的結(jié)構(gòu)圖Fig.6 Structure diagram of deformable convolutional networks
由于砂巖顆粒的形狀和樣式具有多樣性,使用傳統(tǒng)卷積CNN提取特征,同一卷積層的感受野范圍都一樣,這并不利于淺層神經(jīng)網(wǎng)絡(luò)提取圖像中物體的位置特征信息,但是不同的圖像區(qū)域可能對應(yīng)不同形狀大小的物體。與傳統(tǒng)卷積相比,可變卷積擁有更好的性能,感受野更為靈便寬廣,可以更好地適用于復(fù)雜多樣的砂巖顆粒,因此可以將可變卷積應(yīng)用于砂巖顆粒的識別與分割任務(wù)。在原始框架Mask R-CNN的骨干網(wǎng)絡(luò)ResNet50基礎(chǔ)上,將傳統(tǒng)卷積(CNN)替換成可變卷積網(wǎng)絡(luò)(DCN)來進行砂巖顆粒的檢測與分割,以解決具有任意大小和形狀的顆粒問題。將輸入的砂巖特征圖,通過卷積方式生成2N個特征圖,然后為每個特征圖,計算偏移量Δpn,生成可變形采樣點。該采樣點的位置能夠取代周圍擁有類似特征的像素點??勺兙矸e核步長為2×2、大小為3×3、輸出通道數(shù)為18、特征圖填充寬度為1的2D卷積層、特征圖填充寬度為1的2D卷積層作為偏移量[26]。按照這些參數(shù),將采樣點周圍像素的特征信息卷積成固定的大小,最后生成可變形特征圖像。
注意力機制是機器模仿人類視覺,對物體某些特定的地方著重注意的機制,根據(jù)信息的重要性,分配不同的權(quán)重,從而實現(xiàn)提取出重要的特征信息[27]。面對砂巖顆粒分布高度密集的情況,更需關(guān)注各個砂巖顆粒區(qū)域之間相連的邊緣信息。因此在Mask R-CNN中引入GCB自注意力機制,增強圖像中的特征提取。自注意力機制分為空間自注意力機制和通道自注意力機制[20],GCB屬于通道自注意力機制。
通道自注意力在各個通道壓縮像素信息,通過計算每個通道之間的權(quán)重比來提取信息。GCB由3個模塊組成。
(1)建立全局上下文的注意力池化模塊。該模塊將特征大小為C×H×W的矩陣M,輸入權(quán)重系數(shù)為Wk的1×1卷積中用于增加網(wǎng)絡(luò)深度,接著輸入Softmax激活函數(shù)中得到HW×1×1的權(quán)重矩陣Ms,最后Ms與權(quán)重大小為C×HW的矩陣Mw相乘,得到大小為C×1×1的全局上下文特征矩陣。
(3)通過廣播元素形成的特征融合。具體結(jié)構(gòu)如圖7所示,計算方法如式(4)所示。
(4)
GCB自注意力模塊在不同通道學(xué)習(xí)特征,有利于增強關(guān)鍵信息參數(shù)權(quán)重,突出了圖像中砂巖顆粒的重點特征,加強了模型提取砂巖顆粒識別的能力。
Mask R-CNN在FPN中,主要使用最近鄰插值法和雙線性插值法,對高階特征圖進行上采樣,但是這兩種插值只考慮到相鄰的亞像素空間,感知范圍較小,很難滿足小目標(biāo)語義信息,而且在插值過程中沒有考慮其他鄰近像素的影響,引入的噪聲在一定程度上會削弱小目標(biāo)特征的表示能力。
研究采用CARAFE上采樣模塊,替換原有的上采樣方式,利用特征圖來預(yù)測上采樣核。上采樣核感受野更廣,結(jié)合特征圖對應(yīng)的特征,可以快速提取并保留砂巖顆粒這種小目標(biāo)的特征信息,濾除與砂巖顆粒無關(guān)的背景噪聲,增強小目標(biāo)特征的表示能力。其次模塊輕量化,使用Softmax激活函數(shù)對空間自適應(yīng)權(quán)重進行實時預(yù)測,能夠降低模型訓(xùn)練的參數(shù)量和復(fù)雜度,提高網(wǎng)絡(luò)訓(xùn)練速度。經(jīng)過CARAFE上采樣后的特征圖,更能準(zhǔn)確地表示不規(guī)則的砂巖形狀,從而使模型能夠預(yù)測更好地分割效果。在FPN中融合CARAFE的結(jié)構(gòu)如圖8所示。
圖8 融合CARAFE的FPN層Fig.8 FPN layer fused with CARAFE
實驗使用同一平臺,服務(wù)器處理器為Intel Xeon CPU E5-2680 v4@2.40GHz,顯卡是TITAN Xp(12 GB),顯存為12 G。使用Labelme進行圖像標(biāo)注。用到的軟件開發(fā)環(huán)境為Linux,Python環(huán)境為3.8,Cuda 10.1,深度學(xué)習(xí)框架為Pytorch 1.6.0。設(shè)置模型訓(xùn)練的初始學(xué)習(xí)率為0.02,實驗迭代500個Epochs,每輪迭代次數(shù)為10代,共5 000代。
為了能夠比較全面地評價模型的性能,檢驗?zāi)P蛯ι皫r顆粒的檢測與分割效果,選取的評估指標(biāo)有損失函數(shù)(L)、平均精確度(AP)、均值平均精確度(mAP)。
損失函數(shù)能夠說明實驗預(yù)測值與真實值間的差距,損失值下降說明模型能夠趨向于收斂,損失值越小,表述模型越準(zhǔn)確,訓(xùn)練效果也越好。在模型實例分割任務(wù)中,損失函數(shù)為
L=Lrpn_cls+Lrpn_box+Lcls+Lbox+Lmask
(5)
式(5)中:Lrpn_cls、Lrpn_box、Lrpn_box、Lrpn_box、Lrpn_box分別為RPN層的分類誤差、RPN層的預(yù)測錨框誤差、分類誤差、檢測誤差和分割誤差。
平均精確度AP是預(yù)測目標(biāo)類別的平均準(zhǔn)確率,等于準(zhǔn)確率和召回率曲線(P-R曲線)與坐標(biāo)軸所圍面積,即P-R曲線的積分[28]。在這里選取的閾值范圍是交并比IoU=0.5,當(dāng)IoU≥0.5時設(shè)定測試樣本為正樣本。
均值平均精確度是使用coco數(shù)據(jù)集實現(xiàn)實例分割任務(wù)的通用評價指標(biāo)。mAP50、mAP75、mAPS、mAPM、mAPL分別表示交并比閾值為0.50、0.75和圖像物體為小、中、大3個尺寸的均值平均精確度。
4.3.1 模型收斂性實驗
將DGC-Mask R-CNN模型以及其他常用模型分別在砂巖數(shù)據(jù)集上進行訓(xùn)練,并對全部模型的損失值可視化輸出。訓(xùn)練損失值Loss和迭代次數(shù)Iter的關(guān)系,如圖9所示(收斂)。
圖9 訓(xùn)練損失值和迭代次數(shù)的關(guān)系圖Fig.9 Relationship between training loss value and iteration number
根據(jù)實驗中模型的loss曲線,可以看到所有模型的收斂速度,所有模型迭代到5 000次時,loss趨于穩(wěn)定,Cascade-Mask R-CNN[29]的表現(xiàn)最差。DGC-Mask R-CNN模型雖然在起始位置的時候,由于圖像增強以及自監(jiān)督預(yù)訓(xùn)練模型的緣故,導(dǎo)致模型的初始損失值比較大,但是,隨著迭代次數(shù)的增加,模型收斂的速度較快,能夠很快地將損失值降到最低,與其他的模型相比具有更低的損失值,說明模型訓(xùn)練效果最好。
4.3.2 分割效果對比
使用訓(xùn)練好的模型文件,預(yù)估測試集圖像的砂巖顆粒分割情況,與其余4種常用主流分割模型進行對比,檢測與分割的平均精確度如表1所示,均值平均精確度如表2和表3所示,識別分割實際的效果對比如圖10所示。
表1 實例分割中目標(biāo)檢測和分割掩碼的平均精度值Table 1 The average precision value of object detection and segmentation mask in instance segmentation
表2 實例分割中目標(biāo)檢測的均值平均精確度Table 2 Mean average precision of object detection in instance segmentation
表3 實例分割中掩碼分割均值平均精確度Table 3 Mean average precision of Mask segmentation in instance segmentation
模型能夠識別分割出來的砂巖顆粒被填充為黃色;紅色虛線框表示的是在預(yù)測模型中沒有識別分割出來的砂巖顆粒圖10 識別分割的結(jié)果展示圖Fig.10 Display diagram of recognition segmentation results
如表1所示,改進后的DGC-Mask R-CNN在掩碼分割的平均精確度方面達到88.9%,在目標(biāo)檢測方面的平均精確度到達了88.8%;與基準(zhǔn)模型Mask R-CNN相比,分割和檢測平均精確度分別提升了20.0%和19.8%;與Cascade-Mask R-CNN相比,檢測和分割平均精確度分別提升了26.5%和24.4%;與Mask Scoring R-CNN[30]相比,檢測和分割平均精確度分別提升了19.8%和20.3%;與HybridTaskCascade[31]相比,平均精確度分別提升了23.1%和23.0%。
如表2、表3所示,所提出DGC-Mask R-CNN比其他模型在目標(biāo)檢測與分割方面的提升都較為明顯。
改進之后的模型,在mAPS方面提升較為突出,與模型Mask R-CNN相比,檢測和分割在均值平均精確度方面,分別提升了228%和170%。說明改進后的模型能夠更好地適應(yīng)小目標(biāo)的檢測與分割。
如圖10所示,第一列的圖是原圖,剩下其他的圖是模型分割識別過后的效果圖,第二行的圖,皆是第一行圖的局部效果對比圖。可以看到,通過Mask R-CNN改進后的模型,在局部圖中僅有一個砂巖顆粒未被識別出來,相較于其他的模型,識別砂巖顆粒的個數(shù)更多,輪廓更細致。
(1)基于Mask R-CNN進行改進,對高密度、少樣本的砂巖顆粒進行識別研究。針對少量樣本圖片的情況,模型引入了Albu圖像增強技術(shù),防止了過擬合的現(xiàn)象,引入Barlow Twins自監(jiān)督預(yù)訓(xùn)練模型,DCN可變形卷積神經(jīng)網(wǎng)絡(luò),更有利于網(wǎng)絡(luò)學(xué)習(xí)到砂巖顆粒的特征,結(jié)合GCB注意力機制,解決了高密度情況下圖像識別精度不夠的問題,再加上CARAFE算子,使得小目標(biāo)的檢測更加精確。改進后算法在分割和檢測兩方面的平均精度達到了88.9%和88.8%,相比基礎(chǔ)模型Mask R-CNN準(zhǔn)確率提升了20.0%和19.8%;相比Cascade-Mask R-CNN模型準(zhǔn)確率提升了26.5%和24.4%;相比Mask Scoring R-CNN模型準(zhǔn)確率提升了19.8%和20.3%;相比HybridTaskCascade模型準(zhǔn)確率提升了23.1%和23.0%,能夠達到實際項目需求的標(biāo)準(zhǔn)。
(2)改進Mask R-CNN的mAP均值平均精確度在各個方面都較大的提升,相較基礎(chǔ)模型Mask R-CNN在檢測和分割均值平均精確度方面,提升了228%和170%。結(jié)果表明,改進的模型在對小目標(biāo)的識別和分割方面具有較大的優(yōu)勢。
(3)所提的改進Mask R-CNN算法相較其他的算法實現(xiàn)更加精準(zhǔn)的檢測與識別,對少樣本高密度形態(tài)不同的顆粒都能夠較好地檢測與識別,具有很好的魯棒性。在以后的應(yīng)用中,將繼續(xù)完善模型,增加砂巖顆粒數(shù)據(jù)集,豐富巖石顆粒的模型。在工程應(yīng)用中,為石油和其他行業(yè)的地質(zhì)研究提供準(zhǔn)確性強、效率高的研究工具和科學(xué)手段。