亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于集成學(xué)習(xí)的煤和矸石圖像識別技術(shù)研究與實現(xiàn)

        2021-06-28 19:10:38郜亞松
        電腦知識與技術(shù) 2021年10期
        關(guān)鍵詞:集成學(xué)習(xí)

        郜亞松

        摘要:針對目前基于深度學(xué)習(xí)方法對煤和矸石識別研究中所存在的數(shù)據(jù)使用效率低,泛化能力差等問題,本文提出采用交叉驗證的方法來提升研究目標(biāo)對象數(shù)據(jù)的利用效率,并對訓(xùn)練集數(shù)據(jù)添加人工噪聲,從而提升深度模型的泛化能力。另外在訓(xùn)練過程中以驗證集ROC提前終止訓(xùn)練的依據(jù),可以兼顧實際生產(chǎn)中對煤和矸石識別的查準(zhǔn)率和召回率的要求,同時加速網(wǎng)絡(luò)的訓(xùn)練過程。最后在測試集進(jìn)行模型預(yù)測時采用TTA(Test Time Augmentation)方法提升模型預(yù)測結(jié)果的穩(wěn)定性,并采用集成學(xué)習(xí)的方法將多個深度計算模型的預(yù)測結(jié)果進(jìn)行融合,以此提升整個識別方法的性能。經(jīng)過實驗研究結(jié)果發(fā)現(xiàn),通過以上方法可以在小型數(shù)量級上較快得到一個具有較高識別精度和召回率識別模型,并且模型的預(yù)測結(jié)果更能夠反映模型在實際生產(chǎn)環(huán)境中的真實表現(xiàn)。綜上可以得知,本文所實現(xiàn)的模型方法更能夠適應(yīng)煤和矸石的識別研究領(lǐng)域的需求,對未來深度學(xué)習(xí)方法在煤矸識別的研究具有較高的實際應(yīng)用價值和意義。

        關(guān)鍵詞:煤矸識別;集成學(xué)習(xí);人工噪聲;交叉驗證;TTA

        中圖分類號:TP31? ? ? ? 文獻(xiàn)標(biāo)識碼:A

        文章編號:1009-3044(2021)10-0197-03

        煤作為我國主要能源供應(yīng),而矸石則是對煤產(chǎn)能效率的主要影響因素,所以如何有效地降低矸石含量,對于提升燃煤功能效率,具有很高的實際應(yīng)用價值。

        傳統(tǒng)對于煤和矸石識別的研究主要分為兩點,其中一種較為復(fù)雜的是煤和矸石的物理性質(zhì)差異實現(xiàn)的識別技術(shù),比較有代表性的有射線法,振動法等。但此類方法對于我國采煤環(huán)境地質(zhì)復(fù)雜的情況不能很好適用,另外,這些工業(yè)方法會帶來嚴(yán)重的輻射污染,聲污染以及水污染等[1-2]。第二種則是根據(jù)煤和矸石在圖像上所呈現(xiàn)出來的視覺差異所實現(xiàn)的識別技術(shù),其中比較有代表性的分為基于手動提取的紋理,灰度等特征所實現(xiàn)的機器學(xué)習(xí)識別方法[3-4]。另一個是基于深度學(xué)習(xí)所實現(xiàn)的自主特征學(xué)習(xí)的圖像識別方法,該方法相比于傳統(tǒng)機器學(xué)習(xí)圖像識別方法具有較高的泛化能力,并且可以通過對深度網(wǎng)絡(luò)模型的復(fù)雜度以及結(jié)構(gòu)進(jìn)行調(diào)整,更方便的應(yīng)對實際生產(chǎn)對模型的精度或速度的要求[5-6]。

        通過對相關(guān)文獻(xiàn)資料查詢得知,目前基于深度學(xué)習(xí)模型在煤矸石識別的研究中。從數(shù)據(jù)集采集方面來說,大多數(shù)數(shù)據(jù)量總和基本位于5萬張左右,這樣的小型數(shù)據(jù)量對于深度學(xué)習(xí)網(wǎng)絡(luò)來說若采用簡單的訓(xùn)練集,驗證集以及測試集的數(shù)據(jù)劃分方式是很難高效的利用數(shù)據(jù),同時也會對模型最終反映出來的評價指標(biāo)有著較大的影響,使之無法真實地反映出模型本身的性能。除了研究中的數(shù)據(jù)集大小的問題之外,在實驗室環(huán)境中所采集得到的煤和矸石的圖像一般是比較清晰的,并沒有像實際生產(chǎn)環(huán)境中所存在的粉塵,部分遮蔽物等諸多噪聲的情況,并且在測試集中數(shù)據(jù)同樣是沒有相應(yīng)的噪聲信息,所以對應(yīng)得到的深度識別網(wǎng)絡(luò)模型的存在嚴(yán)重的過擬合問題。針對以上情況,本文提出使用交叉驗證的方法來提升數(shù)據(jù)的使用效率,并且采用集成學(xué)習(xí)的方法融合多個深度識別模型的識別效果,從而來實現(xiàn)一個具有一個整體性能較強的煤和矸石的識別方法。另外通過對訓(xùn)練集數(shù)據(jù)添加人工噪聲的方法,進(jìn)一步的提升網(wǎng)絡(luò)模型的泛化能力。最后在數(shù)據(jù)預(yù)測過程中采用TTA技術(shù)來提升網(wǎng)絡(luò)預(yù)測結(jié)果的穩(wěn)定性,同時采用集成學(xué)習(xí)的方法融合多個深度模型的預(yù)測結(jié)果來進(jìn)一步提升網(wǎng)絡(luò)的性能。本次研究,主要針對目前基于深度學(xué)習(xí)對煤和矸石圖像識別研究中所存在的問題提出了相應(yīng)的解決方法,對未來深度學(xué)習(xí)方法在煤和矸石智能化的研究中具有較高的實際應(yīng)用意義和價值。

        1 相關(guān)工作

        本次對于煤和矸石識別技術(shù)的研究使用的是深度學(xué)習(xí)網(wǎng)絡(luò),其中挑選的是在各個相關(guān)識別比賽和實際應(yīng)用中較多的兩種網(wǎng)絡(luò),即ResNet系列和EfficientNet系列網(wǎng)絡(luò)。其中ResNet中所具有的殘差網(wǎng)絡(luò)結(jié)構(gòu)是目前所有深度網(wǎng)絡(luò)模型的基礎(chǔ),該結(jié)構(gòu)可以很好的降低由于網(wǎng)絡(luò)深度加深所帶來的特征消失等問題,可以有效地提升深度網(wǎng)絡(luò)模型的可訓(xùn)性[7]。

        EfficientNet網(wǎng)絡(luò)是目前在各個深度學(xué)習(xí)相關(guān)競賽以及公司研發(fā)深度學(xué)習(xí)相關(guān)產(chǎn)品中首先考慮使用的深度學(xué)習(xí)網(wǎng)絡(luò)模型,該模型兼?zhèn)淞怂俣群途?。該網(wǎng)絡(luò)模型摒棄了傳統(tǒng)深度模型計算中為了追求速度和精度所使用的簡單剪枝和加深網(wǎng)絡(luò)的做法,而是通過研究出平衡網(wǎng)絡(luò)深度,寬度和輸入數(shù)據(jù)分辨率的方法來達(dá)到對速度和精度不同目的的要求[8]。

        以往煤和矸石圖像在進(jìn)行訓(xùn)練時所采用的增強技術(shù)一般是對圖像進(jìn)行旋轉(zhuǎn),隨機裁剪或者是顏色相關(guān)的方法,這些方法可以很好地減小了模型對圖像中煤或矸石的位置,以及亮度等因素的敏感度。但在煤和矸石的實際生產(chǎn)環(huán)境充滿了各種視覺噪聲信息,所以為了進(jìn)一步的提升深度模型對復(fù)雜環(huán)境的魯棒性,本次研究中將針對圖像采取人工添加噪聲的方法對圖像進(jìn)行增強處理,其中包括在圖像信息中添加霧噪聲,雨噪聲以及隨機裁剪等,對應(yīng)產(chǎn)生的人工噪聲增強的圖像效果如圖所示。

        集成學(xué)習(xí)和測試時增強技術(shù)TTA(Test Time Augmentation)[9]兩者都是一種對預(yù)測結(jié)果做進(jìn)一步處理的操作方法,其中TTA技術(shù)主要是對采用增強技術(shù)處理的測試集進(jìn)行多次預(yù)測并求其均值作為最終預(yù)測結(jié)果的一個模型預(yù)測方法,該方法可以對一個模型的預(yù)測結(jié)果起到穩(wěn)定的作用。而集成學(xué)習(xí)的方法則是將多個深度模型預(yù)測的結(jié)果,按照其對應(yīng)任務(wù)目標(biāo)要求所占的比重,對應(yīng)分配其不同的權(quán)重,然后進(jìn)行預(yù)測結(jié)果融合,可以有效地提升預(yù)測結(jié)果的性能。

        2 網(wǎng)絡(luò)模型搭建

        雖然對于煤和矸石圖像識別的目標(biāo)設(shè)定中是二分類問題,但是若對于網(wǎng)絡(luò)的輸出設(shè)置為非煤即矸石的設(shè)定就會極大地降低網(wǎng)絡(luò)的魯棒性。例如向模型中傳入既不是煤也不是矸石的圖像,經(jīng)過模型輸出判斷結(jié)果。若設(shè)定真正例為煤,那么輸入圖像的經(jīng)過網(wǎng)絡(luò)的判斷非煤,那么網(wǎng)絡(luò)就會判定為矸石,所以在對網(wǎng)絡(luò)的輸出設(shè)定含有兩個節(jié)點的輸出,并且要通過正確的調(diào)整判斷閾值來進(jìn)行最終結(jié)果的限定,而不是僅僅使用非A即B的判斷,對應(yīng)網(wǎng)絡(luò)結(jié)構(gòu)如下所示。

        3 實驗過程與結(jié)果

        3.1 模型訓(xùn)練過程

        為了能夠從有限的煤和矸石的數(shù)據(jù)中訓(xùn)練得到最佳的識別模型,在訓(xùn)練過程中需要合理的對一些參數(shù)進(jìn)行設(shè)定。首先對所采集到的所有數(shù)據(jù)90%作為訓(xùn)練集數(shù)據(jù),然后將訓(xùn)練集根據(jù)交叉驗證訓(xùn)練的劃分經(jīng)驗和實驗中數(shù)據(jù)的總量劃分個數(shù)K為5,每個訓(xùn)練子集的輪次為15輪次,而初始學(xué)習(xí)率的設(shè)置由于采用了預(yù)訓(xùn)練權(quán)重,對應(yīng)的學(xué)習(xí)率可以設(shè)置為較小的值,以實現(xiàn)對模型權(quán)重參數(shù)的微調(diào),所以將初始學(xué)習(xí)率設(shè)置為0.0005,學(xué)習(xí)率衰減因子為0.4。除了以上兩種常規(guī)深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練中所設(shè)置的參數(shù),還包含了提前終止訓(xùn)練上限值,經(jīng)過數(shù)次訓(xùn)練之后確定了值為3,所代表的意思是當(dāng)對在劃分后的一個訓(xùn)練集上的模型隨著輪次不斷推進(jìn)時,連續(xù)3次出現(xiàn)ROC得分沒有得到提升,則提前終止模型在該子集上的訓(xùn)練。最后將本次訓(xùn)練中TTA參數(shù)的設(shè)置為3,表示將會使用訓(xùn)練好的模型在測試集上預(yù)測3次,然后將3次的預(yù)測得分求其均值,圖中所示模型訓(xùn)練過程的工作流程。

        從圖中可以看到,在對不同劃分情況的訓(xùn)練集和驗證集訓(xùn)練完成之后,都會直接對本次劃分情況下所產(chǎn)生的最佳識別模型進(jìn)行預(yù)測TTA次預(yù)測,然后將預(yù)測結(jié)果求均值。在完成最后k個劃分的訓(xùn)練之后,將所有的預(yù)測結(jié)果根據(jù)k值求均值,最終完成對一個深度網(wǎng)絡(luò)的完整模型訓(xùn)練。

        3.2 模型預(yù)測結(jié)果與性能評估

        為了驗證本文所實現(xiàn)的煤和矸石識別方法的優(yōu)勢,將選擇一組對比模型進(jìn)行實驗,其中改組模型在未采用人工噪聲增強的訓(xùn)練集上進(jìn)行訓(xùn)練,然后通過交叉驗證的方式取得最好的模型效果,然后將該模型分別對沒有噪聲的測試集上和有噪聲的測試集進(jìn)行測試,并對其ROC曲線進(jìn)行對比分析,對應(yīng)的曲線如下所示。

        從圖中可以看到,對于a組未采用噪聲訓(xùn)練的模型在沒有噪聲的測試集上的表現(xiàn)幾乎接近百分之百,但是當(dāng)用于含有噪聲的測試集上的時候,對應(yīng)的網(wǎng)絡(luò)性能產(chǎn)生了大幅度的下降,整個網(wǎng)絡(luò)在兩個數(shù)據(jù)集上的表現(xiàn)可以反映出未采用人工噪聲訓(xùn)練得到的模型對于未知數(shù)據(jù)泛化能力是很堪憂的。而在本文設(shè)計實現(xiàn)的生成的模型在含有噪聲和沒有噪聲的測試集上的變現(xiàn)雖然有小幅度的變化,但是基本預(yù)測結(jié)果數(shù)據(jù)分布相同,模型泛化能力得到大幅度的增強。另外,為了驗證集成學(xué)習(xí)對于模型預(yù)測性能提升的有效性,選擇了對ResNet系列網(wǎng)絡(luò)和EfficientNet系列網(wǎng)絡(luò)的預(yù)測結(jié)果進(jìn)行結(jié)果增強,對應(yīng)的ROC曲線如下所示。

        從圖中可以看到在沒有采用集成學(xué)習(xí)的方法對預(yù)測結(jié)果進(jìn)行預(yù)測之前的網(wǎng)絡(luò)由于深度的變化對應(yīng)的ROC得分有一定的起伏和波動,通過集成學(xué)習(xí)的方法處理之后對應(yīng)整個網(wǎng)絡(luò)的ROC得分得到的一定的增強,在ResNet網(wǎng)絡(luò)這種性能表現(xiàn)較弱的學(xué)習(xí)機的提升更是明顯,并且對應(yīng)的預(yù)測結(jié)果得分相比原始模型更加平滑,在煤和矸石的圖像識別上具有更好的性能。

        4 結(jié)束語

        本文主要提出使用交叉驗證的方法對煤和矸石圖像識別技術(shù)進(jìn)行研究,可以很好地對有限的數(shù)據(jù)資源進(jìn)行高效率的使用,并且通過針對性人工噪聲添加的方法來提升網(wǎng)絡(luò)模對煤和矸石復(fù)雜識別環(huán)境的魯棒性,從而提升了深度計算模型實際應(yīng)用價值。另外通過TTA技術(shù)對預(yù)測結(jié)果進(jìn)行均值化處理,最后通過集成學(xué)習(xí)的方法融合多種深度識別模型方法對整個識別效果進(jìn)行性能提升,經(jīng)試驗驗證以上技術(shù)在煤和矸石識別的研究中對模型的整體提升具有顯著的效果,有效地促進(jìn)了深度學(xué)習(xí)在煤和矸石自動識別領(lǐng)域的應(yīng)用,對未來進(jìn)步的推進(jìn)煤和矸石自動化識別的研究具有較高的實際應(yīng)用價值和意義。

        參考文獻(xiàn):

        [1] 孟繁明,郭科偉.基于雙能γ射線透射技術(shù)的煤矸石識別與分選系統(tǒng)研究[J].黑龍江科技信息,2013(36):83.

        [2] 李福仁.選煤技術(shù)及工藝流程的研究[J].石化技術(shù),2020,27(7):309,311.

        [3] 余樂,鄭力新,杜永兆,等.采用部分灰度壓縮擴階共生矩陣的煤和煤矸石圖像識別[J].華僑大學(xué)學(xué)報(自然科學(xué)版),2018,39(6):906-912.

        [4] 洪惠超.基于機器視覺的煤矸石分選算法的研究[D].泉州:華僑大學(xué),2018.

        [5] 曹現(xiàn)剛,薛禎也.基于遷移學(xué)習(xí)的GoogLenet煤矸石圖像識別[J].軟件導(dǎo)刊,2019,18(12):183-186.

        [6] 王鵬,曹現(xiàn)剛,夏晶,等.基于機器視覺的多機械臂煤矸石分揀機器人系統(tǒng)研究[J].工礦自動化,2019,45(9):47-53.

        [7] Tan MX,leQ V.EfficientNet:rethinking model scaling for convolutional neural networks[EB/OL].2019[LinkOut]

        [8] Szegedy C,Ioffe S,Vanhoucke V,et al.Inception-v4,Inception-ResNet and the Impact of Residual Connections on Learning[C].National Conference on Artificial Intelligence, 2016: 4278-4284.

        [9] Wang G T,LiW Q,AertsenM,et al.Aleatoric uncertainty estimation with test-time augmentation for medical image segmentation with convolutional neural networks[J].Neurocomputing,2019,338:34-45.

        【通聯(lián)編輯:梁書】

        猜你喜歡
        集成學(xué)習(xí)
        一種不平衡數(shù)據(jù)集成分類方法
        機器學(xué)習(xí)隨機森林算法的應(yīng)用現(xiàn)狀
        不平衡數(shù)據(jù)分類問題解決辦法
        基于集成學(xué)習(xí)改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的手寫字符識別
        基于阿里巴巴大數(shù)據(jù)重復(fù)購買預(yù)測的實證研究
        時代金融(2018年3期)2018-02-07 09:40:23
        基于集成學(xué)習(xí)的房價預(yù)測模型
        基于局部有效性的選擇性決策樹集成
        基于集成學(xué)習(xí)的高送轉(zhuǎn)股票研究
        時代金融(2016年36期)2017-03-31 05:44:10
        基于稀疏編碼器與集成學(xué)習(xí)的文本分類
        基于屬性權(quán)重的Bagging回歸算法研究
        我的极品小姨在线观看| 少妇spa推油被扣高潮| 亚洲第一看片| 日韩人妻中文字幕一区二区| 日本不卡视频一区二区| 男女猛烈无遮挡免费视频| 亚洲欧洲巨乳清纯| 无码av免费精品一区二区三区| 国产一区二区白浆在线观看| 亚洲国产精品无码久久一线| 国产精品无码a∨精品影院| 天天草夜夜草| 国产伦一区二区三区久久| 日韩午夜理论免费tv影院| 国产乱妇乱子在线播视频播放网站| 亚洲中文字幕久久精品蜜桃 | 中文字幕精品亚洲二区| 偷拍综合在线视频二区日韩| 国产欧美日韩一区二区三区| japanese无码中文字幕| 亚洲青涩在线不卡av| 日本五十路人妻在线一区二区| 色爱无码av综合区| 国产精品一久久香蕉国产线看观看| 国产一级黄色性生活片| 国产极品少妇一区二区| 97成人碰碰久久人人超级碰oo| 亚洲精品123区在线观看| 一区二区三区在线乱码| 草草地址线路①屁屁影院成人| 中文字幕精品久久久久人妻红杏1 丰满人妻妇伦又伦精品国产 | 亚洲欧洲日产国码无码久久99| 亚洲av一区二区国产精品| 成人免费av高清在线| 国产成人精品a视频一区| 日本成人久久| av网站一区二区三区| 日本污ww视频网站| 国模无码人体一区二区| 国产激情一区二区三区在线蜜臀 | 日韩欧美在线综合网|