李秋彤
(長安大學(xué)工程機(jī)械學(xué)院,陜西 西安 710021)
隨著社會(huì)智能化程度的不斷提高,智能控制技術(shù)在工程機(jī)械控制中的運(yùn)用越來越廣泛,工程機(jī)械產(chǎn)業(yè)的智能化進(jìn)程不斷加快[1]。為使機(jī)群中挖掘機(jī)的協(xié)同工作效果達(dá)到最佳,需要加強(qiáng)對(duì)挖掘機(jī)的智能化管理和科學(xué)調(diào)度,挖掘機(jī)制造商識(shí)別系統(tǒng)的設(shè)計(jì)與完善,對(duì)于實(shí)現(xiàn)工程機(jī)械的智能化、集群化管理具有重要意義[2]。近年來,深度神經(jīng)網(wǎng)絡(luò)開始走向?qū)嵱没?,隨著深度學(xué)習(xí)的快速發(fā)展,計(jì)算機(jī)視覺領(lǐng)域中各種視覺處理任務(wù)的效果得到了極大提高[3]。為了取得進(jìn)一步突破,許多科研人員開始從人類視覺特性角度出發(fā),結(jié)合額外知識(shí)表示進(jìn)行圖像處理[4]。本文選定Alexnet深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過調(diào)整模型的參數(shù),探究特征提取網(wǎng)絡(luò)參數(shù)改變對(duì)挖掘機(jī)生產(chǎn)商識(shí)別效果的影響。
繪制流程圖有助于更加順利地完成課題,在正式開始軟件設(shè)計(jì)流程之前,有必要先繪制軟件設(shè)計(jì)流程圖,軟件初步設(shè)計(jì)流程圖如圖1所示。
圖1 軟件初步設(shè)計(jì)流程圖
本文主要以挖掘機(jī)為研究對(duì)象,識(shí)別任務(wù)目標(biāo)體積較大,因此需要網(wǎng)絡(luò)適合識(shí)別大中型目標(biāo)。本文所使用的挖掘機(jī)數(shù)據(jù)集較小,要求網(wǎng)絡(luò)具有良好的特征學(xué)習(xí)能力和較強(qiáng)的抗過擬合性能,同時(shí)要求盡可能提高網(wǎng)絡(luò)識(shí)別的訓(xùn)練速度,并且還對(duì)網(wǎng)絡(luò)的可移植性有一定的要求[5]。因此,選擇較為基礎(chǔ)且易于掌握的Alexnet作為本次實(shí)驗(yàn)的基礎(chǔ)框架。
1)圖像數(shù)據(jù)集的構(gòu)建。本文依據(jù)不同的挖掘機(jī)生產(chǎn)商圖像建立了一個(gè)包含18家挖掘機(jī)生產(chǎn)商圖像的樣本數(shù)據(jù)集,共計(jì)搜集了900張圖片,基本包含了工程實(shí)際生產(chǎn)中常見的挖掘機(jī)生產(chǎn)商。由于資源搜集能力的限制,每一家廠商搜集到50張照片。為了保證識(shí)別的精度,每個(gè)圖像中僅有一輛或兩輛挖掘機(jī),并且圖像中的生產(chǎn)商特征沒有重疊或損壞,如圖2所示。
圖2 數(shù)據(jù)集中的圖像舉例
2)圖像數(shù)據(jù)集的標(biāo)簽化處理。由于深度學(xué)習(xí)算法屬于有監(jiān)督的學(xué)習(xí)方式[6],需要采用有標(biāo)簽的樣本圖片進(jìn)行訓(xùn)練,采集得到的各型挖掘機(jī)圖像并沒有標(biāo)簽,因此需要對(duì)所搜集的挖掘機(jī)圖像進(jìn)行人工標(biāo)定。識(shí)別的目標(biāo)為挖掘機(jī)生產(chǎn)商,理論上打標(biāo)簽的對(duì)象為挖掘機(jī)身上的生產(chǎn)商標(biāo)志,但是在實(shí)際工程應(yīng)用中需要識(shí)別整個(gè)挖掘機(jī),本文創(chuàng)新性地設(shè)計(jì)了“整機(jī)+生產(chǎn)商標(biāo)志”的組合數(shù)據(jù)集,既解決了實(shí)際工程中的整機(jī)識(shí)別問題,又保證了識(shí)別精度。為了測(cè)試不同標(biāo)簽方法的識(shí)別效果,本文嘗試建立了3種不同的數(shù)據(jù)集即生產(chǎn)商標(biāo)志數(shù)據(jù)集、“整機(jī)+生產(chǎn)商標(biāo)志”數(shù)據(jù)集和整機(jī)數(shù)據(jù)集,本文分別對(duì)3種數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)訓(xùn)練,并根據(jù)最終的訓(xùn)練結(jié)果選定最優(yōu)的數(shù)據(jù)集方案。
3)圖像數(shù)據(jù)集的歸一化處理。網(wǎng)絡(luò)模型中的訓(xùn)練數(shù)據(jù)來自于imagelabeler裁剪出來的圖像,裁剪出來的圖像大小并不能做到完全一致,所以存在圖像規(guī)格不統(tǒng)一的問題。又因?yàn)锳lexnet網(wǎng)絡(luò)模型所要求的圖像輸入尺寸為227×227×3,所以本文對(duì)搜集到的挖掘機(jī)圖像進(jìn)行了歸一化處理,統(tǒng)一了數(shù)據(jù)集中圖像的規(guī)格。
4)圖像數(shù)據(jù)集的擴(kuò)充。本文通過旋轉(zhuǎn)圖像、添加噪聲等手段進(jìn)行了圖像數(shù)據(jù)集的擴(kuò)充。
通過以上步驟,最終生成來自18家挖掘機(jī)生產(chǎn)商的4500幅圖像。每個(gè)生產(chǎn)商有250張圖像,每張圖像的尺寸為227×227×3。
采用遷移學(xué)習(xí)方法訓(xùn)練得到的網(wǎng)絡(luò)模型識(shí)別精度更高、訓(xùn)練效果更好[7],因此本文采用遷移學(xué)習(xí)方法。在對(duì)本次實(shí)驗(yàn)的數(shù)據(jù)集進(jìn)行訓(xùn)練后,通過不斷調(diào)整網(wǎng)絡(luò)的參數(shù),使網(wǎng)絡(luò)與本文數(shù)據(jù)集更好匹配,提高訓(xùn)練精度,減少訓(xùn)練時(shí)長,最終找到使得網(wǎng)絡(luò)的性能和實(shí)用性達(dá)到最優(yōu)的一組網(wǎng)絡(luò)模型。
通過不斷調(diào)試Alexnet網(wǎng)絡(luò)的主要參數(shù),得到了若干組網(wǎng)絡(luò)模型,其中權(quán)重為5、偏差為5、Minibatchsize為10、MaxEpochs為6、學(xué)習(xí)率為0.0001、測(cè)驗(yàn)頻率為10的一組網(wǎng)絡(luò)模型的準(zhǔn)確率為87.89%,為本次試驗(yàn)最佳結(jié)果。
1)挖掘機(jī)生產(chǎn)商類別數(shù)的對(duì)比實(shí)驗(yàn)。分別使用挖掘機(jī)生產(chǎn)商類別數(shù)為9家、18家、27家的數(shù)據(jù)集進(jìn)行訓(xùn)練,三類數(shù)據(jù)集每類的圖像數(shù)量一致。在對(duì)比實(shí)驗(yàn)中的三次訓(xùn)練使用了相同的參數(shù),訓(xùn)練結(jié)果如圖3、圖4、圖5所示。
圖3 9類生產(chǎn)商識(shí)別結(jié)果
圖4 18類生產(chǎn)商識(shí)別結(jié)果
圖5 27類生產(chǎn)商識(shí)別結(jié)果
由訓(xùn)練結(jié)果可知,在使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用9組生產(chǎn)商的數(shù)據(jù)集的識(shí)別精度為91.78%,訓(xùn)練時(shí)間為8 min24 s;使用18組生產(chǎn)商的數(shù)據(jù)集的識(shí)別精度為87.89%,訓(xùn)練時(shí)間為23 min10 s,使用27組生產(chǎn)商的數(shù)據(jù)集的識(shí)別精度為82.15%,訓(xùn)練時(shí)間為116 min25 s。隨著輸入訓(xùn)練的數(shù)據(jù)集的類別增多,網(wǎng)絡(luò)的識(shí)別精度逐漸下降,且訓(xùn)練時(shí)間不斷上升,綜合考慮訓(xùn)練時(shí)間與訓(xùn)練精度的影響,以及最終工程應(yīng)用中需要的識(shí)別種類,決定選用18家目前市面常見的挖掘機(jī)生產(chǎn)商作為數(shù)據(jù)集,既能夠保證較高的識(shí)別率和訓(xùn)練速度,又可以涵蓋目前市面上的大部分生產(chǎn)商。
2)使用不同標(biāo)簽標(biāo)定數(shù)據(jù)集的對(duì)比實(shí)驗(yàn)。分別使用只有生產(chǎn)商標(biāo)志的數(shù)據(jù)集、“整機(jī)+生產(chǎn)商標(biāo)志”的數(shù)據(jù)集以及挖掘機(jī)整機(jī)的數(shù)據(jù)集進(jìn)行訓(xùn)練,保持三類數(shù)據(jù)集的圖像數(shù)量相同,并且在對(duì)比實(shí)驗(yàn)中的訓(xùn)練使用了相同的參數(shù)。生產(chǎn)商標(biāo)志的數(shù)據(jù)集中共18類,每類有250張生產(chǎn)商標(biāo)志圖像,訓(xùn)練后精度為91.33%;挖掘機(jī)“整機(jī)+生產(chǎn)商標(biāo)志”的數(shù)據(jù)集共18類,每類有250張圖像,其中整機(jī)圖像200張,生產(chǎn)商標(biāo)志圖像50張,訓(xùn)練后精度為87.89%;挖掘機(jī)整機(jī)的數(shù)據(jù)集共18類,每類有250張整機(jī)圖像,訓(xùn)練后精度為83.33%。
在使用相同網(wǎng)絡(luò)和參數(shù)的情況下,使用僅有生產(chǎn)商標(biāo)志的數(shù)據(jù)集精確度最高,但若輸入挖掘機(jī)整機(jī)圖像其無法識(shí)別挖掘機(jī)生產(chǎn)商,只能輸入生產(chǎn)商標(biāo)志進(jìn)行識(shí)別,“整機(jī)+生產(chǎn)商標(biāo)志”數(shù)據(jù)集識(shí)別率明顯高于僅有挖掘機(jī)整機(jī)的數(shù)據(jù)集。實(shí)驗(yàn)結(jié)果表明,使用挖掘機(jī)整機(jī)與生產(chǎn)商標(biāo)志混合的數(shù)據(jù)集可以有效提高訓(xùn)練效果。
文章對(duì)挖掘機(jī)生產(chǎn)商圖像識(shí)別系統(tǒng)軟件設(shè)計(jì)展開研究。介紹了挖掘機(jī)生產(chǎn)商自動(dòng)識(shí)別系統(tǒng)的建立過程,對(duì)圖像樣本數(shù)據(jù)集的建立和模型訓(xùn)練及數(shù)據(jù)對(duì)比都進(jìn)行了較為詳細(xì)的介紹。并采用基于深度學(xué)習(xí)技術(shù)的網(wǎng)絡(luò)Alexnet,通過實(shí)驗(yàn)對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行了測(cè)試與優(yōu)化,提高了挖掘機(jī)生產(chǎn)商的識(shí)別精度。從實(shí)驗(yàn)結(jié)果來看,本算法可以滿足實(shí)際工程生產(chǎn)的要求。