劉 巍
(紅云紅河煙草(集團(tuán))有限責(zé)任公司昆明卷煙廠,云南 昆明 650202)
煙草行業(yè)競(jìng)爭(zhēng)越來(lái)越激烈,搶占市場(chǎng),產(chǎn)品質(zhì)量是重中之重。煙草企業(yè)生產(chǎn)出質(zhì)量出眾的產(chǎn)品,不僅是提升企業(yè)品牌形象的重要舉措,更是踐行“國(guó)家利益至上、消費(fèi)者利益至上”的行業(yè)價(jià)值觀要求。如何生產(chǎn)出“支支精良、包包精美”的產(chǎn)品,減少和杜絕不合格品流入市場(chǎng),是各卷煙企業(yè)質(zhì)量控制的關(guān)鍵環(huán)節(jié)。
目前,小包煙外觀檢測(cè)大多采用傳統(tǒng)的圖像處理方法,通過(guò)圖像特征提取來(lái)做識(shí)別,使用這種方法,遇到新的問(wèn)題需要找新的特征。針對(duì)此問(wèn)題,本文提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的卷煙小包外觀檢測(cè)算法,模擬人的識(shí)別過(guò)程,通過(guò)大量數(shù)據(jù)的學(xué)習(xí),獲得的算法能達(dá)到與人一致的評(píng)判效果,杜絕了人工找圖像特征。
卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中可自動(dòng)生成特征提取器,不需要人工設(shè)計(jì),它是一種特殊的深度神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)中的權(quán)重在訓(xùn)練過(guò)程中確定。卷積神經(jīng)網(wǎng)絡(luò)包含提取輸入圖像特征的神經(jīng)網(wǎng)絡(luò)和一個(gè)進(jìn)行圖像分類的神經(jīng)網(wǎng)絡(luò),如圖1 所示。特征提取神經(jīng)網(wǎng)絡(luò)由成對(duì)的卷積層和池化層組成,接收輸入圖像后,把提取到的特征信號(hào)傳遞給分類神經(jīng)網(wǎng)絡(luò)。隨后分類神經(jīng)網(wǎng)絡(luò)基于圖像特征進(jìn)行運(yùn)算,并產(chǎn)生分類輸出。
圖1 卷積神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)
本文所使用的圖像數(shù)據(jù)來(lái)自于某卷煙廠52# 號(hào)機(jī)FOCKE-FXS 機(jī)型視覺(jué)成像系統(tǒng),所采圖像為近半年的數(shù)據(jù),包括缺陷剔除圖像與正常圖像,其中缺陷剔除圖像587 張,正常圖像295 張。
小包正面外觀缺陷包括商標(biāo)缺陷與印花缺陷兩種,其中商標(biāo)缺陷有商標(biāo)內(nèi)外反折、商標(biāo)上下反折、商標(biāo)左右移位、商標(biāo)歪斜、商標(biāo)破損、商標(biāo)膠印、商標(biāo)粘異物、商標(biāo)露鋁箔紙等典型的缺陷類型,如圖2 所示。
圖2 商標(biāo)典型缺陷
印花缺陷是指煙包印花未正確成型產(chǎn)生的缺陷,有印花反折、印花未粘牢、印花歪斜、印花翹曲、印花長(zhǎng)短、印花露白、多張印花、無(wú)印花等典型的缺陷類型,如圖3所示。
圖3 印花典型缺陷
針對(duì)小包外觀檢測(cè),設(shè)計(jì)了一種卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)(圖4)。輸入的圖像數(shù)據(jù)是經(jīng)過(guò)裁剪及壓縮的小包外觀圖片,得到128×128 的輸入圖像數(shù)據(jù),作為網(wǎng)絡(luò)的輸入層。接下來(lái)是2 層卷積層與池化層,共4 層。C1 層為第1層卷積層,卷積過(guò)濾器大小是5×5,卷積過(guò)濾器共20 個(gè),卷積步長(zhǎng)為1;S2 層為池化層,步長(zhǎng)為2,經(jīng)過(guò)2×2 的最大池化;C3 層為第2 個(gè)卷積層,卷積過(guò)濾器大小是5×5,卷積過(guò)濾器共20 個(gè),步長(zhǎng)為1;S4 層為池化層,步長(zhǎng)為2,經(jīng)過(guò)2×2 最大池化。模型通過(guò)以上結(jié)構(gòu)提取出圖像特征,獲得20 個(gè)29×29 的圖像特征。C5 層為全連接層,將二維的圖像數(shù)據(jù)轉(zhuǎn)換為一維的數(shù)據(jù),便于進(jìn)行分類。最后一層為輸出層,使用softmax 函數(shù)對(duì)小包外觀進(jìn)行分類,得到小包缺陷與正常兩種情況的識(shí)別概率。此外,在C1、C3 兩個(gè)卷積層后的激活函數(shù)為ReLU 激活函數(shù)。
圖4 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
圖像進(jìn)入卷積神經(jīng)網(wǎng)絡(luò)的兩個(gè)卷積層后分別得到20 張?zhí)卣鲌D,圖5 為印花歪斜煙包的特征圖,圖6 為正常煙包的特征圖。經(jīng)過(guò)卷積層提取的特征,如圖中線框所示,印花歪斜的煙包與正常的煙包,相同位置處差別較大,因此可以得出,卷積層提取特征能有效地區(qū)分出外觀有缺陷的煙包。
圖5 印花歪斜煙包特征圖
圖6 正常煙包特征圖
按照設(shè)計(jì)的模型結(jié)構(gòu),在MATLAB 中使用神經(jīng)網(wǎng)絡(luò)工具箱生成卷積神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)率設(shè)定為0.001,訓(xùn)練輪數(shù)為1 000 輪,Minibatch 取128,即每批次計(jì)算128 個(gè)輸入圖像,動(dòng)量系數(shù)取0.9,選擇交叉熵?fù)p失函數(shù)作為優(yōu)化函數(shù),使用訓(xùn)練數(shù)據(jù)集對(duì)小包外觀識(shí)別的訓(xùn)練結(jié)果如圖7 所示,迭代2 000 次以后,模型逐漸趨于穩(wěn)定,準(zhǔn)確率達(dá)到90%以上。
圖7 訓(xùn)練集迭代識(shí)別準(zhǔn)確率曲線
訓(xùn)練過(guò)程中的損失函數(shù)曲線如圖8 所示,隨著迭代的逐漸增加,損失函數(shù)逐漸降低并趨于穩(wěn)定,穩(wěn)定后的數(shù)值保持在0.1 以下。
圖8 損失函數(shù)
用事先分配好的10%隨機(jī)驗(yàn)證集,在每次迭代完成,計(jì)算得到權(quán)重值后,使用驗(yàn)證集進(jìn)行驗(yàn)證,驗(yàn)證數(shù)據(jù)集與測(cè)試數(shù)據(jù)集基本一致,在迭代2 000 次以后,達(dá)到穩(wěn)定。
進(jìn)行6 000 次迭代(1 000 輪)后,得到模型最終權(quán)重值,之后使用全新數(shù)據(jù)集進(jìn)行算法檢驗(yàn),結(jié)果如表1 所示。
表1 數(shù)據(jù)集識(shí)別結(jié)果
由表可知,新數(shù)據(jù)集識(shí)別準(zhǔn)確率達(dá)到99.15%,效果較好,說(shuō)明使用的卷積神經(jīng)網(wǎng)絡(luò)模型是有效的。
近年來(lái),深度學(xué)習(xí)技術(shù)在學(xué)術(shù)界和工業(yè)界都得到了廣泛的應(yīng)用和傳播,在各行各業(yè)都取得了非常好的效果。本文從卷煙工廠實(shí)際生產(chǎn)情況,創(chuàng)新性采用卷積神經(jīng)網(wǎng)絡(luò)對(duì)卷煙小包外觀進(jìn)行檢測(cè),模擬人對(duì)圖像的判斷過(guò)程,準(zhǔn)確識(shí)別出有缺陷的煙包與正常的煙包,經(jīng)過(guò)驗(yàn)證,使用的模型是有效的,識(shí)別準(zhǔn)確率達(dá)到99.15%,獲得較好的效果,具備在煙草行業(yè)小包外觀檢測(cè)中推廣應(yīng)用的價(jià)值。