崔云月,管一弘,孫 娜,王端生,楊雄飛,黃 崗
(1.昆明理工大學(xué)理學(xué)院;2.昆明聚林科技有限公司,云南 昆明 650000)
煙梗是卷煙的重要原料,梗絲或顆粒狀煙梗具有較好的填充性和燃燒性。因此,對(duì)于煙梗的檢測(cè)成了煙草加工過(guò)程中不可缺少的環(huán)節(jié)[1]。煙梗的長(zhǎng)梗率和短梗率是煙草打葉復(fù)烤過(guò)程中一個(gè)關(guān)鍵的加工質(zhì)量檢測(cè)指標(biāo),長(zhǎng)短梗率的高低,直接影響著卷煙企業(yè)制絲生產(chǎn)中梗絲的出絲率[2-3]。目前,長(zhǎng)短梗率的檢測(cè)方法主要通過(guò)人工篩選長(zhǎng)短梗,再稱重得到長(zhǎng)短梗率,該方法不僅工作強(qiáng)度大、耗時(shí)長(zhǎng),也存在著人工篩選時(shí)的偏差。因此,研究高效準(zhǔn)確地長(zhǎng)短梗率檢測(cè)方法,對(duì)于煙草制絲過(guò)程的提質(zhì)增效、降本降耗具有重要意義。
目前,國(guó)內(nèi)外對(duì)煙梗的長(zhǎng)短梗率檢測(cè)方法相關(guān)研究較少。武凱等[4]發(fā)明了測(cè)定煙梗長(zhǎng)梗率的設(shè)備,該設(shè)備通過(guò)采集可見(jiàn)光下的煙梗圖像,利用圖像分析法對(duì)煙梗進(jìn)行識(shí)別,從而檢測(cè)煙梗長(zhǎng)梗率。由于可見(jiàn)光無(wú)法穿透煙葉,因此該方法很難識(shí)別出部分被煙葉包裹住的煙梗。朱文魁等[5]提出一種基于X 射線透射圖像定量檢測(cè)煙梗中粗細(xì)梗率和長(zhǎng)短梗率的測(cè)定方法,該方法利用煙梗與煙片在X 射線下成像的特征差異對(duì)煙梗長(zhǎng)度進(jìn)行識(shí)別,采用定量的檢測(cè)算法實(shí)現(xiàn)了長(zhǎng)梗率和短梗率的測(cè)定,但是該方法操作復(fù)雜且準(zhǔn)確性有待提高。
針對(duì)上述煙梗的長(zhǎng)短梗率檢測(cè)問(wèn)題,本文提出一種基于BP 神經(jīng)網(wǎng)絡(luò)的長(zhǎng)短梗率檢測(cè)方法。首先利用閾值分割方法對(duì)煙梗圖像進(jìn)行分割,通過(guò)最小外接矩形方法識(shí)別出煙梗圖像中的長(zhǎng)短梗,然后建立BP 神經(jīng)網(wǎng)絡(luò)質(zhì)量擬合模型從而實(shí)現(xiàn)長(zhǎng)短梗率的檢測(cè)。結(jié)果表明,該方法能夠較為準(zhǔn)確地?cái)M合煙梗質(zhì)量,極大提高了煙梗長(zhǎng)梗率和短梗率檢測(cè)效率。
本文研究的煙梗圖像是在X 射線透射成像下的灰度圖像。X 射線的透射能力與X 射線光子的能量有關(guān),X 射線波長(zhǎng)越短,光子能量越大,穿透力越強(qiáng);X 射線的透射力也與物質(zhì)密度有關(guān),透射密度越大的物質(zhì),X 射線衰減程度越強(qiáng);透射密度越小的物質(zhì),X 射線的衰減程度也就越弱[6-10]。由于這種性質(zhì),圖像中煙梗灰度值與背景之間存在很大差異。以某幅煙梗的圖像為例,繪制煙梗圖像的三維灰度直方圖如圖1 所示。
Fig.1 Three dimensional gray histogram of tobacco stem image圖1 煙梗圖像的三維灰度直方圖
從圖1 可以看出,背景灰度值大多高于6×104,而煙梗的灰度值相對(duì)較小。因此,本文采用閾值分割法對(duì)煙梗圖像進(jìn)行分割。閾值分割是圖像分割中比較簡(jiǎn)單而且計(jì)算速度較快的一種算法[11]。具體公式定義如下:
對(duì)比多個(gè)閾值發(fā)現(xiàn),當(dāng)閾值為58 000 時(shí),煙梗圖像分割效果最優(yōu)。煙梗圖像分割結(jié)果如圖2 所示。
由圖2 可以看出,閾值分割效果較好,但是在實(shí)際采圖過(guò)程中難免存在噪聲干擾,還需對(duì)閾值分割后的圖像提取連通域,刪除面積較小的孤立噪聲[12]。
Fig.2 Threshold segmentation results圖2 閾值分割結(jié)果
打葉復(fù)烤加工過(guò)程中,大部分煙梗形態(tài)都比較筆直,因此,本文采用旋轉(zhuǎn)法求取煙梗的最小外接矩形,從而識(shí)別出煙梗長(zhǎng)度。具體過(guò)程如下:
(1)獲取目標(biāo)物的最小外接框,即二維形狀各頂點(diǎn)中的最大橫坐標(biāo)、最小橫坐標(biāo)、最大縱坐標(biāo)、最小縱坐標(biāo)定下邊界的矩形。
(2)將目標(biāo)物的邊界以每次1°左右的增量在90°范圍內(nèi)旋轉(zhuǎn)。每旋轉(zhuǎn)一次記錄一次其坐標(biāo)系方向上的外接矩形邊界點(diǎn)的最大和最小值。旋轉(zhuǎn)到某一個(gè)角度后,取面積最小時(shí)外接矩形的參數(shù)為主軸意義下的長(zhǎng)度和寬度[13]。
(3)畫(huà)出目標(biāo)物的最小外接矩形,并標(biāo)注其長(zhǎng)度值。煙梗的長(zhǎng)度值是通過(guò)一定長(zhǎng)度的標(biāo)準(zhǔn)件對(duì)相機(jī)進(jìn)行標(biāo)定,得到實(shí)際圖像尺寸與X 射線所成像素點(diǎn)個(gè)數(shù)的關(guān)系約為1∶2.5,從而得到圖像中煙梗的實(shí)際長(zhǎng)度,煙梗長(zhǎng)度特征提取結(jié)果如圖3 所示。
Fig.3 The result of stem length feature extraction圖3 煙梗長(zhǎng)度特征提取結(jié)果
國(guó)家煙草專賣(mài)局發(fā)布的《打葉煙葉 質(zhì)量檢驗(yàn)》(YC/T147-2010)中規(guī)定,長(zhǎng)度大于20mm 的煙梗為長(zhǎng)梗,長(zhǎng)度小于等于20mm 的煙梗為短梗[14]。長(zhǎng)短梗識(shí)別結(jié)果如圖4 所示。
Fig.4 The results of long and short stem identification圖4 長(zhǎng)短梗識(shí)別結(jié)果
BP 神經(jīng)網(wǎng)絡(luò)實(shí)際為多層感知器,通常由3 層及以上網(wǎng)絡(luò)構(gòu)成,一個(gè)典型的三層BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為輸入層、隱含層和輸出層[15-17],其拓?fù)浣Y(jié)構(gòu)如圖5 所示。
Fig.5 Three layer BP neural network structure圖5 三層BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程分為信號(hào)前向傳播和誤差反向傳播兩個(gè)過(guò)程[18-19]。輸入層信號(hào)經(jīng)神經(jīng)元傳遞到隱含層,通過(guò)各神經(jīng)元間的權(quán)值和激活函數(shù)的相關(guān)計(jì)算將結(jié)果傳遞到輸出層。若輸出結(jié)果與期望值間誤差較大則進(jìn)入誤差反向傳播過(guò)程,利用梯度下降法不斷調(diào)整網(wǎng)絡(luò)權(quán)值與偏置,進(jìn)而使網(wǎng)絡(luò)預(yù)測(cè)輸出值不斷逼近期望值,最終達(dá)到預(yù)期效果并停止訓(xùn)練[20]。具體步驟如下:
(1)構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò),輸入隱含層個(gè)數(shù)及每層神經(jīng)元個(gè)數(shù)。
(2)初始化網(wǎng)絡(luò)權(quán)重和偏置參數(shù),設(shè)置最高迭代次數(shù)、誤差函數(shù)及收斂精度。
(3)分別計(jì)算隱含層和輸出層各神經(jīng)元的輸出Hj和Yk,Hj和Yk的表達(dá)式為:
(4)比較輸出值Yk與期望值Dk,誤差為Ok=Yk-Dk,Ok的表達(dá)式為:
(5)利用梯度下降法不斷更新權(quán)重和偏置參數(shù)。輸入層與隱含層之間的連接權(quán)值和偏置值的更新如式(6)、式(7),隱含層與輸出層之間的連接權(quán)值和偏置值的更新如式(8)、式(9)。
(6)判斷網(wǎng)絡(luò)誤差是否滿足要求,若不滿足,則轉(zhuǎn)到步驟(3)繼續(xù)調(diào)整參數(shù);若滿足,則停止迭代。
2.2.1 網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
通過(guò)上述方法可得到煙梗圖像中長(zhǎng)短梗的灰度值,將煙梗所在的灰度值范圍均分為十段,以灰度級(jí)在每一段范圍內(nèi)的占比作為網(wǎng)絡(luò)輸入,則輸入層節(jié)點(diǎn)個(gè)數(shù)為10;以煙梗的質(zhì)量(歸一化質(zhì)量)作為網(wǎng)絡(luò)輸出,則輸出層節(jié)點(diǎn)個(gè)數(shù)為1。隱含層的節(jié)點(diǎn)個(gè)數(shù)根據(jù)Kolmogorov 定理確定[21],該定理計(jì)算公式如式(10)。
式中,h為隱含層的節(jié)點(diǎn)個(gè)數(shù),m和n分別為輸入層和輸出層的節(jié)點(diǎn)個(gè)數(shù),a為1~10 之間的調(diào)節(jié)整數(shù)。設(shè)置不同的網(wǎng)絡(luò)結(jié)構(gòu)對(duì)煙梗圖像進(jìn)行質(zhì)量擬合實(shí)驗(yàn),得到不同網(wǎng)絡(luò)結(jié)構(gòu)下的煙梗質(zhì)量擬合結(jié)果如表1 所示。
Tabel 1 Fitting results of stem quality under different network structures表1 不同網(wǎng)絡(luò)結(jié)構(gòu)下煙梗質(zhì)量擬合結(jié)果
由表1 可以看出,第二組的網(wǎng)絡(luò)性能最好。因此,本文采用10-4-2-1 型的四層拓?fù)浣Y(jié)構(gòu)構(gòu)建BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型。
2.2.2 網(wǎng)絡(luò)參數(shù)設(shè)定
利用newff 函數(shù)構(gòu)建四層BP 神經(jīng)網(wǎng)絡(luò)模型,經(jīng)過(guò)多次實(shí)驗(yàn)后,最終確定網(wǎng)絡(luò)參數(shù)。隱含層和輸出層神經(jīng)元傳遞函數(shù)分別為tansig、tansig 和purelin。最高迭代次數(shù)為12 000,收斂誤差為0.000 01,學(xué)習(xí)率為0.2,網(wǎng)絡(luò)訓(xùn)練函數(shù)為trainscg 函數(shù)。
通過(guò)BP 神經(jīng)網(wǎng)絡(luò)質(zhì)量擬合模型分別得到煙梗圖像中長(zhǎng)梗和短梗質(zhì)量,從而得到長(zhǎng)梗率和短梗率,具體計(jì)算公式如式(11)、式(12)。
式中,M長(zhǎng)為長(zhǎng)梗率,M短為短梗率,m長(zhǎng)為測(cè)試中的長(zhǎng)梗質(zhì)量,m短為測(cè)試中的短梗質(zhì)量。
分別稱取25 組不同質(zhì)量的長(zhǎng)梗和短梗,從長(zhǎng)梗和短梗中各取一組煙梗進(jìn)行混合,同一質(zhì)量下的混合煙梗在設(shè)備上重復(fù)過(guò)料5 次進(jìn)行采圖,以其中20 組混合煙梗圖像作為BP 網(wǎng)絡(luò)的訓(xùn)練樣本集,其余5 組混合煙梗圖像作為BP 網(wǎng)絡(luò)的測(cè)試樣本集。利用上述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行實(shí)驗(yàn),模型訓(xùn)練誤差變化曲線如圖6 所示,對(duì)不同質(zhì)量的煙梗擬合結(jié)果如表2 所示。
由圖6 可知,BP 神經(jīng)網(wǎng)絡(luò)達(dá)到預(yù)設(shè)收斂誤差自動(dòng)停止訓(xùn)練,此時(shí)網(wǎng)絡(luò)迭代189 次,收斂于9.674 2×10-6,并且收斂速度較快。
Fig.6 Neural network error curve圖6 神經(jīng)網(wǎng)絡(luò)誤差曲線
其中,擬合均值是指同一質(zhì)量下5 次過(guò)料的混合煙梗圖像擬合得到質(zhì)量的平均值。由表2 可以看出,本文設(shè)計(jì)的BP 神經(jīng)網(wǎng)絡(luò)模型的最大相對(duì)誤差為7.12%,最小相對(duì)誤差為1.92%,平均相對(duì)誤差為3.91%,對(duì)于煙梗質(zhì)量的擬合重復(fù)性與準(zhǔn)確性均較好。
上述5 組實(shí)驗(yàn)對(duì)應(yīng)的長(zhǎng)短梗率檢測(cè)結(jié)果如表3 所示。
由表3 可以看出,采用本文方法所得到的長(zhǎng)短梗率與實(shí)際值較為接近,其中最大絕對(duì)誤差為1%,滿足實(shí)際生產(chǎn)要求。
Tabel 2 Fitting results of stem quality表2 煙梗質(zhì)量擬合結(jié)果
Tabel 3 Calculation results of long and short stem ratio表3 長(zhǎng)短梗率計(jì)算結(jié)果
為了比較網(wǎng)絡(luò)模型中不同訓(xùn)練函數(shù)對(duì)煙梗質(zhì)量擬合結(jié)果的影響,本文釆用訓(xùn)練函數(shù)traingdx 和trainbfg 與上述實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比。模型訓(xùn)練誤差變化曲線分別如圖7 和圖8 所示,煙梗質(zhì)量擬合結(jié)果的相對(duì)誤差值如表4 所示。
由圖7 和圖8 可以看出,這兩種網(wǎng)絡(luò)訓(xùn)練模型迭代次數(shù)很高且收斂誤差遠(yuǎn)高于預(yù)設(shè)值,對(duì)比分析可知,本文采用的訓(xùn)練函數(shù)trainscg 訓(xùn)練效果最優(yōu)。
對(duì)比表4 中不同訓(xùn)練函數(shù)下煙梗質(zhì)量的擬合結(jié)果可以看出,本文選取的trainscg 訓(xùn)練函數(shù)得到的質(zhì)量擬合結(jié)果相對(duì)誤差最小,并且相對(duì)誤差的波動(dòng)性也較小。因此,無(wú)論是從訓(xùn)練模型還是預(yù)測(cè)精度上都有較好效果。
Fig.7 Error curve when training function is traingdx圖7 訓(xùn)練函數(shù)為traingdx 時(shí)的誤差曲線
Fig.8 Error curve when training function is trainbfg圖8 訓(xùn)練函數(shù)為trainbfg 時(shí)的誤差曲線
Tabel 4 Comparison of fitting results of different training functions on tobacco stem quality表4 不同訓(xùn)練函數(shù)對(duì)煙梗質(zhì)量擬合結(jié)果對(duì)比
本文提出了一種基于BP 神經(jīng)網(wǎng)絡(luò)的煙梗長(zhǎng)短梗率檢測(cè)方法,通過(guò)檢測(cè)多組不同質(zhì)量的煙梗進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證了該算法的準(zhǔn)確性與穩(wěn)定性,并通過(guò)對(duì)比不同的神經(jīng)網(wǎng)絡(luò)訓(xùn)練函數(shù),找到了網(wǎng)絡(luò)的最佳擬合參數(shù),實(shí)現(xiàn)了對(duì)煙梗質(zhì)量較為精準(zhǔn)的預(yù)測(cè)。本文不僅為煙草企業(yè)準(zhǔn)確高效地檢測(cè)長(zhǎng)梗率和短梗率提供了一種新方法,也為相關(guān)領(lǐng)域的預(yù)測(cè)問(wèn)題提供了一定參考。然而,該方法的檢測(cè)結(jié)果仍存在一定偏差,算法的普適性還需作進(jìn)一步驗(yàn)證,這些都是下一步需要解決的問(wèn)題。