翟乃琦,云利軍,葉志霞,王一博,李亞召
(云南師范大學(xué)信息學(xué)院,云南 昆明 650000)
我國作為煙草大國,每年因煙葉霉變問題導(dǎo)致了巨大的經(jīng)濟(jì)損失。因此,及時有效地預(yù)防煙葉霉變具有重要的研究意義。煙葉本身含有較多的營養(yǎng)物質(zhì),為霉菌在生長繁殖過程中提供了必要的物質(zhì)條件,同時倉儲環(huán)境的溫度和濕度等外部因素會影響霉菌在煙草中的繁殖[1]。防止煙葉霉變的關(guān)鍵在于通過實時監(jiān)測倉儲環(huán)境的變化,對煙葉霉變實現(xiàn)提前預(yù)警,從而減少經(jīng)濟(jì)損失[2 - 4]。
傳統(tǒng)人工檢測煙葉霉變的方法主要分為2種:一是通過感官進(jìn)行評測,二是通過鏡檢鑒別方式檢測[5]。傳統(tǒng)的檢測方法不僅耗時且經(jīng)濟(jì)成本較高。隨著物聯(lián)網(wǎng)技術(shù)和人工智能的發(fā)展,通常應(yīng)用電子鼻技術(shù)來檢測煙葉的霉變狀態(tài)[6,7],如利用電子鼻來檢測煙氣從而判斷卷煙的品牌[8],還可用于區(qū)分白肋煙的成熟度[9]。模式識別算法多采用機(jī)器學(xué)習(xí)的方法(如采用人工神經(jīng)網(wǎng)絡(luò))對卷煙品牌進(jìn)行區(qū)分[10]。
在機(jī)器學(xué)習(xí)方法中,BP(Back Propogation)神經(jīng)網(wǎng)絡(luò)作為一種自適應(yīng)的多層前饋網(wǎng)絡(luò),具有自組織、自學(xué)習(xí)和聯(lián)想等特征。程龍等[11,12]將影響煙葉霉變的各個因素作為網(wǎng)絡(luò)輸入,通過訓(xùn)練得到與霉變狀態(tài)相關(guān)的非線性映射關(guān)系,進(jìn)而預(yù)測煙葉霉變情況。運(yùn)用BP神經(jīng)網(wǎng)絡(luò)雖解決了不少應(yīng)用問題,但網(wǎng)絡(luò)自身伴有局部極小化、收斂速度慢等問題,影響了網(wǎng)絡(luò)的部分性能。針對這些問題,王榮等[13,14]使用粒子群優(yōu)化算法解決局部最優(yōu)問題或通過多種算法綜合的方式提高預(yù)測準(zhǔn)確率。近年來,深度學(xué)習(xí)技術(shù)也逐漸應(yīng)用于各個行業(yè),隨著對傳統(tǒng)網(wǎng)絡(luò)的不斷改進(jìn)和深度學(xué)習(xí)方法的產(chǎn)生,預(yù)測準(zhǔn)確率也在不斷提高。
本文提出了一種基于一維卷積神經(jīng)網(wǎng)絡(luò)1D-CNN(One-Dimensional Convolutional Neural Network)的方法來預(yù)測煙葉霉變的狀態(tài),使用TGS系列半導(dǎo)體氣敏傳感器采集數(shù)值作為特征來訓(xùn)練網(wǎng)絡(luò)模型,預(yù)測煙葉霉變的概率。最后,開發(fā)出一套煙葉霉變實時監(jiān)測系統(tǒng),具有一定的工程實用價值。
本文所使用的實驗材料是由云南省某煙廠提供的正常煙葉樣本,通過對部分樣本進(jìn)行霉菌培養(yǎng),將樣本分為正常煙葉和霉變煙葉2大類[15]。實驗儀器采用課題組自主研發(fā)的電子鼻系統(tǒng)(如圖1所示),主要采集TGS系列氣敏傳感器(TGS2600、TGS2602、TGS2603、TGS2611、TGS2620、TGS822)的響應(yīng)值。部分原始測量典型數(shù)據(jù)如表1所示,第2列中的6個數(shù)字分別對應(yīng)TGS2600、TGS2602、TGS2603、TGS2611、TGS2620、TGS822等6個傳感器的響應(yīng)值;在狀態(tài)列中,0代表正常煙葉,1代表霉變煙葉。
Figure 1 Electronic nose system physical map圖1 電子鼻系統(tǒng)實物圖
編號傳感器響應(yīng)值 狀態(tài)1247 1011 1175 583 396 58002254 1074 1192 597 404 58403256 1133 1200 601 411 587 04459 2146 1293 910 770 84615459 2148 1302 912 765 84716461 2150 1302 911 766 847 1
利用課題組自主研發(fā)的電子鼻系統(tǒng)對正常煙葉與霉變煙葉進(jìn)行測定的方法為:在測定之前首先對采集設(shè)備上電預(yù)熱1 h,確定設(shè)備處于正常工作狀態(tài)后,將實驗樣品放入檢測箱內(nèi),采樣頻率為10秒/次,采樣時間為5 min。采樣數(shù)據(jù)通過設(shè)備中的無線模塊傳輸?shù)椒?wù)端進(jìn)行存儲分析。在每次采樣結(jié)束之后,對采集設(shè)備進(jìn)行狀態(tài)恢復(fù),以保障下一次樣本采集工作的順利進(jìn)行。
本文選用TGS系列氣敏傳感器氣體響應(yīng)值作為基本的特征組成成分。在得到基本特征之后,使用歸一化函數(shù)將輸入特征進(jìn)行歸一化處理,歸一化函數(shù)如式(1)所示:
(1)
一維卷積神經(jīng)網(wǎng)絡(luò)可以很好地用于分析傳感器數(shù)據(jù)的時間序列,因此本文選用一維卷積神經(jīng)網(wǎng)絡(luò)作為模型進(jìn)行訓(xùn)練。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示,每組煙葉樣本數(shù)據(jù)包含180條實時采集數(shù)據(jù),每一條實時數(shù)據(jù)中包含6種氣敏傳感器數(shù)據(jù),從而得到大小為30×6的矩陣,在輸入到模型之前,需要先將其平展成長度為180的向量,然后在第1層卷積層再將其變形為原始的大小為30×6的矩陣。
Figure 2 Basic structure of neural network model圖2 神經(jīng)網(wǎng)絡(luò)模型的基本結(jié)構(gòu)
(1)網(wǎng)絡(luò)的第1層和第2層為卷積層(Conv Layer),卷積窗口的大小設(shè)定為2,步長設(shè)定為1,卷積核數(shù)量設(shè)定為200。
(2)第3層為平展層(Flatten Layer),該層將多維度數(shù)據(jù)平展成一維數(shù)據(jù),從而連接全連接層。
(3)第4層與第5層均為全連接層(Dense Layer),其中,第4層連接神經(jīng)元數(shù)量為200,第5層的神經(jīng)元數(shù)量為50。
(4)第6層為丟棄層(Droupout),Droupout的比例一般設(shè)定為0.5,隨機(jī)失活網(wǎng)絡(luò)中一半的神經(jīng)元,防止過擬合現(xiàn)象的發(fā)生。
(5)最后一層為輸出層(Output),該層使用Sigmoid激活函數(shù),將輸入向量通過矩陣乘法運(yùn)算變換成長度為2的向量,分別代表正常煙葉和霉變煙葉的預(yù)測概率。
在網(wǎng)絡(luò)的每一層,使用激活函數(shù)對輸出結(jié)果進(jìn)行非線性化處理。網(wǎng)絡(luò)中的前幾層均使用ReLU激活函數(shù),最后一層使用Sigmoid激活函數(shù)。ReLU和Sigmoid函數(shù)如式(2)和式(3)所示:
(2)
(3)
本次實驗使用Keras模型搭建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。在構(gòu)建過程中,為了提高模型的性能,本文主要通過改變網(wǎng)絡(luò)模型中卷積層的層數(shù)以及卷積層中卷積核的數(shù)量和大小來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),使模型達(dá)到最優(yōu)。
在網(wǎng)絡(luò)訓(xùn)練過程中,本文選用Adam優(yōu)化算法替代傳統(tǒng)的隨機(jī)梯度下降算法,基于訓(xùn)練數(shù)據(jù)迭代更新網(wǎng)絡(luò)權(quán)重,在Loss損失函數(shù)中選用交叉熵函數(shù)。交叉熵函數(shù)式(4)所示:
(4)
其中,p為真實樣本值,q為預(yù)測樣本值,i代表向量p、q中元素的位置。
在模型訓(xùn)練過程中,設(shè)置網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)為20,設(shè)定目標(biāo)誤差為0.01,批處理大小設(shè)置為64,多次訓(xùn)練之后保存訓(xùn)練誤差最小的網(wǎng)絡(luò)模型。
本文所解決的是一個二元分類問題,樣本類別分為正常煙葉和霉變煙葉2大類,即正類和負(fù)類。根據(jù)數(shù)據(jù)集中獨(dú)立測試集的真實標(biāo)簽和預(yù)測標(biāo)簽,可將每個樣本的預(yù)測結(jié)果分為4種情況:TP(True Positive)、FP(False Positive)、TN(True Negative)和FN(False Negative)。具體如表2所示。
Table 2 Confusion matrix
表2中,TP表示本來是正樣本,分類為正樣本;FP表示本來是負(fù)樣本,分類成正樣本;TN表示本來是負(fù)樣本,分類成負(fù)樣本;FN表示本來是正樣本,分類成負(fù)樣本。在此標(biāo)準(zhǔn)之上,研究人員推演出了特異性Spe(Specificity)、準(zhǔn)確性Acc(Accuracy)和敏感性Sen(Sensitivity)等評價指標(biāo)[16]。
(5)
(6)
(7)
本文將一個采樣周期所得到的一組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。在模型訓(xùn)練的過程中,會根據(jù)網(wǎng)絡(luò)模型的結(jié)構(gòu)動態(tài)調(diào)整學(xué)習(xí)速率、迭代次數(shù)和批處理樣本大小等參數(shù),每調(diào)整一次重新進(jìn)行一次網(wǎng)絡(luò)訓(xùn)練,訓(xùn)練結(jié)束之后,使用測試集數(shù)據(jù)對當(dāng)前的網(wǎng)絡(luò)進(jìn)行測試。模型訓(xùn)練Loss曲線如圖3所示。從圖3中可以看出,Loss曲線隨著訓(xùn)練次數(shù)的增加不斷收斂,大概經(jīng)過8輪次訓(xùn)練后,模型收斂接近目標(biāo)訓(xùn)練誤差,最終確定出模型網(wǎng)絡(luò)結(jié)構(gòu)。隨機(jī)選取5組測試集樣本進(jìn)行網(wǎng)絡(luò)模型的性能測試,其準(zhǔn)確率結(jié)果如表3所示。
Figure 3 Loss curve圖3 Loss曲線
%
從表3中可以看出,在多次網(wǎng)絡(luò)訓(xùn)練后,訓(xùn)練集的平均準(zhǔn)確率為99.46%,測試集的平均準(zhǔn)確率為99.14%。結(jié)果表明,本文方法對煙葉霉變的識別是可行的、高效的,且模型具有一定的輕量化和實用性。
在煙葉倉儲霉變預(yù)測方法的相關(guān)研究進(jìn)展中,對于煙葉霉變狀態(tài)的預(yù)測多采用BP神經(jīng)網(wǎng)絡(luò)模型。為了驗證本文所提模型相較于其它模型的優(yōu)勢,基于本文所采用的數(shù)據(jù)集,選用BP神經(jīng)網(wǎng)絡(luò)對正常煙葉與霉變煙葉進(jìn)行分類,并與本文所提出的模型的分類結(jié)果進(jìn)行對比。
在BP神經(jīng)網(wǎng)絡(luò)模型中,對實驗所采集的數(shù)據(jù)進(jìn)行特征提取,隨機(jī)選擇正常煙葉樣本與霉變煙葉樣本各30組。模型訓(xùn)練完成后隨機(jī)選擇5組測試集樣本進(jìn)行測試,多次測試之后取模型預(yù)測準(zhǔn)確率的平均值進(jìn)行比較,結(jié)果如表4所示。
Table 4 Classification accuracy of different medels表4 不同模型的分類正確率 %
從表4中可以看出,相較于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),本文所提出的1D-CNN模型預(yù)測準(zhǔn)確率更高。
基于本文所構(gòu)建的煙葉霉變預(yù)測模型,作者設(shè)計并實現(xiàn)了一套煙葉倉儲環(huán)境智能監(jiān)測管理系統(tǒng)。該系統(tǒng)通過氣敏傳感器陣列采集倉儲環(huán)境數(shù)據(jù),通過窄帶物聯(lián)網(wǎng)無線通信技術(shù)發(fā)送到監(jiān)控中心數(shù)據(jù)服務(wù)器,在服務(wù)器中部署霉變預(yù)測模型與煙葉倉儲環(huán)境智能監(jiān)測信息管理系統(tǒng)。智能監(jiān)測管理系統(tǒng)主要分為用戶管理、倉儲管理、煙垛區(qū)域管理、倉儲環(huán)境信息監(jiān)測和煙葉霉變預(yù)警5大功能模塊。其中在煙葉霉變預(yù)警模塊中,將環(huán)境監(jiān)測數(shù)據(jù)輸入到一維卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行霉變預(yù)測,及時提醒管理人員進(jìn)行處理。該系統(tǒng)經(jīng)過一段時間的試運(yùn)行,取得了較為滿意的效果。
本文主要研究了煙葉霉變狀態(tài)的預(yù)測問題,使用TGS氣敏傳感器采集數(shù)據(jù)作為網(wǎng)絡(luò)訓(xùn)練特征,基于一維卷積神經(jīng)網(wǎng)絡(luò),完成了對煙葉倉儲霉變狀態(tài)的預(yù)測,預(yù)測結(jié)果具有較高的準(zhǔn)確率,并且應(yīng)用此模型實現(xiàn)了一套煙葉倉儲環(huán)境智能監(jiān)測系統(tǒng),具有一定的工程實用價值。