李 崢,譚方利,賀 帆,吳文信,劉小斌,李宏光,方 明,徐辰生,3*
(1.河南農業(yè)大學 煙草學院,河南 鄭州 450002; 2.湖南省煙草公司 郴州市公司,湖南 郴州 423000; 3.福建省煙草公司 南平市公司,福建 南平 350003)
煙草是一種以葉片為收獲對象且對其內外觀品質要求非常高的特殊經(jīng)濟作物,烤后煙葉的外觀質量是決定煙葉等級的重要指標之一[1-2]。對于煙葉外觀質量的評價長期以來一直以人為感官判斷作為評定依據(jù)[3],對烤煙外觀質量的評定具有一定的主觀性。隨著計算機、現(xiàn)代儀器等學科的飛速發(fā)展,煙葉外觀質量評價也應借助新的方法和儀器實現(xiàn)突破性的發(fā)展。其中,顏色作為國家烤煙分級標準的第二分組因素以及外觀質量評價的重要指標[4],與煙葉外觀質量和內在質量密切相關。早在1931年CIE(國際標準照明委員會)就建立了一系列表示可見光譜的顏色空間標準[5],目前,在煙草行業(yè)中主要應用于顏色參數(shù)與煙葉內在化學成分的相關分析,從而反映顏色與內在品質的關系[3-6],而煙葉外觀質量的本質是化學成分的綜合表現(xiàn),從側面反映出了煙葉表面顏色參數(shù)與外觀質量存在某種關聯(lián)。李悅等[7-8]研究了不同品種、部位的烤后煙葉表面顏色特征參數(shù)與外觀質量之間的關系,結果表明,烤煙顏色特征參數(shù)與外觀質量指標之間存在顯著或極顯著相關關系。
上述研究均反映了煙葉表面顏色參數(shù)與外觀質量存在某種依存關系,而BP神經(jīng)網(wǎng)絡具備處理任何復雜非線性映射的功能,其無論在網(wǎng)絡理論還是在性能方面均已比較成熟,近年來在經(jīng)濟、工業(yè)、醫(yī)療以及農業(yè)等領域均有廣泛的應用[9-13]。煙草方面主要應用于感官質量的預測。彭黔榮等[14]和邵惠芳等[15]以常規(guī)化學成分含量為網(wǎng)絡模型輸入指標,路曉崇等[16]以煙葉顏色參數(shù)作為神經(jīng)網(wǎng)絡輸入層分別構建了感官質量預測模型,結果均表明,各項感官質量評價指標網(wǎng)絡模型的預測效果與實際得分擬合程度較高。而煙葉外觀質量與感官質量密切相關[17]。為此,本研究以烤煙顏色參數(shù)為基礎,利用BP神經(jīng)網(wǎng)絡構建外觀質量預測模型,旨在為煙葉外觀質量評價體系的智能化、精準化發(fā)展提供一定科學依據(jù)。
參照中國煙草種植區(qū)劃[18]對河南煙區(qū)的劃分,河南煙區(qū)分為豫中、豫西、豫南、豫東4個生態(tài)區(qū)域,分別收集豫中煙區(qū)的襄城、郟縣、臨潁、舞陽,豫西煙區(qū)的洛寧、澠池、盧氏,豫南煙區(qū)的方城、內鄉(xiāng)、確山,豫東煙區(qū)的鹿邑、睢縣等12個縣(市)的27個烤煙主產鄉(xiāng)鎮(zhèn)2017年初烤煙葉樣品270個。經(jīng)嚴格分選后,共獲取248個煙葉樣品。
1.2.1 煙葉顏色特征值的獲取 每個煙葉樣品隨機選取20片,采用Color-Eye7000A 型分光光譜儀(美國GretagMac-beth公司)在國家煙草專賣局制定的煙葉分級實驗室環(huán)境[19]條件下測量煙葉正面和背面顏色的L*(明度值)、a*(紅度)、b*(黃度)、C*(飽和度)以及H*(色相角)5個顏色特征值,以煙葉1/4、1/2、3/4處對稱的6個位置作為測量點(圖1),測量點距離主脈約5 cm,每片煙葉正面和背面共計12個測量位點。
圖1 煙葉顏色特征值的測量位點
1.2.2 煙葉外觀質量評價 外觀質量評定前將煙葉樣品平衡含水率至16%~18%,由聘請的10名農業(yè)標準化委員會烤煙煙葉分級專家參照《GB 2635—92烤煙分級標準》和煙葉外觀質量測評標準(表1)對最終確定的248個煙葉樣品的顏色、成熟度、葉片結構、身份、油分、色度等6項外觀質量指標進行評價打分,其中各項外觀質量評價指標最高得分值均為10,不同分值表示煙葉外觀質量歸屬的不同檔次。
表1 烤煙外觀質量評價指標及評分標準
試驗數(shù)據(jù)采用Matlab 2014b與Excel 2010進行處理分析和作圖。
煙葉樣品的顏色特征值及各項外觀質量評價指標得分結果見表2。變異系數(shù)是概率分布離散程度的一個歸一化量度[20],從煙葉樣品正面和背面的顏色特征值統(tǒng)計結果可以看出,煙葉正面和背面的H*值變異系數(shù)分別為0.27%和0.20%,屬弱變異,其余顏色參數(shù)的變異系數(shù)均在5%以上,尤其是煙葉正面的a*值,變異系數(shù)達到10.33%,煙葉背面顏色參數(shù)變異系數(shù)以L*值最大,為8.01%。煙葉外觀質量評價各項指標的變異系數(shù)從大到小排列為油分>身份>色度>葉片結構>成熟度>顏色,其中僅顏色指標變異系數(shù)小于5%??梢?,樣本顏色特征值和外觀質量指標的變異系數(shù)均小于15%,表明數(shù)據(jù)的穩(wěn)定性較好。峰度和偏度可反映樣本的集中趨勢和變異程度,從表2可以看出,煙葉樣品正面和背面顏色特征值的峰度和偏度均接近0,服從正態(tài)分布。外觀質量中油分指標的峰度較高,達到了1.25,但表現(xiàn)為高狹峰,其余指標的峰度均小于1,結合偏度來看,各項外觀質量指標均較小,同樣服從正態(tài)分布,具有良好的統(tǒng)計學意義。
表2 樣本的描述性統(tǒng)計
為避免數(shù)據(jù)冗余,對測得的煙葉顏色特征值進行因子分析,并將因子載荷矩陣方差極大正交旋轉,在累計方差貢獻率為95.49%(>90%)的前提下,最終分析得到5個主因子。從因子分析結果(表3)可以看出,因子1方差貢獻率最高,為22.91%,因子5對烤煙顏色特征值的方差貢獻率最低,為12.22%,其中因子2、因子3和因子4方差貢獻率較為近似,分別為20.59%、20.03%、19.74%。相關系數(shù)統(tǒng)計結果表明,因子1主要反映了煙葉背面顏色特征值H*的影響;因子2和因子3主要反映了煙葉正反面顏色特征值b*和C*的影響;因子4主要反映煙葉正面顏色特征值a*的影響;因子5則主要反映了煙葉正面顏色特征值中L*的影響。
表3 烤煙顏色特征值與因子間的相關系數(shù)
采用3層BP神經(jīng)網(wǎng)絡(輸入層、隱含層、輸出層)創(chuàng)建煙葉外觀質量評價預測模型。依據(jù)因子分析結果,煙葉背面L*值與各主因子間的相關系數(shù)均較低,因此,以248個煙葉樣品的煙葉正面的5個顏色特征值以及煙葉背面的a*、b*、C*、H*共9個參數(shù)作為網(wǎng)絡的輸入值。以煙葉外觀質量中顏色、成熟度、葉片結構等6項指標得分分別作為網(wǎng)絡模型的輸出值建立各自的預測模型。構建的BP神經(jīng)網(wǎng)絡模型輸入層單元數(shù)為9,輸出層單元數(shù)為1,隱含層單元個數(shù)依據(jù)經(jīng)驗公式(1)確定[21],
(1)
式中:p為隱含層節(jié)點數(shù),n為輸入神經(jīng)元數(shù)量,m為輸出神經(jīng)元數(shù)量,α為經(jīng)驗值(1≤α≤10)。
訓練樣本中作為網(wǎng)絡輸入變量的9個煙葉顏色特征值存在較大差異,以葉片正面顏色參數(shù)為例,L*值變化為55.34~63.64,a*值則在10.28~22.17。輸入變量之間的差異造成各分量尺度不一致,網(wǎng)絡訓練結果則會偏重于分量值大的變量,忽略分量值小的變量,進而影響網(wǎng)絡的精準性;此外由于網(wǎng)絡輸入層至隱含層轉換函數(shù)采用Sigmoid函數(shù),數(shù)據(jù)差異較大可使神經(jīng)元的輸入值過早進入Sigmoid 函數(shù)的飽和區(qū)[22],使網(wǎng)絡學習進程停滯。因此,對網(wǎng)絡模型輸入層數(shù)據(jù)采用離差標準化的方法(公式2)使結果落在[0,1]區(qū)間。
(2)
經(jīng)計算,隱含層節(jié)點數(shù)在5~14,通過網(wǎng)絡性能測試確定節(jié)點數(shù)為11的隱含層所構建的網(wǎng)絡模型擬合殘差最小。最終構建9-11-1的3層BP神經(jīng)網(wǎng)絡,結構如圖2所示。
圖2 BP神經(jīng)網(wǎng)絡模型結構
使用Matlab 2014b軟件進行網(wǎng)絡訓練,將已經(jīng)標準化處理的訓練樣本導入軟件中,在輸入層、隱含層、輸出層參數(shù)設定的基礎上,利用軟件工具箱中的newff函數(shù)進行創(chuàng)建。輸入層至隱含層的連接函數(shù)采用tan-sigmoid飽和正切函數(shù),隱含層至輸出層選用線性傳遞函數(shù)purelin以拓展輸出值域,學習函數(shù)采用trainlm;在248個樣品中隨機選擇80%作為訓練樣本,剩余20%為測試樣本;訓練步數(shù)設定為100,反復訓練2 000次,目標誤差精度設置為10-3,學習速率設為0.1。其余參數(shù)設置均使用系統(tǒng)默認值,依據(jù)上述設定標準,設計以下程序代碼:
net=newff (minmax(P),[11,1],{‘tansig’ ,‘ purelin’ },‘trainlm’);
net.divideFcn=‘dividerand’;
net.divideMode=‘sample’;
net.divideParam.trainRatio=80/100;
net.divideParam.testRatio=20/100;
net.trainParam.Show=100;
net.trainParam.goal=0.001;
net.trainParam.Epochs=2 000;
net.trainParam.lr=0.1;
[net,tr]=train(net,P,T);
a=sim(net,P)
代碼中,P為煙葉顏色特征值,T為煙葉外觀質量評價指標;minmax(P)表示由9個訓練樣本的輸入矩陣P的最大值和最小值組成的9×2維矩陣;[11,1]表示隱含層和輸出層神經(jīng)元個數(shù);tansig和purelin分別表示隱含層和輸出層采用的傳遞函數(shù);trainlm指訓練函數(shù)采用L-M優(yōu)化算法以降低網(wǎng)絡對誤差曲面局部細節(jié)的敏感度,防止網(wǎng)絡陷入局部極小值,并有效地提升網(wǎng)絡收斂速度和泛化能力。
通過對6項外觀質量評價指標構建的網(wǎng)絡模型進行訓練和仿真。以訓練完成后各項外觀質量評價指標網(wǎng)絡模型的模擬值為縱坐標,以該項外觀質量評價得分目標輸出值為橫坐標,建立統(tǒng)計回歸分析圖(圖3)。圖中的直線為y=x,表示模擬值與目標輸出值完全相同時的結果。由圖3可知,所建立的網(wǎng)絡模型的模擬值與目標輸出值中顏色、成熟度和葉片結構3項外觀質量評價指標的線性回歸決定系數(shù)達到顯著水平,身份、油分和色度的線性回歸決定系數(shù)均達到極顯著水平。表明各項外觀質量得分的模型預測值與目標輸出值非常接近。
分別對訓練樣本和測試樣本的各項外觀質量評價指標的模型預測值與目標輸出值的差異進行統(tǒng)計,得到歸屬于不同誤差區(qū)間的樣本比例。從表4可以看出,各項外觀質量評價指標預測值與目標輸出值的誤差區(qū)間在0~0.5的訓練樣本比例均達到80%以上,誤差在0~1.0的訓練樣本比例均達到90%以上,表明模型預測結果的準確性較高。測試樣本各項外觀質量評價指標預測值與目標輸出值的誤差范圍集中程度較訓練樣本分散,但整體也集中在較小的誤差范圍內,表明構建的外觀質量預測模型具有較好的推廣泛化性能。雖然有部分外觀質量評價指標網(wǎng)絡模型的預測值與目標輸出值決定系數(shù)未達到極顯著水平,且極少數(shù)樣本的訓練結果與目標輸出值有較大偏差,但考慮到煙葉外觀質量評價打分過程受人為因素影響較大,存在明顯的主觀性和隨機性,因此,整體來看,所建立的神經(jīng)網(wǎng)絡模型的模擬效果較好,具有一定的可行性和實用性。
*、**分別表示模擬值與目標值相關性達到0.05和 0.01顯著水平圖3 訓練后網(wǎng)絡模擬值與目標值輸出的統(tǒng)計回歸分析
表4 單項外觀質量評價指標預測模型輸出誤差情況統(tǒng)計
注:括號中內容為50個測試樣本在各個誤差區(qū)間所占比例。
本研究利用BP神經(jīng)網(wǎng)絡構建了烤煙外觀質量評價的預測模型,為加快網(wǎng)絡收斂速度,采用因子分析法對作為輸入層的煙葉正反面顏色特征值進行篩選,最終確定以煙葉正面的L*、a*、b*、C*、H*以及煙葉背面的a*、b*、C*、H*共9個參數(shù)作為網(wǎng)絡輸入指標,分別對顏色、成熟度、葉片結構、身份、油分、色度等6項外觀質量評價指標得分進行預測。構建的模型擬合效果較好,預測精準度高。
雖然烤煙外觀質量的本質是內在化學成分綜合表現(xiàn)的結果[23],然而,煙葉中已被鑒定的化學成分高達3 035種[24],此外品種、部位等遺傳因素以及田間生長過程、采后烘烤過程等環(huán)境因素均會影響煙葉的內在品質[25-28],最終影響烤煙外觀質量的形成。若通過測量常規(guī)化學成分含量實現(xiàn)對外觀質量的預測,既要考慮到測量過程的時效性,還需考慮測量結果的準確性,因此,實現(xiàn)外觀質量評價過程的智能化仍需要進一步探究。煙葉顏色是葉內多種化學成分綜合作用的外在表現(xiàn)。梁洪波等[3]、丁根勝等[4]、賀帆等[6]研究表明,煙葉顏色與其內在化學成分密切相關。再者隨著現(xiàn)代儀器學科的發(fā)展,CIE顏色空間以非常具體的數(shù)據(jù)直觀地反映煙葉表面的呈色特性,是一種快速、準確、無損的顏色檢測方式,因此,基于煙葉表面顏色特征值實現(xiàn)對外觀質量預測的模型是有效的。
預測模型的適用性應與我國烤煙生產模式密切相關,我國共有21個煙葉產區(qū)[18],生態(tài)條件和煙葉品種的差異可能造成煙葉顏色特征值和外觀質量出現(xiàn)明顯區(qū)別[29-30],而研究僅針對河南煙區(qū)部分代表性產區(qū)煙葉,模型的適用性方面有待探究。未來應針對煙葉產地、品種、部位建立相應的外觀質量預測模型,結合儀器智能檢測、計算機智能分析等先進技術和方法,建立多個不同層次的神經(jīng)網(wǎng)絡預測模型,形成一個龐大的模型集,隨著數(shù)據(jù)量的不斷擴大,網(wǎng)絡模型的模擬效果會不斷提升,預測結果更為精準。