林天然, 姚爭毅, 常鵬飛, 鄭 婧, 李滿玲,謝 萍, 陳詩瑤, 儲偉杰, 李仁忠
(1.福建省煙草公司龍巖市公司, 福建 龍巖 364000; 2.中國煙草總公司福建省公司, 福建 福州 350003; 3.南京南部新城生態(tài)農林發(fā)展有限公司, 江蘇 南京 211500; 4.福建省三明市氣象局, 福建 三明 365000)
【研究意義】鮮煙采收成熟度是指煙葉在田間生長發(fā)育到適于調制加工的成熟程度[1-2]。成熟度是煙葉品質形成的核心因素,適宜的田間采收成熟度是調制優(yōu)質烤煙的基礎[3]。現行的成熟度識別主要通過人工肉眼觀察鮮煙葉片表觀特征包括葉型、葉面紋理及外觀顏色等進行判別[4-5],該方法受操作人員判別水平及環(huán)境因素影響較大,導致成熟度識別準確率較低。李旭華等[6-7]提出基于SPAD值的成熟度判別方法,但SPAD測定儀器成本較高而無法在生產上廣泛應用。隨著計算機技術的發(fā)展,采用數字圖像分析技術對植物表型學進行研究成為熱點[8]。通過對植物圖像進行數字化處理,得到目標對象的特征參數,并在此基礎上構建特征參數與植物生理生化指標的關聯模型[9-10],可快速、準確、無損地獲取其生理生化指標定量信息。采用該方法開展鮮煙葉片成熟度的判定方法研究對精準判斷大田煙草鮮葉采收成熟度具有重要意義?!厩叭搜芯窟M展】采用機器學習是目前對植物表型進行定量分析的一種趨勢[8-9,11]。由于深度學習能夠進行大量數據并行計算和非線性映射,并具有較強的容錯性、自適應和自學習能力[12],因此已廣泛應用于煙葉成熟度識別及分類。目前煙葉成熟度研究采用的特征參數主要有葉色圖像Lab色彩參數[13]、RGB色彩模型參數[14-17]、HSV色彩模型參數和葉面紋理參數[16],王杰等[14-16]在此基礎上分別采用極限學習機、Fisher線性判別函數、BP神經網絡和支持向量機構建了鮮煙成熟度判別模型,并取得了較好的判定精度。CHEN等[18]研究擴展了葉色參數類別,并提出SPAD值-葉色偏態(tài)參數的空間擬合模型,進一步驗證了葉色分布變化的雙向性(深淺變化及分布區(qū)域變化),說明葉色偏態(tài)參數能夠更為精確地反應葉色變化過程。【研究切入點】目前研究大多集中在對相同葉位不同成熟度的識別上,鮮見不同葉位不同成熟度的智能識別技術相關研究。【擬解決的關鍵問題】引入葉色偏態(tài)參數,結合HSV色彩模型參數、葉面紋理參數及葉型參數,組合成葉片圖像復合參數集,運用多元回歸及BP神經網絡構建葉色參數-煙葉成熟度判定模型。通過比較不同參數體系、不同建模方式對不同葉位鮮煙葉片成熟度的判定準確度,篩選出最優(yōu)的成熟度判定模型,以期為全株鮮煙葉片成熟度的智能化識別提供理論依據及應用基礎。
1.1.1 煙葉 煙草品種為云煙87,于2018年6月5日上午10:00采自福建省上杭縣廬豐鄉(xiāng)(24°57′N,116°30′E)植煙區(qū)。選取大田生長正常、長勢一致且無病蟲害的100株煙株于采摘前1 d掛牌標識;每株采摘上、中及下部葉片各3片,共900片煙葉,剔除病害傷殘葉后,將余下的821片鮮煙葉送入室內進行鮮煙成熟度分選(鮮葉離體時間<10 min),具體分類數量詳見表1。
表1 試驗樣品分類及數量
1.1.2 儀器設備 煙葉標準化分級臺,臺面尺寸長300 cm×寬200 cm×高80 cm,桌面底板為灰白色(RGB值為225∶225∶225)啞光磨砂臺面;2支20W條狀白色LED燈管,色溫5 000 K;CANON EOS-550D數碼相機,日本佳能公司生產。
1.2.1 圖像采集 采用煙葉標準化分級臺采集圖像。照明光源LED燈管懸掛于平臺1/4和3/4處;在距離臺面100 cm處固定數碼相機進行圖像采集,原始數字圖像分辨率為3 840 dpi×5 120 dpi。用吸水紙擦凈分選后的鮮葉表面灰塵和露水,將樣品放平臺中央進行拍攝,確保鮮煙葉脈與桌面邊緣垂直。
1.2.2 圖片預處理 參照文獻[17]的方法采用Photoshop CS對葉片原始圖像進行切割,只保留鮮葉葉片部分,并將切割后的圖像保存為白色背景的JPG圖像格式。
1.2.3 圖像特征參數提取
1) 葉色偏態(tài)參數。采用CHEN等[18-19]的方法進行葉色偏態(tài)參數提取,采用MATLAB 2016R(以下簡稱MATLAB)內置函數分別獲取葉片彩色圖像Red(R)、Green(G)和Blue(B)3個通道及灰度圖像(Y)的均值(Mean)、中位數(Median)、眾數(Mode)、偏度(Skewness)及峰度(Kurtosis)等20個參數(RMean,RMedian,RMode,RSkewness,RKurtosis,GMean,GMedian,GMode,GSkewness,GKurtosi,BMean,BMedian,BMode,BSkewness,BKurtosis,YMean,YMedian,YMode,YSkewness,YKurtosis)。均值、中位數和眾數是反映葉色的深淺情況,偏度反映葉色的偏向性,峰度則是反映葉色分布的集中度。
2) 葉色HSV參數。參照沈平等[20]的方法計算圖像色調(H)、圖像顏色的飽和度(S)及圖像顏色的明度(V)。其中,當H為0.167時,圖像顯示黃色,當H為0.333時,圖像顯示綠色;S越大,圖像顏色越深;V越大圖像顏色越明亮。
3) 葉面紋理參數。物體表面紋理一般用灰度共生矩陣(GLCM)表示。GLCM是一種通過研究灰度的空間相關特性描述紋理的常用方法,是描述具有某種空間位置關系2個像素灰度的聯合分布。常用能量(ASM)、對比度(CON)、自相關(COR)和逆距差(IDM)4種參數定量描述物體表面紋理狀況。ASM表示紋理粗細度,是GLCM中所有元素的平方和,紋理越粗則ASM值越大。CON表示紋理溝紋深淺的程度,反映某個像素與其相鄰像素的亮度對比,紋理溝紋越深則CON值越大。COR表示紋理的一致性,反映某個像素與其相鄰像素之間的相關度,紋理越一致,COR值越大。IDM反映紋理的同質性,度量圖像紋理局部變化的多少,IDM值越大表示圖像紋理不同區(qū)域間缺少變化,局部非常均勻。參照沈平等[20]的方法計算能量(ASM)、對比度(CON)、自相關(COR)和逆距差(IDM)4種紋理特征值參數。
4) 葉型參數。最小外接矩形(MBR)是以給定的二維形狀各頂點中的最大橫坐標、最小橫坐標、最大縱坐標及最小縱坐標為邊界點所確定的矩形,用于表示二維形狀最大范圍(圖1)。在此采用MATLAB內置函數獲取目標葉片的連通域信息,記錄葉片面積(LA)及葉片周長(LP)。通過MATLAB內置函數獲取其MBR相關參數信息,由于葉片圖像均垂直于桌面邊緣,因此,本研究以MBR的長邊近似代表葉長(LL),以MBR的短邊近似代表葉寬(LW),計算MBR的面積(S)、目標葉片葉寬葉長比(WL)及目標葉片面積占比(SS)。
圖1 葉型參數
S=LL×LWS
WL=WL/LL
SS=LA/S
1.2.4 構建葉片圖像特征參數表 根據1.2.3的方法構建葉片圖像特征參數,包括葉色偏態(tài)參數(BMean,BMedian,BMode,BSkewness,BKurtosis,YMean,YMedian,YMode,YSkewness,YKurtosis)、葉色HSV參數(H,S,V)、葉面紋理參數(ASM,CON,COR,IDM)和葉型參數(LA,LP,LL,LW,WL,SS)。
1.2.5 相關分析 選取全部821個樣品,運用SPSS對鮮葉成熟度與葉片圖像特征參數進行Person相關分析,顯著性檢查采用雙尾檢驗,顯著水平α=0.05。
1.2.6 判定模型構建
1) 回歸模型構建。采用SPSS以鮮葉成熟度作為因變量,以傳統葉色正態(tài)分布的參數集N1(RMean,GMean,BMean,H,S,V,ASM,CON,COR,IDM,LA,LP,LL,LW,WL,SS)及基于葉色偏態(tài)分布的參數集N2(H,S,V,ASM,CON,COR,IDM,LA,LP,LL,LW,WL,SS)作為自變量,采用基于最小二乘法的逐步回歸方式分別建立線性模型F1和F2。F1及F2模型參數均設置為P≤0.05,P≥0.100。
2) BP神經網絡模型構建[12]。BP神經網絡模型拓撲結構包括輸入層(input)、隱含層(hide layer)和輸出層(output layer)。通過訓練對比后取判定結果與實際誤差最小的隱含層神經元數(Z)為最優(yōu)神經網絡結構。
式中,m及n分別為輸入層及輸出層的神經元數,q為[1,10]之間的常數,「?為向上取整。
采用MATLAB的Neural Network Toolbox,以鮮葉成熟度為輸出因子,分別以N1、N2參數集為輸入層構建判定模型F3、F4。
表2 煙草鮮葉成熟度判定模型
1.2.7 模型的判定準確度比較 運用F1~F4對821個樣品成熟度進行判定,然后計算判定準確度。其中,每個樣品的預測值采用四舍五入法取整作為判定結果。
模型判定準確度=(模型準確判定數量/判定總數量)×100%
通過33個葉片圖像復合參數與煙草鮮葉成熟度的相關性分析表明,參數RMean(0.497)、RMedian(0.469)、RMode(0.347)、GMean(0.227)、GMedian(0.150)、YMean(0.376)、YMedian(0.312)、YMode(0.156)、S(0.112)、V(0.323)、COR(0.110)及IDM(0.699)與煙草鮮葉成熟度呈極顯著正相關;參數RSkewness(-0.327)、RKurtosis(-0.439)、GKurtosi(-0.279)、YSkewness(-0.170)、YKurtosis(-0.353)、H(-0.627)、CON(-0.776)、LA(-0.832)、LP(-0.174)、LL(-0.197)、LW(-0.850)、WL(-0.849)及SS(-0.252)與煙草鮮葉成熟度呈極顯著負相關;參數GSkewness(-0.087)和BMean(0.070)與煙草鮮葉成熟度分別呈顯著負相關和顯著正相關;參數GMode(-0.044)、BMedian(0.019)、BMode(-0.052)、BSkewness(0.009)及BKurtosis(-0.009)與煙草鮮葉成熟度的相關性不顯著;ASM由于數值過小,無法進行相關分析。其中,葉面積(LA)、葉寬(LW)、葉寬葉長比(WL)與鮮煙葉片成熟度的相關性表現最優(yōu)。
在葉色偏態(tài)參數中,以R通道的5個參數相關系數最高,灰度圖像參數次之,B通道表現最差;除B通道的眾數外,R、G和B 3個通道及灰度圖像的均值、中位數和眾數均與成熟度呈極顯著或顯著正相關,說明隨著成熟度的增加,此參數同步提升,反映為葉色逐漸變淺;偏度方面,RSkewness、GSkewness和YSkewness與成熟度呈極顯著或顯著負相關,說明隨著成熟度的增加,葉色偏度逐漸下降,負偏態(tài)程度逐漸加深,反映為葉色從綠色逐漸傾向黃色。峰度方面,RKurtosis、GKurtosi和YKurtosis與成熟度呈極顯著負相關,說明隨著成熟度的增加,葉色偏度逐漸下降,葉色純度逐步下降,反映到葉色變化上,則與葉片從鮮綠變成黃綠相間(此時葉色離散程度最高,峰度最小)的成熟過程相對應。
在HSV參數中,色調值(H)與煙葉成熟度呈極顯著負相關,說明H隨著煙葉成熟度的增大而下降,反映煙草成熟過程中葉色由綠色逐漸轉變?yōu)辄S色的過程;飽和度(S)和明度值(V)與煙葉成熟度呈極顯著正相關,說明,S和V隨著煙葉成熟度的增大而增加,與煙草成熟過程中葉色由暗變亮的過程相對應。
在葉面紋理參數中,除能量(ASM)由于數值太小無法進行相關分析外,對比度(CON)與成熟度呈極顯著負相關,說明隨著成熟度的增大,葉面紋理溝紋逐漸變淺;自相關(COR)及逆距差(IDM)與成熟度呈極顯著正相關,說明隨著成熟度的增大,不同區(qū)域間變化逐漸均勻,紋理趨向一致。綜合以上3個紋理參數說明,隨著葉片成熟度的增加,葉面紋理趨向光滑,不同區(qū)域間的差異逐漸消除。
葉型參數葉面積(LA)、葉周長(LP)、葉長(LL)、葉寬(LW)、葉寬葉長比(WL)及目標葉片面積占比(SS)均與成熟度呈極顯著負相關,說明,隨著成熟度的增加,葉型逐漸縮小。表明,以上顯著相關的參數均能作為構建鮮煙葉片成熟度判定模型的因子。
采用葉色正態(tài)分布參數集N1及葉色偏態(tài)分布參數集N2分別構建F1~F4鮮葉成熟度判定模型(表3)。從圖2和表3看出,F1模型的主要解釋變量是BMean、H、S、V、LW、LP及CON共7個參數;F2模型主要解釋變量為RSkewness、GSkewness、RKurtosis、YKurtosis、LW、LP及H共7個參數;利用BP神經網絡構建鮮葉成熟度判定模型時,當m=16,n=1,q=7時,Z=12,此時采用N1作為輸入因子的F3收斂效果最佳,由此確定F3最佳BP神經網絡結構為16-12-1;采用N2作為輸入因子時,當m=33,n=1,q=4時,Z=10,此時F4收斂效果最佳,由此確定F4最佳BP神經網絡結構為33-10-1。通過對4個模型的R2進行比較后可以得出,4個模型的R2均超過0.8,均能較好地擬合鮮葉成熟度。從建模方式看,采用BP神經網絡構建的F3(R2=0.947)和F4(R2=0.966)均優(yōu)于采用逐步回歸構建的F1(R2=0.828)和F2(R2=0.858);從輸入參數類別看,在相同建模方式情況下,采用偏態(tài)分布參數的F2和F4分別優(yōu)于F1和F3??傮w看,采用葉色偏態(tài)分布參數集N2作為輸入因子所構建的BP神經網絡模型F4擬合效果最優(yōu);采用葉色正態(tài)分布參數集N1作為自變量所構建的逐步回歸模型F1擬合效果最差。
表3 鮮葉成熟度的判定模型
注:左圖為葉色正態(tài)參數集N1,右圖為葉色偏態(tài)參數集N2。
從表4和圖3可知,采用N2作為輸入因子的F4準確度最高,達94.15%,較采用相同建模方式但輸入因子為N1的F3高14.25百分點,較準確度最低的F1高52.74百分點。從不同成熟度看,F4對9個不同成熟度的判定準確度均表現最優(yōu),準確率為74.29%~98.00%,其中,F4對XRL、CRL、COL、BUL及BRL的判定準確率均達95%以上,特別是對BRL的判定準確度高達98%;F4較F3對9個不同成熟度(XUL、XRL、XOL、CUL、CRL、COL、BUL、BRL及BOL)的判定準確率分別提升11.43百分點、10.52百分點、7.4百分點、27.85百分點、14.64百分點、18.94百分點、10.31百分點、18百分點及3.45百分點。
表4 不同模型對鮮葉成熟度的判定準確度
圖3 不同模型對鮮葉成熟度判定準確度的百分位分布
基于數碼圖像分析技術對植物表型學的研究已廣泛開展[8-10],由于其所需設備簡單、成本較低,具有廣闊的應用前景[11]。但由于RGB色彩模式對葉色定量描述存在局限性[18],研究人員提出以RMean、GMean和BMean3個參數為基礎的多種組合參數,但仍然無法精確反映葉色信息[21],因此,基于RGB模型對葉色的定量分析陷入瓶頸。隨著植物表型學的發(fā)展,近年來,研究人員發(fā)現葉色偏態(tài)參數[17],其極大地擴大了葉色圖像的信息,從深淺程度和分布方向2個方面系統、定量地描述葉片葉色。通過相關分析看出,20個偏態(tài)參數中,有15個參數與葉片成熟度顯著相關,說明采用葉色偏態(tài)參數對葉片成熟度進行定量分析可行。同時,有研究[5,13-16]發(fā)現,葉色圖像Lab色彩參數、HSV色彩模型參數及葉面紋理參數也與煙葉成熟度存在不同程度的相關性。研究結果顯示,鮮煙葉片圖像的色調值(H)隨煙葉成熟度的增大而下降,而飽和度(S)和明度值(V)隨煙葉成熟度的增大而增加,其分別與煙草成熟過程中葉色由綠色逐漸轉變?yōu)辄S色、由暗變亮的過程相對應。除能量(ASM)外,對比度(CON)、自相關(COR)及逆距差(IDM)3個葉面紋理參數與成熟度均呈極顯著相關。葉型參數葉面積(LA)、葉周長(LP)、葉長(LL)、葉寬(LW)、葉寬葉長比(WL)及目標葉片面積占比(SS)均與成熟度呈極顯著負相關。說明,鮮煙葉片復合參數可很好地表征成熟度的等級差異,且其與煙草葉片成熟過程中葉色的表觀變化存在一致的對應關系,可為利用其構建煙草葉成熟度判定模型提供數學基礎。
多元逐步回歸法因具備原理簡單、使用方便的優(yōu)點被廣泛使用。而BP神經網絡可學習和存儲大量輸入-輸出模式的映射關系,具有很強的非線性映射能力,近年來越來越多地應用于模型的構建?;诖耍撗芯糠謩e以葉色正態(tài)分布復合參數集(N1)與葉色偏態(tài)分布復合參數集(N2)作為輸入因子,依次采用多元逐步回歸法和BP神經網絡法構建葉片成熟度的判定模型。通過比較4種模型擬合優(yōu)度及判定準確度發(fā)現,基于BP神經網絡所構建的F3和F4模型均優(yōu)于采用多元回歸方式構建的F1和F2模型,可能與BP神經網絡所具備的大數據輸入及非線性映射能力有關;同時,采用N2作為輸入因子的模型F2和F4均優(yōu)于采用N1作為輸入因子的模型F1和F3,說明葉色偏態(tài)參數能更好地反映葉色變化。
引入葉色偏態(tài)參數,結合HSV色彩模型參數、葉面紋理參數和葉型參數,組合成葉片圖像復合參數集,并將其作為輸入因子,運用BP神經網絡構建F4(33-10-1)模型,經檢驗證明其對下部、中部和上部煙葉成熟度的判定精度分別為84.44%、96.10%和92.56%,總體精度達94.15%,可以滿足不同葉位不同成熟度的判定精度需求,是最佳的葉片成熟度判定模型。同時說明,采用葉色偏態(tài)分布復合參數集(N2)作為輸入因子且采用BP神經網絡構建的不同葉位鮮煙葉成熟度的判定方法可在一定程度上解決煙草葉片成熟度田間判定準確度低的問題,可為煙葉生產過程中全株鮮煙葉片成熟度的智能化識別提供理論依據及應用基礎。
致謝:美國塔夫茨大學江旭提供SPSS和MATLAB軟件對數據進行處理分析,特此感謝!