廉孟茹 張淑娟 任 銳 池江濤 穆炳宇 孫雙雙
(山西農(nóng)業(yè)大學(xué)農(nóng)業(yè)工程學(xué)院,山西 太谷 030801)
鮮食玉米含有豐富的蛋白質(zhì)、脂肪、糖類、鈣、胡蘿卜素、維生素等營養(yǎng)成分[1],是人們餐桌上的美食。鮮食玉米籽粒含水率為70%左右時(shí)食用風(fēng)味和營養(yǎng)最佳,此時(shí)為鮮食玉米的最佳收獲期。采收過早,干物質(zhì)和各種營養(yǎng)成分不足、產(chǎn)量低、效益低;采收過晚會(huì)使鮮食玉米風(fēng)味變差。而人工識別最佳采收期的玉米不僅費(fèi)時(shí)費(fèi)力,而且還會(huì)損傷鮮食玉米。
近年來,高新浩等[10]設(shè)計(jì)了一種基于機(jī)器視覺的鮮食玉米品質(zhì)檢測分類器,實(shí)現(xiàn)了對不同品種、尺寸以及破損程度的鮮食玉米進(jìn)行分類。但是還未有高光譜成像技術(shù)應(yīng)用于鮮食玉米含水率無損檢測的報(bào)道。研究擬采用高光譜技術(shù)對鮮食水果玉米進(jìn)行光譜數(shù)據(jù)采集并提取,通過比較不同預(yù)處理方法和特征波長提取方法,選用決定系數(shù)(R2)最大、均方根誤差(RMSE)值最小的處理方法作為鮮食水果玉米的最佳建模方法,以此實(shí)現(xiàn)對鮮食玉米含水率的預(yù)測。
鮮食水果玉米樣本于2020年7月17日采摘自山西省榆次區(qū)北田鎮(zhèn)北田村,于當(dāng)天運(yùn)送至實(shí)驗(yàn)室,選取尺寸大小均勻、無病蟲害的水果玉米144根,其標(biāo)號,人工剝開玉米苞葉,去除玉米須,采集光譜信息及相關(guān)試驗(yàn)。利用Kennard-Stone算法[11]將鮮食水果玉米樣本按3∶1的比例劃分為校正集和預(yù)測集。得到校正集玉米樣本108個(gè),預(yù)測集玉米樣本36個(gè)。
高光譜分選儀:ZOLIX Gaia Sorter型,北京卓立公司;
電熱鼓風(fēng)干燥箱:SY101-2型,天津市三水科學(xué)儀器有限公司。
采集光譜的波長范圍為900~1 700 nm。采集玉米的光譜信息,光譜分辨率為9 nm。設(shè)置曝光時(shí)間為20 ms,平臺移動(dòng)速度為2 cm/s,樣本與鏡頭的距離為22 cm。提取樣本感興趣區(qū)域?yàn)?0個(gè)像素點(diǎn)×50個(gè)像素點(diǎn)。為了消除光強(qiáng)變化和鏡頭中暗流對采后數(shù)據(jù)的影響以及計(jì)算掃描物體的相對反射光譜值,在光譜數(shù)據(jù)采集前先采集黑白板,并對高光譜采集后的數(shù)據(jù)進(jìn)行黑白校正,計(jì)算公式為:
(1)
式中:
R——校正后的圖像;
I——原始圖像;
B——黑板校正圖像;
W——白板校正圖像。
鮮食玉米籽粒稱重后,置于105 ℃電熱鼓風(fēng)干燥箱內(nèi)干燥至恒重(6 h左右),測定玉米籽粒烘干后的質(zhì)量[12],按式(2)計(jì)算玉米籽粒含水率。
(2)
式中:
W——鮮食玉米的含水率;
W1——烘干前玉米的質(zhì)量,g;
W2——烘干后玉米的質(zhì)量,g。
水果玉米的原始光譜圖如圖1所示。
圖1 水果玉米的原始光譜圖Figure 1 The original spectrum of fruit corn
從圖1可以看出,樣本集玉米光譜平均反射率曲線整體趨勢一致。玉米光譜900~1 700 nm的光譜范圍內(nèi)時(shí)光譜反射率范圍大約為0.12~0.53,在波數(shù)為970,1 200,1 450 nm附近處有3處明顯的特征峰。970,1 450 nm附近的特征峰來源于O—H鍵的伸縮振動(dòng),與水分子的結(jié)構(gòu)有關(guān)[13-14];1 200 nm附近的特征峰為液態(tài)水的組合頻吸收帶[15];1 450 nm是O—H鍵一級倍頻峰[16]。
通過使用直接干燥法測定的含水率頻率直方圖如圖2 所示。
從圖2和表1可以看出,鮮食水果玉米樣本的含水率分布在0.68~0.81。含水率的均值、中值和眾數(shù)都在0.75 附近,含水率分布大致符合正態(tài)分布。
圖2 水果玉米含水率頻率直方圖Figure 2 Frequency histogram of moisture contentof fruit corn
光譜數(shù)據(jù)預(yù)處理可以消除光譜數(shù)據(jù)采集過程中試驗(yàn)儀器產(chǎn)生的噪聲、背景干擾、周圍雜散光干擾等因素對數(shù)據(jù)的影響[17],消除光譜數(shù)據(jù)中的冗余信息,提高模型的準(zhǔn)確率。試驗(yàn)采用變量標(biāo)準(zhǔn)化算法(SNV)、附加散射校正算法(MSC)、卷積平滑(SG)、去趨勢法(De-trending)、移動(dòng)平均法(MA)和歸一法(Normalize)6種方法對玉米光譜數(shù)據(jù)進(jìn)行預(yù)處理,并與原始光譜數(shù)據(jù)(RW)建模效果作對比,預(yù)處理后的光譜圖如圖3所示。
圖3 預(yù)處理后的光譜圖Figure 3 Spectrum after pretreatment
測定的玉米樣本含水率的描述性統(tǒng)計(jì)數(shù)據(jù)如表1所示。
表1 玉米樣本含水率描述性統(tǒng)計(jì)數(shù)據(jù)
對處理后的光譜數(shù)據(jù)建立偏最小二乘回歸(PLS)模型比較建模效果如表2所示。
表2 光譜預(yù)處理方法對PLS建模結(jié)果的影響
高光譜數(shù)據(jù)中包含了大量化學(xué)和物理信息,具有高維度和共線性問題,其中一些相關(guān)性不強(qiáng)的光譜信息會(huì)影響建模效果,不僅使建模時(shí)間增加,還會(huì)降低模型相關(guān)性[18-19]。為了更加高效準(zhǔn)確地預(yù)測模型效果,需要對光譜數(shù)據(jù)進(jìn)行特征波長的提取。選用連續(xù)投影法(SPA)、競爭性自適應(yīng)加權(quán)重算法(CARS)和隨機(jī)蛙跳法(RF)3種方法來優(yōu)選特征波長,并利用優(yōu)選出的特征波長建立PLS回歸模型來比較建模效果。
2.2.1 SPA特征波長提取 采用SPA建模優(yōu)選過程及所篩選出的最優(yōu)波長如圖4和圖5所示。
由圖4和圖5可知,優(yōu)選的變量數(shù)目從1到6變化時(shí)其對應(yīng)的均方根誤差(RMSE)值在減??;變量數(shù)目超過6時(shí),RMSE值開始增加;當(dāng)變量數(shù)目為6時(shí),RMSE值最小,為0.012 375,所以采用SPA建模方法優(yōu)選出6個(gè)特征波長,分別為1 074,1 141,1 182,1 278,1 685,1 700 nm。
圖4 特征波長優(yōu)選過程Figure 4 Feature wavelength optimization process
圖5 SPA提取的特征波長Figure 5 Feature wavelength extracted by SPA
2.2.2 CARS特征波長提取 采用CARS建模,設(shè)置蒙特卡羅采樣次數(shù)為50次,優(yōu)選過程及所篩選出的最優(yōu)波長如圖6所示。
從圖6(a)可以看出,隨著蒙特卡羅采樣次數(shù)從1次增加到50次,所采集的變量由254個(gè)減小到2個(gè);從圖6(b)可以看出,交叉驗(yàn)證均方根誤差(RMSE)的值呈由大變小再變大的趨勢,在第35次采樣時(shí)均方根誤差最小,最小值為0.011 3;圖6(c)為波長變量優(yōu)選過程中各波長變量回歸系數(shù)的變化趨勢,第35次采樣時(shí)均方根誤差最小。由CARS模型運(yùn)行結(jié)果提取出16個(gè)特征波長,分別為902,918,953,1 064,1 128,1 131,1 195,1 198,1 310,1 380,1 421,1 424,1 488,1 491,1 535,1 545 nm。
圖6 CARS提取的特征波長Figure 6 Feature wavelength extracted by CARS
2.2.3 RF特征波長提取 采用RF建模,為了減小隨機(jī)蛙跳法所產(chǎn)生的不穩(wěn)定性,蒙特卡羅采樣次數(shù)應(yīng)盡可能多,設(shè)置蒙特卡羅采樣次數(shù)為2 000次,優(yōu)選過程及所篩選出的最優(yōu)波長如圖7所示。
概率越大的變量對建模的貢獻(xiàn)率越大,從圖7可以看出,波段的選擇概率范圍為0.0~0.6,大部分變量的選擇概率值都很小,只有少數(shù)變量的選擇概率峰值比較突出,可被確定為特征波長,選擇概率大的數(shù)據(jù)坐標(biāo)點(diǎn)有(3,0.224 0)、(57,0.242 5)、(73,0.300 0)、(75,0.273 0)、(76,0.245 0)、(93,0.232 5)、(98,0.215 0)、(132,0.211 5)、(167,0.213 5)、(186,0.537 0)共計(jì)10個(gè),其對應(yīng)的特征波長分別為902,1 074,1 125,1 131,1 135,1 189,1 205,1 313,1 424,1 485 nm。
圖7 RF提取的特征波長Figure 7 Feature wavelength extracted by RF
比較基于MSC預(yù)處理的3種特征波長的PLS建模結(jié)果與原始光譜的PLS建模效果如表3和圖8所示。
表3 不同特征波長提取方法對PLS建模效果的影響
圖8 3種特征波長的PLS建模與原始光譜的PLS建模預(yù)測效果
研究基于去除苞葉的鮮食玉米進(jìn)行光譜信息采集并建立含水率模型,該模型預(yù)測效果較好。但是針對田間未去除苞葉的鮮食玉米含水率的無損檢測模型還需進(jìn)一步研究。