穆炳宇, 薛建新,張淑娟,任 銳,廉孟茹,池江濤
(山西農(nóng)業(yè)大學(xué)工學(xué)院,山西晉中 030801)
花椰菜(Brassica oleracea L. var. botrytis L.),俗稱(chēng)花菜、菜花或椰菜花,屬十字花科一年生植物?;ㄒ藸I(yíng)養(yǎng)價(jià)值高,其中以維C 的含量最為豐富;還含有異硫氰酸鹽化合物,可有效抗癌防癌[1]。但是,花椰菜在受到暴曬、凍害或者水分流失后會(huì)出現(xiàn)褐變、腐爛,從而失去食用價(jià)值[2]?;ㄒ巳菀资艿较x(chóng)害的影響,導(dǎo)致黑腐病發(fā)生,使得花球、根莖處呈現(xiàn)黑色霉層,形成爛菜花,造成減產(chǎn)甚至絕收。目前,花椰菜的品質(zhì)檢測(cè)主要靠人工來(lái)完成,尚未有針對(duì)花椰菜新鮮和腐爛的判別研究。
近年來(lái),近紅外光譜技術(shù)已經(jīng)廣泛應(yīng)用于農(nóng)產(chǎn)品品質(zhì)的無(wú)損檢測(cè)中。何寬等人[3]利用光譜成像技術(shù),結(jié)合光譜信息分割法實(shí)現(xiàn)了對(duì)采后藍(lán)莓腐爛病的無(wú)損檢測(cè),準(zhǔn)確率達(dá)97.5%以上。孫海霞等人[4]使用光譜技術(shù)對(duì)黑斑鮮棗進(jìn)行了識(shí)別,通過(guò)SPA 提取的特征波長(zhǎng)獲得主成分圖像,采用BP-NN 和CNN建立識(shí)別模型,判別準(zhǔn)確率分別為78.3%和90.0%。Shijie Tian 等人[5]使用透射可見(jiàn)/ 近紅外技術(shù)實(shí)現(xiàn)了對(duì)發(fā)霉蘋(píng)果核的檢測(cè),對(duì)以往直徑較大的健康蘋(píng)果被誤認(rèn)為患病,核心發(fā)霉且直徑較小的蘋(píng)果被誤認(rèn)為健康的現(xiàn)狀作出了改進(jìn)。Roberto Ciccoritti 等人[6]將近紅外和化學(xué)計(jì)量學(xué)方法結(jié)合,成功地用于改善獼猴桃在收獲和儲(chǔ)存期間的質(zhì)量控制,減少了水果損失。劉燕德等人[7]應(yīng)用近紅外光譜技術(shù),采集黃龍病、缺損和健康3 類(lèi)葉片樣本的光譜信息并進(jìn)行建模分析,結(jié)果表明,近紅外光譜技術(shù)可以對(duì)柑橘黃龍病進(jìn)行檢測(cè)。
采用可見(jiàn)/ 近紅外光譜技術(shù)對(duì)花椰菜的腐爛進(jìn)行PLS 建模分析,首先對(duì)不同的預(yù)處理方法進(jìn)行對(duì)比,并進(jìn)行特征波長(zhǎng)提取方式的模型比較,在此基礎(chǔ)上,選出最優(yōu)的花椰菜判別模型,以期為在線無(wú)損檢測(cè)花椰菜品質(zhì)的設(shè)備研究提供理論依據(jù)。
花椰菜樣品于2019 年9 月采摘自山西省太谷區(qū),當(dāng)日運(yùn)至試驗(yàn)室。選擇新鮮和表面有黑斑的腐爛花椰菜各170 朵,進(jìn)行光譜數(shù)據(jù)的采集。將采集到的光譜數(shù)據(jù)使用Kennard-Stone 算法按3∶1 的比例劃分為校正集254 朵(新鮮127 朵,腐爛127 朵)和預(yù)測(cè)集86 朵(新鮮43 朵,腐爛43 朵)。
Field Spec 3 型光譜儀, 美國(guó)ASD (Analytical Spectral Device) 公司產(chǎn)品,光譜范圍為350~2 500 nm。使用ASD View Spec Pro V5.0 軟件采集花椰菜同一位置的信息3 次,取平均光譜值;去除兩端光譜噪聲后,選擇500~2 200 nm 的光譜數(shù)據(jù)進(jìn)行后續(xù)判別分析。
1.3.1 原始光譜預(yù)處理
為提高數(shù)據(jù)的使用質(zhì)量、減少不必要的環(huán)境干擾,對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理是十分必要的。試驗(yàn)采用如下方法對(duì)光譜進(jìn)行預(yù)處理:
標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate transformation,SNV)[8]可使得光譜受到樣本表面顆粒和曲面的光程變化的影響最小[9]。S-G 平滑算法(Savitzky-Golay Smoothing)[10]可對(duì)數(shù)據(jù)進(jìn)行多項(xiàng)式最小二乘擬合并且加權(quán)平均,以消除噪聲、減少隨機(jī)誤差對(duì)試驗(yàn)造成的影響?;€校正(Baseline)[11]可用來(lái)修正光譜采集中,因樣本差異和環(huán)境所導(dǎo)致的吸收峰偏移。
1.3.2 光譜特征波長(zhǎng)的提取
若使用全波段建模,不僅耗時(shí),而且預(yù)測(cè)模型包含大量無(wú)用信息。因此,建模之前的特征波長(zhǎng)提取極為關(guān)鍵。試驗(yàn)采用回歸系數(shù)法(Regression coefficient,RC)、連續(xù)投影算法(Successive projections algorithm,SPA)[12]、隨機(jī)蛙跳(Random frog,RF)算法來(lái)對(duì)波長(zhǎng)進(jìn)行優(yōu)選。基于偏最小二乘法(Partial least squares,PLS) 原理,RC 法通過(guò)局部極值的選擇而確定最佳波段[13]。SPA 法可消除特征波長(zhǎng)間的共線性問(wèn)題。RF 法可使用較少的變量迭代建模[14]。
1.3.3 建模分析
PLS 是由H.Wold 在1966 年最先提出的[15-16],其可以應(yīng)用于大小樣本的研究,提取出的數(shù)據(jù)信息與待測(cè)指標(biāo)之間相關(guān)性好。
光譜數(shù)據(jù)的預(yù)處理、PLS 建模等在The Unscrambler X 10.1 中進(jìn)行。SPA,RF 在Matlab R2014b軟件中實(shí)現(xiàn)。通過(guò)校正集均方根誤差(RMSEC) 與決定系數(shù)(R2c) 來(lái)評(píng)價(jià)所建模型的準(zhǔn)確度,當(dāng)決定系數(shù)越接近1,均方根誤差越接近于0 時(shí),所建模型效果最佳[17]。
新鮮和腐爛花椰菜的平均光譜曲線見(jiàn)圖1。
由圖1 可知,500~2 200 nm 波段范圍內(nèi),完好與腐爛花椰菜樣本曲線的整體趨勢(shì)一致,但是腐爛樣本的光譜反射率顯著高于完好樣本的光譜反射率,這可能是由于腐爛花椰菜樣本表面有黑斑,導(dǎo)致反射率升高。
為降低噪聲和環(huán)境因素對(duì)光譜采樣的影響,試驗(yàn)對(duì)原始樣本的數(shù)據(jù)進(jìn)行預(yù)處理分析。
不同預(yù)處理方法的PLS 模型校正效果見(jiàn)表1。
表1 不同預(yù)處理方法的PLS 模型校正效果
通過(guò)觀察表1 可知,經(jīng)過(guò)不同預(yù)處理的建模精度普遍高于原始光譜建模精度。由此可知,3 種不同預(yù)處理方式均可達(dá)到降噪的效果,其中Baseline 后的校正集建模精度最高,其RMSEC 達(dá)0.095 3,R2c 達(dá)0.963 7。
2.3.1 SPA 法特征波長(zhǎng)的提取
SPA 法可提高建模的速度和效率。
基于SPA 算法的最佳變量選擇見(jiàn)圖2。
如圖2 所示,特征波長(zhǎng)數(shù)為10 時(shí),RMSE 為最小,值為0.148 64,所提取的10 個(gè)波長(zhǎng)數(shù)換算為波長(zhǎng)即為752,1 083,2 189,1 494,530,523,519,703,568,513 nm,重要程度依次遞減。
2.3.2 RC 法特征波長(zhǎng)的提取
RC 法是通過(guò)對(duì)經(jīng)基線校正預(yù)處理數(shù)據(jù)所建立的PLS 模型提取回歸系數(shù),選取RC 曲線中的局部極值作為特征波長(zhǎng)值,所提取的19 個(gè)特征波長(zhǎng)如圖3 所示。
基于RC 法特征波長(zhǎng)的提取見(jiàn)圖3。
2.3.3 RF 法特征波長(zhǎng)提取
經(jīng)Baseline 法預(yù)處理后的數(shù)據(jù),采用RF 算法來(lái)提取特征波長(zhǎng)。RF 原理是基于蒙特卡洛算法采樣,隨機(jī)性大,因此需要多次運(yùn)行提高準(zhǔn)確率,結(jié)果如下:
基于RF 法特征波長(zhǎng)的提取見(jiàn)圖4,3 種方法提取的特征波長(zhǎng)見(jiàn)表2。
表2 3 種方法提取的特征波長(zhǎng)
由表2 可知,3 種特征波長(zhǎng)提取方法所提取的特征波長(zhǎng)個(gè)數(shù)依次為SPA (10 個(gè))、RC (16 個(gè))、RF(10 個(gè)),其中1 083 nm 波長(zhǎng)在3 種方法中均被提?。?67,703 nm 波長(zhǎng)被SPA 與RC 提?。?90,1 083,2 115 nm 波長(zhǎng)被RC 與RF 提取。
使用The Unscrambler X 10.1 中的PLS 進(jìn)行建模分析,所建3 種PLS 模型(SPA,RC 和RF) 的系數(shù)和判別結(jié)果如下所示。
不同特征波長(zhǎng)提取的PLS 建模預(yù)測(cè)結(jié)果見(jiàn)表3。
表3 不同特征波長(zhǎng)提取的PLS 建模預(yù)測(cè)結(jié)果
由表3 可知,經(jīng)RC 提取的特征波長(zhǎng)建模效果最優(yōu),對(duì)新鮮和腐爛花椰菜的判別準(zhǔn)確率均為100%。
利用可見(jiàn)/ 近紅外技術(shù)對(duì)新鮮和腐爛花椰菜進(jìn)行檢測(cè)研究,通過(guò)PLS 對(duì)不同的預(yù)處理方法進(jìn)行了數(shù)學(xué)模型分析。結(jié)果表明,Baseline 預(yù)處理效果最好,RMSEC 為0.095 3,R2c 為0.963 7;利用SPA,RC,RF 3 種方法進(jìn)行特征波長(zhǎng)提取,分別建立PLS 模型進(jìn)行判別,結(jié)果表明經(jīng)RC 提取特征波長(zhǎng)建模的效果最好,對(duì)于新鮮和腐爛花椰菜的判別準(zhǔn)確率均為100%,試驗(yàn)可為相關(guān)在線無(wú)損檢測(cè)設(shè)備的研究提供理論基礎(chǔ)。