馬帥帥 于慧春 殷 勇 袁云霞 李 欣 薛書凝
(河南科技大學(xué)食品與生物工程學(xué)院,河南 洛陽 471023)
黃瓜本身營(yíng)養(yǎng)豐富,風(fēng)味獨(dú)特,深受人們喜愛,是世界范圍內(nèi)普遍栽培的重要蔬菜作物。但黃瓜采摘后容易失水萎蔫、衰老,新鮮度降低,口感變差,食用價(jià)值降低,影響其市場(chǎng)銷量。而傳統(tǒng)果蔬的品質(zhì)檢測(cè)方法主要有感官評(píng)定、化學(xué)檢測(cè)法等[1],感官評(píng)定主觀性強(qiáng),且無法對(duì)其內(nèi)部進(jìn)行準(zhǔn)確評(píng)定?;瘜W(xué)檢測(cè)法精度高,但耗時(shí)、費(fèi)力、工藝復(fù)雜,測(cè)定結(jié)果受前處理影響較大,無法實(shí)現(xiàn)其快速檢測(cè)。
近年來,高光譜成像技術(shù)因其“圖譜合一”、速度快、樣品無需預(yù)處理等優(yōu)點(diǎn),在果蔬的品質(zhì)檢測(cè)領(lǐng)域中獲得較多的應(yīng)用研究[2]。利用高光譜圖像中的光譜信息,結(jié)合化學(xué)計(jì)量學(xué)方法,可以實(shí)現(xiàn)對(duì)被檢測(cè)樣品每一點(diǎn)口感風(fēng)味等食用品質(zhì)指標(biāo)(如可溶性固形物、水分、酸度及硬度等)以及營(yíng)養(yǎng)品質(zhì)指標(biāo)(如淀粉、色素等)的預(yù)測(cè)和評(píng)估;利用高光譜圖像信息,結(jié)合圖像處理方法,可以實(shí)現(xiàn)對(duì)樣品外部品質(zhì)(如傷痕、形態(tài)等)的檢測(cè)。因此,高光譜技術(shù)可以同時(shí)檢測(cè)樣品的內(nèi)部和外部品質(zhì),在果蔬品質(zhì)檢測(cè)領(lǐng)域呈現(xiàn)出極大發(fā)展?jié)摿Α?/p>
目前高光譜圖像技術(shù)在黃瓜病蟲害[3]、葉片含水量[4]、黃瓜葉片葉綠素含量[5]及過氧化酶活性[6]等方面的檢測(cè)及評(píng)價(jià)都有研究報(bào)道,但在黃瓜新鮮度方面的研究很少,且建立的理化值預(yù)測(cè)模型精度不高,穩(wěn)定性較差[7]。由于高光譜圖像數(shù)據(jù)信息量龐大,且存在大量冗余多重共線性信息,會(huì)嚴(yán)重影響預(yù)測(cè)模型的精度及可靠性,因此應(yīng)用時(shí)需要進(jìn)行特征波長(zhǎng)的選擇。
黃瓜的水分含量與硬度可以反映黃瓜的新鮮狀態(tài)且二者具有顯著相關(guān)性,可以作為關(guān)鍵指標(biāo)對(duì)貯藏期間黃瓜新鮮度進(jìn)行判別評(píng)價(jià)[8]。試驗(yàn)擬采用高光譜成像技術(shù)對(duì)不同貯藏時(shí)間的黃瓜樣品進(jìn)行檢測(cè),在對(duì)原始高光譜數(shù)據(jù)進(jìn)行預(yù)處理以去除噪聲干擾的基礎(chǔ)上,研究硬度和失水率的適宜特征提取方法,并建立判別模型,以期實(shí)現(xiàn)對(duì)貯藏黃瓜新鮮度的快速、準(zhǔn)確評(píng)價(jià)。
質(zhì)構(gòu)儀:SMS TA.XT Express型,英國(guó),Stable Micro Systems公司;
電子天平:DT-500B型,常熟市佳衡天平儀器有限公司;
高光譜圖像采集系統(tǒng)(見圖1):由高光譜成像儀(IST50-3810型,德國(guó)Inno-Spec公司)、500 W的光纖鹵素?zé)?RK90000420108型,德國(guó)Esylux公司)、移動(dòng)裝置和計(jì)算機(jī)組成,實(shí)驗(yàn)室自行搭建。
黃瓜:德瑞特D19,河南省洛陽市大張超市。
1.3.1 貯藏與采樣 將新鮮采摘的黃瓜樣品500 kg,存放于貯藏庫(溫度25 ℃、濕度80%)。對(duì)常溫貯藏的黃瓜每隔1 d取樣一次,即對(duì)黃瓜貯藏第1,3,5,7,9,11天取樣,并分別進(jìn)行硬度、失水率和高光譜檢測(cè)。
1. 樣本 2. 光源 3. 光譜儀 4. 輸送裝置 5. 計(jì)算機(jī)
1.3.2 硬度測(cè)定 采用質(zhì)構(gòu)儀選擇果蔬硬度測(cè)試模型,測(cè)試參數(shù)設(shè)置:探頭直徑5 mm,觸發(fā)力值5.0 g,下行速度1 mm/s,測(cè)中速度0.5 mm/s,上行速度1 mm/s。試驗(yàn)當(dāng)天從貯藏庫不同貨架隨機(jī)選取6根黃瓜,距離黃瓜頭部2 cm處徑向均勻選取3個(gè)測(cè)試點(diǎn),取其平均值作為該天黃瓜樣本的硬度值。
1.3.3 失水率的測(cè)定 黃瓜入庫當(dāng)天從貯藏庫不同貨架隨機(jī)選取6根黃瓜,依次順序編號(hào),樣品重量用電子天平測(cè)量,按式(1)計(jì)算失水率。取6根黃瓜樣品失水率平均值作為該天黃瓜樣本的失水率值。
(1)
式中:
a——失水率,%;
W——每根黃瓜原始重量,g;
w——相應(yīng)黃瓜當(dāng)天的重量,g。
1.3.4 高光譜檢測(cè) 通過預(yù)試驗(yàn)確定高光譜檢測(cè)參數(shù):成像儀物鏡高度350 mm,曝光時(shí)間90 ms,載物平臺(tái)的移動(dòng)速度1.20 mm/s。儀器光譜采集范圍371.05~1 023.82 nm,光譜分辨率2.8 nm,采樣間隔為0.49~0.51 nm,在光譜范圍內(nèi)共采集1 288個(gè)波段。試驗(yàn)當(dāng)天從貯藏庫不同貨架隨機(jī)選取10根黃瓜,從黃瓜頭部2 cm處開始,均勻切片,每片厚度約2 mm,每根黃瓜切5片,共計(jì)50片樣本。黃瓜片逐一平放在洗凈的玻璃平皿中,置于輸送帶上進(jìn)行高光譜數(shù)據(jù)采集。
1.4.1 黑白校正 用ENVI5.1軟件選取黃瓜樣本圖像中感興趣區(qū)域,對(duì)高光譜圖像進(jìn)行黑白板校正。校正方法:在同一采集環(huán)境下,采集標(biāo)準(zhǔn)白色校正板得到的全白標(biāo)定圖像(反射率接近99%),關(guān)閉相機(jī)鏡頭采集全黑標(biāo)定圖像(反射率接近0%),并按式(2)計(jì)算得到校正后圖像[9]。
(2)
式中:
R——校正后高光譜圖像;
I——原始黃瓜高光譜圖像;
B——全黑標(biāo)定圖像;
W——全白標(biāo)定圖像。
1.4.2 原始光譜數(shù)據(jù)的預(yù)處理 為減少環(huán)境噪聲及儀器自身的系統(tǒng)誤差對(duì)光譜信息的干擾,分別采用Savitzky-Golar法(SG)、多元散射校正(MSC)和標(biāo)準(zhǔn)正態(tài)變量變換(SNV) 3種方法對(duì)原始高光譜數(shù)據(jù)進(jìn)行預(yù)處理,并根據(jù)相關(guān)系數(shù)(R2)和均方根誤差(RMSE)進(jìn)行結(jié)果對(duì)比。
1.4.3 特征波長(zhǎng)的選擇 由于原始光譜數(shù)據(jù)存在共線性,為了減少模型運(yùn)算量,提高計(jì)算精度,對(duì)預(yù)處理之后的光譜數(shù)據(jù)采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(CARS)、偏最小二乘(PLS)、連續(xù)投影算法(SPA),分別進(jìn)行特征波長(zhǎng)的提取。
CARS方法是基于蒙特卡羅采樣和偏最小二乘(PLS)模型中回歸系數(shù)的一種特征波長(zhǎng)選擇方法,旨在選擇最具有競(jìng)爭(zhēng)力的波數(shù)組合[10-11]。其通過蒙特卡羅采樣選擇的校正集樣本建立對(duì)應(yīng)的PLS模型,計(jì)算該次采樣中波長(zhǎng)回歸系數(shù)的絕對(duì)值權(quán)重,去掉權(quán)重較小的波長(zhǎng)后,采用自適應(yīng)重加權(quán)采樣的方法選擇波長(zhǎng)來建立PLS模型,選取交互驗(yàn)證均方根誤差(RMSECV)最小的PLS模型對(duì)應(yīng)的波長(zhǎng)為特征波長(zhǎng)[12]。
偏最小二乘回歸系數(shù)法[13],是在PLS建模過程中得到的,是集主成分分析、典型相關(guān)分析于一體的一種特征波長(zhǎng)提取方法。通過偏最小二乘回歸分析,得到權(quán)重回歸系數(shù),并根據(jù)回歸系數(shù)的極值進(jìn)行特征波長(zhǎng)的提取。
連續(xù)投影算法(SPA)[14]可以將波長(zhǎng)變量間的共線性消除,有效避免信息重疊,從而用很少的信息量來代表多數(shù)樣本的光譜信息[15-16],特征波長(zhǎng)最終的選擇結(jié)果為最小交互驗(yàn)證均方根誤差(RMSEV)對(duì)應(yīng)的波長(zhǎng)變量個(gè)數(shù)。
1.4.4 模型的建立 采用BP神經(jīng)網(wǎng)絡(luò)[17](back propagation neural network,BPNN)方法構(gòu)建檢測(cè)模型。BPNN是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小和梯度下降法計(jì)算目標(biāo)函數(shù)最優(yōu)值從而逼近函數(shù)表達(dá)[18],使信號(hào)正向傳播和誤差反向傳播交替循環(huán)進(jìn)行,信號(hào)正向傳播一次計(jì)算相應(yīng)的誤差一次,讓誤差沿著梯度負(fù)方向下降一個(gè)很小的變化量,將得到的誤差變化量反向傳播到BPNN各層,然后對(duì)各層參數(shù)的值進(jìn)行調(diào)整,再進(jìn)行下一次循環(huán)。當(dāng)BPNN的誤差收斂到一個(gè)較為穩(wěn)定的范圍,可認(rèn)為各層參數(shù)的值達(dá)到了理想狀態(tài),模型達(dá)到了最優(yōu)狀態(tài)。
如表1所示,在貯藏期間硬度值隨貯藏時(shí)間增長(zhǎng)總體呈下降趨勢(shì),其中第3~5天硬度值下降趨勢(shì)最明顯。
表1 黃瓜硬度值
如表2所示,貯藏中黃瓜在第1~3天失水速率最高,可能是貯藏室整體環(huán)境溫濕度不穩(wěn)定造成的,環(huán)境穩(wěn)定后隨貯藏時(shí)間增長(zhǎng)黃瓜樣本失水率總體平穩(wěn)增加。
去除876.97~1 023.82 nm明顯存在噪聲的波段,保留371.05~876.47 nm范圍內(nèi)的平均光譜進(jìn)行后續(xù)分析。各不同貯藏日期黃瓜樣本原始光譜曲線如圖2所示。
2.4.1 高光譜圖像預(yù)處理 分別采用SG、SNV、MSC 3種方法對(duì)光譜進(jìn)行預(yù)處理,并基于預(yù)處理后的全光譜數(shù)據(jù)建立硬度和失水率指標(biāo)的BP預(yù)測(cè)模型,結(jié)果如表3所示。
由表3可知,SG法預(yù)處理效果較好,其對(duì)硬度和失水率預(yù)測(cè)的R2分別為0.82,0.84,RMSE分別為0.03,0.39。但是整體R2較低,均在0.8左右,說明基于全波長(zhǎng)信息的預(yù)測(cè)模型效果不理想,大約只有80%的有效信息,在全波長(zhǎng)高光譜信息中存在較多的冗余信息,降低了模型的精度和可靠度,因此需對(duì)全波長(zhǎng)高光譜進(jìn)行特征波長(zhǎng)的選擇。
表2 黃瓜失水率
圖2 黃瓜原始光譜圖
表3 3種預(yù)處理方法的BP分析結(jié)果
圖3為經(jīng)SG卷積平滑法處理后的光譜數(shù)據(jù)。對(duì)比圖2和圖3可以發(fā)現(xiàn),經(jīng)SG法預(yù)處理后,減少了噪聲和暗電流等因素對(duì)光譜數(shù)據(jù)的影響,曲線更平滑,更有利于模型的構(gòu)建。
2.4.2 特征波長(zhǎng)的選擇 圖4為CARS方法特征波長(zhǎng)提取過程。如圖4(a)所示,隨著采樣次數(shù)的增加,優(yōu)化變量數(shù)逐步下降;圖4(b)中RMSECV值表明了基于CARS選擇的特征波長(zhǎng)建立的PLS模型的效果,RMSECV值越小表明模型效果越好,*號(hào)即為RMSECV值最小的位置,對(duì)應(yīng)RMSECV值最小的位置采集次數(shù)為59次,得到黃瓜硬度指標(biāo)的較優(yōu)特征波長(zhǎng)個(gè)數(shù)為25個(gè)。同理,黃瓜失水率的采樣次數(shù)為70次,得到的較優(yōu)特征波長(zhǎng)個(gè)數(shù)為20個(gè),篩選過程如圖4(c)和(d)所示。
圖3 SG處理后黃瓜光譜圖
運(yùn)用PLS方法提取硬度和失水率特征波長(zhǎng)個(gè)數(shù)分別為13,16個(gè),得到黃瓜特征光譜的權(quán)重系數(shù)圖,如圖5所示。從權(quán)重系數(shù)圖看,絕對(duì)值越大的波長(zhǎng)點(diǎn)代表這些波長(zhǎng)對(duì)模型的影響越大,這些波長(zhǎng)都處在波峰或者波谷位置,第1主成分和第2主成分波動(dòng)小,樣本間的差異不明顯;第3主成分波動(dòng)大,樣本間的差異明顯,所以選取第3主成分回歸系數(shù)波峰和波谷所對(duì)應(yīng)的波長(zhǎng)為特征波長(zhǎng)。
SPA提取特征波長(zhǎng)個(gè)數(shù)均為20個(gè),特征波長(zhǎng)提取如圖6所示。
圖4 基于CARS特征波長(zhǎng)提取
圖5 基于PLS特征波長(zhǎng)提取
基于不同方法所篩選出的各個(gè)特征波長(zhǎng)結(jié)果如表4所示。
2.4.3 特征波長(zhǎng)下黃瓜硬度和失水率判別模型分析 分別基于3種方法提取的特征波長(zhǎng)建立BPNN模型。每個(gè)等級(jí)的黃瓜樣品的50條高光譜中35條作為訓(xùn)練集,15條作為預(yù)測(cè)集。
BPNN模型結(jié)果如表5所示。在BPNN模型中,迭代次數(shù)設(shè)置1 000次,學(xué)習(xí)速率為0.001,訓(xùn)練目標(biāo)為0.000 1,隱含層神經(jīng)元函數(shù)選擇tansig函數(shù),輸出層神經(jīng)元函數(shù)選擇purelin函數(shù),網(wǎng)絡(luò)訓(xùn)練函數(shù)選擇trainlm函數(shù)。在BPNN硬度模型中,輸入層神經(jīng)元個(gè)數(shù)為25,13,20個(gè),分別對(duì)應(yīng)CARS、PLS和SPA選取的硬度特征波長(zhǎng)個(gè)數(shù);在BPNN失水率模型中,輸入層神經(jīng)元個(gè)數(shù)分別為20,16,20個(gè),分別對(duì)應(yīng)CARS、PLS和SPA選取的失水率特征波長(zhǎng)個(gè)數(shù)。輸出層神經(jīng)元數(shù)為6,對(duì)應(yīng)樣品種類。隱含層層數(shù)越多,精度越高,但網(wǎng)絡(luò)結(jié)構(gòu)越復(fù)雜,訓(xùn)練時(shí)間越長(zhǎng)[19],最終選擇的隱含層層數(shù)均為1。隱含層神經(jīng)元個(gè)數(shù)的選擇參照式(3),經(jīng)調(diào)試,隱含層神經(jīng)元個(gè)數(shù)為23時(shí),判別效果最佳。
(3)
式中:
圖6 基于SPA特征波長(zhǎng)提取
表4 特征波長(zhǎng)提取結(jié)果
表5 特征波長(zhǎng)下BPNN判別正確率
N——隱含層神經(jīng)元個(gè)數(shù);
n——輸入層神經(jīng)元個(gè)數(shù);
m——輸出層神經(jīng)元個(gè)數(shù);
a——常數(shù)。
由表5可知,3種模型的預(yù)測(cè)效果均明顯改善,SPA提取的特征波長(zhǎng)建立的BPNN判別模型效果較好,硬度訓(xùn)練集和測(cè)試集正確率分別達(dá)到95.24%,91.67%,失水率訓(xùn)練集和測(cè)試集正確率分別達(dá)到97.78%,95.00%。與全波長(zhǎng)光譜信息的預(yù)測(cè)模型相比,預(yù)測(cè)的精度大大提高。由表6可知,SPA選擇的特征波長(zhǎng)建立的判別模型對(duì)硬度和失水率的判別效果均較好,R2和RMSE值均優(yōu)于其他特征波長(zhǎng)選擇方法。
基于SPA方法提取的特征光譜信息,構(gòu)建BPNN硬度和失水率預(yù)測(cè)模型,預(yù)測(cè)結(jié)果如圖7、8所示。
表6 特征波長(zhǎng)下BPNN模型判別分析結(jié)果
圖7 BPNN硬度模型訓(xùn)練和驗(yàn)證結(jié)果
圖8 BPNN失水率模型訓(xùn)練和驗(yàn)證結(jié)果
研究通過對(duì)原始高光譜數(shù)據(jù)的預(yù)處理及特征波長(zhǎng)的提取,建立黃瓜硬度和失水率預(yù)測(cè)模型。采用Savitzky-Golar法、多元散射校正和標(biāo)準(zhǔn)正態(tài)變量變換3種方法對(duì)高光譜原始數(shù)據(jù)進(jìn)行處理,基于全波段信息建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,結(jié)果表明Savitzky-Golar法預(yù)處理更優(yōu);在Savitzky-Golar法預(yù)處理基礎(chǔ)上,采用競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法、偏最小二乘、連續(xù)投影算法3種方法進(jìn)行特征波長(zhǎng)提??;基于特征波長(zhǎng),建立BP神經(jīng)網(wǎng)絡(luò)判別模型。李丹等[20]曾對(duì)黃瓜水分進(jìn)行預(yù)測(cè),通過對(duì)900~1 700 nm波段范圍內(nèi)的特征波長(zhǎng)下建立的偏最小二乘水分預(yù)測(cè)模型,模型的相關(guān)系數(shù)和均方根誤差分別為0.86和0.111。文中基于連續(xù)投影算法提取的特征波長(zhǎng)所建立的預(yù)測(cè)模型,精度明顯高于其他特征波長(zhǎng)選取方法;硬度和失水率訓(xùn)練集準(zhǔn)確率分別為95.24%,97.78%,測(cè)試集準(zhǔn)確率分別為91.67%,95.00%,預(yù)測(cè)結(jié)果相對(duì)于全波長(zhǎng)預(yù)測(cè)精度大大提高。
研究下一步解決的問題是硬度和失水率共同特征波長(zhǎng)的提取并構(gòu)建多理化指標(biāo)預(yù)測(cè)模型,特征波長(zhǎng)提取方法仍然是模型構(gòu)建的關(guān)鍵點(diǎn),是值得不斷深入分析和研究的問題。