邢書(shū)海,張淑娟,孫海霞,陳彩虹,李成吉
(山西農(nóng)業(yè)大學(xué)工學(xué)院,山西太谷030801)
近紅外光譜技術(shù)作為一種高效、無(wú)損、易操作、可實(shí)時(shí)在線檢測(cè)的新型檢測(cè)技術(shù),已被廣泛應(yīng)用于果蔬檢測(cè)中,并取得了顯著成果,在水果品質(zhì)檢測(cè)方面應(yīng)用廣泛[1]。SIRISOMBOON等[2]使用近紅外光譜技術(shù)檢測(cè)番茄的力學(xué)性狀,采用多元散射校正(MSC)對(duì)光譜進(jìn)行預(yù)處理,建立的校正模型相關(guān)系數(shù)為0.95,最低標(biāo)準(zhǔn)誤差為0.35,偏差為0.19。KAVDIR等[3]運(yùn)用可見(jiàn)光和近紅外光譜技術(shù)測(cè)量不同品種酸黃瓜的硬度、表皮和果肉的顏色、干物質(zhì)含量,采用偏最小二乘法(PLS)建立校正預(yù)測(cè)模型,結(jié)果得到了酸黃瓜的硬度、表皮顏色、果肉顏色和干物質(zhì)含量最好的PLS校正模型,決定系數(shù)分別為0.70、0.89、0.34、0.65。目前,國(guó)內(nèi)已有學(xué)者利用近紅外光譜技術(shù)對(duì)西瓜、蘋(píng)果、梨、鮮棗等[4-11]進(jìn)行研究,但未見(jiàn)對(duì)西葫蘆的研究。
西葫蘆是人們愛(ài)吃的蔬菜之一,其果實(shí)呈圓筒形,果形較小,果面平滑,以采摘嫩果供菜用。西葫蘆皮薄、肉厚、汁多和富含水分,受到廣大消費(fèi)者的喜愛(ài)。溫室大棚種植西葫蘆已成為一些地區(qū)農(nóng)民增加收入的一項(xiàng)重要來(lái)源。目前,西葫蘆的品質(zhì)檢測(cè)和分級(jí)分選還是依靠人工來(lái)完成。硬度是反映果蔬品質(zhì)的重要指標(biāo)[9,12],也是西葫蘆在收購(gòu)、流通、銷(xiāo)售過(guò)程中需要關(guān)注的重要指標(biāo)。因此,研究針對(duì)西葫蘆的快速、方便、無(wú)損硬度品質(zhì)檢測(cè)技術(shù)是非常必要的。
本試驗(yàn)應(yīng)用可見(jiàn)/近紅外反射光譜技術(shù)快速獲取西葫蘆漫反射近紅外光譜,對(duì)西葫蘆硬度品質(zhì)進(jìn)行檢測(cè),為今后在線快速無(wú)損檢測(cè)果蔬硬度提供理論依據(jù)。
本研究的光譜數(shù)據(jù)采集采用美國(guó)ASD(Analytical Spectral Device)公司生產(chǎn)的ASD FieldSpec3型光譜儀,采樣波段范圍為350~2 500 nm,光譜采樣間隔為1 nm,掃描次數(shù)30次,分辨率3.5 nm,光纖探頭視場(chǎng)角度為30°。采用漫反射方式進(jìn)行西葫蘆樣品光譜信息采集。光源采用與光譜儀配套的14.5 V的鹵素?zé)簟?/p>
所有試驗(yàn)樣品采摘于山西省太谷縣范莊溫室大棚蔬菜生產(chǎn)基地。選取大小均勻、表面無(wú)機(jī)械損傷的西葫蘆樣本200個(gè),在室溫下貯藏。西葫蘆采集光譜數(shù)據(jù)時(shí),隨機(jī)抽取進(jìn)行編號(hào)、標(biāo)記和光譜數(shù)據(jù)采集,在自制的暗室內(nèi)進(jìn)行光譜采集(圖1),運(yùn)用ASDFieldSpec3型光譜儀按編號(hào)順序采集樣品的漫反射光譜數(shù)據(jù),光譜分辨率為3nm(350~1000nm),掃描波長(zhǎng)范圍為 350~2 500、1 000~2 500 nm,采樣間隔設(shè)置為1.4nm(350~1000nm)和2nm(1000~2 500 nm),數(shù)據(jù)間隔為1 nm。樣品的縱軸(果柄-果蒂軸)與操作臺(tái)平行,每個(gè)正常西葫蘆樣品都以縱軸為轉(zhuǎn)軸旋轉(zhuǎn)180°采集2次,每次采集掃描30次,然后取平均值作為該樣品的實(shí)測(cè)光譜信息。采集的原始光譜信息如圖2所示。
西葫蘆硬度測(cè)定采用美國(guó)FTC公司生產(chǎn)的TMS-PRO型食品物性分析儀(質(zhì)構(gòu)分析儀),檢測(cè)精度為0.015%,選用P/2n針狀探頭,選取西葫蘆赤道部位向陽(yáng)面和背陰面分別測(cè)定,進(jìn)行3次穿刺試驗(yàn),保證刺入點(diǎn)位置與光譜采集位置一致,記錄并取平均值作為果實(shí)硬度數(shù)據(jù)。設(shè)置測(cè)前速度5 mm/s,貫入速度 1 mm/s,測(cè)后速度 6 mm/s,最小感知力5 g,穿刺深度4 mm。硬度計(jì)算公式如下。
其中,F(xiàn)為硬度值(N);p為物性分析儀測(cè)量值(g);g為重力加速度,取 9.8 N/kg。
為了消除光譜采集過(guò)程中來(lái)自高頻隨機(jī)噪音、基線漂移、樣本不均勻和光散射等的影響,對(duì)采集的光譜數(shù)據(jù)進(jìn)行預(yù)處理。卷積平滑法[13](S-G)是一種常用的光譜數(shù)據(jù)處理方法,可以消除采集光譜時(shí)產(chǎn)生的隨機(jī)誤差,減少噪聲。多元散射校正[14](MSC)主要用來(lái)消除由于散射與顆粒尺寸以及分布不均勻帶來(lái)等因素的影響,它可以提高對(duì)有用信息的提取,獲得較優(yōu)的光譜。標(biāo)準(zhǔn)正態(tài)變換[15](SNV)主要是對(duì)光譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)正態(tài)化處理,消除采集光譜數(shù)據(jù)的散射光所產(chǎn)生的誤差。采用卷積平滑法進(jìn)行光譜預(yù)處理,此時(shí)能很好濾除各種因素產(chǎn)生的高頻噪音,再進(jìn)行多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)分布(SNV)和卷積平滑法(S-G)以及幾種方法相結(jié)合對(duì)光譜數(shù)據(jù)進(jìn)行處理。之后,再應(yīng)用主成分回歸(PCR)、逐步多元線性回歸(SMLR)和偏最小二乘回歸(PLSR)建模方法分別對(duì)西葫蘆硬度品質(zhì)進(jìn)行建模分析。
通過(guò)建模樣本均方根誤差(RMSEC)與預(yù)測(cè)樣本均方根誤差(RMSEP)來(lái)評(píng)價(jià)所建模型的精確性。當(dāng)校正集和驗(yàn)證集的相關(guān)系數(shù)越接近1和均方根誤差越接近于0時(shí),并且校正集和驗(yàn)證集的均方根誤差越接近,表明所建模型較優(yōu)。
由表1可知,樣品硬度最小值為3.06 N,最大值為4.79 N,平均值為3.89 N。運(yùn)用SPXY法以3∶1的比例劃分校正集和預(yù)測(cè)集,最終選取校正集樣本136個(gè),預(yù)測(cè)集樣本44個(gè)。
表1 樣本硬度測(cè)量結(jié)果
采用不同的方法對(duì)原始光譜進(jìn)行預(yù)處理,應(yīng)用偏最小二乘回歸PLSR的建模算法會(huì)產(chǎn)生不同的效果。通過(guò)運(yùn)用PLSR算法對(duì)經(jīng)過(guò)平滑處理、SNV、MSC預(yù)處理的光譜數(shù)據(jù)進(jìn)行建模分析,以確定最好的建模模型(表2)。
表2 PLSR多種預(yù)處理建模分析結(jié)果
由圖3可知,運(yùn)用原始光譜數(shù)據(jù)經(jīng)平滑處理與標(biāo)準(zhǔn)正態(tài)變換(SNV)處理的光譜數(shù)據(jù)建立的PLSR預(yù)測(cè)模型,校正集相關(guān)系數(shù)為0.979,預(yù)測(cè)集相關(guān)系數(shù)為0.976,較其他模型建模最優(yōu)。使用多元散射校正(MSC)和標(biāo)準(zhǔn)正態(tài)變換(SNV)來(lái)消除西葫蘆果實(shí)表面紋理、大小以及均勻度等因素的影響[16]。2種校正方法進(jìn)行對(duì)比,SNV作為光程校正效果更好,校正的相關(guān)系數(shù)較高。
為了驗(yàn)證不同建模算法優(yōu)劣,運(yùn)用PCR和SMLR分別對(duì) SNV、MSC、S-G+SNV 以及 S-G+MSC預(yù)處理的光譜數(shù)據(jù)進(jìn)行建模分析比較,進(jìn)行最優(yōu)硬度檢測(cè)預(yù)測(cè)模型確定(表3)。
表3 PCR和SMLR對(duì)光譜數(shù)據(jù)建模結(jié)果
通過(guò)對(duì)比分析不同預(yù)處理和不同建模方法在350~2 500 nm全波段光譜數(shù)據(jù)建模,應(yīng)用PLSR對(duì)經(jīng)過(guò)S-G+SNV預(yù)處理的光譜數(shù)據(jù)進(jìn)行建模的效果最好。采用PLSR建模效果最好,原因在于PLSR算法適用于復(fù)雜分析體系的全波段光譜數(shù)據(jù),數(shù)據(jù)矩陣分解與回歸相互結(jié)合,使得特征向量直接與樣品性質(zhì)相關(guān),所建預(yù)測(cè)模型更為穩(wěn)健。為了驗(yàn)證模型的可靠性和準(zhǔn)確性,運(yùn)用模型對(duì)44個(gè)驗(yàn)證樣本進(jìn)行預(yù)測(cè),結(jié)果如圖4所示,預(yù)測(cè)相關(guān)系數(shù)為0.886,預(yù)測(cè)均方根誤差為0.126。
本研究在350~2500nm光譜范圍內(nèi)利用可見(jiàn)/近紅外漫反射光譜技術(shù)對(duì)西葫蘆的硬度指標(biāo)進(jìn)行檢測(cè),建立了基于可見(jiàn)/近紅外漫反射光譜檢測(cè)西葫蘆硬度指標(biāo)的方法和模型。試驗(yàn)共研究了180個(gè)西葫蘆樣品,采用主成分回歸(PCR)、逐步多元線性回歸(SMLR)和偏最小二乘回歸(PLSR)進(jìn)行模型建立,對(duì)比光譜平滑處理、SNV、MSC處理建模結(jié)果的影響,通過(guò)對(duì)比不同處理方法建模后的效果,結(jié)果表明,PLSR進(jìn)行建模的模型最優(yōu)。預(yù)測(cè)模型得到西葫蘆硬度真實(shí)值和預(yù)測(cè)值的相關(guān)系數(shù)達(dá)0.886。本研究表明,可見(jiàn)/近紅外漫反射光譜可作為一種快速無(wú)損的檢測(cè)技術(shù)來(lái)評(píng)價(jià)西葫蘆硬度指標(biāo),并對(duì)西葫蘆在線無(wú)損檢測(cè)的進(jìn)一步研究有借鑒意義。