孟慶龍,尚靜,黃人帥,陳露濤,張艷
1(貴陽(yáng)學(xué)院 食品與制藥工程學(xué)院,貴州 貴陽(yáng),550005) 2(貴陽(yáng)學(xué)院 農(nóng)產(chǎn)品無損檢測(cè)工程研究中心,貴州 貴陽(yáng),550005)
我國(guó)是水果生產(chǎn)大國(guó),其中蘋果的種植面積以及總產(chǎn)量排名世界第一,但是因我國(guó)蘋果的采后分級(jí)技術(shù)相對(duì)落后,使其品質(zhì)難以把控,不能滿足高端市場(chǎng)的需求。水果果實(shí)的可溶性固形物含量(soluble solids content, SSC)是衡量水果口感和營(yíng)養(yǎng)價(jià)值的關(guān)鍵指標(biāo),也是判斷水果成熟度的主要依據(jù),所以檢測(cè)蘋果的SSC對(duì)于判斷其內(nèi)部品質(zhì)和采收時(shí)間具有非常重要的意義。
近年來,諸多學(xué)者采用折射儀測(cè)量果汁的糖度來獲取水果的SSC[1-2],該方法的最大缺點(diǎn)就是有損檢測(cè),需要破壞被檢測(cè)對(duì)象,而基于高光譜成像技術(shù)的無損檢測(cè)恰好可以彌補(bǔ)不足。高光譜成像技術(shù)集圖像信息和光譜信息于一體,具有分析速度快、無污染、無損傷等優(yōu)勢(shì),深受國(guó)內(nèi)外學(xué)者的青睞,被廣泛應(yīng)用于工業(yè)[3]、食品業(yè)[4-9]、農(nóng)業(yè)[10-11]等領(lǐng)域。近年來,國(guó)內(nèi)外科研工作者已利用高光譜技術(shù)開展了關(guān)于獼猴桃[1,12]、梨[13-15]、荔枝[16]和藍(lán)莓[17-18]等水果SSC的無損檢測(cè)研究,并取得了較好的研究成果。而采用高光譜成像技術(shù)結(jié)合誤差反向傳播(error back propagation, BP)網(wǎng)絡(luò)以及多元線性回歸(multiple linear regression, MLR)對(duì)蘋果SSC的無損檢測(cè)研究相對(duì)較少。
本文采用高光譜圖像采集系統(tǒng)采集采后儲(chǔ)藏期間“富士”蘋果的高光譜圖像,并提取感興趣區(qū)域的反射光譜;應(yīng)用連續(xù)投影算法(successive projection algorithm,SPA)和競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling,CARS)對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行降維,最終基于特征光譜建立了預(yù)測(cè)蘋果SSC的BP網(wǎng)絡(luò)模型以及MLR模型,以期為蘋果SSC的檢測(cè)提供一種快速、無損的方法。
新鮮“富士”蘋果,購(gòu)買于超市,選取表面無損傷的蘋果120個(gè),將其編號(hào)儲(chǔ)藏在室溫(22±2)℃條件下,取樣間隔為1 d,每次取樣30個(gè),共取樣4次,這樣目的是使建立的預(yù)測(cè)模型可以預(yù)測(cè)范圍相對(duì)較大的SSC值,增加其適用性。
高光譜圖像采集系統(tǒng)(GaiaField-F-V10),四川雙利合譜科技有限公司,系統(tǒng)結(jié)構(gòu)如圖1所示。
1-CCD相機(jī);2-成像光譜儀(圖像空間分辨率為696×700); 3-鏡頭;4-溴鎢燈光源;5-電動(dòng)平移臺(tái);6-暗箱;7-高性能計(jì)算機(jī)圖1 高光譜圖像采集系統(tǒng)示意圖Fig.1 Schematic diagram of hyperspectral imaging acquisition system
ATAGO PAL-α數(shù)字手持袖珍折射儀,日本Atago公司;TD4Z-WS臺(tái)式低速離心機(jī),湖南湘立科學(xué)儀器有限公司;JYZ-V911榨汁機(jī),九陽(yáng)股份有限公司。
1.2.1 高光譜圖像采集與校正
將蘋果樣品放在暗箱中的電動(dòng)平移臺(tái)上,調(diào)整采集系統(tǒng)的參數(shù)確保能采集到清晰又不失真的高光譜圖像。相機(jī)的曝光時(shí)間是9.5 ms,蘋果樣本距離鏡頭約40 cm,電動(dòng)平移臺(tái)的移動(dòng)速度是1.35 cm/s。然后,對(duì)待檢測(cè)樣本逐一掃描,采集所有蘋果樣本的高光譜圖像。最后,采集全白和全黑的標(biāo)定圖像對(duì)原始高光譜圖像進(jìn)行校正。
1.2.2 蘋果SSC的測(cè)定
在獲取蘋果高光譜圖像后立即進(jìn)行SSC的測(cè)定。先將蘋果樣本切成小塊后榨汁,于3 000 r/min下離心5 min,然后將蘋果汁涂抹在折光棱鏡的鏡面上,連續(xù)按測(cè)量鍵按鈕多次,當(dāng)最后液晶顯示屏3次顯示值一致時(shí)記錄該值,每個(gè)樣本分別測(cè)量多次的平均值作為其實(shí)測(cè)值。
1.2.3 樣本集劃分
采用基于聯(lián)合X-Y距離的樣本劃分法(sample set partitioning based on joint x-y distances,SPXY)[19]將120個(gè)蘋果樣本劃分為90個(gè)校正集樣本和30個(gè)預(yù)測(cè)集樣本。蘋果SSC的統(tǒng)計(jì)結(jié)果見表1。從表1可知,校正集中蘋果樣本SSC相比預(yù)測(cè)集具有較寬的范圍,有助于后續(xù)建立良好的預(yù)測(cè)模型。
表1 蘋果可溶性固形物含量的統(tǒng)計(jì)結(jié)果Table 1 Statistics results of SSC of apples
1.3.1 光譜預(yù)處理
在建模之前需對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,試驗(yàn)采用二階導(dǎo)數(shù)(second derivative, SD)、標(biāo)準(zhǔn)正態(tài)變換(standard normal variation, SNV)、多元散射校正(multi-scatter calibration, MSC)3種光譜預(yù)處理方法[20]對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,并比較它們對(duì)全光譜模型的影響。光譜數(shù)據(jù)處理在ENVI 5.4和MATLAB R2016b軟件平臺(tái)中完成。
1.3.2 建模方法及模型評(píng)價(jià)
試驗(yàn)采用SPA和CARS對(duì)原始光譜數(shù)據(jù)進(jìn)行降維。采用BP網(wǎng)絡(luò)和MLR建立蘋果SSC的預(yù)測(cè)模型,其中BP網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),其輸入信號(hào)從輸入層經(jīng)隱含層到輸出層,能夠?qū)崿F(xiàn)輸入與輸出之間的高度非線性映射,而MLR是建立自變量X(光譜數(shù)據(jù))和因變量Y(SSC實(shí)測(cè)值)之間的線性回歸方程。以校正集的相關(guān)系數(shù)(rc)及其均方根誤差(root mean square error of calibration set,RMSEC)和預(yù)測(cè)集的相關(guān)系數(shù)(rp)及其均方根誤差(root mean square error of prediction set,RMSEP)作為判別模型性能的指標(biāo)。
蘋果樣本的原始光譜以及經(jīng)過SNV、MSC和SD預(yù)處理后的反射光譜(感興趣區(qū)域?yàn)檎麄€(gè)蘋果樣本)如圖2所示。為了進(jìn)一步分析3種光譜預(yù)處理方法(SNV、MSC和 SD)對(duì)BP網(wǎng)絡(luò)預(yù)測(cè)模型的檢測(cè)效果,分別將原始光譜以及經(jīng)過3種光譜預(yù)處理后的光譜輸入BP網(wǎng)絡(luò)模型中建模,其結(jié)果如表2所示。從表2可知,經(jīng)SD預(yù)處理后建立的BP預(yù)測(cè)模型具有最高的rp(0.87)以及最小的RMSEP(0.52),說明相比于SNV和MSC,SD光譜預(yù)處理方法更好,因此本文采用SD對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。
2.2.1 采用SPA篩選特征光譜
采用SPA篩選特征光譜時(shí),計(jì)算不同有效波長(zhǎng)對(duì)應(yīng)的RMSEP,常常依據(jù)最小的RMSEP值選定最有效的特征光譜。RMSEP隨SPA中有效波長(zhǎng)數(shù)的變化規(guī)律如圖3-a所示,RMSEP值隨有效波長(zhǎng)數(shù)的增加而減小,當(dāng)有效波長(zhǎng)數(shù)超過5時(shí),RMSEP變化不明顯,因此選取5個(gè)波長(zhǎng)作為特征光譜,采用SPA選取的5個(gè)特征光譜分布如圖3-b所示。
a-原始光譜;b-SNV預(yù)處理;c-MSC預(yù)處理;d-SD預(yù)處理圖2 經(jīng)過不同光譜預(yù)處理后得到的反射光譜Fig.2 Reflectance spectra after different spectra preprocessings
表2 基于不同光譜預(yù)處理方法的BP模型對(duì)蘋果 可溶性固形物含量的檢測(cè)結(jié)果Table 2 SSC prediction results of apples by BP model based on different spectra preprocessing methods
a-RMSEP隨SPA中有效波長(zhǎng)數(shù)的變化規(guī)律; b-選取的特征波長(zhǎng)圖3 基于SPA算法從全光譜中提取特征波長(zhǎng)Fig.3 Characteristic wavelengths selection from full spectra by SPA algorithm
2.2.2 采用CARS篩選特征光譜
在采用CARS篩選特征光譜時(shí),將蒙特卡洛采樣次數(shù)設(shè)定為50次,利用5折交叉驗(yàn)證法計(jì)算所建立的PLS模型中的交叉驗(yàn)證均方根誤差(root mean square error of cross-validation,RMSECV),結(jié)果如圖4所示。從圖4-a可知,RMSECV值隨著采樣次數(shù)的增加呈先減小后增加的趨勢(shì),當(dāng)采樣次數(shù)達(dá)到19時(shí),RMSECV值最小,本文得到的最優(yōu)波長(zhǎng)集包含有43個(gè)特征波長(zhǎng),提取的特征光譜分布如圖4-b所示。
a-不同采樣次數(shù)下RMSECV的變化規(guī)律; b-選取的特征波長(zhǎng)圖4 基于CARS算法從全光譜中提取特征波長(zhǎng)Fig.4 Characteristic wavelengths selection from full spectra by CARS algorithm
分別將經(jīng)SPA和CARS篩選的特征光譜輸入BP網(wǎng)絡(luò)模型以及MLR模型中,基于不同波長(zhǎng)選取方法的BP網(wǎng)絡(luò)模型以及MLR模型對(duì)蘋果SSC的檢測(cè)結(jié)果見表3。
表3 基于不同波長(zhǎng)選取方法的BP和MLR模型對(duì)蘋果 可溶性固形物含量的檢測(cè)結(jié)果Table 3 SSC prediction results of apples by BP and MLR model based on different variable selection methods
從表3可知,SPA-BP模型具有最高的rp(0.87)和最小的RMSEP(0.52),說明SPA-BP模型具有最好的預(yù)測(cè)性能。SPA-MLR模型的校正性能和預(yù)測(cè)性能均劣于SPA-BP模型。雖然CARS-MLR模型的校正性能較好(rc=0.95,RMSEC=0.33),但是其預(yù)測(cè)性能劣于SPA-BP模型。另外采用SPA特征波長(zhǎng)選擇方法從256個(gè)全光譜波段中提取了5個(gè)特征變量作為BP網(wǎng)絡(luò)的光譜輸入,明顯提升了BP網(wǎng)絡(luò)模型的運(yùn)行效率。由此表明基于SPA提取的特征光譜建立的BP網(wǎng)絡(luò)模型對(duì)蘋果SSC的無損檢測(cè)具有良好的預(yù)測(cè)能力,可實(shí)現(xiàn)蘋果SSC的快速無損檢測(cè)。蘋果SSC的實(shí)測(cè)值和預(yù)測(cè)值如圖5所示。
圖5 蘋果可溶性固形物含量的預(yù)測(cè)結(jié)果Fig.5 Prediction results of SSC of apples
(1)原始光譜中除了包含自身有用信息外,外界不確定因素(如光的散射以及環(huán)境噪聲等)也會(huì)對(duì)建模效果產(chǎn)生一定影響,因此通過綜合比較3種光譜預(yù)處理方法(SD、SNV和MSC)對(duì)預(yù)測(cè)模型的檢測(cè)效果表明,SD預(yù)處理方法相比于SNV和MSC更好。
(2)為解決高光譜成像技術(shù)在水果品質(zhì)無損檢測(cè)中存在數(shù)據(jù)量冗余的難題,對(duì)預(yù)處理后的光譜數(shù)據(jù)降維,結(jié)果表明,應(yīng)用SPA和CARS分別從256個(gè)全光譜中篩選了5個(gè)和43個(gè)特征波長(zhǎng),明顯提升了預(yù)測(cè)模型的運(yùn)行效率。
(3)為得到蘋果SSC最優(yōu)預(yù)測(cè)模型,采用BP網(wǎng)絡(luò)模型和MLR模型對(duì)SPA和CARS算法提取的特征光譜分別建模,結(jié)果表明:基于特征光譜建立的SPA-BP網(wǎng)絡(luò)模型預(yù)測(cè)性能最優(yōu),其相關(guān)系數(shù)rp為0.87,均方根誤差RMSEP為0.52,可應(yīng)用于蘋果SSC的無損檢測(cè)。