尚 靜,2,孟慶龍,2,張 艷2,*,穆興燕
(1.貴陽學院食品與制藥工程學院,貴州貴陽 550005; 2.貴陽學院農(nóng)產(chǎn)品無損檢測工程研究中心,貴州貴陽 550005)
李子酸甜可口,深受廣大消費者的青睞。通常果實可溶性固形物含量是評價水果成熟度的主要指標之一,檢測李子的可溶性固形物含量不僅有助于指導消費,而且對于指導李子的采收時間、采后儲藏和加工都具有重要的意義。
水果可溶性固形物含量的傳統(tǒng)檢測方法是采用折射儀測量被擠出的果汁的糖度[1],該方法的最大缺點是有損檢測。因此,開發(fā)研制一種快速、無損的李子可溶性固形物含量檢測方法在李子品質(zhì)檢測領域中具有廣泛的應用前景。近年來,基于光譜技術(shù)的檢測以其無損、快速等諸多優(yōu)點深受廣大科研工作者的青睞,被廣泛應用于食品行業(yè)、醫(yī)藥行業(yè)以及化工行業(yè)等各個領域[2-6]。國內(nèi)外研究學者已利用光譜技術(shù)開展了關(guān)于獼猴桃[1,7]、蘋果[8-9]、荔枝[10]、藍莓[11-12]和梨[13]等水果可溶性固形物含量的無損檢測研究,并取得了較好的研究成果。而采用光譜技術(shù)結(jié)合化學計量學對李子可溶性固形物含量的無損檢測研究相對較少,而且前期的研究大多采用全光譜數(shù)據(jù)直接建模,檢測效率較低。
本文采用反射式光譜采集系統(tǒng)獲取采后儲藏期間“紅”李子和“青”李子的平均光譜。然后利用連續(xù)投影算法和競爭性自適應重加權(quán)算法對預處理后的光譜數(shù)據(jù)進行降維,并結(jié)合化學計量學和誤差反向傳播網(wǎng)絡提出了基于光譜技術(shù)的李子可溶性固形物含量的檢測方法,以期為李子可溶性固形物含量的檢測提供一種無損、快速、高效的方法。
新鮮“紅”李子和“青”李子 共2種,購買于當?shù)氐奈譅柆敵?。從買回來的李子中分別挑選大小均勻一致且完好無損的“紅”李子和“青”李子各60個。將選好的李子樣本依次編號后放在室溫(22±2) ℃下儲藏,每隔1 d取樣一次,每次取樣30個,共取樣4次,這樣取樣的目的是使建立的預測模型可以預測范圍相對較大的可溶性固形物含量值,增加其適用性。
反射式光譜采集系統(tǒng) 蔚海光學儀器(上海)有限公司的光纖光譜采集系統(tǒng),該系統(tǒng)包括高性能光譜儀QEPro(檢測器為CCD,波長范圍:198.2~1006.4 nm)、光纖R600-7-VIS-125F(直徑為600 μm)、鹵鎢燈光源HL-2000、反射探頭支架RPH-1(用于固定反射探頭的表面鍍鋁的探頭架,反射探頭與表面呈90°)、RPH-ADP適配器(用于使探頭適合于RPH-1型探頭架,使探頭架可以固定直徑為3.17 mm(1/8英寸)的探頭)、標準反射白板WS-1、計算機等,系統(tǒng)結(jié)構(gòu)如圖1所示;ATAGO PAL-α數(shù)字手持袖珍折射儀 日本Atago公司,測量范圍為Brix 0.0%~85%,測量精度為±0.2%;TD4Z-WS臺式低速離心機 湖南湘立科學儀器有限公司,最高轉(zhuǎn)速為4 000 r/min,轉(zhuǎn)速精度為±30 r/min;JYZ-V911榨汁機 九陽股份有限公司,額定轉(zhuǎn)速為50 r/min。
圖1 反射式光譜采集系統(tǒng)Fig.1 Schematic diagram of spectra acquisition system
1.2.1 李子光譜數(shù)據(jù)采集 將待測李子樣本緊貼在反射探頭支架RPH-1表面上(反射探頭通過RPH-ADP適配器固定在反射探頭支架RPH-1上,距離反射探頭支架表面約1 cm),光譜采集部位為李子赤道位置,5次測量結(jié)果的平均值作為李子樣本的光譜數(shù)據(jù)。反射式光譜采集系統(tǒng)的積分時間是110 ms,掃描平均次數(shù)為8,滑動平均寬度為1,光譜采集范圍為198.2~1006.4 nm,該光譜范圍內(nèi)共1044個波段。
1.2.2 李子可溶性固形物含量的測定 在獲取李子光譜數(shù)據(jù)后立即進行可溶性固形物含量的測定。將李子樣本榨汁后再離心(離心機的轉(zhuǎn)速為3000 r/min,離心時間為5 min),然后將李子汁涂抹在折光棱鏡的鏡面上,連續(xù)按測量鍵按鈕多次,當最后液晶顯示屏3次顯示值一致時記錄該值,每個樣本分別測量多次求平均值,作為該樣本可溶性固形物含量的真實測量值。
1.2.3 樣本集劃分 采用SPXY(sample set partitioning based on joint x-y distances)方法[14-15]按照3∶1的比例將120個李子樣本劃分為校正集和預測集,得到校正集樣本90個和預測集樣本30個。表1給出了校正集和預測集樣本可溶性固形物含量的統(tǒng)計結(jié)果。從表1可以看出,校正集中李子樣本可溶性固形物含量的最小值小于預測集中樣本可溶性固形物含量的最小值,并且校正集中李子樣本可溶性固形物含量的最大值大于預測集中的最大值,從而說明校正集具有較寬的范圍,樣本劃分合理有助于建立良好的預測模型。
表1 李子可溶性固形物含量的統(tǒng)計結(jié)果Table 1 Statistics results of soluble solids content of plums
采用OceanView(Ocean Optics,copyright 2013)軟件、MATLAB R2016b等軟件對光譜數(shù)據(jù)進行處理。通過前期比較多種光譜預處理方法[16](標準正態(tài)變換、二階微分、多元散射校正等)對李子光譜數(shù)據(jù)預處理后的數(shù)據(jù)進行建模,得出標準正態(tài)變換是對李子光譜數(shù)據(jù)預處理的最優(yōu)方法,因此本文采用標準正態(tài)變換對原始光譜數(shù)據(jù)進行預處理。采用連續(xù)投影算法(successive projection algorithm,SPA)和競爭性自適應重加權(quán)算法(competitive adaptive reweighted sampling,CARS)提取特征波長。采用誤差反向傳播(error back propagation,BP)網(wǎng)絡建立李子可溶性固形物含量預測模型,并以校正集樣本的相關(guān)系數(shù)(rc)和均方根誤差(RMSEC)以及預測集樣本的相關(guān)系數(shù)(rp)和均方根誤差(RMSEP)作為評價模型性能的指標。
由于原始光譜的首末兩端含有較多的噪聲信息,因此剔除前5個和后15個波段,選擇中間波段202.25~995.38 nm為有效光譜區(qū)域,該區(qū)域共有1024個波段。圖2分別給出了60個“紅”李子的原始平均光譜曲線和60個“青”李子的原始平均光譜曲線。從圖2可以看出,在202.25~995.38 nm波段內(nèi),“紅”李子和“青”李子的平均光譜曲線的變化趨勢基本一致。在675 nm處具有明顯的吸收峰,主要由李子表面葉綠素的吸收引起的,反映了李子的表面顏色信息,而980 nm處的吸收峰則主要由李子中的水分吸收所引起的,反映了李子的水分含量信息[17]。
圖2 不同品種的李子平均光譜曲線Fig.2 Average spectral curves of the different varieties of plums
2.2.1 采用SPA選取特征波長 采用SPA選取特征波長時,計算不同有效波長下的RMSEP,通常根據(jù)最小的RMSEP值確定最佳的特征波長數(shù)。圖3給出了RMSEP隨SPA中有效波長數(shù)的變化規(guī)律,由圖3可見,RMSEP值隨有效波長數(shù)的增加而減小,當有效波長數(shù)大于31時,RMSEP變化不明顯,變量過多會增加模型的運算量和復雜性,因此選取31個波長作為特征波長,這31個特征波長按重要性從高到低依次為840.70、369.69、245.49、243.86、377.68、221.86、287.66、507.55、649.82、217.78、230.01、214.51、213.69、225.94、243.04、317.52、255.24、268.23、224.31、234.09、205.52、266.60、323.96、290.90、303.82、208.79、203.06、292.51、221.04、260.92和247.11 nm。
圖3 RMSEP隨SPA中有效波長數(shù)的變化規(guī)律Fig.3 Variation regulation of RMSEP with the number of effective wavelengths in SPA
2.2.2 采用CARS選取特征波長 在采用CARS選取特征波長時,設定蒙特卡洛采樣次數(shù)為50次,采用5折交叉驗證法計算所建立的PLS模型中的交叉驗證均方根誤差RMSECV,結(jié)果如圖4所示。從圖4可以看出開始隨著采樣次數(shù)的增加,PLS預測模型的RMSECV值逐漸減小,表明在光譜數(shù)據(jù)中大量無關(guān)或噪聲信息被去除,當采樣次數(shù)達到19時,RMSECV值的增加說明在光譜數(shù)據(jù)中一些與李子可溶性固形物含量預測相關(guān)的重要變量被剔除。即第19次采樣中獲得的波長子集建立的PLS模型RMSECV值最小,本文得到的最優(yōu)波長集包含有104個特征波長,主要分布在203.06~288.47,340.84~420.70,502.83~538.09和916.19~933.28 nm,說明這幾個區(qū)域是對李子可溶性固形物含量敏感的波段。
圖4 不同采樣次數(shù)下RMSECV的變化規(guī)律Fig.4 Variation regulation of RMSECV under the different number of sampling times
分別將全光譜(Full Spectra,FS)數(shù)據(jù)以及經(jīng)SPA和CARS選取的特征波長作為BP網(wǎng)絡模型的輸入變量,由于BP網(wǎng)絡模型隨機選取初始權(quán)值,因此采用50次重復建模結(jié)果的平均值作為最終結(jié)果,見表2。
表2 基于不同波長選取方法的BP模型 對李子可溶性固形物含量的預測結(jié)果Table 2 SSC prediction results of plums by BP model based on different variable selection methods
從表2可以看出,CARS-BP模型具有最高的rc(0.998)和rp(0.887),最小的RMSEC(0.026)和RMSEP(1.767),說明CARS-BP模型具有最好的校正性能和預測性能。FS-BP和SPA-BP模型的校正性能和預測性能均劣于CARS-BP模型,另外,采用CARS特征波長選擇方法從1024個全光譜波段中選擇了104個特征變量作為BP網(wǎng)絡的光譜輸入,明顯提升了BP網(wǎng)絡模型的運行效率。由此表明基于特征光譜建立的BP網(wǎng)絡對李子可溶性固形物含量的無損檢測具有良好的預測能力,可應用于李子可溶性固形物含量的無損檢測。其中,李子可溶性固形物含量的測量值和預測值如圖5所示。
圖5 李子可溶性固形物含量的預測結(jié)果Fig.5 Prediction results of soluble solids content of plums
應用紫外/可見光譜技術(shù)結(jié)合化學計量學方法構(gòu)建了李子可溶性固形物含量的預測模型,采用SNV光譜預處理方法來消除噪聲對光譜信息的影響;對預處理后的光譜數(shù)據(jù)應用SPA和CARS進行降維處理,分別從全光譜的1024個波長中提取了31和104個特征波長;采用BP網(wǎng)絡模型對全光譜以及SPA和CARS算法提取的特征波長分別建模,結(jié)果表明,基于特征波長建立的CARS-BP網(wǎng)絡模型為最優(yōu)模型,其rc為0.998,RMSEC為0.026,rp為0.887,RMSEP為1.767。