陳李品 于繁千惠 陶 然 陳桂東 李兆杰 薛長(zhǎng)湖
(中國(guó)海洋大學(xué)食品科學(xué)與工程學(xué)院 山東青島266003)
牡蠣是世界上第一大養(yǎng)殖貝類,也是我國(guó)四大養(yǎng)殖貝類之一,資源豐富,是一種營(yíng)養(yǎng)價(jià)值高的天然保健食品,也是一種具有藥用價(jià)值的海洋生物[1]。牡蠣干制品具有風(fēng)味獨(dú)特,耐儲(chǔ)藏,攜帶方便等特點(diǎn),因而受到廣大消費(fèi)者的歡迎。在牡蠣干制品加工過程中,水分含量是一個(gè)重要的品質(zhì)評(píng)價(jià)指標(biāo),與風(fēng)味、質(zhì)構(gòu)及貨架期息息相關(guān)[2]。目前,水分含量檢測(cè)方法主要是干燥稱重法[3]或水分含量測(cè)定儀法,雖然干燥稱重法的操作簡(jiǎn)單,成本低,精度高,但耗時(shí)長(zhǎng),對(duì)樣品有破壞性,不利于牡蠣干制過程中水分含量的在線實(shí)時(shí)檢測(cè)。
高光譜成像技術(shù)(Hyperspectral imaging,HSI)作為一種非傳統(tǒng)、非破壞性的技術(shù),提供了研究對(duì)象的空間信息和光譜信息,達(dá)到“圖譜合一”的效果[4],該技術(shù)既可以檢測(cè)物體的外部品質(zhì),又可以像光譜技術(shù)一樣檢測(cè)物體的內(nèi)部品質(zhì),用于定性、定量分析[5]。近年來,高光譜成像技術(shù)在食品檢測(cè)[6-7]、分類[8-9]等方面的研究日益廣泛,如西班牙的Talens 等[17]利用高光譜成像(900~1 700 nm)測(cè)定西班牙熟火腿的水分,采用偏最小二乘回歸(PLSR)和偏最小二乘法判別進(jìn)行多元分析,對(duì)熟火腿進(jìn)行品質(zhì)分級(jí)。目前,在水產(chǎn)方面,該技術(shù)被應(yīng)用于脫水蝦[10]、干貝[11]、三文魚[12]等的水分含量可視化檢測(cè),以及檢測(cè)肉的新鮮度[13-14]、持水力[15]分析等。目前鮮見采用高光譜成像技術(shù)預(yù)測(cè)牡蠣干制過程中水分含量的相關(guān)研究報(bào)道。
本研究采用高光譜成像技術(shù)檢測(cè)牡蠣干制過程中水分含量的變化,并用化學(xué)計(jì)量學(xué)方法分析數(shù)據(jù),以期建立一種預(yù)測(cè)牡蠣水分含量的實(shí)時(shí)在線檢測(cè)技術(shù),推進(jìn)水產(chǎn)加工實(shí)現(xiàn)數(shù)字精細(xì)化。
新鮮牡蠣,青島水產(chǎn)市場(chǎng)。挑選大小均一的樣品,用保鮮袋包裝并編號(hào),20 個(gè)牡蠣為1 組。瀝干水分后開殼,分別稱重(記為M0);將牡蠣置于37℃干燥箱中冷風(fēng)干燥1 h,取出后置于干燥器中冷卻,20 ℃時(shí)稱重(記為M1),并將樣品橫放于傳輸平臺(tái)上,然后采集每個(gè)樣品的高光譜圖像。循環(huán)烘干-稱重-采集圖像,共得到100 個(gè)高光譜圖像(源于5 個(gè)干燥時(shí)期:1,2,3,4,5 h)。采用交叉驗(yàn)證的方法建立校正集和預(yù)測(cè)集。通過公式(1)計(jì)算水分含量。
高光譜成像采集系統(tǒng)主要構(gòu)成部分:線掃描成像光譜儀image-λ-V10E-LU (Spectral Imaing Ltd.,芬蘭SPECIM)(幀頻:15~60 fps,空間通道數(shù):1 392;光譜通道數(shù):1 040(953),傳輸方式:USB)、面陣CCD 相機(jī)(Hamastsu Ltd.,芬蘭SPECIM)、鏡頭OLE-23(Spectral Imaing Ltd.,芬蘭SPECIM)、電移臺(tái)PSA200-11-X(四川雙利合譜科技有限公司)、光源調(diào)節(jié)器(3900,Schott,芬蘭SPECIM)、對(duì)稱分布的4 個(gè)150 W 鹵素?zé)艟€光源(HSIA-LS-T-200W,加拿大)和計(jì)算機(jī)。全套系統(tǒng)的外部被黑色密閉柜封閉,以避免外界光照對(duì)采集圖像的影響。
為防止基線漂移造成數(shù)據(jù)不準(zhǔn),采集光譜前將儀器預(yù)熱30 min。在采集牡蠣干樣本高光譜圖像前,對(duì)試驗(yàn)參數(shù)進(jìn)行調(diào)整,最終參數(shù)設(shè)置:光譜范圍400~1 100 nm,曝光時(shí)間6.6 s,物距348 mm,其中電控位移平臺(tái)的移動(dòng)速度設(shè)為0.9 cm/s。
為減弱成像光譜儀相機(jī)暗電流和室內(nèi)光照度的影響,需要對(duì)原始高光譜圖像I0進(jìn)行黑白板校正。掃描標(biāo)準(zhǔn)白板得到白色標(biāo)定圖像W(反射率~100%),旋上相機(jī)鏡頭蓋采集到黑色標(biāo)定圖像B(反射率~0%),校正后的高光譜圖像I 通過式(2)校正。
式中,I0——樣品的原始漫反射光譜圖像;W——白板的漫反射圖像;B——暗圖像;I——校正后的漫反射光譜圖像。
校正后得到高光譜圖像。通過ENVI4.7(Research system Inc,Co.,美國(guó))選取整個(gè)牡蠣干的圖像作為感興趣區(qū)域(region of interest,ROI),并計(jì)算光譜的平均反射值,即可得到樣本反射光譜曲線。依次提取所有樣本的平均光譜,得到100×256(樣本數(shù)× 變量數(shù))光譜矩陣。
為消除由散射和光學(xué)干擾引起的樣品間潛在的變異性,如散射、噪聲、漂移等,并提高模型的準(zhǔn)確性和可靠性,需要對(duì)原始光譜數(shù)據(jù)進(jìn)行預(yù)處理。
多元散射校正(MSC)主要是消除顆粒大小和顆粒分布不均勻產(chǎn)生的散射影響。MSC 算法是基于一組樣品的光譜矩陣進(jìn)行運(yùn)算的。首先計(jì)算校正集樣品的平均光譜;然后將理想光譜與原始光譜進(jìn)行線性回歸計(jì)算,可得出多元散射校正后的光譜[16]。
高光譜成像儀得到的光譜信號(hào)還會(huì)疊加隨機(jī)誤差,稱之為噪聲。卷積平滑法(S-G)被較多的應(yīng)用在光譜去噪方面。通過在被平滑點(diǎn)的前、后隨機(jī)選取若干點(diǎn)進(jìn)行“平均”或“擬合”,以得到平滑點(diǎn)的最佳估計(jì)值,從而降低隨機(jī)噪聲。
試驗(yàn)中用來建模的樣本數(shù)高達(dá)上百個(gè),且每個(gè)高光譜數(shù)據(jù)有上百個(gè)波段,這就會(huì)導(dǎo)致整體的數(shù)據(jù)矩陣非常大。因此,為減少原始光譜的數(shù)據(jù)冗余,去除無關(guān)信息,建立一種低維的數(shù)據(jù)模型至關(guān)重要。
相關(guān)系數(shù)是光譜分析中常用的一種選擇特征波長(zhǎng)的方法,通過計(jì)算一組樣本的某一波長(zhǎng)吸光度與待測(cè)濃度之間的相關(guān)性,若相關(guān)性較高,就可以選擇這一波長(zhǎng)作為特征波長(zhǎng)。兩個(gè)變量之間的線性相關(guān)程度可以用相關(guān)系數(shù)R 或者決定系數(shù)R2來描述[17-18]。因此,本研究計(jì)劃采用相關(guān)系數(shù)法提取出對(duì)水分敏感的特征波長(zhǎng)。
光譜的定量建模分析即為定量校正,也稱多元校正,其原理是在物質(zhì)濃度(即理化值)與儀器的響應(yīng)值(即光譜) 之間建立一種定量的關(guān)聯(lián)關(guān)系。
多元線性回歸[19](Multiple linear regression,MLR)是早期光譜定量分析中常用的方法。多元線性回歸模型也可以稱為復(fù)線性回歸分析,它研究的是一組自變量如何直接影響一個(gè)因變量[20]。利用誤差最小的原理,求解一個(gè)或多個(gè)特征波長(zhǎng)下的反射值與所研究的樣品品質(zhì)指標(biāo)之間的關(guān)系。
BP 神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層構(gòu)成,結(jié)合牡蠣干水分含量實(shí)測(cè)值與特征波段下感興趣區(qū)域光譜平均反射值的回歸分析。
采用相關(guān)系數(shù)R 和均方根誤差RMSE 對(duì)模型的預(yù)測(cè)能力進(jìn)行驗(yàn)證和精度評(píng)價(jià)。R 值越接近1,說明所建模型精度越高,RMSE 值越接近零,且RMSEC 和RMSEP 差異越小,所建模型越穩(wěn)健。模型建立及評(píng)價(jià)都基于MATLAB(The Math Works,Natick,USA) 軟件。
從表1可見,由于牡蠣干制加工時(shí)間跨度較大,使得樣品的水分含量相差較大,導(dǎo)致標(biāo)準(zhǔn)偏差大,說明樣本具有較好的代表性,模型的廣泛性也較好。
由圖1可見,不同干制加工時(shí)間牡蠣干的平均光譜反射率曲線的趨勢(shì)相似,隨著水分含量的減少,光譜反射率呈下降趨勢(shì)。牡蠣干光譜平均反射率曲線在波長(zhǎng)970 nm 附近有一個(gè)波谷,可能是由于水分子中O-H 三級(jí)倍頻吸收帶造成的[21]。水是牡蠣的主要成分,因此水分含量的減少可以被認(rèn)為與光譜曲線變化的相關(guān)性較大。光譜反射率曲線可以定性解釋牡蠣干的光譜特征,而需要進(jìn)一步采用化學(xué)計(jì)量學(xué)的方法建立模型對(duì)牡蠣干水分含量進(jìn)行定量預(yù)測(cè)。
圖1 不同干制加工時(shí)間牡蠣干的光譜平均反射率曲線Fig.1 The spectral average reflectance curves of oysters at different drying times
表1 牡蠣干的水分含量Table 1 Summary of moisture content in samples
未經(jīng)預(yù)處理的平均反射率光譜圖和經(jīng)過不同預(yù)處理后的光譜曲線如圖2所示。經(jīng)過平滑、多元散射校正、平滑與多元散射校正結(jié)合預(yù)處理后的光譜曲線雖基本保留了原始光譜的吸收特性,但有不同程度的強(qiáng)化。
本試驗(yàn)共有256 個(gè)波段,若直接用來建模,必然會(huì)因?yàn)檩斎霐?shù)據(jù)量過大,而影響模型運(yùn)行的速度和精度。因此,在建模之前將水分含量實(shí)測(cè)值與全波段下感興趣區(qū)域光譜平均反射值進(jìn)行相關(guān)系數(shù)分析,以選取特征波長(zhǎng)。從圖3可以看出,相關(guān)系數(shù)范圍在-0.8~0.8 之間,說明水分含量和光譜平均反射值之間相關(guān)性較好[22]。選擇8 個(gè)相關(guān)系數(shù)的極大值或極小值作為特征波長(zhǎng),分別為429,491,530,555,600,817,917,970 nm。
圖2 原始數(shù)據(jù)與經(jīng)過預(yù)處理后的光譜圖Fig.2 Raw data and spectra after pretreatment
圖3 基于相關(guān)系數(shù)的特征波長(zhǎng)的選擇Fig.3 Selection of characteristic wavelength based on correlation coefficient
2.4.1 MLR 模型 基于所選擇的特征波長(zhǎng)分別對(duì)未經(jīng)過預(yù)處理、多元散射校正、卷積平滑校正、多元散射校正結(jié)合卷積平滑校正后的數(shù)據(jù)建立MLR 模型,分別為Y0、YMSC、YS-G、YMSC+S-G,如式(3)、(4)、(5)、(6)所示。其預(yù)測(cè)結(jié)果見表2。從表2中可以看出,4 種模型都取得了相對(duì)較好的效果,說明所提取的特征波長(zhǎng)基本涵蓋了牡蠣干水分的特征信息。特征波長(zhǎng)模型均取得了良好的結(jié)果,4 個(gè)MLR 模型的Rp、Rc 和Rcv 都較高,Rp 分別為0.8916,0.8775,0.9007,0.8885,Rc 分別為0.8538,0.8946,0.8284,0.8831,Rcv 分別為0.8774,0.8858,0.8800,0.8846,且RMSEC、RMSEP 和RMSECV 都較低。從預(yù)測(cè)結(jié)果分析,R 值和RMSE 值增降幅度并不大,因此認(rèn)為4 個(gè)MLR 模型的預(yù)測(cè)效果相當(dāng),都可預(yù)測(cè)牡蠣干的水分含量。
表2 高光譜成像技術(shù)預(yù)測(cè)牡蠣水分含量模型的性能Table 2 Performances of models for prediction of moisture content of oysters by hyperspectral imaging technique
YMSC+S-G=454.9940-1.3695X429+3.6667X491+2.4201X530-8.3629X555-4.3013X600+0.4326X817+0.1130X917-6.0722X970
由圖4可見,樣本均以比較近的距離均勻分布于回歸直線周圍,說明該模型比較準(zhǔn)確地預(yù)測(cè)了牡蠣干的水分含量。
圖4 MLR 模型的預(yù)測(cè)值和實(shí)際值的散點(diǎn)分布圖Fig.4 Scatter plot of predicted and actual values for the sample
2.4.2 BP 神經(jīng)網(wǎng)絡(luò)模型 基于所選擇的特征波長(zhǎng)分別對(duì)未經(jīng)過預(yù)處理、多元散射校正、卷積平滑校正、多元散射校正結(jié)合卷積平滑校正后的數(shù)據(jù)建立BP 神經(jīng)網(wǎng)絡(luò)模型,其預(yù)測(cè)結(jié)果見表3。
表3 高光譜成像技術(shù)預(yù)測(cè)牡蠣干水分含量模型的性能Table 3 Performances of models for prediction of moisture content of oysters by hyperspectral imaging technique
由表3可見,4 種模型都取得了相對(duì)較好的效果。說明所提取的特征波長(zhǎng)基本涵蓋了牡蠣水分的特征信息。4 個(gè)模型的Rp、Rc 和Rcv 都較高,Rp 分別為0.9996,0.9995,0.9995,0.9995,Rc 分別為0.9995,0.9807,0.9802,0.9817,Rcv 分別為0.9994,0.9918,0.9921,0.9904,且RMSEC、RMSEP和RMSECV 都較低。分析以上4 種模型,R 值和RMSE 值增降幅度并不大,認(rèn)為BP 神經(jīng)網(wǎng)絡(luò)4 個(gè)模型的預(yù)測(cè)效果相當(dāng),都能達(dá)到很好的預(yù)測(cè)效果。
圖5 BP 神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)值和實(shí)際值的散點(diǎn)分布圖Fig.5 Scatter plots of predicted and actual values for the BP neural network model
從圖5可以看出,樣本均以較近的距離均勻分布于回歸直線周圍,說明相關(guān)系數(shù)法提取的特征波長(zhǎng)基本涵蓋了牡蠣干水分的特征信息,可以使用該模型對(duì)牡蠣干水分含量進(jìn)行預(yù)測(cè)。
從表2,3,圖4,5 可以看出,兩種模型都取得了較好的預(yù)測(cè)效果。而MLR 模型的校正集、預(yù)測(cè)集和交叉驗(yàn)證集相關(guān)系數(shù)較BP 神經(jīng)網(wǎng)絡(luò)低,BP神經(jīng)網(wǎng)絡(luò)效果較好。然而,從RMSEC、RMSEP 和RMSECV 分析,MLR 效果較BP 神經(jīng)網(wǎng)絡(luò)好。結(jié)果表明,兩種模型都顯示高光譜成像技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法可用于檢測(cè)牡蠣干制加工過程中水分含量。
本研究驗(yàn)證了采用高光譜成像技術(shù)結(jié)合化學(xué)計(jì)量學(xué)的方法對(duì)牡蠣干水分含量預(yù)測(cè)的可行性。采用相關(guān)系數(shù)法提取特征波長(zhǎng),并對(duì)光譜數(shù)據(jù)進(jìn)行多元散射校正、卷積平滑校正后分別建立MLR模型和BP 神經(jīng)網(wǎng)絡(luò)模型,對(duì)預(yù)測(cè)集樣本的水分含量進(jìn)行預(yù)測(cè)。結(jié)果表明,MLR 模型和BP 神經(jīng)網(wǎng)絡(luò)模型均取得了較好的結(jié)果。本研究為牡蠣干制加工過程中水分含量在線實(shí)時(shí)無損檢測(cè)提供了參考。