樊奈昀,劉貴珊,張晶晶,張 翀,袁瑞瑞,班晶晶
寧夏大學(xué)農(nóng)學(xué)院,寧夏 銀川 750021
高光譜成像技術(shù)可以提供與樣品物理和化學(xué)特性相關(guān)的空間和光譜信息,在食品、農(nóng)業(yè)、化工,制藥等領(lǐng)域中得到了廣泛的應(yīng)用[1-2]。光譜信息與待測成分間模型的建立非常關(guān)鍵,直接影響光譜分析的工作效率和質(zhì)量[3-4]。以往有關(guān)建模條件的研究只考慮某一方面的優(yōu)化,存在方法組合考察不全面的問題。因此,為了提高模型的魯棒性,需要對波段選擇、預(yù)處理和建模方法的組合進行綜合考察。響應(yīng)面設(shè)計可以對建模過程中的影響因子和水平及其交互作用進行優(yōu)化和評價,是一種采用多元二次回歸方程以及多種統(tǒng)計方法分析尋找多因素系統(tǒng)中最佳條件的數(shù)學(xué)統(tǒng)計方法[5]。目前有關(guān)高光譜成像技術(shù)結(jié)合化學(xué)計量學(xué)方法和響應(yīng)面試驗設(shè)計在高光譜檢測中的研究鮮有報道。
綜上,針對建模因素之間存在相互作用的影響情況,以冷鮮灘羊肉的蛋白質(zhì)含量檢測為例,采用響應(yīng)面試驗設(shè)計思路,綜合考察不同特征優(yōu)選、預(yù)處理及多元校正方法對光譜定量分析模型的作用,建立冷鮮灘羊肉蛋白質(zhì)含量的分析優(yōu)化檢測體系,為冷鮮肉從生產(chǎn)到銷售的數(shù)字精細化技術(shù)開發(fā)應(yīng)用提供理論參考。
90只灘羊樣本[4~6月齡,平均胴體重(32.8±4.02) kg],寧夏鹽池大夏牧場食品有限公司。屠宰后,取其背最長肌,置于0~4 ℃的便攜式冰箱運往實驗室。4 ℃條件下排酸處理24 h,排酸完成后取出羊肉,除去其脂肪和肌膜,切成(3.0 cm×2.0 cm×1.0 cm)塊狀樣本。通過Kennard-Stone(KS)方法選取67個樣本作為校正集,其余23個樣本作為驗證集。
可見/近紅外高光譜成像系統(tǒng)(400~1 000 nm,125個波段),主要由五部分組成: V10E-QE型高光譜成像光譜儀(芬蘭Spectral Imaging Ltd公司); C8484-05G型CCD相機(日本Hamamatsu公司); DCR Ⅲ型光纖鹵素?zé)?50 W(美國Schott公司); SC300-1A型電控位移平臺(北京Zolix公司); 計算機(北京 Zolix公司)。
啟動高光譜系統(tǒng)預(yù)熱30 min后,通過黑白校正來減少攝像頭光源不均勻、光敏單元本身響應(yīng)錯亂,暗電流及偏置等因素對圖像的影響[6]。
根據(jù)GB-5009.5—2016《食品中蛋白質(zhì)的測定》中凱氏定氮法測定冷鮮灘羊肉背最長肌中蛋白質(zhì)含量。
為綜合考察不同特征優(yōu)選方法、預(yù)處理方法及多元校正方法對蛋白質(zhì)可見/近紅外光譜模型定量分析的影響,以特征優(yōu)選(A)、預(yù)處理(B)、多元校正(C)為考察因素,目標(biāo)函數(shù)F為響應(yīng)值評價指標(biāo),如式(1)所示。根據(jù)Design-Expert 8.0.6軟件中Box-Behnken法設(shè)計響應(yīng)面試驗方案,確定蛋白質(zhì)含量的最佳光譜檢測體系,試驗因素與水平設(shè)計見表1。
(1)表1 試驗因素與水平表Table 1 Factors and levels code
圖1為原始平均光譜圖,在400~570 nm波段范圍內(nèi),肉樣光譜反射率較低,在610~780 nm波段范圍內(nèi),肉樣在橙紅色區(qū)域反射率較強,波譜吸收取決于物質(zhì)分子基團的電子能級躍遷,不同物質(zhì)具有特定的吸收帶。在可見光區(qū)域,觀察到肉樣在430,540,575,758和971 nm波谷處有主要吸收帶,430 nm處的吸收帶與肉樣中血紅蛋白化學(xué)鍵振動有關(guān),540和575 nm處的吸收帶與脫氧肌紅蛋白和氧合肌紅蛋白有關(guān),758和971 nm處的吸收帶由肉樣水分中O—H基團的三倍和二倍頻特征吸收所引起[7-8]。
圖1 平均原始光譜曲線Fig.1 Original average reflectance spectrum
二維相關(guān)光譜(two-dimensional correlation spectra,2DCOS)將光譜信號擴展到第二維上增強了光譜分辨率,從而使一維光譜中的弱峰和重疊峰更加清晰[9]。采用二維相關(guān)光譜技術(shù),以蛋白質(zhì)含量作為擾動條件,解析光譜細微特征的變化,尋找與微擾相關(guān)的特征信息。
樣品的2DCOS同步譜及對應(yīng)的三維立體圖如圖2所示。二維相關(guān)同步譜圖2(a)中存在自相關(guān)峰和交叉峰兩類,位于對角線上的峰為自相關(guān)峰,由動態(tài)光譜信號自相關(guān)得到,對角線外的交叉峰表示相應(yīng)吸收峰之間的相關(guān)程度。自相關(guān)峰的強度反映了不同波長下光譜信號隨外部擾動的變化程度[10],即對蛋白質(zhì)含量變化的敏感程度。由自相關(guān)譜圖圖2(c)可知,波長473,679,734和814 nm 處存在較強的自相關(guān)峰,說明該變量處光譜信號對外擾較敏感,是本文所要尋找的與蛋白質(zhì)相關(guān)的敏感變量。在主對角線以外,(473,679),(679,734),(734,814)和(473,814) nm 處存在明顯正交叉峰,表明473,679,734和814 nm處吸收峰強度在擾動條件下同時同向變化,來源相同。結(jié)合二維相關(guān)分析,本研究選擇波長473~814 nm范圍作為冷鮮灘羊肉蛋白質(zhì)檢測的研究區(qū)域。
基于所選特征波段,分別采用MSC和SNV預(yù)處理方法來消除樣品表面散射、光程變化,顆粒大小及分布不均勻產(chǎn)生的散射影響[11]。經(jīng)過MSC和SNV預(yù)處理后的光譜曲線如圖3所示,2種預(yù)處理方法均能有效抑制系統(tǒng)高頻噪音的干擾、提取有用信息、消除光散射等噪音信號,提高光譜分辨率和靈敏度。
2.4.1 Box-Behnken試驗設(shè)計及結(jié)果
為實現(xiàn)數(shù)據(jù)快速降維,減少大量光譜數(shù)據(jù)處理負擔(dān),消除特征變量間共線性影響,提高模型運算速度,采用CARS[12]和VCPA[13]算法對2DCOS范圍內(nèi)特征波段進行二次優(yōu)選,分別提取出16和9個特征波長。然后利用表1所列的因素水平,采用Box-Behnken設(shè)計思路,確定蛋白質(zhì)檢測的可見/近紅外光譜預(yù)測模型的最佳組合,目標(biāo)函數(shù)F為響應(yīng)值,F(xiàn)值越大表明模型的性能越好,表2為試驗因素及水平的組合結(jié)果。
圖2 肉樣二維VIS/NIR相關(guān)同步譜(a), 三維立體圖(b),自相關(guān)譜(c)
2.4.2 顯著性檢驗
利用軟件Design Expert 8.0.6對表2的試驗結(jié)果進行多元回歸擬合,得到回歸模型方程為Y=70.69+2.16A+1.31B+0.14C+0.86AB-0.19AC+0.059BC-2.59A2+0.42B2-4.84C2
圖3 473~814 nm范圍內(nèi)原始光譜曲線及預(yù)處理后的光譜曲線Fig.3 Spectra of different pretreaments inthe region of 473~814 nm
表2 Box-Behnken試驗設(shè)計及結(jié)果Table 2 Box-Behnken design and experimental results
表3 多元回歸模型及方差分析Table 3 Multiple regression model andanalysis of variance
2.4.3 響應(yīng)面分析
特征優(yōu)選,預(yù)處理和多元校正方法間交互作用的等高線及響應(yīng)面圖,如圖4所示。響應(yīng)面中水平方向投影的形狀反映了建模條件交互作用是否明顯,等高線為橢圓形表示兩因素交互作用顯著,圓形則表示交互作用不顯著。圖4(a)沿A軸方向的響應(yīng)曲面的坡度比較陡峭,說明特征優(yōu)選方法對蛋白質(zhì)檢測模型性能的影響最大,但其與預(yù)處理方法交互作用不顯著。圖4(b)等高線形狀為橢圓形,反映出特征優(yōu)選方法和多元校正方法兩因素交互作用明顯。如果響應(yīng)面坡度比較平緩,表明建模條件的變化對響應(yīng)值的影響不大; 如果響應(yīng)面坡度非常陡峭,則表明模型性能對于建模條件的改變非常敏感,圖4(c)顯示沿C軸方向的響應(yīng)面坡度比B軸更為平緩,說明預(yù)處理方法的變化對響應(yīng)值的影響比多元校正方法的影響大。該結(jié)論與方差分析結(jié)果一致: 即各因素對蛋白質(zhì)可見/近紅外光譜模型預(yù)測精度的影響順序為特征優(yōu)選方法>預(yù)處理方法>多元校正方法。
結(jié)合表2與圖4的分析結(jié)果,得到最佳建模組合為2DCOS-SNV-LSSVM。模型相關(guān)系數(shù)(Rc/Rp)越接近于1,均方根誤差(RMSEC/RMSEP)越小,則模型效果越好,2DCOS-SNV-LSSVM模型的Rc=0.858 8,RMSEC=0.005 8;Rp=0.860 4,RMSEP=0.005 7,模型具有較高的運行速率和預(yù)測能力。
圖4 建模條件交互作用的響應(yīng)面圖及等高線圖(a): 特征優(yōu)選和預(yù)處理方法對模型性能的交互作用; (b): 特征優(yōu)選和多元校正方法對模型性能的交互作用;(c): 預(yù)處理和多元校正方法對模型性能的交互作用Fig.4 Response surface and contour map of the modeling conditions interaction(a): The interaction of preprocessing and extraction method;(b): The interaction of extraction method and multivariate analysis;(c): The interaction of preprocessing and multivariate analysis
利用可見/近紅外高光譜成像技術(shù)結(jié)合Box-Behnken法設(shè)計響應(yīng)面試驗,建立了冷鮮灘羊肉蛋白質(zhì)含量的高光譜定量分析模型。研究結(jié)果如下:
(1)采用二維相關(guān)光譜技術(shù),以蛋白質(zhì)含量作為擾動條件,解析二維相關(guān)同步譜和自相關(guān)譜,選擇473~814 nm范圍內(nèi)特征波段作為冷鮮灘羊肉蛋白質(zhì)檢測的敏感區(qū)域。
(2)基于響應(yīng)面試驗設(shè)計,各因素對蛋白質(zhì)可見/近紅外光譜模型預(yù)測精度的影響順序為特征優(yōu)選方法>預(yù)處理方法>多元校正方法,優(yōu)選出2DCOS-SNV-LSSVM模型具有較高的運行速率和預(yù)測能力,其Rc=0.858 8,RMSEC=0.005 8;Rp=0.860 4,RMSEP=0.005 7。
(3)響應(yīng)面試驗設(shè)計綜合考察定量檢測模型建模條件的各種組合,為今后針對不同分析對象的光譜分析模型的優(yōu)化及提高預(yù)測結(jié)果的準(zhǔn)確性等方面提供理論參考。