苗鈞魁,張雅婷,劉小芳,于源,冷凱良,2*,楊增光,蔣永毅
1(中國水產(chǎn)科學研究院黃海水產(chǎn)研究所 農(nóng)業(yè)部海洋漁業(yè)可持續(xù)發(fā)展重點實驗室 青島市極地漁業(yè)資源開發(fā)工程研究中心, 山東 青島,266071)2(青島海洋科學與技術(shù)試點國家實驗室,山東 青島,266200)3(青島菲優(yōu)特檢測有限公司, 山東 青島,266111)
南極磷蝦(Euphausiasuperba)廣泛分布于南極海域,據(jù)研究數(shù)據(jù)統(tǒng)計估計,南極磷蝦的生物量高達3.7億t左右[1],如今該資源在《南極海洋生物資源養(yǎng)護公約》的監(jiān)督下得到可持續(xù)發(fā)展,是世界上最重要的動物蛋白及脂質(zhì)的寶庫之一[2]。南極磷蝦約含有77.9%~83.1%的水分,11.9%~15.4%的蛋白質(zhì),0.4%~3.6%的脂肪和約2%的甲殼質(zhì)[3-4]。南極磷蝦粉是南極磷蝦加工的主要產(chǎn)品之一,蛋白質(zhì)含量一般在490~720 g/kg,脂肪含量在50~200 g/kg,其蛋白質(zhì)和脂肪含量均較高[5-10]。由于南極磷蝦粉的生產(chǎn)是在磷蝦捕撈加工船上進行,受制于船上條件,加工過程中磷蝦粉的品質(zhì)檢測工作難以完成,成為影響我國南極磷蝦粉產(chǎn)品品質(zhì)的因素之一,亟待解決。
近紅外光譜(near infrared spectroscopy, NIR)技術(shù)是一種對有機物成分快速分析的新型分析技術(shù),其工作原理是根據(jù)被測物質(zhì)在不同波長下的吸光度差異來進行物質(zhì)分析。隨著近紅外分析技術(shù)的不斷進步,近紅外光譜分析在石油、化工、農(nóng)林、食品等領(lǐng)域得到了廣泛應(yīng)用[11-12]。與傳統(tǒng)方法相比,該技術(shù)具有以下優(yōu)點:待測樣品無需預(yù)處理、多組分快速同步檢測、對待測樣品不造成傷害、對環(huán)境和人體健康不構(gòu)成威脅[13]。在水產(chǎn)加工領(lǐng)域,應(yīng)用近紅外光譜法檢測食品品質(zhì)已有很多應(yīng)用研究:曹小華等[14]以480個不同類型的魚粉樣品為原料,利用傅里葉近紅外光譜建立了魚粉揮發(fā)性鹽基氮的定量分析模型,模型預(yù)測值與化學值之間的決定系數(shù)達0.94以上;王小燕等[15]采集了不同公司生產(chǎn)的多個批次的魚糜樣品共196個,建立了魚糜樣品中水分和蛋白質(zhì)含量的近紅外光譜校正模型,并采用獨立樣品集進行了預(yù)測;王衛(wèi)軍等[16]以94份具有代表性的長牡蠣鮮樣組織樣品的近紅外數(shù)據(jù)和其對應(yīng)的化學真實值數(shù)據(jù)為基礎(chǔ),研究了近紅外技術(shù)預(yù)測長牡蠣鮮樣組織中水分、糖原等成分含量的可行性。現(xiàn)有的對于磷蝦粉品質(zhì)的研究均采用傳統(tǒng)的化學分析方法,從技術(shù)角度來看,實驗室研究和實際應(yīng)用市場都需要更準確快捷的分析方法[17-18]?;诮t外光譜分析技術(shù),利用采集到的磷蝦粉光譜數(shù)據(jù),建立定性分析模型,有望實現(xiàn)南極磷蝦粉品質(zhì)指標的快速檢測。
由于目前國內(nèi)生產(chǎn)磷蝦粉的企業(yè)少,磷蝦粉樣品收集不易,本研究采集了18個磷蝦粉樣品,首先利用采集到的樣品進行定標模型的建立,并對該模型進行了評價。為提高預(yù)測模型的精確度,進一步按1∶1的質(zhì)量比對磷蝦粉樣品進行了混合,增加了樣品的數(shù)量,共獲得50個磷蝦粉混合樣品,以此提升磷蝦粉品質(zhì)近紅外檢測模型的預(yù)測精度,為實現(xiàn)南極磷蝦粉品質(zhì)指標的近紅外快速檢測提供了參考依據(jù)。
傅里葉變換近紅外光譜儀(美國Antaris Ⅱ公司),配備RESULTM樣品光譜采集的集成軟件以及數(shù)據(jù)處理軟件 TQ analyst(美國Thermo Fisher公司)。
本實驗在2018年10月—2019年11月,分別從遼漁集團有限公司獲得樣品6個,分別編號為遼漁1~遼漁6,從中水集團遠洋股份有限公司獲得磷蝦粉樣品12個,分別編號為中水1~中水12。樣品無異味、霉變、結(jié)塊現(xiàn)象,符合衛(wèi)生標準,樣品于-20 ℃冰箱中密封儲存待用。
系統(tǒng)采用漫反射方式采集光譜圖像。儀器工作參數(shù)設(shè)置如下:正式掃描開始前,使光譜儀開機預(yù)熱30 min;將樣品加入至直徑為5 cm的石英杯中,樣品高度1.5~2 cm,樣品均勻分布在石英杯中。光譜掃描波數(shù)為10 000~4 000 cm-1,掃描次數(shù)為32次,分辨率8 cm-1,掃描溫度為室溫,用吸光度表示吸收光譜。在近紅外光譜掃描過程中,為減少儀器波動對光譜的影響,樣品經(jīng)過3次平行掃描測量。
樣品光譜采集完成后,根據(jù)GB/T 19164—2003對18個初始樣品的水分、蛋白質(zhì)、脂肪含量進行了測定,每個樣品平行測試3次,測量結(jié)果取算數(shù)平均值。
建模前,先采用TQ Analyst軟件對采集的樣品的原始近紅外光譜數(shù)據(jù)進行預(yù)處理。分別采用導數(shù)和平滑結(jié)合的6種光譜前處理方法對采集的光譜進行處理,選取最優(yōu)預(yù)處理方法,再用偏最小二乘法對預(yù)處理后的光譜數(shù)據(jù)進行運算處理,選擇TQ analyst軟件自動推薦的光譜范圍,并對模型進行檢驗,模型的評價參數(shù)包括建模相關(guān)系數(shù)(correlation coefficient in calibration,RC)、交互驗證殘差均方根(root mean square error of cross validation,RMSECV)、交互驗證相關(guān)系數(shù)(correlation coefficient in cross validation,RCV)、交叉驗證用樣品真實值標準差與RMSECV的比值(the ratio of the RMSECV to standard deviation of reference data in the validation,RPDCV)、外部驗證殘差均方根(root mean square error of external prediction,RMSEP)、外部驗證相關(guān)系數(shù)(correlation coefficient in external validation,REV)以及外部驗證用樣品真實值的標準差與RMSEP的比值(the ratio of the RMSEP to standard deviation of reference data in the prediction, RPDEV)[16]。
利用交叉驗證來完成模型的內(nèi)部驗證,校正樣品中的每個樣品依次作為臨時驗證樣品,除被選中的臨時驗證樣品外的其余樣品作為建模樣品,構(gòu)成模型對臨時驗證樣品進行預(yù)測,依次循環(huán)完所有樣品以得到交叉預(yù)測值。
本研究進行了2種磷蝦粉預(yù)測模型的構(gòu)建,一種是利用18個原始樣品直接進行建模,隨機選取15個作為建模集,3個樣品作為驗證集;因脂肪含量是蝦粉品質(zhì)指標的關(guān)鍵因素,因此另一種挑選遼漁和中水樣品組中脂肪含量最高和最低的2組4個樣品(遼漁1、遼漁5、中水3和中水5),分別與同組的其他樣品按1∶1的質(zhì)量比混合均勻,獲得32個混合磷蝦粉樣品,加上18個初始樣品,共獲得50個磷蝦粉樣品,并以此進行第2組近紅外模型的建立,其中隨機抽取40個樣品作為建模集,10個樣品作為驗證集。
在異常樣品存在的情況下進行建模將會對模型的預(yù)測精度造成影響,為確保磷蝦粉樣品數(shù)據(jù)的精度,需對光譜數(shù)據(jù)中的異常樣品進行剔除。常用的異常值剔除方法有:濃度殘差剔除法、馬氏距離法(mahalanobis distance,MD)、蒙特卡洛采樣算法、杠桿值法等。馬氏距離是指數(shù)據(jù)的協(xié)方差距離,它是一種有效地計算2個未知樣品集的相似度的方法。本文利用MD法對光譜數(shù)據(jù)進行異常樣品剔除處理[19]。
在進行粉末樣品NIR漫反射光譜采集時,由于樣品顆粒尺寸、均勻性等的影響,光程無法保持恒定,此時需要使用多元信號修正或標準正則變換(standard normal variate transform, SNV)來對光譜進行處理,以消除這些因素的干擾。本文采用SNV方式。
近紅外光譜測量過程中,經(jīng)常出現(xiàn)光譜偏移或飄移。導數(shù)處理是凈化譜圖較常用的預(yù)處理方法,可根據(jù)需要進行一階或二階微分處理。導數(shù)處理既可以消除基線偏移,還可以起到一定的放大和分離重疊信息的作用;平滑的作用是提高信噪比,減小隨機噪音,從而也可以提高模型的穩(wěn)健性[20-21]。有2種平滑方法可供使用,一種是經(jīng)典的 Savitzky-Golay濾波(SG),它是一種多項式濾波方法,另一種是Norris導數(shù)濾波(Norris derivative filter, NDF),它只能用于一階或二階導數(shù)光譜,是紅外光譜分析中一種很好的濾波方法。
圖1 磷蝦粉樣品的NIR漫反射原始光譜Fig.1 Raw NIR diffuse reflectance spectra of krill meal samples
本文分別采用一階微分(first-order difference,F(xiàn)D)、二階微分(second-order difference,SD)及其與SNV方式和2種平滑方式相結(jié)合的6種方式對磷蝦粉樣品近紅外圖譜進行預(yù)處理,近紅外光譜預(yù)處理結(jié)果如表1~表3所示:
表1 磷蝦粉蛋白近紅外光譜預(yù)處理結(jié)果Table 1 Krill meal protein NIR pretreatment results
表2 磷蝦粉水分近紅外光譜預(yù)處理結(jié)果Table 2 Krill meal moisture NIR pretreatment results
表3 磷蝦粉脂肪近紅外光譜預(yù)處理結(jié)果Table 3 Krill meal fat NIR pretreatment results
磷蝦粉原始樣品的原始光譜的蛋白質(zhì)、水分、脂肪所對應(yīng)的預(yù)處理結(jié)果如表1~表3所示,經(jīng)RC、REV和RCV3個參數(shù)綜合比較,蛋白、脂肪和水分三者的最佳預(yù)處理方式均為SNV+FD+NDF,經(jīng)預(yù)處理后,蛋白模型主成分數(shù)為6,RC為0.989 3,REV為0.917 2,RCV為0.964 8;水分模型主成分數(shù)為3,RC為0.983 1,REV為0.997 1,RCV為0.971 0;脂肪模型主成分數(shù)為10,RC為1.000 0,REV為0.991 0,RCV為0.944 3。
磷蝦粉光譜數(shù)據(jù)預(yù)處理參數(shù)如表4所示,經(jīng)譜圖預(yù)處理后,模型的相關(guān)系數(shù)較未經(jīng)過預(yù)處理得到明顯提升,說明模型的預(yù)測精度也得到顯著提升,預(yù)處理后的光譜圖見圖2。
表4 原始磷蝦粉光譜數(shù)據(jù)預(yù)處理參數(shù)Table 4 Pretreatment parameters of NIR spectral data of krill meal samples composition
圖2 磷蝦粉樣品的預(yù)處理后NIR光譜圖Fig.2 NIR spectra of krill meal samples after pretreatment
2.3.1 原始磷蝦粉樣品指標表述性統(tǒng)計
本實驗中18份樣品的建模集和驗證集的樣品數(shù)見表5,建模集樣品共15個,其中遼漁磷蝦粉樣品5個,中水樣品10個;驗證集樣品共3個,其中遼漁樣品1個,中水樣品2個。表5數(shù)據(jù)顯示各組分間各個成分最大值分別為最小值的:水分(7.64倍)、蛋白質(zhì)(1.13倍)、脂肪(1.98倍),各組分含量差異較大,樣品成分含量范圍足夠廣泛,證明此樣品可以進行近紅外光譜的建模分析。
表5 原始磷蝦粉樣品建模集和驗證集樣品成分含量Table 5 Modeling set and validation set composition content of original krill meal samples
2.3.2 預(yù)測模型建立與優(yōu)化
原始樣品建模結(jié)果如表6及圖3~圖5所示,不同成分樣品無異常值被剔除。模型建立過程中的各個相關(guān)系數(shù),即:RC、RCV和REV值越接近100%,模型的擬合程度越好[22];RMSECV、RMSEP也同樣用來評價模型的優(yōu)劣,RMSECV和RMSEP越小,證明模型的精確度越高,RMSECV和RMSEP越接近,證明模型的穩(wěn)定性越高;同時模型的RPD值是模型評價的另一個重要指標,精準度高的模型具有高RPD值,當RPD值大于2.5時模型可以進行準確預(yù)測。
表6 磷蝦粉原始樣品建模過程中的指標描述Table 6 Index description in the process of modeling the original krill sample
在原始樣品模型中,各組分的三類相關(guān)系數(shù)都在0.9以上,蛋白、脂肪和水分3個含量指標的建模相關(guān)系數(shù)RC均大于0.98,其RMSEC值均小于0.45,交叉驗證相關(guān)系數(shù)RCV均在0.94以上,脂肪RMSECV略高(>1),但RPDCV均大于2.5,說明模型的精確度較好[23]。但在外部驗證中,外部驗證相關(guān)系數(shù)還比較理想,REV值大于0.91,但蛋白和脂肪的RMSEP值較高,RPDEV僅水分為6.46,蛋白質(zhì)和脂肪均小于2.5,不甚理想,這可能主要由于驗證集樣本量較小導致。
圖3 原始樣品模型蛋白含量NIR主要參數(shù)Fig.3 NIR parameters of protein content in the original sample model
圖4 原始樣品模型脂肪含量NIR主要參數(shù)Fig.4 NIR parameters of fat content of the original sample model
圖5 原始樣品模型水分含量NIR主要參數(shù)Fig.5 NIR parameters of moisture content of the original sample model
為提升NIR模型的預(yù)測精度,檢測樣品數(shù)量應(yīng)越多越好。但由于有區(qū)分度的磷蝦粉樣品不易獲得,廠家在生產(chǎn)過程中也未對樣品進行分類,很難短時間內(nèi)獲得足量有區(qū)分度的樣品。由于磷蝦粉本身不是一種單一的分布均勻的原料,理論上通過混合后的樣品依然符合磷蝦粉樣品的特征。如1.5所述,本實驗采用40個原始樣品加混合樣品進行單獨建模,與原始樣品的NIR模型進行比較。光譜預(yù)處理方式采用2.2中最佳預(yù)處理方式:SNV+FD+NDF。
2.4.1 混合磷蝦粉樣品指標表述性統(tǒng)計
表7以及圖6~圖8數(shù)據(jù)表明,經(jīng)SNV+FD+NDF預(yù)處理后,蛋白質(zhì)模型主成分數(shù)為6,光譜范圍為5 731.40~5 580.98 cm-1, 7 875.86~7 613.59 cm-1,8 396.54~8 219.13 cm-1;水分模型主成分數(shù)為4,光譜范圍為5 164.43~4 971.56 cm-1,6 869.20~6 117.10 cm-1;脂肪模型主成分數(shù)為7,光譜范圍為8 307.83~7 926.00 cm-1,8 573.96~8 396.54 cm-1。
表7 混合磷蝦粉光譜數(shù)據(jù)預(yù)處理參數(shù)Table 7 Pretreatment parameters of NIR spectral data of mixed krill meal samples composition
混合樣品的建模集和驗證集的樣品數(shù)見表8,建模集樣品共40個,其中遼漁原始磷蝦粉樣品4個,遼漁混合磷蝦粉樣品8個,中水原始磷蝦粉樣品9個,中水混合磷蝦粉樣品19個,驗證集樣品共10個,其中遼漁原始磷蝦粉樣品2個,遼漁混合磷蝦粉樣品2個,中水原始磷蝦粉樣品3個,中水混合磷蝦粉樣品3個。各組分間各個成分差異情況與原始樣品相同,符合建模要求。
圖6 混合樣品水分、蛋白質(zhì)和脂肪模型主成分因子數(shù)Fig.6 Factors of mixed sample moisture, protein and fat models
圖7 混合樣品模型蛋白質(zhì)含量NIR主要參數(shù)Fig.7 NIR parameters of protein content of the mixed sample model
圖8 混合樣品模型脂肪含量NIR主要參數(shù)Fig.8 NIR parameters of fat content of the mixed sample model
2.4.2 預(yù)測模型建立與優(yōu)化
在原始樣品模型中,各組分的RC、RCV和REV三類相關(guān)系數(shù)除脂肪的REV為0.905 8,其余均在0.94以上,水分、脂肪和蛋白質(zhì)3個含量指標的建模相關(guān)系數(shù)RC均大于0.97,其RMSEC值均小于0.45,交叉驗證相關(guān)系數(shù)RCV均在0.94以上,RMSECV在0.6左右,RPDCV均大于2.5,說明模型的精確度較好。在外部驗證中,水分和蛋白質(zhì)的REV分別為0.977 9和0.984 1,而脂肪的REV為0.905 8,較其他2個成分略差,脂肪的RMSEP也偏高,但RPDEV均大于2.5,說明該模型可以進行準確預(yù)測。
表8 混合磷蝦粉建模集和驗證集樣品成分含量Table 8 Modeling set and validation set composition content of mixed krill meal samples
如圖9、表9所示;磷蝦粉混合樣品構(gòu)建的模型與磷蝦粉原始樣品構(gòu)建的模型相比較,在三類相關(guān)系數(shù)方面并未體現(xiàn)出明顯優(yōu)勢,但在脂肪的RMSECV以及蛋白質(zhì)和脂肪的RMSEP和RPDEV等參數(shù)方面有所提升,說明通過混合樣品數(shù)量的提升可以降低預(yù)測值的偏離程度,提升預(yù)測模型的準確性。
圖9 混合樣品模型水分含量NIR主要參數(shù)Fig.9 NIR parameters of moisture content of the mixed sample model
表9 磷蝦粉混合樣品建模過程中的指標描述Table 9 Description of indicators in the modeling process of mixed krill samples
本文采用最小偏二乘法建立并優(yōu)化了磷蝦粉中水分、脂肪和蛋白質(zhì)的近紅外定標模型,確定了磷蝦粉近紅外圖譜最佳預(yù)處理方式為SNV+FD+NDF,經(jīng)預(yù)處理后,通過交互驗證和外部驗證,各組分的RC、RCV和REV三類相關(guān)系數(shù)除脂肪的REV為0.905 8,其余均在0.94以上,RPD均大于2.5,證明磷蝦粉近紅外定標模型對3個成分均有較好的預(yù)測準確性,可以快速準確的進行磷蝦粉中主要成分的定量。比較以原始磷蝦粉樣品構(gòu)建的近紅外定標模型和以混合磷蝦粉樣品構(gòu)建的近紅外定標模型,在相關(guān)系數(shù)方面并未體現(xiàn)出明顯優(yōu)勢,但在RMSECV、RMSEP和RPDEV等參數(shù)方面有所提升,說明通過混合樣品數(shù)量的增加可以降低預(yù)測值的偏離程度,提升預(yù)測模型的準確性。
本研究為磷蝦粉中水分、脂肪和蛋白質(zhì)含量近紅外模型的構(gòu)建以及快速檢測提供了理論依據(jù)和數(shù)據(jù)支持。為進一步提升磷蝦粉近紅外定標模型的預(yù)測精度,下一步應(yīng)繼續(xù)擴大磷蝦粉樣品的采集范圍,增加代表性原始磷蝦粉樣品的數(shù)量,使其能夠滿足不同來源磷蝦粉樣品的成分預(yù)測。另外,可以通過特征波場選擇算法優(yōu)化定標模型,使其預(yù)測精度進一步提升。