(哈爾濱商業(yè)大學 旅游烹飪學院,哈爾濱 150076)
大麻哈魚為黑龍江省著名的特色水產(chǎn)品,是一種河海洄游性魚類,在海洋里生活三、四年后,為了繁殖后代,每年秋季,它們會成群結(jié)隊千里迢迢從太平洋北部向出生地黑龍江、烏蘇里江和松花江洄游進行產(chǎn)卵、繁殖[1]。大麻哈魚肉嫩味鮮,質(zhì)地細膩,鮮香軟糯,蛋白質(zhì)含量高達14.9%~17.5%,脂肪為8.7%~17.8%,水分為61.4%[2]。然而大麻哈魚的加工利用程度特別是精深加工程度很低,其加工基本上以冷凍加工為主,其他形式的加工產(chǎn)品較少,富有中式特色的產(chǎn)品很少。具有中式特色的大麻哈魚類菜肴通常出現(xiàn)在餐館或食堂,并且對其品質(zhì)的控制手段依然停留在廚師的感官經(jīng)驗,尚未形成標準化的品質(zhì)評價標準和快速檢測手段。因此,中式大麻哈魚類菜肴形成標準、快速的品質(zhì)評價方法已迫在眉睫。
肉品的品質(zhì)特別是其嫩度的大小與其水分含量的高低密切相關。然而由于水分含量的一般檢測方法采用將樣品直接干燥的方式,因而檢測起來耗時、耗力、耗能,因此對于中式烹飪菜肴樣品來說,其測定受場地、儀器、時間、人力等限制,而且測定也對樣品具有不可逆的破壞性,在實際生產(chǎn)中實施起來存在相當大的困難,因此需要建立一種能夠?qū)崿F(xiàn)對中式烹飪菜肴水分含量快速、無損、低耗的檢測方法。
近紅外光譜儀具有檢測快、價格低廉、非破壞性、可在線分析等諸多優(yōu)點,近年來多用于肉類標準化的快速檢測。其方法通常通過掃描未知水分含量的肉樣近紅外光譜圖,再套用具體的科學模型,即可得到水分含量的預測值,測定過程安全、快速、無損、環(huán)保、低耗且預測值準確可靠[3-9],能夠滿足標準、快速地檢測中式大麻哈魚類菜肴水分含量的需要。
目前國內(nèi)外學者利用NIR研究水產(chǎn)品多數(shù)為新鮮魚肉成分的檢測,例如對新鮮魚類的脂肪、水分和蛋白質(zhì)[10,11]和一些特殊成分(如色素、二甲胺、甲醛、膠原蛋白等[12-15])含量的定量測定,此外也有對魚類新鮮度和種類的定性測定[16,17]。再者是對魚糜和魚丸制品的研究,例如新鮮魚糜的水分、蛋白質(zhì)、脂肪含量[18-21]的定量檢測,魚丸類制品的水分、淀粉含量的定量檢測[22]。此外,還有少部分對于新鮮魚類品種的檢測[23]。但是對熟制魚類產(chǎn)品的應用還較少,且魚類種類也較為單一,對于我國特產(chǎn)的大麻哈魚的應用更是少之又少,而尚未見針對熟制大麻哈魚的相應品質(zhì)的測定。因此,本研究應用近紅外光譜分析技術快速、無損、低耗的特點,建立一種對蒸制大麻哈魚水分含量檢測的新型手段,并為中式大麻哈魚類菜肴的形成標準、快速的品質(zhì)評價方法提供一定的理論依據(jù),以期應用在實際生產(chǎn)中。
實驗所用的大麻哈魚肉產(chǎn)于黑龍江省撫遠市,購買于哈爾濱市家樂福超市,采樣部位均為大麻哈魚大腹肉。
ANTARIS Ⅱ近紅外光譜儀 Thermo Fisher科技有限公司;DHG/50Hz鼓風干燥箱 昆山一恒儀器有限公司;JD200-3電子天平 沈陽天平儀器有限公司;GD-ZFG蒸箱 中國格盾有限公司。
1.3.1 大麻哈魚樣品的制備
取出所購買的大麻哈魚魚腹肉,清洗,將其切成2 cm×2 cm,15 g的小方塊,共制成120個樣品。分成6組,每組20個樣品,放入蒸箱蒸制,根據(jù)預實驗結(jié)果,設定蒸制時間為5~10 min,此時大麻哈魚肉中心溫度>74 ℃,可以保證大麻哈魚肉蒸制成熟,冷卻待測。
1.3.2 水分含量傳統(tǒng)測定方法
參照GB 5009.3-2010的直接干燥法[5]。
1.3.3 光譜采集、建模及模型評價
首先采用近紅外光譜分析儀隨機采集120組具有代表性的大麻哈魚肉樣品的NIR光譜;采用1.3.2方法測定大麻哈魚肉樣本中要預測的水分含量;用化學計量學分析軟件對大麻哈魚肉樣本原始光譜進行預處理,剔除異常樣本,并建立大麻哈魚肉樣本內(nèi)部成分近紅外光譜定量模型;用建立好的大麻哈魚肉樣本水分含量定量模型對未知大麻哈魚肉樣品進行預測分析。
光譜采集:將1.3.1制備好的魚肉樣本均勻放置于紅外光譜儀的樣品積分球上,并確保積分球被肉樣完全覆蓋。之后按如下條件采集光譜:波數(shù)范圍4000~9000 cm-1,掃描次數(shù)64次。在大麻哈魚肉5~10 min的蒸制時間范圍內(nèi),每1 min設置20組樣品,共計120組樣品。每組樣品平均3次進行,并進行平均光譜處理。
建模方法:采用TQ Analyst軟件進行光譜分析,建模利用PLS法(Partial Least Squares,偏最小二乘法)進行。
模型評價方法:采用驗證集樣品對最終模型進行外部驗證,并以校正誤差均方根(RMSEC)、預測誤差均方根(RMSEP)、Rc(RMSEC對應的相關系數(shù))、Rv(RMSEP對應的相關系數(shù))值作為模型性能的評價指標。
1.3.4 數(shù)據(jù)分析
由于大麻哈魚肉基質(zhì)及其成分復雜,在其NIR光譜中,多種化學成分或基團吸收峰相互疊加,很難直接建立二者的相互關系,因此需利用傳統(tǒng)的檢測手段測定水分含量,再與其NIR光譜信息進行一一對應,進而得到相應的數(shù)學關系模型。
1.3.4.1 校正集和驗證集的劃分
基于光譜變量的選擇方法,采用Kennard-Stone(KS)法,即根據(jù)約4∶1的比例將樣品劃分為96個校正集和24個驗證集。
1.3.4.2 光譜建模區(qū)間選擇
分別采用全光譜區(qū)間(4000~10000 cm-1)以及TQ軟件所建議優(yōu)化的區(qū)間(6614.64~8735.95 cm-1)建立樣品的PLS模型,按照1.3.3方法對模型進行評價,選出最佳的建模區(qū)間。
1.3.4.3 光譜預處理方法
光譜采集過程中,由于客觀因素產(chǎn)生的系統(tǒng)誤差將影響NIR定量分析模型的信息,例如樣品不均勻或受污染、樣品受到其他組分的干擾、光譜采集不準確、光譜范圍的選擇不正確、光譜噪音大等而產(chǎn)生誤差,因此最終模型確定前,要不斷地進行優(yōu)化處理原始光譜。本研究采用S-G平滑、N-D平滑、MSC、SNV、一至二階導數(shù)及對數(shù)化處理方式,對原始光譜進行全面的預處理,最終建立最佳的PLS模型。
1.3.4.4 光譜異常樣本的剔除方法
采用馬氏距離相似性判別(Discriminant Analysis)判別樣品類別的匹配程度并剔除異常樣本,利用杠桿值與學生殘差t檢驗和內(nèi)部交互驗證均方根法(RMSECV)剔除異常樣本。
蒸制大麻哈魚中的含氫基團會隨著近紅外光線的照射而不斷地隨之振動,進而吸收能量,產(chǎn)生吸收帶。而根據(jù)吸收帶的信息(如吸收帶位置、吸收波長和強度等),可以了解相應分子的結(jié)構(gòu)特點,反映大麻哈魚的化學物質(zhì)信息。蒸制大麻哈魚原始近紅外光譜圖見圖1。
圖1 蒸制大麻哈魚近紅外原始光譜圖Fig.1 Near infrared original spectrogram of steamed Oncorhynchus keta
由圖1可知,在5000,6600,8500 nm波長下,可以明顯觀察到光譜吸收峰;此外,在4500 nm時光譜噪音較大;波長>8000 nm時光譜走向趨向平緩。總體而言,不同樣品間的光譜走勢大致相同,無法直接提取特征信息,因此需對原始光譜進行進一步處理。
以Rc、Rv、RMSEC、RMSEP為指標比較全光譜與TQ軟件建議光譜區(qū)間的建模結(jié)果,選擇建模最適光譜區(qū)間。其中RMSEC值和RMSEP值越小,表明模型誤差越?。籖c和Rv值越大,模型相關性越好。誤差越小,線性越好,則所建模型良好。原始光譜分別在全光譜和軟件建議光譜區(qū)間的建模圖見圖2和圖3,圖中左上角為不同建模區(qū)間Rc、Rv、RMSEC、RMSEP值。
圖2 原始光譜在全光譜區(qū)間PLS建模結(jié)果Fig.2 PLS modeling result of original spectrum in full spectrum range
圖3 原始光譜在建議光譜區(qū)間PLS建模結(jié)果Fig.3 PLS modeling result of original spectrum in suggested spectrum range
由圖2和圖3可知,相比于全光譜區(qū)間,原始光譜在建議光譜區(qū)間建模的Rc、Rv值較大,RMSEC、RMSEP值較小,說明原始光譜建模效果較佳,這可能是因為TQ建議光譜區(qū)間范圍較窄,不如全光譜區(qū)間包含的信息全面,失去部分有效信息。因此,建模區(qū)間選擇4000~10000 cm-1全光譜區(qū)間。
2.3.1 不同預處理方法得到的PLS模型
采用S-G平滑、N-D平滑、MSC、標準正態(tài)變化(SNV)、一至二階導數(shù)及對數(shù)化處理方式,對原始光譜進行全面的預處理,并分別建立相應的PLS模型。不同預處理方法對PLS模型各指標及模型建議主因子數(shù)的影響見表1。
表1 不同預處理方式對蒸制大麻哈魚水分含量模型各參數(shù)的影響Table 1 Effects of different pretreatment methods on parameters of water content model of steamed Oncorhynchus keta
S-G和N-D平滑的主要計算方法是利用S-G或N-D函數(shù)運算,對數(shù)據(jù)進行擬合,對光譜進行多點處理,并采用數(shù)字濾波函數(shù)對擬合函數(shù)進行卷積平滑處理[24]。由表1可知,經(jīng)S-G平滑后,各評價指標均小于原始光譜;經(jīng)N-D平滑后,雖然Rc、RMSEC、RMSEP值會有所優(yōu)化,但Rv卻小于原始光譜,說明平滑處理優(yōu)化模型效果較差,這可能是平滑處理會誤刪部分有效信息導致的。
MSC(多元散射校正)通常是假定樣品收集的散射信號與化學吸收信號進行分離時在整個波長范圍內(nèi)的散射信號的散射系數(shù)是同一個,其優(yōu)點是收集的光譜信息不會被散射影響,可有效提高肉樣組成成分包含的信息[25]。由表1可知,經(jīng)過SNV處理后誤差減小,相關系數(shù)增加。
SNV(標準正態(tài)變化),其與MSC原理相似,但算法略有不同,SNV是以每條譜線在各個波長位置都有一定的數(shù)學分布(如正態(tài)分布)為前提,然后進一步校正譜線,將平均譜線認定為標準的理想譜線,再進行正態(tài)標準化[26]。
由表1可知,經(jīng)過SNV處理后,與原始光譜相比,其RMSECV值大大減小,相關系數(shù)Rc大大增加,但其RMSEP值和Rv值與其他各組相比優(yōu)化程度相對較小,因此還需結(jié)合其他模型處理方式進行進一步探討。
經(jīng)求導變換和對數(shù)化處理后,可消除基線漂移、背景干擾并忽略譜線重疊,使得光譜分辨率和清晰度均有所提高[27]。由表1可知,相比于原始光譜,經(jīng)對數(shù)化處理后,Rc有所提高,其余參數(shù)下降;經(jīng)二階導數(shù)處理,RMSEC值減小,Rc增大,但RMSEP及Rv值則遠不如其,這可能是因為導數(shù)處理后雖分辨率增加但同時增大噪聲,引起擬合過度,致使模型預測誤差增大。
2.3.2 Press值對PLS模型因子個數(shù)選取的影響
Press值能決定模型因子個數(shù)的選取。在進行定量回歸時,PLS模型因子個數(shù)的多少直接影響模型的效果,當因子個數(shù)較小時造成光譜模型誤差較大,模型不適宜應用。當因子個數(shù)過多時,可能增添噪聲,使模型擬合過度,即無法適用于預測檢測樣品,即使模型的參數(shù)可能較好,但在測試其他樣品時誤差較大。所以,恰當?shù)闹饕蜃訑?shù)是良好模型建立的必要條件,在保證模型評價參數(shù)俱佳的前提下,應盡可能地選擇較小的主因子數(shù),進而減小迭代次數(shù),提高分析效率[28]。由表1可知,雖然經(jīng)SNV預處理的光譜Rc值高于其他建模方法,但其Rv值較低且建模主因子數(shù)達到最大值10,因此不建議采用;而相比于原始光譜,一階導數(shù)預處理后更優(yōu),僅多1個主因子數(shù),因而選擇一階導數(shù)預處理方式。
圖4 一階導數(shù)PRESS圖Fig.4 PRESS graph of first derivative
由圖4可知,當主因子數(shù)<7時,隨主因子數(shù)的增加,RMSECV不斷減小;而當主因子數(shù)為7~10時,RMSECV隨主因子數(shù)的變化幅度較小,且此時RMSEC值也幾乎不變(數(shù)據(jù)未顯示),因此模型主因子數(shù)選擇7。
2.4.1 馬氏距離排序剔除
在多元統(tǒng)計的判別分析中,會經(jīng)常采用馬氏距離(Mahalanobis Distance),來判別樣本點的類別歸屬。根據(jù)馬氏距離可通過計算樣本間的協(xié)方差距離進而分析二者間的相似度,即將每個樣本與計算得出的平均光譜之間的距離進行比對,標記異常樣本用于剔除[29]。利用TQ軟件的Specture Outliner功能,對樣本馬氏距離進行排序,見圖5。
圖5 樣本馬氏距離排序圖Fig.5 Sample Mahalanobis distance sorting graph
由圖5可知,最右側(cè)線與平均光譜差異最大、距離最遠,顯示為y值最大,因此將此異常樣本剔除。將異常樣本剔除后,再次進行建模。剔除異常樣本(第33號樣本)后得到的一階導數(shù)PLS模型見圖6。
圖6 馬氏處理后的PLS模型圖Fig.6 PLS model diagram after Markov processing
由圖6可知,剔除異常樣本后模型的RMSEC變小,且相關系數(shù)增加。
2.4.2 杠桿值與學生殘差t檢驗
各樣本可通過杠桿值分析其對模型不同的影響程度,進而鑒別出異常樣本。而根據(jù)杠桿值和校正集的均方根殘差的結(jié)果則可計算得到各樣本的學生殘差值,進而進一步篩選樣本[30]。杠桿值與學生殘差處理的魚肉樣光譜數(shù)據(jù)圖見圖7。
圖7 杠桿值與學生殘差處理魚肉樣光譜數(shù)據(jù)Fig.7 Lever values and student residual processing spectral data of fish samples
由圖7可知,有2個較偏離的點,分別為44和97,所以判定為異常樣本,將此2個異常樣本剔除后,再次建模。杠桿法剔除異常樣本后的模型見圖8。
圖8 杠桿法剔除異常樣本后的PLS模型Fig.8 PLS model after eliminating abnormal samples with leverage method
由圖8可知,剔除異常樣本后模型的RMSEP變小,且相關系數(shù)增加。
將傳統(tǒng)法測得的水分含量(即真實值)與模型預測水分含量(即理論值)比較,可計算模型的誤差率,驗證其準確性。
隨機10個樣本的模型理論值與真實值對照表見表2。
表2 蒸制大麻哈魚近紅外光譜水分含量測定理論值與真實值對照表Table 2 Contrast table between theoretical values and real values of water content determination of steamedOncorhynchus keta by near infrared spectroscopy %
由表2可知,所得模型與直接干燥法測定的水分含量相比,其誤差率為0.1%~0.3%,正確率達97.0%(P<0.05),誤差率較小,準確度較高。綜上所述,模型評價參數(shù)值(見圖8)分別為Rc:0.9682;Rv:0.9850;RMSEC:0.00508;RMSEP:0.00426,模型參數(shù)值較好,能滿足蒸制大麻哈魚水分含量的分析要求。說明所建立的模型較為準確,可應用于蒸制大麻哈魚肉水分含量的無損、快速檢測。
本研究選取蒸制大麻哈魚作為樣本集與校正集,采用近紅外光譜儀在4000~10000 cm-1波長內(nèi)采集魚肉塊樣品近紅外光譜,并利用化學法測定其水分含量,并與光譜對應,建立偏最小二乘模型。經(jīng)全面的光譜預處理、篩選適宜的主因子數(shù)并反復多種方式剔除異常樣本后,得到最優(yōu)模型。結(jié)果顯示所構(gòu)建的檢測蒸制大麻哈魚水分含量模型的校正均方差值為0.00508,相關系數(shù)值為0.9682,預測結(jié)果正確率大于97.0%(P<0.05),能夠?qū)崿F(xiàn)對未知蒸制大麻哈魚水分含量的準確預測,達到快速、無損檢測的目的。