李夢瑤,翟晨,王書雅,謝云峰,劉云國
(1.中糧營養(yǎng)健康研究院,營養(yǎng)健康與食品安全北京市重點實驗室,北京 102209;2.新疆大學(xué) 生命科學(xué)與技術(shù)學(xué)院,烏魯木齊 830002;3.國貿(mào)食品科技(北京)有限公司,北京 102209)
淀粉(starch)是農(nóng)副產(chǎn)品的主要組成部分,被廣泛應(yīng)用于食品加工業(yè)和化學(xué)工業(yè)中。近幾年,淀粉的生產(chǎn)和加工貿(mào)易取得了較大的發(fā)展[1-3]。目前,在牛肉醬、甜面醬等調(diào)味品加工方面,淀粉具有增加穩(wěn)定性、改善口感和感官性狀的功能;在食物烹調(diào)中,淀粉作為調(diào)味品具有勾芡等作用[4-7]。不同種類的淀粉,其結(jié)構(gòu)及理化性質(zhì)不同,功能和使用效果差別較大。由于原料及制備工藝不同,淀粉成本具有一定的差異,部分生產(chǎn)者通過添加低成本淀粉來賺取更高的利潤。因此亟需研究一種簡單、快速、無損的淀粉種類鑒別及定量分析技術(shù)。
目前,淀粉種類鑒別多采用傳統(tǒng)感官評定方法和常規(guī)理化分析方法,這些方法受主觀因素影響較大,準確度難以保證,并且費時費力,破壞樣品,無法滿足淀粉種類的快速準確定性及定量分析需求[8-10]。隨著光譜技術(shù)和化學(xué)計量學(xué)的發(fā)展,近紅外光譜(near infrared spectroscopy,NIRS)技術(shù),作為一種快速、無損、綠色的檢測技術(shù),在農(nóng)業(yè)、食品質(zhì)量等方面得到了越來越多的重視和應(yīng)用[11-14]。近年來,近紅外光譜技術(shù)多用于食品中淀粉含量的分析,對于淀粉品種的鑒別及混合淀粉中成分的定量分析研究較少[15-17]。
本研究通過對市售的73份4個不同種類(馬鈴薯、玉米、小麥、綠豆)的淀粉樣品進行光譜采集,通過主成分分析(principal components analysis,PCA),對不同種類淀粉建立了定性分析模型。對不同比例的馬鈴薯-小麥淀粉混合物進行光譜采集,優(yōu)化光譜預(yù)處理方法,基于偏最小二乘法(partial least squares, PLS)建立小麥淀粉添加比例的預(yù)測模型。通過分析,該研究提出的快速、準確、無損定性定量預(yù)測方法可用于淀粉的種類鑒別及成分分析。
市售馬鈴薯淀粉、玉米淀粉、小麥淀粉和綠豆淀粉等樣品共73份:均購自當?shù)爻?;小麥淀粉純品、馬鈴薯淀粉純品:購自Sigma公司。淀粉的近紅外光譜在德國Bruker公司的MPA型多功能近紅外光譜儀上測定。本文所涉及的化學(xué)計量學(xué)方法均采用MATLAB和OPUS軟件完成。
1.2.1 淀粉近紅外光譜信息采集
將淀粉填裝至采樣杯,振蕩使樣品均勻后采用積分球漫反射方式進行掃描,采集淀粉的近紅外光譜。為保證試驗的準確性,對淀粉樣品進行 2 次平行采樣,并對平均光譜進行分析。光譜掃描范圍為4000~12000 cm-1,分辨率為16 cm-1,掃描次數(shù)為64次。
1.2.2 定性模型的建立與評價
對市售的17份馬鈴薯淀粉、12份綠豆淀粉、24份小麥淀粉和20份玉米淀粉進行近紅外光譜采集。通過矢量歸一化(vector normalization,SNV)、一階導(dǎo)數(shù)(first derivative,FD)、二階導(dǎo)數(shù)(second derivative,SD)、FD+SNV、SD+SNV等方法對原始光譜進行預(yù)處理,并對預(yù)處理的方法進行優(yōu)化。在最佳預(yù)處理方法的基礎(chǔ)上,利用主成分分析(PCA)得到樣品的PCA得分,該計算過程通過MATLAB軟件實現(xiàn)。
PCA是多元統(tǒng)計分析中用來分析數(shù)據(jù)的一種方法,它是用一種較少數(shù)量的特征對樣本進行描述以達到降低特征空間維數(shù)的方法,通過找到幾個彼此互不相關(guān),且能夠表征原來所有變量所具有信息的綜合變量來代替原始變量,簡而言之,這種用幾個互不相關(guān)的代表性變量來代表原來很多變量的統(tǒng)計學(xué)分析方法就成為主成分分析[18]。
1.2.3 定量模型的建立與評價
將購自Sigma公司的小麥淀粉和馬鈴薯淀粉純品制備成30組不同比例的混合物,按照Duplex法[19]以2∶1分為 2 組,其中校正集20個,預(yù)測集10個,樣本中小麥淀粉添加比例的統(tǒng)計結(jié)果見表1,校正集的小麥淀粉添加比例分布在7.29%~90.69%之間,預(yù)測集的小麥淀粉添加比例分布在18.04%~89.69%之間。數(shù)據(jù)劃分均勻,校正集的小麥淀粉添加比例范圍大于預(yù)測集,有利于構(gòu)建穩(wěn)健的預(yù)測模型。
表1 馬鈴薯-小麥淀粉樣本劃分Table 1 Division of potato-wheat starch sample
采用OPUS分析軟件對樣品的光譜圖進行多元散射校正(multiple scattering correction,MSC)、SNV、FD、SD、FD+SNV、SD+MSC等多種方式的預(yù)處理。在最佳預(yù)處理方法的基礎(chǔ)上,利用偏最小二乘法(PLS)建立不同比例的小麥淀粉-馬鈴薯淀粉和光譜數(shù)據(jù)之間的相關(guān)性模型,并選擇校正均方根誤差(root mean square error of calibration,RMSEC)、預(yù)測均方根誤差(root mean square error of prediction,RMSEP)、校正決定系數(shù)(RC2)、預(yù)測決定系數(shù)(RP2)和預(yù)測集相對分析誤差(RPD)作為模型的評價指標[20,21]。
綠豆淀粉、馬鈴薯淀粉、小麥淀粉和玉米淀粉的近紅外光譜見圖1a。
圖1 不同品種淀粉的原始光譜圖(a)和PCA散點圖(b)Fig.1 Original spectrogram(a) and PCA scatter plot(b) of different starches
由圖1a可知,不同種類的淀粉在12000~4000 cm-1范圍內(nèi),峰形、峰位以及吸光度的差別較小,無法直接鑒別。首先對光譜進行預(yù)處理,然后進行主成分分析,通過OPUS分析軟件得到的最佳預(yù)處理方法為SD+SNV,得到前兩個主成分的累積貢獻率為93.0%,基本包含了大多數(shù)的變量信息,選擇第一主成分和第二主成分的得分作圖(見圖1b),進而對樣品光譜進行分類。
由不同種類的淀粉樣品的主成分分布圖(見圖1b)中可知,綠豆淀粉和馬鈴薯淀粉可以被完全區(qū)分開,且綠豆淀粉聚合度較好,但馬鈴薯淀粉的樣品空間分布相對比較分散,可能是市售的馬鈴薯淀粉的原料品質(zhì)及淀粉純度差異較大的原因。玉米淀粉和小麥淀粉樣品交叉重疊,區(qū)分不明顯,可能與兩種淀粉的理化性質(zhì)相近有關(guān),例如:小麥淀粉脂肪含量范圍為0.07%~0.15%,玉米淀粉脂肪含量范圍為0.1%~0.2%;小麥淀粉蛋白質(zhì)含量范圍為0.3%~0.5%,玉米淀粉蛋白質(zhì)含量在0.35%~0.45%,脂肪和蛋白質(zhì)含量范圍交叉重疊[22,23]。近紅外光譜信息反映了蛋白質(zhì)和脂肪中由C、H、O、N等組成的特殊價鍵信息。因此導(dǎo)致兩種淀粉光譜信息也存在交叉重疊現(xiàn)象,后期將進一步優(yōu)化算法以進行玉米淀粉和小麥淀粉之間的區(qū)分。
圖2 馬鈴薯-小麥淀粉的原始光譜圖(a)和馬鈴薯- 小麥淀粉的FD+SNV光譜圖(b)Fig.2 The original spectrogram of potato-wheat starch(a) and FD+SNV spectrogram of potato-wheat starch(b)
不同比例的小麥淀粉和馬鈴薯淀粉的近紅外原始光譜見圖2a。為減少儀器噪聲或基線波動產(chǎn)生的誤差,以及消除大量冗余信息對有效光譜信息提取的干擾,首先對樣品原始光譜圖進行預(yù)處理,預(yù)處理方法包括:最小-最大歸一化、SNV、MSC、FD、SD、FD+ SNV、FD+MSC、SD+SNV、SD+MSC等,然后基于PLS方法建立小麥淀粉比例的預(yù)測模型。不同預(yù)處理方法建立模型的評價數(shù)據(jù)見表2。
表2 不同處理方法對模型的影響Table 2 Effect of different processing methods on the model
續(xù) 表
以預(yù)測均方根誤差(RMSEP)和決定系數(shù)(R2)為檢驗指標選擇最優(yōu)預(yù)測模型。由表2可知,經(jīng)FD+SNV預(yù)處理后,采用PLS法建立的馬鈴薯-小麥淀粉的定量模型效果最佳,其決定系數(shù)分別為0.9988和0.9982,且校正集的RMSEC和預(yù)測集的RMSEP值以及相對分析誤差(RPD)最小,這一結(jié)果表明該模型校正集擬合效果和驗證集的預(yù)測效果都較好。一階導(dǎo)數(shù)+SNV預(yù)處理后的光譜見圖2b。
以小麥淀粉添加比例的真實值及預(yù)測值為橫、縱坐標,得到校正集和預(yù)測集的散點圖(見圖 3)。校正集決定系數(shù)R2=0.9988,回歸方程為 y=0.9934x+0.374,驗證集決定系數(shù) R2=0.9982,回歸方程為 y=1.0268x-1.48,相關(guān)性均達到極顯著水平,表明近紅外定量分析模型測定結(jié)果準確可靠。
圖3 馬鈴薯-小麥淀粉中小麥淀粉添加比例的校正集(a) 和預(yù)測集(b)的預(yù)測結(jié)果Fig.3 Prediction results of correction set(a) and prediction set(b) of wheat and starch addition ratio in potato-wheat starch
本研究基于近紅外漫反射技術(shù),建立了一種淀粉種類的快速無損檢測方法。通過對不同種類的淀粉進行光譜采集,結(jié)合不同預(yù)處理方法及主成分分析法(PCA),建立了不同種類淀粉的鑒別分析模型,通過分析,馬鈴薯淀粉和豌豆淀粉可被較好地鑒別,玉米淀粉和小麥淀粉界限不明顯?;诙ㄐ苑治鼋Y(jié)果,建立淀粉混合物的定量分析方法,以不同比例的馬鈴薯淀粉和小麥淀粉的混合物為檢測對象,對混合物中小麥淀粉添加比例進行定量預(yù)測,采用多種光譜預(yù)處理方法,基于PLS建立混合物的預(yù)測模型,最優(yōu)模型的校正集和預(yù)測集其決定系數(shù)分別為0.9988和0.9982,均方根誤差分別為0.385和0.347,預(yù)測相對分析誤差(RPD)為14.6。結(jié)果表明,該方法準確度高,且無需對樣品進行處理,操作簡單,可實現(xiàn)快速無損鑒別淀粉種類的目的。