古方青,管 驍,劉 靜,楊永健,張仲源
(1.上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海200093;2.上海海事大學(xué)信息工程學(xué)院,上海200135;3.上海市食品藥品檢驗(yàn)所,上海201203)
近紅外光譜技術(shù)快速檢測(cè)原料乳中摻雜物
古方青1,管 驍1,劉 靜2,楊永健3,張仲源1
(1.上海理工大學(xué)醫(yī)療器械與食品學(xué)院,上海200093;2.上海海事大學(xué)信息工程學(xué)院,上海200135;3.上海市食品藥品檢驗(yàn)所,上海201203)
采用近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法,對(duì)原料乳中常見(jiàn)的2種摻雜物——大豆分離蛋白與植脂末進(jìn)行定量分析研究。先通過(guò)不同光譜預(yù)處理方法結(jié)合偏最小二乘法(PLS)建模評(píng)價(jià)不同預(yù)處理方法的效果,結(jié)果表明通過(guò)平滑處理結(jié)合多元散射校正(MSC)進(jìn)行光譜預(yù)處理效果最佳,大豆分離蛋白PLS定量模型相關(guān)系數(shù)(R2)與交叉驗(yàn)證均方差(RMSECV)分別為0.980 9、0.127 5,植脂末PLS模型分別為0.972 2、0.130 8。隨后比較了不同建模方法的效果,結(jié)果發(fā)現(xiàn):采用徑向基神經(jīng)網(wǎng)絡(luò)(RBF)對(duì)大豆分離蛋白的建模效果最佳,R2為0.999 4,測(cè)試集均方根誤差為0.003 1;采用廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)方法對(duì)植脂末建模效果最佳,R2為0.998 9,測(cè)試集均方根誤差為0.004 5。因此,合理結(jié)合近紅外光譜技術(shù)與化學(xué)計(jì)量學(xué)方法可快速、準(zhǔn)確檢測(cè)原料乳中大豆分離蛋白和植脂末這2種摻雜物含量。
化學(xué)計(jì)量學(xué);植脂末;近紅外光譜;原料乳;大豆分離蛋白
近年來(lái),不斷出現(xiàn)的原料乳質(zhì)量問(wèn)題日益引起人們對(duì)乳制品質(zhì)量安全的重視。目前,原料乳出現(xiàn)的主要質(zhì)量問(wèn)題為摻雜使假,摻雜物主要包括水、蛋白粉、植脂末等[1-2]。傳統(tǒng)的原料乳質(zhì)量分析方法通常需要利用不同手段對(duì)乳中不同組分分別進(jìn)行測(cè)定,例如用凱氏定氮法測(cè)定蛋白質(zhì)含量,用蓋勃法或羅茲法等方法測(cè)定脂肪含量等,這些方法耗時(shí)費(fèi)力,不利于原料乳品質(zhì)的在線監(jiān)控。因此,如何快速有效檢測(cè)出原料乳中蛋白、植脂末這兩類摻雜物是乳品企業(yè)及相關(guān)質(zhì)檢單位亟待解決的問(wèn)題[1,3]。
隨著光學(xué)儀器設(shè)計(jì)、制造水平的提高、計(jì)算機(jī)技術(shù)的發(fā)展和化學(xué)計(jì)量學(xué)方法研究的深入,近紅外光譜分析技術(shù)在過(guò)程分析和工業(yè)控制領(lǐng)域應(yīng)用越來(lái)越廣,它具備無(wú)損、高效、快速、成本低、綠色環(huán)保和易于實(shí)現(xiàn)自動(dòng)化等優(yōu)點(diǎn)[4],特別是試樣一般無(wú)需化學(xué)前處理,更加便于實(shí)現(xiàn)在線分析,同時(shí)依靠化學(xué)計(jì)量學(xué)方法,可實(shí)現(xiàn)物質(zhì)的定性與定量研究[5-6]。
筆者通過(guò)分析摻入大豆分離蛋白以及植脂末的原料乳的近紅外漫反射光譜,結(jié)合多種光譜預(yù)處理以及建模方法,建立定量模型,以期為快速檢測(cè)原料乳中的蛋白或脂肪摻假物含量提供新的思路。
1.1 儀器設(shè)備
MPA型傅里葉變換近紅外光譜儀(德國(guó)Bruker),譜區(qū)范圍4 000~12 501 cm-1,掃描次數(shù)為64次,分辨率為8 cm-1。
1.2 試樣準(zhǔn)備
新鮮正常原料乳,取自上海金山奶牛場(chǎng),用蒸餾水稀釋至蛋白質(zhì)質(zhì)量分?jǐn)?shù)為1.5%作為基底乳備用。在基底乳中分別摻入不等量的大豆分離蛋白或植脂末模擬摻假試樣,大豆分離蛋白摻入量控制在0.1%~5.0%(質(zhì)量分?jǐn)?shù)),植脂末摻入量控制在0.1%~3.0%(質(zhì)量分?jǐn)?shù)),濃度梯度均勻分布,共制備61組樣本。建模過(guò)程中在61組樣本中隨機(jī)選取45組作為訓(xùn)練集,剩余16組為測(cè)試集。
1.3 光譜采集與數(shù)據(jù)處理
在環(huán)境溫度25℃、相對(duì)濕度45%條件下,近紅外光譜儀開(kāi)機(jī)預(yù)熱10 min。采集光譜前,將試樣均質(zhì)60 s。利用光纖探頭采集試樣漫反射近紅外光譜,每個(gè)試樣采集光譜10次。將61×10組光譜數(shù)據(jù)圖導(dǎo)入OPUS 6.5軟件進(jìn)行處理,即對(duì)每一個(gè)試樣的10組圖譜取平均值作為該樣本的代表性光譜,共獲得61組光譜圖,并將光譜圖以.CSV格式進(jìn)行保存以備后續(xù)數(shù)據(jù)分析。
1.4 數(shù)據(jù)分析
數(shù)據(jù)處理分析在Math works公司提供的Matlab 2009b環(huán)境下進(jìn)行。
2.1 光譜預(yù)處理及特征信息提取
圖1顯示了正常原料乳、基底乳、61組摻入不同濃度大豆分離蛋白或植脂末的摻偽乳漫反射圖譜。由圖1可知:稀釋處理的基底乳圖譜與原料乳未見(jiàn)明顯差異,均在波數(shù)5 106和6 800 cm-1附近有較強(qiáng)特征吸收。但摻入大豆分離蛋白或植脂末后,光譜在部分波數(shù)處出現(xiàn)較大幅度擾動(dòng),如植脂末組在4 200~5 200 cm-1與6 700~6 900 cm-1區(qū)間內(nèi)隨著植脂末摻入量的提高光譜吸收增強(qiáng)。由于大豆分離蛋白與植脂末本身在近紅外區(qū)間各處均有吸收,故選取全譜建立模型。光譜信號(hào)中除包括試樣成分信息外,還包含高頻噪聲、基線漂移和試樣背景等,因此建模前需對(duì)光譜進(jìn)行預(yù)處理以過(guò)濾干擾信號(hào),提高模型準(zhǔn)確度。常用的光譜預(yù)處理方法包括平滑處理、多元散射校正、小波變換、一階導(dǎo)數(shù)、二階導(dǎo)數(shù)等[7]。同時(shí),對(duì)光譜進(jìn)行主成分分析可以避免建模中的信息冗余,在分析中起到簡(jiǎn)化數(shù)據(jù)的目的。本實(shí)驗(yàn)中筆者首先采取了平滑處理、多元散射校正以及小波變換等不同組合對(duì)光譜進(jìn)行預(yù)處理,并通過(guò)主成分分析提取出特征變量,進(jìn)一步通過(guò)偏最小二乘法建立定量模型,根據(jù)模型的相關(guān)系數(shù)R2、交叉驗(yàn)證均方差RMSECV和相對(duì)誤差Σσ評(píng)價(jià)模型效果[8](表1)。。
表1為大豆分離蛋白試樣組5種不同的光譜預(yù)處理方法效果。由表1可知:通過(guò)光譜平滑處理結(jié)合多元散射校正預(yù)處理后,應(yīng)用主成分分析,前4個(gè)主成分累積可解釋原光譜信息的90.1%,PLS模型相關(guān)系數(shù)R2可達(dá)0.980 9,RMSECV為0.127 5,建模效果最好;相反,盡管通過(guò)平滑處理結(jié)合小波變換預(yù)處理后,提取前3個(gè)主成分可解釋原光譜99.8%的信息,但最終建模效果不理想(R2為0.926 8,RMSECV為0.232 6),可能的原因是建模效果并非完全取決于預(yù)處理方法的有用信息提取量,也與冗余信息剔除效果有關(guān),同時(shí)全波段光譜與特征光譜段的選擇也會(huì)影響建模效果。因此,平滑處理結(jié)合多元散射校正光譜預(yù)處理方法在綜合平衡以上兩方面關(guān)系的效果最佳。同樣,通過(guò)對(duì)植脂末試樣組光譜預(yù)處理效果比較可知,采用平滑處理結(jié)合多元散射校正預(yù)處理后,提取前4個(gè)主成分可解釋原始光譜的88.8%信息,PLS模型R2為0.972 2,RMSECV為0.130 8,建模效果最好。由此可見(jiàn),對(duì)本實(shí)驗(yàn)中的摻偽乳試樣而言,平滑處理結(jié)合多元散射校正光譜預(yù)處理方法最能有效降低原始光譜的噪音,對(duì)提高建模性能有較大的幫助。
表1 不同光譜預(yù)處理方法對(duì)PLS建模效果的影響Table 1 Effects of different spectrum pretreatments on performances of PLSmodels
2.2 建模方法的比較
建模方法的選擇同樣對(duì)最終模型效果有重要影響。除偏最小二乘建模方法外,其他常用建模方法還包括多元線性回歸、人工神經(jīng)網(wǎng)絡(luò)等。近年來(lái),人工神經(jīng)網(wǎng)絡(luò)方法得到了飛速發(fā)展[9-10]。神經(jīng)網(wǎng)絡(luò)是一種新的智能學(xué)習(xí)方法,它通過(guò)模擬動(dòng)物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理得到數(shù)學(xué)模型。該網(wǎng)絡(luò)還可根據(jù)系統(tǒng)的復(fù)雜程度,通過(guò)自行調(diào)整內(nèi)部大量節(jié)點(diǎn)之間相互連接的關(guān)系,進(jìn)而達(dá)到高效處理信息的目的[11]。本文將原始光譜通過(guò)平滑處理結(jié)合多元散射校正預(yù)處理后,對(duì)主成分系數(shù)擬通過(guò)分別采用線性神經(jīng)網(wǎng)絡(luò)(linear neural network,LNN)、反向傳播神經(jīng)網(wǎng)絡(luò)(Back propagation neural network,BP)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF)和廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)建立模型。
由于不同神經(jīng)網(wǎng)絡(luò)方法模型系數(shù)各有不同,例如BP網(wǎng)絡(luò)中節(jié)點(diǎn)層數(shù)、節(jié)點(diǎn)個(gè)數(shù)以及訓(xùn)練函數(shù)不同,對(duì)模型建立效果影響很大[12]。因此筆者比較了不同神經(jīng)網(wǎng)絡(luò)中不同系數(shù)設(shè)置對(duì)模型性能的影響,評(píng)價(jià)指標(biāo)通過(guò)模型R2、訓(xùn)練集均方根誤差σ1以及測(cè)試集均方根誤差σ2來(lái)衡量。表2為不同的神經(jīng)網(wǎng)絡(luò)建模方法對(duì)大豆分離蛋白及植脂末含量預(yù)測(cè)能力的比較結(jié)果。
表2 不同建模方法的效果比較Table 2 Com parison of perform ancse of differentm odeling m ethods
由表2可知:LNN建模效果較差,這是由于該建模方法只能較好表征線性關(guān)系的輸入與輸出,而在本實(shí)驗(yàn)中由于建模輸入的自變量較多,與輸出結(jié)果線性關(guān)系不明顯,由此導(dǎo)致模型預(yù)測(cè)能力不佳;BP神經(jīng)網(wǎng)絡(luò)建模相關(guān)系數(shù)較高,2種摻雜物的定量預(yù)測(cè)模型R2均大于0.97,但預(yù)測(cè)效果不理想,測(cè)試集均方根誤差σ2較大,這是由于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建中間層節(jié)點(diǎn)數(shù)量較多,模型樣本數(shù)量偏少,建模隨機(jī)性大而不具代表性所導(dǎo)致;而RBF和GRNN模型擬合度以及預(yù)測(cè)準(zhǔn)確程度均較高,其中對(duì)大豆分離蛋白含量的預(yù)測(cè),通過(guò)GRNN網(wǎng)絡(luò)建模,SPREAD為0.1時(shí),R2為0.999 4,測(cè)試集均方根誤差σ2僅為0.003 1,而對(duì)植脂末建模效果分析中,RBF建立模型可以取得最佳效果,模型R2為0.998 9,測(cè)試集均方根誤差σ2為0.004 5。
總體看來(lái),通過(guò)神經(jīng)網(wǎng)絡(luò)方法建立模型,對(duì)大豆分離蛋白以及植脂末含量的預(yù)測(cè)均能達(dá)到很好的效果,具有應(yīng)用價(jià)值,但由于各種神經(jīng)網(wǎng)絡(luò)中參數(shù)變量復(fù)雜,且有不同組合,而不同取值均能對(duì)模型預(yù)測(cè)能力產(chǎn)生不同影響,因此在實(shí)際應(yīng)用中需不斷探討參數(shù)變量以及最優(yōu)組合的選擇。本文中筆者僅討論了部分通用參數(shù)設(shè)置條件下建立模型的結(jié)果,而對(duì)模型的全面優(yōu)化仍有待進(jìn)一步研究。
通過(guò)實(shí)驗(yàn)研究表明:利用近紅外光譜分析可以快速檢測(cè)原料乳中常見(jiàn)摻雜物——大豆分離蛋白和植脂末的含量。通過(guò)選擇平滑處理結(jié)合多元散射校正光譜預(yù)處理方法結(jié)合GRNN建模方法,大豆分離蛋白組模型R2可達(dá)到0.999 4,測(cè)試集均方根誤差為0.003 1;通過(guò)平滑處理結(jié)合多元散射校正預(yù)處理結(jié)合RBF建模,植脂末組模型R2達(dá)0.998 9,測(cè)試集均方根誤差為0.004 5,說(shuō)明建立的模型穩(wěn)定性很高,且預(yù)測(cè)能力較強(qiáng),可為研究原料乳中其他摻雜物的近紅外定量分析提供參考。此外,進(jìn)一步優(yōu)化近紅外光譜的建模參數(shù)設(shè)置,將有利于推廣近紅外光譜分析技術(shù)在原料乳質(zhì)量監(jiān)控實(shí)際工作中的應(yīng)用。
[1] 郭朔.近紅外光譜分析技術(shù)快速檢測(cè)液態(tài)乳制品品質(zhì)的研究[D].長(zhǎng)春:吉林大學(xué),2008.
[2] 王多加,周向陽(yáng),金同銘,等.近紅外光譜檢測(cè)技術(shù)在農(nóng)業(yè)和食品分析上的應(yīng)用[J].光譜學(xué)與光譜分析,2004,24(4):447?450.
[3] 王田子,鄧麗敏,田立軍,等.近紅外在乳及乳制品質(zhì)量檢測(cè)中的研究進(jìn)展[J].光譜學(xué)與光譜分析,2010,30(12):3208?3212.
[4] Balabin R M,Smirnov SV.Melamine detection bymid,and near?infrared(MIR/NIR)spectroscopy:a quick and sensitivemethod for dairy products analysis including liquid milk,infant formula,and milk powder[J].Talanta,2011,85(1):562?568.
[5] 徐廣通,袁洪福,陸婉珍.現(xiàn)代近紅外光譜技術(shù)及應(yīng)用進(jìn)展[J].光譜學(xué)與光譜分析,2000,20(2):134?142.
[6] 張曉慧,劉建學(xué).近紅外光譜技術(shù)在牛奶及其制品質(zhì)量檢測(cè)中的應(yīng)用[J].紅外,2007,28(6):38?41.
[7] 褚小立,袁洪福,陸婉珍.近紅外分析中光譜預(yù)處理及波長(zhǎng)選擇方法進(jìn)展與應(yīng)用[J].化學(xué)進(jìn)展,2004,16(4):528?542.
[8] 何勇,李曉麗,邵詠妮.基于主成分分析和神經(jīng)網(wǎng)絡(luò)的近紅外光譜蘋果品種鑒別方法研究[J].光譜學(xué)與光譜分析,2006,26(5):850?853.
[9] Dowman R,Ben?Avraham D.An artifical neural network model of orienting attention towards threatening somatosensory stimuli[J]. Psychophysiology,2007,44(2):229?239.
[10] Robinson C J,Johnson D O,Almeida J S.Second trimester prediction of preeclampsia using an artifical neural network[J].J Soc Gynecol Invest,2006,13(2):126A.
[11] Liu X Z,Kang SZ,Li F S.Simulation of artificial neural network model for trunk sap flow of Pyruspyrifolia and its comparison with multiple?linear regression[J].Agric Water Manage,2009,96:939?945
[12] 齊俊.BP神經(jīng)網(wǎng)絡(luò)在牛乳檢測(cè)中的應(yīng)用[D].哈爾濱:哈爾濱理工大學(xué),2009.
Rapid determ ination of adulteration in raw m ilk by near?infrared spectroscopy analysis
GU Fangqing1,GUAN Xiao1,LIU Jing2,YANG Yongjian3,ZHANG Zhongyuan1
(1.School of Medical Instruments and Food Engineering,University of Shanghai for Science and Technology,Shanghai200093,China;2.College of Information Engineering,ShanghaiMaritime University,Shanghai200135,China;3.Shanghai Institute for Food and Drug Control,Shanghai201203,China)
Quantitative determination of two kinds of common adulterants in raw milk,namely soy protein isolates and creamer,was performed by combining near?infrared spectroscopy with chemometrics analysis. Firstly,the effects of different spectrum pretreatment methods were evaluated by combining different spectrum pretreatment methods with partial least squares model.The results showed that smoothing algorithm combined with multiple scattering corrections had best performance.R2and RMSECV of PLS model for soy protein isolateswere 0.980 9 and 0.127 5,and that of creamerwere 0.972 2 and 0.130 8,respectively.Then,the performances of different modeling methods were compared.The results demonstrated that the bestmodelingmethods for soy protein isolates and creamer were RBF and GRNN methods.R2and RMSE testof the RBFmodel for soy protein isolateswere 0.999 4 and 0.003 1,and that of the GRNN model for creamer were 0.998 9 and 0.004 5,respectively.Therefore,NIRS combined reasonably with chemometric methods could be used to determine the contents of soy protein isolates andcreamer in raw milk with high speed and accuracy.
chemometrics;creamer;near?infrared spectroscopy;raw milk;soy protein isolates
TS252.7;O657.33
A
1672-3678(2013)06-0073-05
10.3969/j.issn.1672-3678.2013.06.015
2013-01-15
國(guó)家自然科學(xué)基金(31101348);上海市教委科研創(chuàng)新項(xiàng)目(10YZ113)
古方青(1988—),女,安徽無(wú)為人,碩士研究生,研究方向:食品安全監(jiān)控技術(shù);管 驍(聯(lián)系人),副教授,E?mail:gnxo@163.com