程文宇 管 驍 劉 靜
(1.上海理工大學醫(yī)療器械與食品學院,上海 200093;2.上海海事大學信息工程學院,上海 200135)
乳制品中非法添加三聚氰胺,長期或反復大量攝入會對腎與膀胱產(chǎn)生影響,導致腎結(jié)石。三鹿毒奶粉事件的直接原因即是奶粉中含有超量三聚氰胺[1]。為了維護乳制品安全,不同國家對其中的三聚氰胺限量有不同要求。中國政府2008年明確規(guī)定,乳制品中(包括原料乳)三聚氰胺含量不得超過2.5mg/kg[2];國際食品法典委員會2012年7月規(guī)定每公斤液態(tài)牛奶中三聚氰胺含量不得超過0.15mg[3]。
三聚氰胺的常用檢測方法主要有高效液相色譜法和氣質(zhì)聯(lián)用法,但這些方法主要在實驗室進行,且需要專業(yè)操作人員,不利于原料乳品質(zhì)的在線監(jiān)控[4]。在計算機技術(shù)的飛速發(fā)展、光學技術(shù)和化學計量學方法的不斷進步下,近紅外光譜分析技術(shù)在多個領(lǐng)域顯示了其獨特的優(yōu)勢,其中無損、高效、快速、成本低、無污染的優(yōu)點,使其明顯優(yōu)于傳統(tǒng)的分析檢測技術(shù),而且樣品無需預處理,更加便于實現(xiàn)在線分析[5]。
有機物在近紅外光譜區(qū)主要表現(xiàn)為含氫官能團X—H(X═C、N、O、S)基頻振動的不同倍頻與合頻吸收峰,由于合頻和倍頻躍遷幾率低,譜帶強度弱并重疊嚴重,因此提取的有用信息為弱信息和多元信息,對微量物質(zhì)的定量效果往往不佳。劉景旺等[6]利用近紅外光譜對牛奶中的三聚氰胺進行了檢測,但存在準確性不高等問題。近年來隨著化學計量學的發(fā)展,近紅外技術(shù)結(jié)合適當?shù)幕瘜W計量學處理方法,可以對食品組成成分以及外源添加物進行定性判別[6-8],并有效提高檢測限度。
小波變換被譽為數(shù)學上的顯微鏡,是一種理想的信號處理方法,它能將重疊的混合信號轉(zhuǎn)變?yōu)椴煌l率的基元信號,具有多分辨率、方向選擇性等特點,可對信號進行局部化分析[9]。在近紅外光譜分析中,小波變換可以有效地消除光譜噪音,提高局部特征信號[10],是近紅外光譜預處理常用的方法之一。本研究擬通過近紅外光譜小波變換結(jié)合主成分分析以及廣義回歸神經(jīng)網(wǎng)絡(WT—PCA—GRNN)對添加三聚氰胺的液態(tài)奶進行定量分析,并結(jié)合支持向量機(WT—PCA—SVM)對其進行定性判別,目的是探討近紅外光譜技術(shù)結(jié)合化學計量學方法對液態(tài)奶中三聚氰胺快速檢測的可行性,為快速檢測液態(tài)奶中的三聚氰胺提供理論依據(jù)。
傅里葉近紅外光譜儀:MPA型,德國Bruker公司。光譜采集模式為漫反射(光纖),譜區(qū)范圍4 000~12 501cm-1,分辨率8cm-1,掃描次數(shù)64次;
電子天平:AB104-N型,上海第二天平儀器廠;
均質(zhì)機:APV1000型,上海順儀實驗設備有限公司。
將取自上海金山奶牛場的新鮮原料乳,通過蒸餾水稀釋配制成蛋白質(zhì)濃度為1.5%的基底乳,備用。將不等量的三聚氰胺分別摻入基底乳中模擬摻假試樣,三聚氰胺摻入量控制在0.001%~1.000%(質(zhì)量分數(shù)),在均勻分布濃度梯度下,共制備54組樣本。在建模時從54組樣本中隨機選取15組作為定量模型的測試集,剩余39組樣為訓練集。另外取18組未添加三聚氰胺的原料乳樣本,分別用蒸餾水稀釋至蛋白質(zhì)含量為1.5%~3.2%(質(zhì)量分數(shù)),濃度梯度0.1%。表1為訓練集和測試集劃分結(jié)果。
將樣品在恒溫水浴鍋中保持25℃、環(huán)境相對濕度為45%,使機器開機預熱10min。采集光譜前,將不同樣本用轉(zhuǎn)速2 000r/min均質(zhì)機攪拌60s。樣本的漫反射近紅外光譜利用光纖探頭采集,每組樣本測量10次,取平均值作為該樣本典型光譜,每組樣本光譜由2 203個數(shù)據(jù)點構(gòu)成。數(shù)據(jù)采集軟件為OPUS 6.5,數(shù)據(jù)處理分析軟件為 Matlab R2009b。
本試驗采用Daubechies(db2)小波對原始光譜信號進行4層小波分解[6]。處理效果見圖1。
表1 測試集的選擇結(jié)果Table 1 Results ofdivision of test set
表1 測試集的選擇結(jié)果Table 1 Results ofdivision of test set
*用于測試集。
序號 三聚氰胺質(zhì)量分數(shù)/% 序號 三聚氰胺質(zhì)量分數(shù)/% 序號 三聚氰胺質(zhì)量分數(shù)/%1 2 3 4 5 6 7 8 9 1 0 11 12 13 14 15 16 17 18 0.001*0.002 0.003 0.004*0.005 0.006 0.007 0.008 0.009 0.010*0.012 0.014 0.016 0.018 0.020*0.022 0.024*0.028*0.030 0.032 0.034 0.036 0.038*0.040 0.045*0.050 0.055*0.060 0.065 0.070*0.075 0.080 0.085 0.090*0.100 0.150 0.200 0.250 0.300*0.350 0.400 0.450 0.500 0.550 0.600*0.650*0.700 0.750 0.800 0.850*0.900 0.026 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 360.095 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 541.000
圖1 小波變換圖譜Figure 1 Transformed spectrums by WT
據(jù)報道[11],三聚氰胺中NH2的波動處于近紅外區(qū)域,在6 644~6 812cm-1間有明顯的吸收峰,而根據(jù)朗伯—貝耳定律,紅外線通過水分時是被選擇性吸收,其吸收量大小遵循近紅外輻射經(jīng)過物質(zhì)后的光強,與物質(zhì)的濃度(水分含量)之間存在一定關(guān)系,即吸收能量隨著被測物濃度的增加而增加[12]。
為驗證三聚氰胺在波數(shù)為6 644~6 812cm-1區(qū)域內(nèi)的吸收峰,將小波變換后的圖譜進行一階導數(shù)分析,先將6 644~6 812cm-1內(nèi)43個光譜數(shù)值擬合成多元函數(shù),處理后發(fā)現(xiàn)最大導數(shù)值處為6 792cm-1,因此選取6 792cm-1處進行分析,將所有樣品的光譜在該處導數(shù)進行比較分析,結(jié)果見圖2。
圖2 不同三聚氰胺濃度下6 972cm-1導數(shù)值Figure 2 Derivative value at 6 972cm-1 at different concentrations
由圖2可知,三聚氰胺濃度與6 792cm-1處導數(shù)值基本成正比例關(guān)系,這與三聚氰胺在6 644~6 812cm-1內(nèi)存在吸收峰的推斷吻合。但由圖2也不難發(fā)現(xiàn),當三聚氰胺在濃度低于0.05%時,濃度與峰值導數(shù)比例關(guān)系并不明顯,并且有幾組樣品在6 792cm-1處導數(shù)為負值,這是由于樣品背景及其它組分等干擾,以及設備等系統(tǒng)誤差所共同導致的光譜峰漂移[13,14]。
由于低濃度變化規(guī)律不明顯以及光譜漂移等問題,本試驗采用主成分分析(PCA)對光譜進一步處理。主成分分析是通過線性變換重新組合原來具有一定相關(guān)性的眾多指標,選出較少個數(shù)重要且互不相關(guān)的變量,從而使進一步研究變得簡單的一種多元統(tǒng)計分析方法[15]。本試驗目的是將6 644~6 812cm-1內(nèi)已被小波變換放大的特征信號進行進一步提取,獲得更具代表性的特征值進行后續(xù)分析。表2為主成分分析結(jié)果。
表2 主成分分析結(jié)果Table 2 Result of PCA
由表2可知,通過主成分分析,可以將6 644~6 812cm-1內(nèi)43個數(shù)據(jù)點轉(zhuǎn)換成少量的代表性變量,本試驗取前4個主成分因子作為建模自變量,累積貢獻率達到99.405%。
GRNN是由輸入層、隱含層和一個線性輸出層組成的,是徑向基函數(shù)(radial basis function,RBF)網(wǎng)絡的一種。GRNN的拓撲結(jié)構(gòu)如圖3所示。GRNN多用于函數(shù)局部逼近,并具有非線性映射能力強、訓練速度快的優(yōu)點,適用于樣本數(shù)量較少的建模。此外,GRNN只有一個光滑因子需要調(diào)整,因而合適的預測網(wǎng)絡能夠很快地被找到,具有一定的運算優(yōu)勢。因此,本試驗采用GRNN對液態(tài)奶中三聚氰胺含量進行建模[16]。
圖3 GRNN拓撲結(jié)構(gòu)Figure 3 Topology of GRNN
利用Matlab軟件建立GRNN模型,取通過主成分分析得到的4個因子作為模型自變量,三聚氰胺含量作為模型因變量,將表1中所選取的39組數(shù)據(jù)用于建立模型,15組測試集用于評價模型效果,采用模型相關(guān)系數(shù)R2評價模型效果。經(jīng)過軟件尋優(yōu),平滑因子取值為0.1,此時三聚氰胺含量訓練集模型R2為0.694 3,測試集模型R2為0.654。結(jié)果顯示如圖4、5所示,雖然模型對三聚氰胺含量預測與實際值總體趨勢相同,但預測準確度不高,R2值偏低,作為定量分析仍有待進一步完善。
圖4 訓練集預測結(jié)果Figure 4 Predicted results of train set
圖5 測試集預測結(jié)果Figure 5 Predicted results of test set
由上述分析可以看出,盡管無法對液態(tài)奶中的三聚氰胺含量進行準確定量,但對三聚氰胺含量的預測規(guī)律與實際值相同。因此,本試驗進一步利用支持向量機方法對摻入三聚氰胺的液態(tài)奶樣本進行定性判別。
支持向量機是在結(jié)構(gòu)風險最小原理和統(tǒng)計學習理論基礎上建立的,在模型的復雜性和學習能力之間根據(jù)有限的樣本信息尋求最優(yōu),從而能夠推廣應用到函數(shù)擬合等其他機器學習問題中。在近紅外光譜分析中,樣本數(shù)量得到的通常不多,而SVM作為一種專門研究小樣本情況下預測問題和統(tǒng)計估計的方法,能夠較好地解決小樣本、非線性、高維數(shù)和局部極值等諸多實際問題[17,18]。圖6為支持向量機拓撲結(jié)構(gòu)圖。
圖6 SVM拓撲結(jié)構(gòu)Figure 6 Topology of SVM
由于新加入的18組未添加三聚氰胺的液態(tài)乳樣本未進行有效主成分提取,所以需要將這些樣本與上述54組加入不同比例三聚氰胺的液態(tài)奶樣本合并,共得到72組樣本,對其原始光譜重復上述小波變換預處理。隨后將72組樣本隨機劃分,其中54組為訓練集,18組為測試集。對訓練集進行主成分分析,通過計算提取得5個主成分因子,累積貢獻率為99.11%。再利用支持向量機建立模型,其中5項主成分因子為模型自變量,是否摻入三聚氰胺作為因變量,摻入為1,未摻入為0,分別采用不同核函數(shù)建立SVM模型。隨后將18組測試集帶入主成分分析模型,將得到的主成分因子帶入支持向量機模型檢驗,模型效果見表3。
表3 不同核函數(shù)的預測結(jié)果Table 3 Predicted results by using different kernel function
由表3可知,采用RBF作為核函數(shù)時,本試驗預測效果最佳,訓練集與預測集預測準確率均為94.44%,結(jié)果令人滿意。這表明利用近紅外光譜技術(shù)對液態(tài)奶中摻入三聚氰胺的定性判別是完全可行的。
通過近紅外光譜技術(shù),對液態(tài)奶中三聚氰胺進行研究,首先采用小波變換放大三聚氰胺特征信號,再利用主成分分析獲得有效的特征因子,分別對液態(tài)奶中三聚氰胺進行了定量及定性的研究,結(jié)果表明:① 當液態(tài)奶中三聚氰胺質(zhì)量比低于0.05%時,模型預測能力較差,這是由于近紅外光譜技術(shù)本身的特點所致;② 利用支持向量機對液態(tài)奶中三聚氰胺進行定性分析可獲得較好的判別結(jié)果,并且近紅外光譜技術(shù)具有前處理簡單、無污染、無破壞性等優(yōu)勢。進一步擴充模型光譜數(shù)量,提高模型精度,將有利于推廣近紅外光譜分析技術(shù)在實際液態(tài)奶質(zhì)量監(jiān)控工作中的應用。
1 李高杰.現(xiàn)代近紅外光譜技術(shù)在食品分析中的應用[J].經(jīng)營管理者,2010(19):403.
2 中華人民共和國衛(wèi)生部,中華人民共和國工業(yè)和信息化部,中華人民共和國農(nóng)業(yè)部,國家工商行政管理總局.國家質(zhì)量監(jiān)督檢驗檢疫總局公告2008年第25號[J].中國食品衛(wèi)生雜志,2008,20(6):564.
3 新華.牛奶中三聚氰胺含量設定新標準[J].北京農(nóng)業(yè),2012(22):9.
4 張鑫,顧欣,陳美蓮,等.近紅外光譜技術(shù)在乳品行業(yè)的研究現(xiàn)狀及應用前景[J].上海畜牧獸醫(yī)通訊,2010(6):12~13.
5 李慧,曾銘,要磊,等.近紅外光譜技術(shù)在食品檢測中的應用研究進展[J].食品工業(yè),2011(12):85~88.
6 劉景旺,張博洋,李樹峰,等.近紅外吸收光譜技術(shù)快速檢測奶制品中添加三聚氰胺[J].光散射學報,2010,22(3):291~297.
7 金長江,鄭先哲.應用近紅外光譜技術(shù)快速檢測黑加侖漿果的主要營養(yǎng)成分[J].東北農(nóng)業(yè)大學學報,2011,42(5):41~47,147.
8 Poji'cM,Jasna Mastilovi'c,Dragan Pali'c,et al.The development of near-infrared spectroscopy(NIRS)calibration for prediction of ash content in legumes on the basis of two different reference methods[J].Food Chemistry,2010,123(3):800~805.
9 田高友,袁洪福,劉慧穎,等.小波變換用于近紅外光譜性質(zhì)分析[J].分析化學,2004,32(09):1 125~1 130.
10 郝勇,陳斌,朱銳.近紅外光譜預處理中幾種小波消噪方法的分析[J].光譜學與光譜分析,2006,26(10)1 838~1 841.
11 Haughey S A,Graham S F,Cancout E,et al.The application of near-infrared reflectance spectroscopy(NIRS)to detect melamine adulteration of soya bean meal[J].Food Chemistry,2013,136(3~4):1 557~1 561.
12 Decruyenaere V,F(xiàn)roidmont E,Bartiaux-Thill N,et al.Faecal near-infrared reflectance spectroscopy (NIRS)compared with other techniques for estimating the in vivo digestibility and dry matter intake of lactating grazing dairy cows[J].Animal Feed Science and Technology,2012,173(3~4):220~234.
13 Dalle Zotte A,Berzaghi P,Janssonb LM,et al.The use of near-infrared reflectance spectroscopy(NIRS)in the prediction of chemical composition of freeze-dried egg yolk and discrimination between different n-3PUFA feeding sources[J].Animal Feed Science and Technology,2006,128(1~2):108~121.
14 張華秀,李曉寧,范偉,等.近紅外光譜結(jié)合Boosting-PLS快速檢測奶粉中蛋白質(zhì)含量[J].計算機與應用化學,2010,27(9):1 197~1 200.
15 Aoyama S,Toshima T,Saito Y,et al.Maternal breast milk odour induces frontal lobe activation in neonates:A NIRS study[J].Early Human Development,2010,86(9):541~545.
16 Brunet D,Woignier T,Lesueur-Jannoyer M,et al.Determination of soil content in chlordecone(organochlorine pesticide)using near infrared reflectance spectroscopy(NIRS)[J].Environmental Pollution,2009,157(11):3 120~3 125.
17 Bruno-Soares AM,Murrayb I,Patersonb RM,et al.Use of near infrared reflectance spectroscopy(NIRS)for the prediction of the chemical composition and nutritional attributes of green crop cereals[J].Animal Feed Science and Technology,1998,75(1):15~25.
18 張仲源,劉靜,管驍,等.近紅外光譜分析技術(shù)在食品檢測中的應用研究進展[J].食品與發(fā)酵工業(yè),2011,37(11):159~165.