周 密,馮 灝,劉 杰,皮江一,王會霞,周陶鴻,
彭青枝1,2,張 莉1,2
(1.湖北省食品質量安全監(jiān)督檢驗研究院,湖北 武漢 430075;2.湖北省食品質量安全檢測工程技術研究中心,湖北 武漢 430075)
蜂蜜是蜜蜂采集植物的花蜜、分泌物或蜜露,與自身分泌物混合后,經(jīng)充分釀造而成的天然甜物質[1]。隨著人們健康意識的提高,蜂蜜作為一種天然食品漸受青睞。自然界中分泌花蜜的植物種類繁多,不同植物來源蜂蜜所具備的活性功能也不盡相同[2],產(chǎn)品價格更是千差萬別。市場上部分不法商販受利益驅使,對蜂蜜進行摻雜使假,掩蓋或錯誤標識蜂蜜蜜源信息是常見的使假手段之一[3]。而我國作為蜂產(chǎn)品出口大國,此種違法現(xiàn)象不僅損害了消費者的合法權益,制約了我國蜂產(chǎn)業(yè)在經(jīng)濟全球化中的進程,更是給國際蜂產(chǎn)業(yè)的健康、可持續(xù)發(fā)展留下隱患。因此,為了保護消費者利益和促進生產(chǎn)者的公平競爭,保障蜂產(chǎn)業(yè)的繁榮發(fā)展,對蜂蜜植物源進行鑒別研究意義重大。
蜂蜜富含多種礦物質元素,占比雖小,但提供了重要的樣品信息[4],能為蜂蜜屬性區(qū)分提供依據(jù),如魏月等[5]分析了云南南部4種植物源蜂蜜中21種礦質元素,結合典型判別分析,對4種蜂蜜的植物源歸屬判別正確率達90%,表明在氣候和土壤環(huán)境相似的情況下,不同植物源蜂蜜之間礦質元素存在差異;陳輝等對蜂蜜產(chǎn)地[6]和植物源[7]的鑒別研究不僅能將來自河北、北京等地的荊條蜜進行產(chǎn)地溯源,還能有效鑒別來自不同地區(qū)的荊條、椴樹、洋槐、油菜蜂蜜,表明同種植物源蜂蜜產(chǎn)地之間的差異或小于不同植物源之間引起的差異,因此,利用蜂蜜中多種礦質元素對不同地區(qū)蜂蜜樣品進行植物源鑒別是可行的。
截尾數(shù)據(jù)(Censored data)指監(jiān)測數(shù)據(jù)中污染物的檢測值小于檢出限或者定量下限的不完全數(shù)據(jù)[8],在食品化學污染物評價中不可避免。受限于植物生長自然環(huán)境、樣品狀態(tài)、儀器條件等因素,電感耦合等離子體質譜儀(ICP-MS)測定蜂蜜樣品時,截尾數(shù)據(jù)總是客觀存在的,世界衛(wèi)生組織(World health organization,WHO)建議在對食品中低含量污染物進行暴露評估過程中,當?shù)陀跈z出限的結果數(shù)據(jù)小于數(shù)據(jù)總量的60%時,所有小于檢出限的結果均以二分之一檢出限值進行替換參與計算[9]。如Hannah等[10]在評估土壤中鋅、錳元素含量時,比較了替換法(Substitution method)、最大似然估計法(Maximum likelihood estimation)、次序統(tǒng)計量回歸法(Regression on order substitution)、生存分析法(Survival analysis)4種不同截尾數(shù)據(jù)處理方法,發(fā)現(xiàn)使用替換法將截尾數(shù)據(jù)按二分之一檢出限值處理時能較好地計算樣本幾何平均值。盡管國內外有通過ICP-MS進行元素分析并建立判別模型鑒別蜂蜜植物源的報道[5,11],但并未涉及ICP-MS中截尾數(shù)據(jù)對模型判別能力的研究,且識別模型單一,缺少對模型參數(shù)的優(yōu)化。因此,為提高蜂蜜植物源模型的鑒別能力,有必要建立蜂蜜中ICP-MS截尾數(shù)據(jù)和識別模型參數(shù)的研究。本文采用ICP-MS測定荊條、洋槐、葵花、油菜4種植物源蜂蜜中的16種金屬元素,再利用替換法按二分之一檢出限值處理截尾數(shù)據(jù)并建立支持向量機(Support vector machine,SVM)分類模型,并進一步通過網(wǎng)格搜索法(Grid search,GS)、遺傳算法(Genetic algorithm,GA)和粒子群優(yōu)化算法(Particle swarm optimization,PSO)3種尋優(yōu)算法優(yōu)化模型參數(shù),有效提高了判別能力,以期為規(guī)范蜂蜜市場秩序提供技術支持。
NexION 350X型電感耦合等離子發(fā)射光譜質譜聯(lián)用儀(美國PerkinElmer公司),檢測器帶電信號稀釋功能;Multiwave Pro型微波消解儀(奧地利Anton paar公司);BHW-09A24S型恒溫消解趕酸儀(上海博通化學科技有限公司);WNE29型恒溫水浴鍋(德國Memmert公司);Purelab Chorus型超純水系統(tǒng)(英國ELGA公司)。
硝酸(優(yōu)級純,德國Merck公司);Na、Mg、Al、K、Ca、Ti、Cr、Mn、Ni、Cu、Zn、As、Se、Cd、Ba、Pb單元素標準儲備液(1 000 mg/L,國家有色金屬及電子材料分析測試中心);實驗室用水為去離子水。
1.2.1 樣品前處理 樣品收集:蜂蜜樣品來源于武漢市蜂產(chǎn)品質量工程控制技術研究中心,植物源屬性明確。其中,油菜蜜37例,荊條蜜36例,洋槐蜜13例,葵花蜜11例,共計97例,測試前于-20℃冷凍貯藏。
微波消解程序:設置微波消解儀最大工作功率1 500 W,在10 min內由室溫升溫至120℃,保持5 min;然后在10 min內由120℃升溫至180℃,保持20 min。
元素分析前處理:樣品分析前于水浴鍋內40℃恒溫水浴至樣品結晶完全融化,充分混勻后稱取約1 g(精確至0.001 g)樣品至聚四氟乙烯消解罐內,加入10.0 mL硝酸,放置過夜后于微波消解儀中按上述微波消解程序消解,消解完畢后145℃加熱趕酸至約1.0 mL消化液,轉移聚四氟乙烯罐中消化液至50 mL刻度離心管,用水多次洗滌聚四氟乙烯罐內壁,合并洗液至刻度離心管中,并定容至50 mL,待測。
參考GB 5009.268-2016《食品安全國家標準食品中多元素的測定》[12]中第一法(ICP-MS法)測定樣品中Na、Mg、Al、K、Ca、Ti、Cr、Mn、Ni、Cu、Zn、As、Se、Cd、Ba、Pb 16種元素,采用碰撞檢測模式消除Ca、Ti、As、Se元素的測定干擾,45Sc、72Ge、103Rh、185Re內標混合使用溶液由儀器在線加入,質量濃度均為200μg/L。
1.2.2 儀器測定條件 霧化器氣體流速0.96 L/min,輔助器氣體流速1 L/min,等離子體氣體流速17 L/min,碰撞池氣體流速(氦氣)5 mL/min,ICP射頻功率為1 500 W,脈沖電壓為875 V,掃描次數(shù)20次,重復次數(shù)2次,樣品沖洗時間13 s,讀數(shù)延遲7 s。
1.2.3 數(shù)據(jù)分析 方差分析采用SPSS Statistics 25.0(美國IBM公司)軟件,SVM算法優(yōu)化和數(shù)據(jù)圖繪制采用Matlab 2014a(美國Mathworks公司)軟件。
對荊條、油菜、洋槐、葵花4種植物源蜂蜜中16種元素含量按“1.2”方法分析,97例蜂蜜樣品平行測定3次;連續(xù)測定11次空白(2.0%硝酸溶液),以儀器響應值的3倍標準偏差除以工作曲線斜率,按1.0 g試樣定容至50 mL計算得方法檢出限(LOD),結果見表1。
表1數(shù)據(jù)顯示,受植物源生長環(huán)境、蜂蜜樣品存儲條件等因素影響,部分樣品中Al、Ti、Cr、Ni、As、Se、Cd、Ba、Pb測試結果小于方法檢出限(Min
表1 4種不同植物源蜂蜜中16種金屬元素含量Table 1 Contents of metal elements in the four kinds of botanical source honeys (mg/kg,n=3)
支持向量機是Cortes等[13]基于統(tǒng)計學理論提出的一種新的核函數(shù)機器學習算法,在鑒別分類及回歸預測分析中應用廣泛[14-16]。數(shù)據(jù)處理采用Lin等[17]開發(fā),李洋等[18]優(yōu)化的LIBSVM工具箱建立SVM分類模型。首先選取合適的核函數(shù)類型,研究顯示,基于高斯徑向基函數(shù)(Gaussian radial basis function)的SVM模型表現(xiàn)出優(yōu)秀的分類性能,且參數(shù)的優(yōu)化過程簡單[19],因此本研究選擇高斯徑向基函數(shù)建立SVM分類模型。
2.2.1 樣品集的劃分 采用Kennard-Stone法將4種植物源蜂蜜共計97例樣品按2∶1劃分為訓練集和測試集[20],利用訓練集建立判別模型,并將測試集作為未知樣品代入模型檢驗,樣品集劃分如下:訓練集65例,其中荊條蜜24例,洋槐蜜9例,葵花蜜7例,油菜蜜25例;測試集32例,其中荊條蜜12例,洋槐蜜4例,葵花蜜4例,油菜蜜12例。
2.2.2 選擇輸入變量建立模型 通過單因素分析選出4種植物源蜂蜜間具有顯著性差異的13種元素Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb,考慮截尾數(shù)據(jù)的存在,將輸入變量分為:①所有樣品均不含截尾數(shù)據(jù)的變量(7種):Na、Mg、K、Ca、Mn、Cu、Zn;②樣品中含截尾數(shù)據(jù)且按二分之一檢出限進行替換處理的數(shù)據(jù)變量(13種):Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb。將訓練集和測試集數(shù)據(jù)標準化到[1,2]之間,尋優(yōu)參數(shù)設置為默認參數(shù)(懲罰參數(shù)c為1,核函數(shù)參數(shù)g的默認值為1/k,k是類別數(shù))[16],將訓練集進行K折交叉驗證(K=3),建立蜂蜜植物源SVM分類模型,將測試集代入模型驗證。判別結果表明,含截尾數(shù)據(jù)建立的SVM分類模型,其訓練集、測試集共計97例樣品的綜合判別正確率達91.8%,高于不含截尾數(shù)據(jù)所建模型的綜合判別正確率82.5%,表明客觀存在的截尾數(shù)據(jù)中同樣包含較為重要的樣品信息,在建立分類模型時,應充分考慮截尾數(shù)據(jù),使用替換法按二分之一檢出限值處理,增加數(shù)據(jù)組輸入變量,以提高模型準確度。除葵花蜜在兩組變量輸入模型中判別正確率為100%外,其余植物源蜂蜜均存在歸類錯誤的情況。含截尾數(shù)據(jù)的訓練集中,65例樣品僅4例歸類錯誤,判別正確率達93.8%,而測試集中32例樣品的判別正確率僅為87.5%,可能由于樣品量較少,模型過擬合導致,因此,為進一步提高模型穩(wěn)健性,有必要進一步優(yōu)化SVM分類模型參數(shù)。
采用高斯徑向基核函數(shù)建立SVM模型時,懲罰參數(shù)c和核函數(shù)參數(shù)g對于控制模型的復雜度、逼近誤差及模型的測量精度有重要影響,可使用GS、GA、PSO算法對懲罰參數(shù)和核函數(shù)參數(shù)進行尋優(yōu)分析[16]。GS法在log2c與log2g為[-8,8]區(qū)間尋優(yōu),GS法尋優(yōu)結果見圖1A,隨著得到交叉驗證準確率的提高,log2c與log2g參數(shù)所形成的網(wǎng)格顏色由藍色變?yōu)辄S色,搜索得最佳參數(shù)c=4.00,g=1.41,交叉驗證最佳正確率為90.8%,將其投影到二維平面得GS法尋優(yōu)等高線圖(圖1B);設置種群數(shù)量為20,最大進化代數(shù)為50進行GA算法尋優(yōu),通過最佳適應度曲線發(fā)現(xiàn),在迭代次數(shù)為0~15時,交叉驗證率不斷提高,20次迭代后達到最大值,最佳參數(shù)為c=5.10,g=1.86,交叉驗證正確率為90.8%(圖1C);設置種群數(shù)量為20,最大進化代數(shù)為100進行PSO算法尋優(yōu),經(jīng)過80次迭代后交叉驗證正確率達最大值90.8%,最佳參數(shù)c=62.8,g=1.26(圖1D)。
圖1 SVM模型c、g參數(shù)尋優(yōu)結果圖Fig.1 The parameter optimization results of c and gA:3D display of GS optimization results(GS尋優(yōu)結果三維顯示);B:contour diagram of GS optimization results(GS尋優(yōu)結果等高線圖);C:GA optimization results(GA尋優(yōu)結果);D:PSO optimization results(PSO尋優(yōu)結果)
將訓練集結合尋優(yōu)參數(shù)建立SVM分類模型,并利用測試集進行驗證,結果見表2。3種尋優(yōu)算法建立的SVM分類模型綜合判別正確率均有一定程度的提高,其中,采用PSO算法進行參數(shù)尋優(yōu)后模型識別效果提升最為顯著,訓練集判別正確率為100%(圖2A),測試集有3例分類錯誤(圖2B),1例荊條蜜(分類標簽1)錯誤分類至油菜蜜(分類標簽4)中,1例洋槐蜜(分類標簽2)錯誤分類至荊條蜜中,1例油菜蜜分類至荊條蜜中,判別正確率為90.6%,且訓練集、測試集綜合判別正確率由91.8%提升至96.9%。
表2 優(yōu)化參數(shù)SVM模型分類結果Table 2 Model classification results of SVM by parameter optimization
圖2 PSO-SVM分類標簽和真實標簽圖Fig.2 PSO-SVM classification label and the actual labelA:training set(訓練集);B:testing set(測試集)
本文基于荊條、洋槐、葵花、油菜4種植物源蜂蜜中13種顯著差異性金屬元素,結合替換法處理的截尾數(shù)據(jù),有效建立了SVM蜂蜜植物源鑒別模型。方差分析結果表明,4種不同植物源蜂蜜中Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb存在顯著性差異;采用替換法處理的截尾數(shù)據(jù)作為輸入變量較不含截尾數(shù)據(jù)的SVM分類模型識別率高;利用PSO算法參數(shù)尋優(yōu)后建立的SVM判別模型對97例蜂蜜植物源屬性的綜合判別正確率達96.9%,可為食品屬性鑒別提供有益思路。