謝有超,彭黔榮,2,*,楊 敏,張 榮,付陽洋
(1.貴州大學(xué)化學(xué)與化工學(xué)院,貴州貴陽 550025;2.貴州中煙工業(yè)有限責(zé)任公司技術(shù)中心,貴州貴陽 550009;3.貴州大學(xué)藥學(xué)院,貴州貴陽 550025)
我國是世界上最早養(yǎng)蜂的國家之一,目前,蜂群總數(shù)已達(dá)到920萬群,占世界蜂群總數(shù)的13%。由于蜂群種類和數(shù)量的紛繁復(fù)雜,我國既是蜂產(chǎn)品生產(chǎn)大國,也是出口大國,2018 年我國蜂蜜行業(yè)產(chǎn)量約54.25萬噸,天然蜂蜜的出口量到達(dá)了10萬噸[1]。蜂蜜是指蜜蜂從花朵中采集花蜜并儲藏在蜂巢中的濃稠、甜味、似糖漿的物質(zhì),主要由碳水化合物(75%~80%)、水(15%~18%)、蛋白質(zhì)(0.29%~1.69%)、有機(jī)酸(0.1%~1%)和礦物質(zhì)(0.03%~0.9%)組成[2]。它是一味營養(yǎng)豐富、藥食同源的食品,共有180多種營養(yǎng)成分,老年人和嬰兒都能食用,具有補(bǔ)脾胃、潤腸、潤肺和解毒等功效。蜂蜜中含有的超氧化物歧化酶(SOD)是一種氧自由基清除劑,具有延緩衰老的功能[3]。此外,蜂蜜可作為輔助藥物用于臨床,能夠起到防癌以及抗癌的良好功效[4-5]。
蜂蜜中由于具有復(fù)雜多樣的化學(xué)成分,傳統(tǒng)的檢測方法如高效液相色譜法、高效液相色譜/質(zhì)譜法、氣相色譜法、氣相色譜/質(zhì)譜法等通過化學(xué)分析化學(xué)手段得出被測成分含量,是對蜂蜜內(nèi)部品質(zhì)檢測及摻假判別檢測的國際標(biāo)準(zhǔn)方法[6-7]。雖然這些方法敏感性較高,但設(shè)備成本高、檢測手段單一、操作過程復(fù)雜,對樣本有破壞,已難以滿足生產(chǎn)實踐中對蜂蜜品質(zhì)及摻假鑒別的大批量、快速、無損的檢測需求。近紅外(NIR)光譜技術(shù)以其具有快速、高效、環(huán)境友好等特點,在石油化工[8-9]、制藥[10-11]、煙草[12-13]等行業(yè)都扮演著重要作用。NIR分析手段也被廣泛應(yīng)用于蜂蜜中的果糖、葡萄糖、蔗糖、麥芽糖、水分以及微量成分的檢測、分析鑒別蜂蜜摻假、植物花蜜來源和產(chǎn)地鑒別。本文基于近紅外光譜技術(shù)在蜂蜜檢測的應(yīng)用現(xiàn)狀,綜述了化學(xué)計量學(xué)解析近紅外光譜對蜂蜜定量和定性分析的研究成果,對近紅外光譜技術(shù)在蜂蜜檢測中存在的問題進(jìn)行總結(jié),并進(jìn)一步對蜂蜜檢測方法提出展望。
近紅外光譜技術(shù)作為一種較為成熟的光譜技術(shù),可實現(xiàn)對蜂蜜中糖類、水分、羥甲基糠醛等理化指標(biāo)的快速檢測。定量模型的選擇直接影響著對蜂蜜中成分含量的預(yù)測能力,可分為線性和非線性校正方法。偏最小二乘法(PLS)作為一種線性回歸的多元校正方法,當(dāng)各變量內(nèi)部高度相關(guān)時,通過對檢測樣品的光譜陣X和濃度陣Y同時進(jìn)行分解,并在分解時考慮X和Y兩者間的相互關(guān)系,加強(qiáng)對應(yīng)計算關(guān)系,保證最佳校正模型的建立[14]。PLS是多元線性回歸、典型相關(guān)分析和主成分分析的完美結(jié)合,是所有多元校正方法里變量約束最少的方法,這種靈活性使之用于當(dāng)樣本數(shù)據(jù)遠(yuǎn)小于變量數(shù)時,也能得到最佳的回歸系數(shù),在光譜多元校正分析中得到了最為廣泛的應(yīng)用。
蜂蜜之所以被認(rèn)為是高價值的食品,是因為其碳水化合物(主要是葡萄糖和果糖)為生物體提供即時能量,蜂蜜中果糖和葡萄糖的含量及比例對蜂蜜的結(jié)晶狀態(tài)和營養(yǎng)效能也有較大影響[15]。當(dāng)前針對糖類的檢測手段如液相色譜法存在著分析成本高、環(huán)境不友好、檢測技術(shù)水平低等弊端,無法實現(xiàn)快速和實時檢測。蜂蜜中果糖、葡萄糖、蔗糖和麥芽糖等糖類成分均有-CH2、C-O、O-H等基團(tuán),在近紅外區(qū)均有特征吸收峰[16]。因此,采用近紅外光譜技術(shù)可以實現(xiàn)對蜂蜜中的糖類成分的檢測。
在目前的研究中,糖類成分的定量分析大多采用PLS校正模型,極少采用非線性定量模型如人工神經(jīng)網(wǎng)絡(luò)(ANN)對蜂蜜中的糖類成分進(jìn)行預(yù)測。大部分的研究在于如何采用不同的預(yù)處理方法和特征變量選擇提高PLS模型對蜂蜜中糖類含量的預(yù)測能力,通過模型建立和驗證過程中用到的統(tǒng)計參數(shù),如校正標(biāo)準(zhǔn)偏差(SEC)、預(yù)測標(biāo)準(zhǔn)偏差(SEP)、決定系數(shù)(R2)或相關(guān)系數(shù)(R)等對PLS校正模型進(jìn)行評價。
邱琳等[17]以多批次不同產(chǎn)地、不同品種的原蜜、煉蜜及商品蜂蜜樣本為研究對象,以液相色譜-示差折光法分別測定蜂蜜中果糖、葡萄糖和還原糖的化學(xué)值為參考值,用PLS分別建立三種糖類的近紅外光譜與化學(xué)值的定量分析模型,以標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、多元散射校正(MSC)、SNV作為預(yù)處理方法和以留一內(nèi)部交互驗證法確定最佳因子數(shù)所建的回歸模型的R分別為0.97390、0.92794、0.95268,SEP分別為0.647%、1.300%、1.270%。蜂蜜中糖類含量的預(yù)測結(jié)果均較好,表明應(yīng)用近紅外光譜技術(shù)可用于對蜂蜜糖類成分進(jìn)行定量檢測。
丁家欣等[18]用高效液相色譜-蒸發(fā)光散射檢測器(HPLC-ELSD),測定了國內(nèi)不同地區(qū)蜂蜜樣本中的葡萄糖和果糖,并將其測定的化學(xué)值作為建模的參考值。再用近紅外透射光譜法采集光譜,為解析復(fù)雜和重疊的光譜信息,采用一階導(dǎo)數(shù)和數(shù)據(jù)中心化對光譜進(jìn)行預(yù)處理。以交互驗證法優(yōu)化葡萄糖和果糖分析模型的最佳因子數(shù),建立蜂蜜光譜與葡萄糖和果糖的PLS模型,校正模型的R值分別為0.918、0.954,RMSEP為1.610、1.879。相比于HPLC-ELSD法測定蜂蜜中糖類含量,極大地減少了分析步驟和時間,為快速測定蜂蜜中葡萄糖和果糖提供了檢測方法。
蜂蜜中糖類成分的檢測可通過PLS建立線性的校正模型,在實際工作中,光譜變量與濃度之間具有一定的非線性。為了比較線性和非線性分析模型對于蜂蜜中糖類含量的測定能力,?zbalci等[19]采集了不同品牌的蜂蜜樣品光譜,分別以PLS和人工神經(jīng)網(wǎng)絡(luò)(ANN)建立對葡萄糖、果糖、蔗糖和麥芽糖含量的預(yù)測模型,發(fā)現(xiàn)以PLS建立的分析模型R值為0.964、0.965、0.968、0.949,而在930種不同拓?fù)浣Y(jié)構(gòu)中選擇出的四種最佳ANN模型的R值為0.965、0.965、0.978、0.956,這表明出兩種分析模型都能快速準(zhǔn)確測定蜂蜜中的糖類成分,并且由兩種化學(xué)計量學(xué)所建立的回歸模型得出的結(jié)果差異性不大,為檢測蜂蜜含量提供了不同研究思路。
在對不同蜂蜜糖類的預(yù)測中,PLS模型的R值都能達(dá)到90%以上,表明近紅外光譜技術(shù)采用PLS模型的預(yù)測值與傳統(tǒng)化學(xué)分析手段的參考值相關(guān)性極高,可使用近紅外光譜技術(shù)逐漸替代傳統(tǒng)的分析方法實現(xiàn)對蜂蜜糖類的快速檢測。非線性校正模型ANN和線性校正模型PLS的R值十分接近,但在模型建立的過程中,非校正模型的認(rèn)知難度要大于PLS。因此,在對蜂蜜糖類成分進(jìn)行快速、高效檢測時,首先考慮建立PLS線性校正模型。
水是蜂蜜中的第二大成分,被認(rèn)為是蜂蜜最重要的特征之一,其含量的多少會影響蜂蜜的理化性質(zhì),如粘度、比重量、風(fēng)味和結(jié)晶[20]。水分含量高的蜂蜜在高溫下容易發(fā)酵,引起變質(zhì)。蜂蜜中水分含量的高低受多種因素影響,如蜜源的種類、溫度和濕度、釀蜜時間的長短和養(yǎng)蜂人員的技術(shù)等[21]。目前,對蜂蜜中水分含量的測定方法常采用折光法,但其對檢測環(huán)境和檢測樣本的均勻性要求較高,因此,近紅外光譜法作為一種簡單快速的分析手段被逐漸用于蜂蜜水分的檢測之中。
水在近紅外譜區(qū)有一些特定的吸收譜段區(qū),研究者大多從特征波長的選擇方法進(jìn)行研究,通過對蜂蜜樣本近紅外光譜圖的特征波段進(jìn)行優(yōu)化選取建立最佳的PLS校正模型,從而不斷提高蜂蜜中對水含量的預(yù)測能力。
Li等[22]采用SN/T 0852-2000進(jìn)出口蜂蜜檢驗方法對市售蜂蜜樣品的水分含量進(jìn)行測定,作為模型參考值。為盡可能地包含樣品特征信息,降低噪音干擾,在對樣品進(jìn)行近紅外采集光譜后,采用一階導(dǎo)數(shù)+MSC+Savitzky Golay(SG)濾波平滑的方式對光譜進(jìn)行預(yù)處理。通過特征吸收峰位置確定波長范圍并建立水分的PLS定量分析模型。對校正模型進(jìn)行準(zhǔn)確性考察后得到其校正集的相關(guān)系數(shù)為0.9990,校正集的均方差(RMSEC)為0.174,實測值與模型預(yù)測值的相對偏差在±5%以內(nèi),證明了運(yùn)用近紅外技術(shù)檢測蜂蜜水分的可能性。
為提取最有效的光譜信息,減少建模所用的變量數(shù),提高模型對蜂蜜中水分的預(yù)測精度,屠振華等[23]在模型建立過程中利用了不同特征波長選擇辦法,以相對標(biāo)準(zhǔn)偏差(RSD)評價模型性能。結(jié)果發(fā)現(xiàn),以反復(fù)遺傳算法選擇作為一種全局性的特征波長選取方法,不僅有效使建模所用的變量數(shù)減少了95%,同時也提高了模型的預(yù)測精度和穩(wěn)定性,水分模型的相關(guān)系數(shù)也由未經(jīng)變量選擇的 0.9758 提高到了 0.9833,校正相對標(biāo)準(zhǔn)偏差(RSDC)和預(yù)測相對標(biāo)準(zhǔn)偏差(RSDP)分別由2.06%、2.34%下降到1.71%、2.04%。
不同光譜波段和不同預(yù)處理方法的選擇會直接影響所建近紅外光譜模型對蜂蜜水分的預(yù)測能力,劉晨[24]對77組蜂蜜樣本通過近紅外采集光譜,并通過由特征吸收和無特征吸收的六個波段建立模型。在六個不同波段之中分別以基線校正、消除常數(shù)偏移量、歸一化和一階導(dǎo)數(shù)四種不同光譜預(yù)處理方法校正模型,以相關(guān)系數(shù)和驗證校正標(biāo)準(zhǔn)差(RMSECV)評價模型性能。結(jié)果表明,在4850~5120 cm-1波段中,R可以達(dá)到99.42%,RMSECV為1.01,采用的不同預(yù)處理方法結(jié)合PLS對水分的預(yù)測準(zhǔn)確率都可以達(dá)到94%以上,這為快速建立蜂蜜水分分析模型的波段區(qū)間選擇提供了參考。
特征選擇作為近紅外光譜分析中不可缺失的一個環(huán)節(jié),其波長或波段的選擇能顯著影響PLS校正模型對于蜂蜜中水分含量的預(yù)測。特征變量提取的方法繁多,使用不同的方法可能會得到不同或差異較大的預(yù)測結(jié)果,因此,針對不同的蜂蜜樣本,除了通過水的特征吸收峰確定校正譜段外,還應(yīng)比較不同特征選擇方法對模型的影響,從而建立對蜂蜜水分含量預(yù)測效果最佳的PLS模型。
羥甲基糠醛(HMF)是衡量蜂蜜質(zhì)量的一個重要指標(biāo),它幾乎不存在于新鮮純正的蜂蜜中,因此可以反映蜂蜜新鮮程度及加工處理條件的優(yōu)劣。它是由糖的降解形成的,主要來自果糖,果糖在熱穩(wěn)定性上比蔗糖和葡萄糖差,在酸性條件下就會部分脫水生成羥甲基糠醛[25]。在過去的幾十年里,美國國家環(huán)境健康科學(xué)研究所致力對HMF進(jìn)行研究,以便獲得與之相關(guān)的毒性信息,一些研究人員已證實了HMF具有致癌能力[26]。最近的研究也表明HMF的代謝產(chǎn)物也可能是致癌化合物,危害人體健康[27-28]。
蜂蜜中的HMF一般用高效液相色譜法進(jìn)行測定,其前處理繁瑣、檢測時間長,不利于實時檢測。HMF對人體有害,消費者們希望能快速方便地檢測出其在蜂蜜中的含量,保證蜂蜜的品質(zhì)。近紅外光譜技術(shù)中的PLS校正模型由于在多元分析中能實現(xiàn)對小樣本光譜數(shù)據(jù)的分析,研究者常通過對模型預(yù)處理方法和潛變量數(shù)進(jìn)行優(yōu)化得到最佳的回歸模型,由顯著性檢驗等方法判斷近紅外光譜法與傳統(tǒng)分析手段有無差異。
鄭連姬等[29]利用高效液相色譜測定97個蜂蜜樣品HMF的化學(xué)值,并采用透反射方式采集樣品光譜。為了提高校正模型的預(yù)測能力,通過Norris求導(dǎo)法(Norris derivative)和一階導(dǎo)數(shù)及10個因子數(shù)對光譜進(jìn)行預(yù)處理,建立了蜂蜜中羥甲基糠醛的近紅外光譜與化學(xué)值間的校正模型,PLS模型的校正決定系數(shù)、交叉驗證系數(shù)分別達(dá)到0.99874、0.99620,RMSEP為2.02,RMSECV為2.40。與傳統(tǒng)高效液相色譜法所得的化學(xué)值進(jìn)行t顯著性檢驗,得出P>0.05,表示兩種方法檢測結(jié)果無顯著性差異,證實了近紅外光譜技術(shù)可用于對蜂蜜中HMF含量進(jìn)行測定。
在蜂蜜精制過程中可能會產(chǎn)生影響人體健康的5-羥甲基糠醛(5-HMF),Li等[22]對同仁堂收集的蜂蜜樣本通過近紅外光譜技術(shù)建立PLS模型,采用一階導(dǎo)數(shù)+SG平滑+MSC的光譜預(yù)處理方法,以預(yù)測殘差平方和(PRESS)為判據(jù)選擇潛變量因子數(shù)14建立校正模型,其模型很好地預(yù)測了不同精煉溫度和精煉時間的蜂蜜樣本,R到達(dá)了0.9963,RSEVC為0.7857,比率性能偏差(RPD)為11.3862,遠(yuǎn)大于RPD要求值3,這表明過程分析中使用的近紅外光譜等技術(shù)可應(yīng)用于蜂蜜的精制過程中5-HMF含量變化的定量測定。
為了快速測定意大利蜂蜜中5-HMF的含量,Apriceno等[30]將研究重點放在用近紅外光譜技術(shù)對不同植物來源的5-HMF進(jìn)行預(yù)測,采用高效液相色譜法獲得41份不同產(chǎn)地蜂蜜樣品的HMF,作為參考值。利用化學(xué)計量學(xué)對近紅外數(shù)據(jù)進(jìn)行特征提取,通過對光譜區(qū)域、回歸模型、散射和導(dǎo)數(shù)校正的深入研究,結(jié)果得出偏最小二乘回歸比主成分回歸預(yù)測能力更強(qiáng),以4252~4848 cm-1光譜區(qū)域結(jié)合光譜散射預(yù)處理所建立的分析模型的預(yù)測的相關(guān)系數(shù)為0.98,RPD為3.3,建立了魯棒性良好的校正模型,證明了基于NIR-化學(xué)計量學(xué)的方法是一種強(qiáng)有力的工具,可用于蜂蜜等復(fù)雜食品基質(zhì)的質(zhì)量控制,判斷蜂蜜的新鮮程度。
HMF的PLS模型的預(yù)處理方法和潛變量數(shù)經(jīng)優(yōu)化選擇后,其R能達(dá)到95%以上,經(jīng)t顯著性檢驗和RSD值可以得出近紅外光譜法與高效液相色譜法并無顯著差異,可用于對HMF的測定,并且預(yù)測效果極佳。因此,近紅外光譜法作為檢測HMF的一種新穎手段,可逐漸替代操作繁瑣的傳統(tǒng)化學(xué)分析方法,實現(xiàn)對蜂蜜中HMF地快速、高效檢測。
蜂蜜中微量物質(zhì)往往和蜂蜜的抗菌、抗腫瘤、抗氧化、抗炎等生物學(xué)功能相關(guān)[31]。其含量在蜂蜜中較少,由于常規(guī)檢測要求儀器性能好,檢測方法合理,業(yè)務(wù)人員水平高,不確定因素過多往往會導(dǎo)致對蜂蜜中微量成分的檢測不精確。而近紅外光譜法采用透射原理,無需對樣品進(jìn)行任何的預(yù)處理過程,建立良好的校正模型就能對微量成分的含量進(jìn)行快速預(yù)測。
pH是描述氫離子活度的參數(shù),可作為區(qū)分花蜜和甘露蜜以及判斷單花蜜是否真實的一個重要參數(shù),而蜂蜜總酸度反映了蜂蜜中酸性物質(zhì)含量的高低,是衡量蜂蜜是否發(fā)酵的重要參數(shù),也是區(qū)分花蜜和甘露蜜的一個重要參考指標(biāo)[32]。李水芳[33]對來自全國不同地區(qū)的15 種蜂蜜樣本測得的pH和總酸度與樣品近紅外光譜進(jìn)行分析。基于歐式距離的K-S方法把樣本集劃分為校正集和驗證集,并利用蒙特卡洛方法剔除奇異值,再經(jīng)競爭性自適應(yīng)重加權(quán)采樣(CARS)變量選擇法結(jié)合PLS回歸進(jìn)行變量篩選來提高模型的穩(wěn)健性,優(yōu)化后pH和總酸度PLS模型的預(yù)測能力明顯提高,R可以分別達(dá)到0.9058、0.9083,RMSEP分別為0.1196、0.4674。
酚類物質(zhì)是蜂蜜外觀和功能特性的重要組成部分,被認(rèn)為具有很高治療價值,而蜂蜜中礦物質(zhì)(特別是銅和鐵)的存在可能導(dǎo)致高活性羥基自由基的產(chǎn)生[34-35]。另一方面,水溶性維生素,特別是維生素C(抗壞血酸)的抗氧化特性,有助于提高機(jī)體免疫力[36]。Escuredo等[37]首次運(yùn)用近紅外光譜技術(shù)對蜂蜜中的抗氧化劑化合物進(jìn)行預(yù)測,以伊比利亞半島西北部的60個蜂蜜樣本建立起酚類、類黃酮、銅和維生素C的分析模型,通過留一內(nèi)部交互驗證法選擇最佳因子數(shù)避免過度擬合,分別采用不同的光譜的預(yù)處理方法建立四者的PLS模型,以RMSEV值和RPD量化模型性能。研究表明,所建模型對酚類和類黃酮總值具有較高的預(yù)測能力(RPD>3)。
為了進(jìn)一步提高抗氧化活性以及酚類物質(zhì)模型的預(yù)測能力,Haroon[38]基于近紅外光譜技術(shù)對蜂蜜成分進(jìn)行研究,對6 種不同的品種蜂蜜樣品采用不同的預(yù)處理方法進(jìn)行PLS分析,首次實現(xiàn)了對類胡蘿卜素含量以及三價鐵離子進(jìn)行快速檢測,其建立的五個定量模型對蜂蜜的總酚含量、總黃銅含量、總類胡蘿卜素含量、三價鐵離子和 1,1-二苯基-2-三硝基苯肼相關(guān)系數(shù)達(dá)到了0.95~0.96,RPD為3.45~3.89,所建立的校正模型能很好地量化蜂蜜的抗氧化性成分。
酶活性是評估蜂蜜質(zhì)量的基礎(chǔ),Huang等[39]為了研究溫度效應(yīng)對淀粉酶活性的動力學(xué)機(jī)制,對來自不同植物來源的蜂蜜樣本基于可見光和近紅外(Vis/NIR)光譜分析,應(yīng)用PLS和最小二乘支持向量機(jī)(LS-SVM)算法來建立Vis/NIR光譜與淀粉酶活性之間的定量關(guān)系。結(jié)果發(fā)現(xiàn),通過高斯濾波平滑-標(biāo)準(zhǔn)正態(tài)變量(GF-SNV)預(yù)處理并結(jié)合連續(xù)投影算法(SPA)選擇特征波長建立LS-SVM模型(GF-SNV-LS-SVM)比PLS更能快速測定蜂蜜的淀粉酶活性,在校正集和預(yù)測集中都有更高的決定系數(shù),R2可以達(dá)到0.8872。因此,證實采用Vis/NIR光譜技術(shù)結(jié)合化學(xué)計量學(xué)可快速,無損地測定蜂蜜的淀粉酶活性。
PLS模型因其突出的優(yōu)勢,結(jié)合化學(xué)計量學(xué)方法被逐漸用于蜂蜜微量成分的檢測之中。通過RPD值驗證了近紅外光譜技術(shù)的預(yù)測值和傳統(tǒng)的分析化學(xué)、儀器化學(xué)手段對蜂蜜檢測的化學(xué)值并無顯著差異。非線性校正方法如(SVM)也可用于蜂蜜檢測之中,在預(yù)測能力上看,可能比PLS方法的效果更好。因此,在進(jìn)行系統(tǒng)地檢測蜂蜜的成分時,不僅僅應(yīng)考慮線性校正方法,對非線性校正手段如ANN和SVM都應(yīng)進(jìn)行模型建立的考慮,從而針對不同的蜂蜜樣本成分含量的檢測選擇出最佳的定量分析模型。
蜂蜜作為一種天然食品,其營養(yǎng)價值愈來愈受到人們的關(guān)注,然而不少不法商人受利益驅(qū)動,使蜂蜜摻假成為繼橄欖油[40-41]和牛奶[42-43]之后,最有可能成為摻假的目標(biāo)食品,蔗糖、果糖、葡萄糖、麥芽糖及高果糖漿等都是蜂蜜中最為常見的摻假物。蜂蜜摻假不僅極大損害了消費者利益,給消費者帶來健康問題,同時也導(dǎo)致食品信任問題,影響了我國蜂蜜出口,因此,蜂蜜摻假問題越來越受到眾多學(xué)者的關(guān)注。蜂蜜摻假鑒定技術(shù)隨著摻假手段的發(fā)展也不斷在發(fā)展,現(xiàn)代分析手段對蜂蜜摻假問題進(jìn)行研究,為定性分析蜂蜜摻假的研究方向提供了思路。蜂蜜的鑒別摻假技術(shù)及特點如表1。
當(dāng)前現(xiàn)有的蜂蜜摻假鑒別方法各具優(yōu)缺點,近紅外光譜技術(shù)因其具有快速無損鑒別的優(yōu)勢,一直是鑒定蜂蜜摻假問題的研究重點和熱點,所涉及到的模式識別工具如無監(jiān)督的聚類模型和有監(jiān)督的分類模型從不同的角度對蜂蜜進(jìn)行摻假鑒別。不同摻假類別的蜂蜜采用不同的定性分析模型的鑒別能力有所差異,研究者往往根據(jù)原理不同的算法建立多種分類器,比較得出合適特定蜂蜜樣本的最佳分析模型。
麥芽糖漿(MS)是蜂蜜最常見摻雜的甜味劑,Li等[49]首次運(yùn)用近紅外光譜法鑒別摻雜MS蜂蜜,并比較不同摻雜程度的MS和高果糖玉米糖漿(HFCS)蜂蜜在最小二乘線性判別(PLS-LDA)模型中的鑒別能力。在PLS-LDA模型的優(yōu)化過程中,CARS用來選擇關(guān)鍵變量可以提高模型的預(yù)測精度,相比于未對波段進(jìn)行特征選取的PLS-LDA模型,CARS-PLS-LDA方法對HFCS摻假蜂蜜和MS摻假蜂蜜的判斷準(zhǔn)確度可以達(dá)到86.3%和96.1%。
Ferreiro等[50]對西班牙的33 種不同花蜜來源的蜂蜜運(yùn)用可見-近紅外光譜與化學(xué)計量學(xué)相結(jié)合的方法快速鑒別蜂蜜摻假,通過不同的無監(jiān)督和有監(jiān)督學(xué)習(xí)方式對摻假蜂蜜進(jìn)行區(qū)分。結(jié)果發(fā)現(xiàn)無監(jiān)督學(xué)習(xí)方式、層次聚類法(HCA)和主成分分析(PCA)可以顯示出不同程度蜂蜜摻假的空間分布,但是不能實現(xiàn)完全的區(qū)分。而通過有監(jiān)督學(xué)習(xí)方式,LDA可以實現(xiàn)九種摻假水平(在10%~90%范圍內(nèi))之間的完全區(qū)分,所建立的PLS回歸模型得到了高相關(guān)系數(shù),對于摻雜程度低于45%的蜂蜜,外部預(yù)測模型中的最大誤差低于1%。
Guelpa等[51]將近紅外光譜與化學(xué)計量學(xué)相結(jié)合,對南非蜂蜜、故意摻入糖溶液(葡萄糖和果糖)蜂蜜以及廉價進(jìn)口蜂蜜進(jìn)行鑒別。采用臺式實驗室儀器、小型手持便捷式以及移動模塊化三種不同的近紅外設(shè)備采集樣品光譜,通過K-S算法改進(jìn)后的duplexs算法將樣本集劃分為訓(xùn)練集和測試集。在不同的儀器設(shè)備上采集的光譜采用不同的光譜預(yù)處理方法建立PLS-DA判別模型,以交互驗證和測試集的正確分類率來比較在不同儀器上所建立模型的性能。研究表明,采用有監(jiān)督的PLS-DA在三種不同儀器上對摻假蜂蜜的總體分類精度都能達(dá)到93.3%以上。
PLS-LDA在蜂蜜摻假鑒別中應(yīng)用十分廣泛,作為一種有監(jiān)督的分析模型,對摻假蜂蜜的鑒別精度都能達(dá)到90%以上,且通過對波段進(jìn)行特征選擇,其判斷準(zhǔn)確度能得到極大的提升。HCA作為無監(jiān)督聚類分析中應(yīng)用最為廣泛的方法,因為沒有數(shù)據(jù)的存在,其鑒別能力要低于PLS-LDA,甚至不能實現(xiàn)摻雜物類型的完全區(qū)分。因此,在對蜂蜜摻假進(jìn)行檢測時,盡量建立有“學(xué)習(xí)”樣本的有監(jiān)督的定性分析模型,并通過不同的分類算法比較得出最佳分類器,實現(xiàn)對摻假物的區(qū)分。
蜂蜜是一種天然產(chǎn)品,蜜蜂從植物中采集花蜜,并儲存在蜂巢中作為食物食用。蜂蜜的成分和性質(zhì)取決于蜜蜂在其生產(chǎn)過程中捕獲的花蜜的植物來源。而傳統(tǒng)對于蜜源鑒定的方法一般都存在著需對樣品進(jìn)行破壞性處理,分析費時、操作復(fù)雜,同時分析過程中會用到強(qiáng)酸或強(qiáng)腐蝕性等有害試劑,影響檢測人員的安全和健康[53]。因此,有必要探索一種新的快速、廉價、安全的測定蜂蜜蜜源的方法。
近紅外光譜對蜜源的鑒別大多采用有監(jiān)督的模式識別方法,如反向傳播人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)、偏最小二乘判別分析(PLS-DA)和SVM等。分類模型的算法原理不同,其正確判別率往往有所差異。鑒別分析人員不能通過蜂蜜光譜數(shù)據(jù)直接確定定性分析模型,往往需要建立不同分類器,比較得出分類正確率最高的模型。
為了實現(xiàn)快速無損識別蜂蜜蜜源,Chen等[54]使用帶光纖探針的近紅外儀器對洋槐蜜、椴樹蜜、油菜蜜、荊花蜜和棗花蜜5種國產(chǎn)蜂蜜進(jìn)行分類。分別采用一階導(dǎo)數(shù),SG平滑和二階導(dǎo)數(shù)對光譜進(jìn)行預(yù)處理,以基于主成分分析的馬氏距離判別分析法(MD-DA)和反向傳播人工神經(jīng)網(wǎng)絡(luò)(BP-ANN)建立分類模型。結(jié)果表明,BP-ANN模型比MD-DA具有更好的預(yù)測能力,其校準(zhǔn)集和驗證集的分類正確率均在90%以上。
單一花種蜂蜜往往比混合蜜更具商業(yè)價值,Minaei等[55]基于VIS-NIR高光譜成像技術(shù)對波蘭的五種單一蜜源蜂蜜進(jìn)行判別,從快速和非破壞角度為蜜源鑒別提供了檢測手段。通過PCA對高光譜圖像進(jìn)行降維,以S-G平滑算法對圖像去噪,使用徑向基(RBF)神經(jīng)網(wǎng)絡(luò)、SVM和隨機(jī)森林(RF)三種不同的機(jī)器學(xué)習(xí)算法預(yù)測蜜源。結(jié)果表明,RBF不論在預(yù)測精度和計算時間方面都優(yōu)于SVM和RF,可對單一蜜源實現(xiàn)正確分類。
線性判別法和非線性判別法的性能孰優(yōu)孰劣在化學(xué)計量學(xué)中一直是討論的重點。Haroon等[56]基于6種不同蜜源的PCA數(shù)據(jù)分別建立線性LDA和非線性LS-SVM的判別模型,通過交互驗證確定兩者模型的最佳主成分個數(shù)。在優(yōu)化過程中,以6個主成分建立的LDA模型和以9個主成分確定LS-SVM模型有最高的識別率,且LDA模型的判別率要高于LS-SVM,訓(xùn)練集和測試集的判別率均為100%。
Gan等[57]對不同植物來源的蜂蜜樣品采用四種不同分析手段進(jìn)行鑒別分析。使用SNV方法對光譜數(shù)據(jù)進(jìn)行預(yù)處理,建立偏最小二乘判別分析(PLS-DA)模型用于植物來源分類,PCA用于減少數(shù)據(jù)的維度,剔除異常值,應(yīng)用支持向量機(jī)判別分析(SVM-DA)和區(qū)間偏最小二乘(iPLS)分別優(yōu)化分類器的判別結(jié)果。結(jié)果發(fā)現(xiàn)以電子鼻(EN)、電子舌(ET)、近紅外光譜(NIR)和中紅外光譜(MIR)四種分析手段建立的模型對校正集和預(yù)測集樣本的鑒別精度幾乎都是100%。
不同的判別模型的鑒別能力有所差異,但有監(jiān)督的模式識別的正確率往往要優(yōu)于無監(jiān)督的模式識別,比如BP-ANN模型就比MD-DA具有更好的預(yù)測能力。由于有監(jiān)督的模式識別的原理不同,孰優(yōu)孰劣需要根據(jù)蜂蜜樣本的光譜數(shù)據(jù)建立模型才能進(jìn)行比較,但正確分類率都能達(dá)到90%。因此,對蜂蜜蜜源的鑒別首先考慮有監(jiān)督的分類模型,結(jié)合光譜數(shù)據(jù)特點選擇正確判別率最高的定性分析模型。
蜂蜜品質(zhì)與產(chǎn)地關(guān)系密切,歐盟規(guī)定:蜂蜜標(biāo)簽應(yīng)標(biāo)注產(chǎn)地,同一植物來源而產(chǎn)地不同的蜂蜜,價格會有所差異[58]。中國作為蜂蜜的生產(chǎn)和出口大國,日益嚴(yán)峻的商業(yè)競爭更要求加大對于蜂蜜產(chǎn)地標(biāo)簽的重視。由于蜂蜜產(chǎn)地的差異主要來自環(huán)境因素,這種差異較摻假和蜜源植物的差異小,因此產(chǎn)地判別比摻假和蜜源植物判別更加困難[59]。
近紅外光譜技術(shù)在中藥[60-61]、農(nóng)產(chǎn)品[62-63]等產(chǎn)地溯源的研究已比較成熟。蜂蜜產(chǎn)地鑒別由于光譜數(shù)據(jù)差異性小,對其研究較晚,但還是通過化學(xué)計量學(xué)中的模式識別方法如PLS-LDA對蜂蜜產(chǎn)地進(jìn)行鑒別研究,并采用不同的預(yù)處理方法和特征變量選擇提高模型的判別正確率。
李水芳等[64]為實現(xiàn)蜂蜜產(chǎn)地的快速鑒別,對4種不同產(chǎn)地的蜂蜜樣品通過近紅外光譜結(jié)合化學(xué)計量學(xué)方法對蜂蜜產(chǎn)地進(jìn)行判別分析。采用基于歐式距離K-S法把樣本劃分為訓(xùn)練集和預(yù)測集,對光譜數(shù)據(jù)進(jìn)行一階導(dǎo)數(shù)和歸一化預(yù)處理,再用小波變換(WT)進(jìn)行壓縮和濾噪。以徑向基神經(jīng)網(wǎng)絡(luò)(RBFNN)和偏最小二乘-線性判別分析(PLS-LDA)對不同產(chǎn)地的蜂蜜樣品建立判別模型。研究表明,WT結(jié)合線性的PLS-LDA建模比WT結(jié)合非線性的RBFNN建模更適合蜂蜜產(chǎn)地判別,驗證集的判別總正確率為90.9%,從而證實近紅外光譜技術(shù)具有快速判別蜂蜜產(chǎn)地的潛力。
為創(chuàng)建特定的產(chǎn)地光譜指紋,Woodcock等[65]對法國科西嘉島蜂蜜樣品的近紅外光譜數(shù)據(jù)通過一系列化學(xué)計量工具進(jìn)行分析。通過PCA對科西嘉島和非科西嘉島的光譜數(shù)據(jù)進(jìn)行初步分析,研究各種光譜預(yù)處理方法對偏最小二乘法回歸模型的判別能力。研究發(fā)現(xiàn),使用交叉驗證確定主因子數(shù),變量選擇特定波段和二階導(dǎo)數(shù)數(shù)據(jù)預(yù)處理開發(fā)的最佳PLS判別模型對科西嘉和非科西嘉蜂蜜樣品正確分類結(jié)果分別是90.0%和90.3%,為科西嘉島蜂蜜創(chuàng)建了特定光譜指紋。
Herrero等[66]為了開發(fā)單一,快速的判別模型,對15個是來自加利西亞受保護(hù)地理標(biāo)志(PGI)的蜂蜜和15個非PGI標(biāo)簽蜂蜜的近紅外光譜數(shù)據(jù)進(jìn)行SNV預(yù)處理以消除基線漂移后,分別采用PLS-DA、簇類的獨立軟模式法(SIMCA)、K最鄰近法(KNN)和多層前饋神經(jīng)網(wǎng)絡(luò)(MLF-NN)建立分類模型,從敏感性和特異性來評價模型用于判別分析的能力。結(jié)果顯示,NIR信息數(shù)據(jù)與SIMCA算法的組合開發(fā)的模型,其特異性較高而敏感性較低,可以用于鑒別真正的PGI蜂蜜。
目前,采用近紅外光譜技術(shù)對蜂蜜產(chǎn)地鑒別的研究不多,大部分建立的分析模型是PLS-LDA,通過不同預(yù)處理方法和變量選擇方法提高PLS-LDA模型的判別能力,分析模型較為單一。因此,需結(jié)合蜂蜜光譜數(shù)據(jù)開發(fā)多種分類模型,拓展近紅外光譜技術(shù)對蜂蜜產(chǎn)地的鑒別檢測,從而深化對蜂蜜全面、系統(tǒng)地研究。
近年來,隨著現(xiàn)代儀器分析技術(shù)的不斷進(jìn)步,近紅外光譜技術(shù)在很多傳統(tǒng)行業(yè)的檢測方面方興未艾。作為一種新型的分析手段,憑借其快速、準(zhǔn)確、無損以及環(huán)境友好等優(yōu)勢,在蜂蜜成分含量測定、真?zhèn)螕郊勹b別、蜂蜜蜜源鑒別和產(chǎn)地鑒別都已取得了很大的進(jìn)展。但是,應(yīng)用近紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)對蜂蜜進(jìn)行檢測還存在一些問題:
a.在蜂蜜成分的定量分析中,采用的最多是PLS建立的線性回歸模型來預(yù)測成分含量,而對于非線性模型的研究較少,如決策樹回歸、人工神經(jīng)網(wǎng)絡(luò)和KNN回歸方法。此外,由于蜂蜜在不同地區(qū),不同季節(jié)的成分含量差異較大,所建立的預(yù)測模型往往魯棒性能差。
b.對于蜂蜜摻雜物的研究,目前的近紅外光譜技術(shù)還無法做到對所有的摻雜物進(jìn)行檢測,隨著蜂蜜需求量的增加,蜂蜜直接或間接摻入糖和劣質(zhì)蜂蜜的問題會日益凸顯,迄今為止也沒有一種用于蜂蜜摻雜物測定的便捷式設(shè)備。
c.對蜂蜜的地理和植物來源的判別分析上,它涉及到多因素問題,往往需要多位經(jīng)驗豐富的專家才能實現(xiàn)對蜜源和產(chǎn)地的判別,因此在模型的建立上,前期成本比較高昂。
未來,對蜂蜜的檢測會越來越朝著快速無損的分析技術(shù)方向進(jìn)行,近紅外光譜技術(shù)作為其中的佼佼者,也不會依循單一的分析手段,會結(jié)合多變量數(shù)據(jù)分析和機(jī)器學(xué)習(xí)方法,深度挖掘數(shù)據(jù)背后的含義,開發(fā)多類預(yù)測模型,擴(kuò)展其在蜂蜜檢測中的應(yīng)用。另外,便捷式設(shè)備也將逐漸開發(fā)并應(yīng)用到用到蜂蜜檢測的各個方面之中,而不再局限在分析實驗室中,更能保障食品安全,提升人們對蜂蜜食品安全的信心。