郭 城,吳衛(wèi)成,諶 迪,葉 沁,盧文靜,關(guān)榮發(fā),肖朝耿*
(1 中國計量大學生命科學學院 杭州310018 2 浙江省農(nóng)業(yè)科學院食品科學研究所 杭州310021 3 浙江工業(yè)大學食品科學與工程學院 杭州310014)
蜂王漿是哺育蜂舌腺和上顎腺分泌的一種天然漿狀物,其成分復雜,不僅含有大量的蛋白質(zhì)、氨基酸、糖類、脂類、維生素和礦物質(zhì)[1],還含有特有的王漿酸,其中蛋白質(zhì)含量最多,這些肽和蛋白質(zhì)類都是重要的營養(yǎng)和保健因子,有提高免疫力,增強體質(zhì),促進智力及抗衰老等作用[2]。
蜂王漿的蛋白屬于優(yōu)質(zhì)蛋白,然而其受貯藏條件的影響大,研究表明隨著溫度和時間的增加,蜂王漿中水溶性蛋白質(zhì)的含量會逐漸減少,且不同溫度下的下降速率不同,同時水溶性蛋白質(zhì)降解產(chǎn)物可發(fā)生聚合,從而導致水不溶性蛋白的增加[3]。蜂王漿的品質(zhì)變差主要體現(xiàn)在水溶性蛋白質(zhì)降解,這說明蜂王漿品質(zhì)與蛋白質(zhì)的變化有關(guān)[4-7]。在保證蜂王漿新鮮度的前提下,測定蛋白質(zhì)含量是一項必不可少的工作。國家蜂王漿標準中凱氏定氮法測定的是總氮含量,包括非蛋白氮,試驗過程繁瑣費時??捡R斯亮藍染色法測定的是可溶性蛋白質(zhì)含量,占蜂王漿蛋白總量的46%~89%,是蜂王漿蛋白質(zhì)的主要活性成分,雖然考馬斯亮藍染色法較為快捷,但是需要預處理,在多批次的樣品檢測時,仍繁瑣費時。
近年來,傅里葉變換中紅外光譜技術(shù)憑借快速、無損、高靈敏的優(yōu)點,在食品、農(nóng)業(yè)、醫(yī)藥領(lǐng)域的應用越來越廣泛[8-10]。Sahlan 等[11]利用衰減全反射中紅外光譜結(jié)合化學計量學方法鑒別真?zhèn)畏涿?,鑒別效果理想。吳黎明等[12-13]利用傅里葉變換中紅外光譜技術(shù)分析不同貯存條件下蜂王漿相對峰強與貯存條件的相關(guān)性,結(jié)果表明通過中紅外光譜反映不同貯存條件下蜂王漿新鮮度是可行的,然而沒有結(jié)合化學計量學法對蜂王漿紅外光譜建立定量分析模型。陳繁等[14-15]使用中紅外光譜技術(shù)結(jié)合支持向量機算法對蜂王漿進行冷凍常溫二分類、貯藏時間三分類的定性分析,并通過拉曼光譜結(jié)合偏最小二乘法對蜂王漿的水分、蛋白質(zhì)含量進行定量預測,結(jié)果表明用中紅外光譜技術(shù)結(jié)合化學計量學檢測不同貯藏條件的蜂王漿是可行性的。競爭性自適應權(quán)重取樣(CARS)法是一種基于回歸系數(shù)絕對值大小篩選波長點的方法。通過每次篩選去掉PLS 回歸模型中回歸系數(shù)絕對值最小的點,保留權(quán)重大的波長點,交互驗證出模型驗證均方根誤差最低的子集,可有效提取出針對預測對象最為關(guān)鍵的波長點組合[16]。李水芳等[17]使用近紅外光譜和化學計量學方法對蜂蜜中還原糖等12 個理化參數(shù)定量分析時,發(fā)現(xiàn)經(jīng)蒙特卡洛交互驗證(MCCV)法篩除異常樣本后的數(shù)據(jù)結(jié)合CARS 法挑選的變量得到的PLS 模型預測能力比優(yōu)化前明顯提高。本研究將該方法應用于蜂王漿中紅外光譜數(shù)據(jù)的特征波長點選擇,建立蜂王漿水溶性蛋白質(zhì)、總糖的PLS 預測模型,探究對其定量預測的可能性。
蜂王漿樣本為不同年份收集的不同產(chǎn)地、溫度、時間條件下保存下的油菜漿,分別來自浙江富陽(杭州康力食品有限公司)、浙江蕭山(杭州德興蜂業(yè)有限公司)、青海(南京江山食品有限公司)。采集蜂王漿后迅速帶回實驗室,-18 ℃保存。將樣品分為每份15 mL 的小份,分別在-18,4,25 ℃條件下保存。在樣品采集后的0,7,14,30,60,84 d,分別進行紅外光譜采集和理化分析。
牛血清蛋白標準品(BSA),國藥集團化學試劑有限公司;考馬斯亮藍G-250 溶液,杭州龍山精細化工有限公司。
紫外-可見分光光度計(UV-6100),上海元析儀器有限公司;傅里葉變換中紅外光譜儀(VERTEX70),配有衰減全反射附件,美國BRUKER 公司。
1.3.1 考馬斯亮藍染色法測定蜂王漿水溶性蛋白質(zhì) 標準曲線的繪制:將稀釋成0.1 mg/mL 的BSA 標準蛋白溶液按不同質(zhì)量濃度分裝于具塞試管,編號1~6,向各試管加入5 mL 考馬斯亮藍G-250 溶液,混合均勻后放置5 min,用1 cm 光徑的比色皿在波長595 nm 處比色測量吸光度。以水溶性蛋白質(zhì)含量為橫坐標,吸光值為縱坐標繪制標準曲線。
樣品的測定:吸取經(jīng)4 000 r/min 離心處理的蜂王漿上清液1 mL 于柱塞試管中,混合均勻,向各管中加入5 mL 考馬斯亮藍溶液,搖勻后放置5 min,用1 cm 光徑比色皿在波長595 nm 處比色測定吸光度,每個樣品重復測量3 次,通過標準曲線查得每毫升溶液中水溶性蛋白質(zhì)的含量。
1.3.2 亞鐵氰化鉀法測定蜂王漿總糖 總糖含量測定采用GB 9697-2008《蜂王漿》國家標準規(guī)定的亞鐵氰化鉀法。
測試前,提前更換在烘箱(120 ℃)干燥12 h后硅膠干燥劑,儀器預熱15 min 后進行儀器自檢、性能測試和采集背景光譜。用膠頭吸管吸取適量蜂王漿樣品,涂抹在衰減全反射ATR 附件上,以均勻覆蓋ATR 上的圓形晶體為準。為避免樣品間的交叉污染,每測完1 個樣品后用無水乙醇清洗并擦拭干凈。
光譜測定條件:掃描溫度15~25 ℃,掃描波長4 000~600 cm-1,分辨率4 cm-1,樣本掃描16 次,背景掃描16 次,每個樣品掃描3 次,將收集的光譜平均處理后,作為待分析的光譜數(shù)據(jù)。
采用PLS 結(jié)合CARS 法選擇的特征波長點,分別建立蜂王漿水溶性蛋白質(zhì)和總糖含量預測的PLS 預測模型,并與其它波長選擇方法所建立的PLS 模型進行預測性能比較。
采用校正集相關(guān)系數(shù)Rc和驗證集相關(guān)系數(shù)Rp、校正交叉驗證均方根誤差、預測均方根誤差來評價預測模型的精度和穩(wěn)定性,其中各評價指標的計算方法參考文獻[18]。一般,Rc和Rp越接近于1,RMSECV 和RMSEP 越接近于0,說明模型穩(wěn)定性越好。
用OPUS 軟件采集光譜,Unscrambler X 做光譜預處理,用MATLAB 做光譜的波長變量選擇和PLS 建模分析。
蜂王漿樣品的原始中紅外光譜見圖1,圖2。可以看出,雖然不同貯存條件下蜂王漿在波形、波峰上十分相似,但是隨著時間和溫度的上升,譜峰波數(shù)和峰強仍發(fā)生明顯變化,1 650 cm-1處的吸收峰向低波數(shù)1 646 cm-1處移動,1 550 cm-1處的吸收峰向高波數(shù)1 552 cm-1處移動,1 060 cm-1處的吸收峰向低波數(shù)1 058 cm-1處移動,相同時間室溫貯存的蜂王漿的紅外光譜峰強明顯低于冷凍條件下貯存的蜂王漿。結(jié)合前人研究對蜂王漿中紅外光譜的特征峰指認如下:1 700~1 520 cm-1處為蛋白質(zhì)的吸收峰,其中1 700~1 600 cm-1處為酰胺I帶,主要為C=O 伸縮振動,1 565~1 520 cm-1處為酰胺II 帶,主要為N-H 伸縮振動,1 050 cm-1處主要是碳水化合物如糖類的C=O 振動,900~600 cm-1處可能含有糖的C-O 伸縮振動[19-22]。對蜂王漿中水溶性蛋白質(zhì)和總糖含量的定量可能在上述波段內(nèi)。
圖1 蜂王漿樣本的中紅外光譜Fig.1 Mid-infrared spectrum of royal jelly samples
圖2 不同貯存條件下的蜂王漿中紅外光譜圖譜峰變化Fig.2 Changes of peaks in mid-infrared spectrum of royal jelly under different storage conditions
蜂王漿樣品的水溶性蛋白質(zhì)和總糖含量分析結(jié)果見表1。蜂王漿樣品水溶性蛋白質(zhì)含量最大值為4.5%,最小值為3.24%;總糖含量最大值為13.83%,最小值為5.05%。以上指標能較好地反映不同品質(zhì)的蜂王漿,用其建立定量模型的適用性較好。
表1 149 份蜂王漿樣品中水溶性蛋白質(zhì)、總糖含量Table 1 Water soluble protein and total sugar content in 149 royal jelly samples
偏最小二乘法(PLS)是將多元線性回歸、典型相關(guān)性分析、主成分分析相結(jié)合,提取自變量組的主成分,用自變量預測因變量,并建立兩組相關(guān)變量之間線性回歸模型的一種分析方法,是應用較廣泛的化學計量學方法之一。基于PLS 的蜂王漿水溶性蛋白質(zhì)、總糖含量在一階導數(shù)、二階導數(shù)、標準正態(tài)變換(SNV)、多元散射校正(MSC)、Savitzky-Golay 平滑等預處理方法組合下的校正集交叉驗證均方根誤差(RMSECV)、校正集相關(guān)系數(shù)(Rc)、預測均方根誤差(RMSEP)、預測相關(guān)系數(shù)(Rp)見表2。
從表2 中水溶性蛋白質(zhì)全波長PLS 定量分析模型結(jié)果可看出,各預處理方式的數(shù)據(jù)均不理想。經(jīng)比較,全波長最優(yōu)預處理方法是SG 平滑+一階導數(shù),校正集系數(shù)最高,僅0.7281,驗證集相關(guān)系數(shù)為0.7876,RMSECV 為0.1958,RMSEP 為0.2033,建模效果較差。建立總糖的全波長PLS 定量模型,對比多種預處理方式處理結(jié)果,SG 平滑+二階導數(shù)處理下結(jié)果最優(yōu),校正集相關(guān)系數(shù)0.7419,驗證集相關(guān)系數(shù)為0.7662,RMSECV 為1.2568,RMSEP為1.7582,建模效果不理想。
表2 不同預處理方法的全波長定量模型結(jié)果Table 2 Full-wavelength quantitative model results of different pretreatment methods
考慮到收集的樣本數(shù)據(jù)可能存在偶然誤差,先使用使用蒙特卡洛交互驗證(MCCV)法剔除奇異樣本。MCCV 法是根據(jù)產(chǎn)生的隨機變量來交叉驗證,計算模型的預測誤差平方和(PRESS)值,按出現(xiàn)誤差的次數(shù)高、低排列,根據(jù)出現(xiàn)的頻次判斷樣本奇異點,MCCV 法相比傳統(tǒng)方法有較高的識別奇異點的能力[23]。
首先通過PLS 回歸模型確定最佳主因子數(shù),按照4∶1 的比例隨機將樣本集劃分為校正集和驗證集,并循環(huán)2 000 次后得到各樣本的預測殘差,計算每個樣本預測殘差的均值和方差,繪制均值-方差圖(圖2 和圖3所示)。一般來說,將方差和均值都明顯偏離主要樣本的樣本視為奇異樣本點。由于導致方差和均值偏大的情況較為復雜,因此本研究對水溶性蛋白質(zhì)和總糖的奇異樣本點逐個剔除并建立PLS 回歸模型,對比結(jié)果顯示:水溶性蛋白質(zhì)剔除108 號和109 號2 個樣本,總糖剔除108、109、120、121 號4 個樣本,模型改善效果最佳。
圖4 總糖的均值-方差圖Fig.4 Mean-variance of total sugar
建立蜂王漿水溶性蛋白質(zhì)和總糖含量偏最小二乘模型時,先用SG 平滑+一階導數(shù)的方法預處理光譜,然后采用CARS 法篩選特征波長點。篩選過程中保留波長數(shù)、交互驗證均方差、波長變量回歸系數(shù)的變化如圖5所示。
由圖5 可知,隨著運行次數(shù)的增加,保留的變量數(shù)呈遞減趨勢,交互均方根誤差呈先遞減后遞增的趨勢,說明采樣過程中無關(guān)變量被逐個剔除后再剔除有效變量,在交互驗證均方根誤差最小時,無關(guān)變量被全部剔除。在第23 次采樣時(中線位置),保留的84 個變量為水溶性蛋白質(zhì)的特征波長點。同理,建立蜂王漿總糖的PLS 模型時,先對總糖中紅外光譜做SG 平滑+二階導數(shù)預處理,然后采用CARS 法篩選特征波長,在運行第28 次時將全部無關(guān)變量剔除,最后保留特征波長點111 個。
圖5 水溶性蛋白質(zhì)特征波長CARS 法篩選過程Fig.5 Screening process of characteristic wavelength CARS method for water-soluble proteins
分析圖6 和圖7,水溶性蛋白質(zhì)和總糖在3 400 cm-1處的吸收峰和900~600 cm-1范圍都選出類似的變量,而其它位置存在差異,如水溶性蛋白質(zhì)在1 620 cm-1和1 550 cm-1處的吸收峰附近選出較多的變量,總糖在1 050 cm-1處的吸收峰附近選出較多變量。這可能是因為水溶性蛋白質(zhì)和總糖含量隨溫度時間變化都會減少,但各自又存在不同的特征吸收。相比于水溶性蛋白質(zhì),建立總糖PLS 模型的特征波長點集中在1 400~600 cm-1范圍,1 240 cm-1處可能是還原性糖的C=O 伸縮振動,1 050 cm-1處是還原性糖的C-O伸縮振動,900~600 cm-1有CO、PO 和CH 等的吸收峰[24-28]。分析選出的特征波長對應的光譜范圍與分子振動的紅外吸收,基本與實際情況相符合。
圖6 水溶性蛋白質(zhì)的變量分布點Fig.6 Variable distribution points of water-soluble proteins
圖7 總糖的變量分布點Fig.7 Variable distribution points of total sugar
建立預測水溶性蛋白質(zhì)含量的CARS-PLS 定量模型,最佳光譜預處理方法是SG 平滑+一階導數(shù),校正集相關(guān)系數(shù)0.9631,驗證集相關(guān)系數(shù)0.9771,RMSECV 為0.0913,RMSEP 為0.0754,建模效果良好,預測效果好。建立總糖的CARS-PLS定量模型,對比多種預處理方法處理結(jié)果,其中,SG 平滑+二階導數(shù)處理可得到最優(yōu)光譜,校正集相關(guān)系數(shù)0.9750,驗證集相關(guān)系數(shù)0.9850,RMSECV 為0.4485,RMSEP 為0.4244,建模效果好,預測效果好。
為了進一步比較CARS 在中紅外光譜變量選擇中的性能,選擇其它常用的波長選擇方法,如無信息變量消除法(UVE)、GA(遺傳算法)應用到本研究的波長變量選擇中,建立相應的PLS 模型,對比分析結(jié)果見表3。
從表3 對比分析可以看出,不論是水溶性蛋白質(zhì)還是總糖的FULL-PLS 模型,RMSEP 都在1以上,明顯高于CARS-PLS 和UVE-PLS 模型。由于參與建模的變量數(shù)量過多,因此導致模型過擬合,預測相關(guān)性變差。經(jīng)比較,采用無信息變量消除法(UVE)進行變量選擇的PLS 模型,驗證集與預測集的相關(guān)系數(shù)有所提高,而篩選后的變量過少,可能過濾掉了有用變量,準確度不高。采用CARS 法篩選特征波長的PLS 模型所得水溶性蛋白質(zhì)、總糖各驗證集真實值和預測值線性相關(guān)性高,預測準確度好。由此可見,通過CARS 法篩選特征波長建立水溶性蛋白質(zhì)、總糖PLS 定量模型是可行的,所得模型準確性高,穩(wěn)健性好。
表3 基于不同變量選擇方法的水溶性蛋白質(zhì)、總糖含量PLS 模型預測效果Table 3 PLS model prediction effect of water-soluble protein and total sugar content based on different variable selection methods
圖8 水溶性蛋白質(zhì)的CARS-PLS 模型建模效果圖Fig.8 Modeling effect diagram of CARS-PLS model of water-soluble protein
從未參與建立預測模型的樣品中隨機選取15 組不同溫度、時間貯存的蜂王漿樣品,采集中紅外光譜,使用CARS-PLS 模型驗證模型的準確性,結(jié)果見表4。其中,水溶性蛋白質(zhì)含量預測的平均相對誤差為2.8%,總糖含量預測的平均相對誤差為3.2%。
圖9 總糖的CARS-PLS 模型建模效果圖Fig.9 CARS-PLS model modeling effect diagram of total sugar
表4 CARS-PLS 定量模型準確性驗證結(jié)果Table 4 The accuracy verification results of CARS-PLS quantitative model
(續(xù)表4)
基于衰減全反射中紅外光譜技術(shù)結(jié)合CARS變量選擇算法建立蜂王漿水溶性蛋白質(zhì)、總糖的PLS 定量模型。通過光譜預處理研究中紅外光譜的PLS 定量模型的最適優(yōu)化方式,通過CARS 法分別篩選出84 個、111 個特征波長點,并構(gòu)建基于無信息變量消除法和遺傳算法的PLS 模型。結(jié)果表明:CARS-PLS 模型性能明顯優(yōu)于其它模型,說明CARS 算法用于蜂王漿中紅外光譜變量的選擇是可行的,同時也說明通過合適的變量選擇方法可以提高模型的準確性和穩(wěn)健性。比較所有模型的預測結(jié)果,最終確定CARS-PLS 模型預測水溶性蛋白質(zhì)、總糖含量的驗證集準確率為97.71%和98.50%,驗證集誤差為0.0754 和0.4244。此外,通過外部驗證,對水溶性蛋白質(zhì)、總糖含量的相對誤差分別為2.8%,3.2%,說明基于衰減全反射中紅外光譜和CARS 算法測定蜂王漿中水溶性蛋白質(zhì)、總糖含量是有效的,檢測速度快精度高,在蜂王漿品質(zhì)的快速檢測方面有很好地應用前景。