孫宗保,周 軒,吳建峰*,鄒小波,孫 瑩,唐群勇,霍玲玲
(1.江蘇大學 食品與生物工程學院,江蘇 鎮(zhèn)江 212013;2.江蘇今世緣酒業(yè)股份有限公司,江蘇 淮安 223411;3.江蘇大學 農(nóng)業(yè)工程研究院,江蘇 鎮(zhèn)江 212013)
白酒在我國歷史悠久,在人們的生活中有著無可替代的地位,不同等級白酒的口感、風味及價格都相差甚異。白酒基酒的品質(zhì)和等級決定了成品酒的質(zhì)量和等級,不同等級的基酒可以勾兌出不同風格、不同口感和不同等級的成品酒。同時準確判別白酒基酒等級也是白酒分級儲藏的主要依據(jù)。因此,白酒基酒等級的準確評判至關重要。如今部分企業(yè)對白酒基酒質(zhì)量等級的鑒定仍主要依靠人工感官評定,但是人工感官評定存在著一定的個體差異性、不穩(wěn)定性和局限性,由主觀因素導致的評價標準不統(tǒng)一,使得不同等級產(chǎn)品間的差異難以量化。因此,發(fā)展一種快速有效的白酒基酒等級和品質(zhì)評價技術(shù)顯得尤為必要。
目前,白酒質(zhì)量等級的研究主要采用近紅外光譜[1]、熒光光譜[2]、氣相色譜-質(zhì)譜聯(lián)用[3]、傳感技術(shù)等。光譜法檢測成本低,易操作,但靈敏度欠佳;電子鼻用傳感器陣列取代了人工嗅覺,但單一性強,且對環(huán)境溫度敏感[4];氣相色譜-質(zhì)譜選擇性好,應用廣泛,但白酒微量成分眾多,普通的質(zhì)量分析器無法檢測到痕量物質(zhì)。近年來,質(zhì)譜技術(shù)發(fā)展迅速,逐步應用到白酒研究中,如程平言等[5-6]采用頂空固相微萃取與質(zhì)譜(headspace-solid phase microextractionmass spectrometry,HS-SPME-MS)聯(lián)用技術(shù)結(jié)合支持向量機(support vector machine,SVM)、偏最小二乘-判別分析(partial least squares-discriminant analysis,PLS-DA)、逐步判別分析(stepwise linear discriminant analysis,SLDA)對濃香型和清香型白酒等級進行鑒定。尤其是具有高分辨率、高靈敏度的四級桿-靜電場軌道阱Q-Exactive臺式質(zhì)譜儀,與超高效液相色譜(ultra-high performance liquid chromatography,UPLC)結(jié)合,能快速采集數(shù)據(jù)并精確測定質(zhì)量數(shù),被廣泛應用于食品成分和品質(zhì)的檢測研究[7-9],如真實性評估、農(nóng)藥殘留、生物毒素[10-12]等。在酒精類飲品中也逐步得到推廣和使用[13-15],特別是在白酒品質(zhì)檢測方面,取得了很好的效果,如穆蕾等[16]采用高分辨質(zhì)譜法鑒定出馥郁香型白酒中73種微量成分;ZHAO X R等[17]采用超高效液相色譜和高分辨質(zhì)譜建立了白酒等發(fā)酵液中氨基甲酸乙酯的檢測方法;CHEN D W等[18]采用高分辨質(zhì)譜建立了一種簡便、快速檢測白酒中了17種鄰苯二甲酸酯的方法。此外在白酒香型鑒定上也得到很好地應用,如程明川等[19]采用Orbitrap高分辨質(zhì)譜與代謝組學分析,通過主成分分析(principal component analysis,PCA)降維處理對3種香型白酒成功進行鑒別。可以看出高分辨質(zhì)譜對白酒成分及品質(zhì)安全檢測具有高效快捷的效果,但是對白酒等級的研究鮮有報道。白酒中揮發(fā)性成分眾多,細微的變化也能使白酒口感風味產(chǎn)生差異,因此本研究從白酒揮發(fā)性成分出發(fā),采用超高效液相色譜(UPLC)與基于Orbitrap高分辨質(zhì)譜(high resolution mass spectrometry,HR-MS)技術(shù)聯(lián)用,經(jīng)組學分析軟件SIEVE篩選處理,使用多種化學計量學方法對不同等級濃香型白酒基酒進行鑒別,并比較不同模型的識別效果,以期建立一種客觀、準確的白酒基酒等級鑒別方法。
濃香型白酒基酒:由江蘇今世緣酒業(yè)股份有限公司提供,公司專業(yè)感官評定人員根據(jù)感官評定標準和流程將車間工人初步分級的白酒基酒進行感官品評分級,試驗最終選取由專業(yè)感官評定人員確定的一級好、一級差、二級好、二級差基酒各30個樣本(共120個)。甲醇、甲酸(均為色譜純):國藥集團化學試劑有限公司;甲酸銨(色譜純):美國Sigma公司;娃哈哈純凈水:杭州娃哈哈集團有限公司。
Ultimate 3000超高效液相色譜:美國Dionex公司;四級桿-靜電場軌道阱高分辨質(zhì)譜儀:美國Thermo Scientific公司;KQ-300DE超聲清洗器:昆山市超聲儀器有限公司;Milli-Q Advantage A10超純水系統(tǒng):美國Millipore公司;AR224CN電子天平:奧豪斯儀器(上海)有限公司。
1.3.1 樣品準備
樣品經(jīng)0.22 μm的濾膜過濾后直接進樣。
1.3.2 液相色譜條件
色譜柱為Hypersil GOLD C8(100 mm×2.1 mm,3 μm);流動相組成:水相(W)為5 mmol/L甲酸銨以及0.1%甲酸水溶液,有機相(M)為5 mmol/L甲酸銨以及0.1%甲酸甲醇溶液;進樣量為10 μL。梯度洗脫條件如表1所示。
表1 梯度洗脫條件Table 1 Gradient elution conditions
1.3.3 質(zhì)譜掃描參數(shù)
表2 白酒基酒分析質(zhì)譜掃描參數(shù)Table 2 Scan parameters of base liquor ofBaijiuby mass spectrum
1.3.4 數(shù)據(jù)處理與分析
選擇正負離子切換采集數(shù)據(jù),數(shù)據(jù)采用SIEVE組學分析軟件對白酒組分進行提取、過濾(P<0.05)后,運用Matlab 2009a(Math works Co,USA)軟件進行處理,分別采用主成分分析(PCA)、線性判別分析(LDA)、支持向量機(SVM)以及反向傳播神經(jīng)網(wǎng)絡(back propagation-artificial neural network,BP-ANN)等化學計量學方法對不同等級白酒基酒進行建模分析。
為了保證數(shù)據(jù)的重現(xiàn)性,本實驗在進樣過程中穿插了質(zhì)量控制(quality contral,QC)樣品,考察系統(tǒng)的穩(wěn)定性。在整個進樣周期內(nèi),以一級好酒樣本中某一化合物為例,其保留時間(retention time,RT)偏差應在2 s以內(nèi),響應值的相對標準偏差(relative standard deviation,RSD)在10%左右,質(zhì)量測量精度偏差<10-6。采用外標法進行校正后,結(jié)果證明系統(tǒng)有良好的重現(xiàn)性、穩(wěn)定性和較高的質(zhì)量精度,一級好酒樣本色譜圖見圖1。
圖1 不同定性方法對一級好酒樣本GC-MS分析總離子流色譜圖Fig.1 TIC of first grade wine sample with different qualitative methods by GC-MS
從四種不同等級白酒基酒120個樣本中,隨機選取總樣本的2/3(80個)作為訓練集,余下的1/3樣本(40個)作為預測集。經(jīng)SIEVE軟件篩選分析后得到309個化合物,以不同樣本中309個化合物的峰面積組成數(shù)據(jù)矩陣,采用主成分分析(PCA)、線性判別分析(LDA)、支持向量機(SVM)以及反向傳播神經(jīng)網(wǎng)絡(BP-ANN)等化學計量學方法對4種不同等級的白酒進行區(qū)分。
2.2.1 主成分分析(PCA)
全部化合物的三維主成分空間分布圖見圖2。由圖2可知,其中第一主成分(the first principal component,PC1)、第二主成分(PC2)和第三主成分(PC3)的方差貢獻率分別為86.59%、3.05%、2.58%,累積方差貢獻率為92.22%,在保留大部分信息的同時,也反應了化合物在原始變量空間中的分布,并在多維空間將不同等級白酒的差異可視化。從圖2可以看出,四種等級的白酒在該得分圖中分類趨勢較為明顯,說明這四種等級的白酒有一定的差異性。但是從PCA分析結(jié)果來看,不同等級樣本間仍然存在一定的交叉重疊,需要進一步運用模式識別方法將其區(qū)分開。
圖2 白酒樣本三維主成分得分圖Fig.2 Score plot of 3-dimension principal components of Baijiusamples
2.2.2 LDA、SVM和BP-ANN分析
不同等級白酒全部化合物的LDA二維得分圖見圖3。由圖3可知,其第一判別因子和第二判別因子的貢獻率分別為85.48%和8.64%,累計貢獻率為94.32%。四個等級白酒各居一個象限,除個別樣本外,聚類現(xiàn)象明顯,能很好地區(qū)分開。隨著主成分個數(shù)的改變,LDA的識別率也不同,識別率的變化情況見表3??梢钥闯觯S著主成分數(shù)的增加,LDA模型訓練和預測的識別率都逐漸增加,當主成分達到13時,模型準確率最高,訓練集識別率為91.25%,錯誤識別7個樣本,測試集識別率為90.00%,4個樣本被預測錯誤,結(jié)果表明,所建立的LDA模型對白酒基酒等級判別有較好的識別效果。
圖3 白酒樣本線性判別分析二維得分圖Fig.3 Score plot of 2-dimension ofBaijiusamples analysis by LDA
表3 LDA、SVM、BP-ANN在不同主成分下訓練和測試的結(jié)果Table 3 Discriminating results of training set and test set of LDA,SVM and BP-ANN under different principal components
支持向量機(SVM)以結(jié)構(gòu)風險最小化為原則建立模型,能兼顧經(jīng)驗風險與置信區(qū)間這兩個實際風險因素,最終訓練得到有良好泛化性的模型[20]。試驗中,將訓練和預測時的誤判數(shù)作為考察模型優(yōu)劣的一個指標,從表3可以看出,和LDA模型的識別結(jié)果相似,當主成分數(shù)為1和2時,訓練集和測試集識別率均不高,樣本誤判數(shù)20左右;隨著主成分數(shù)的增加,訓練集和測試集的識別率都逐漸上升,當主成分數(shù)達到15時,識別率最高分別為100%和97.50%,此時主成分的累積貢獻率為98.64%,訓練時模型完全正確,預測時模型誤判數(shù)1個。
在建立反向傳播神經(jīng)網(wǎng)絡模型(BP-ANN)過程中,以響應信號的識別率作為檢驗模型的條件[21],通過比較多次試驗結(jié)果,對BP-ANN模型的各個參數(shù)進行優(yōu)化。經(jīng)反復訓練后各參數(shù)最終確定為:目標誤差0.001,學習速率0.1,動量因子0.7,網(wǎng)絡學習次數(shù)1 000次[22]。訓練結(jié)果從表3可以看出,主成分數(shù)為1時,由于其方差貢獻率較小,所解釋的樣本信息較少,因此訓練集和測試集識別率不高,所建模型效果較差。隨著主成分數(shù)不斷增加,訓練集識別正確率不斷提高,當主成分數(shù)為8時,訓練集與測試集的識別正確率均達到100%,無錯誤識別樣本;隨著主成分數(shù)繼續(xù)增加,訓練集模型的識別正確率又略有下降,但依然在97.00%以上,最多錯誤識別2個樣本。
2.2.3 不同識別模式分析結(jié)果的比較
將不同等級白酒基酒在主成分分析(PCA)、線性判別分析(LDA)、支持向量機(SVM)和反向傳播神經(jīng)網(wǎng)絡(BP-ANN)等多種模式下的最佳識別結(jié)果進行比較,其中PCA區(qū)分效果較好,前3個主成分解釋了白酒化合物92.22%的信息。LDA、SVM和BP-ANN分別在主成分數(shù)為13、15和8時得到最佳識別效果。三種識別模型中,BP-ANN的識別效果最好,訓練集和測試集識別率均為100%,預測性能最佳;其次是支持向量機,訓練集和測試集識別率分別高達100%和97.50%;LDA訓練集和測試集識別效果要略差于這兩種非線性分析方法,但訓練集和測試集識別正確率也分別達到91.25%和90%。原因可能是不同等級白酒中的揮發(fā)性成分之間存在著復雜的非線性關系,這恰好是適合BP-ANN處理的模型問題,因而BP-ANN要優(yōu)于LDA分析結(jié)果,此外,BP-ANN能夠解決SVM建模過程中過擬合的缺點[23]。總的來說,四種方法對不同等級白酒基酒中揮發(fā)性物質(zhì)的細微差異均得到較好的識別效果,訓練集和測試集的最佳判別率均在90.00%以上,因此,化學計量學與UPLC-QExactive-MS技術(shù)相結(jié)合能快速有效鑒別不同等級濃香型白酒基酒。
采用UPLC-Q-Exactive-MS結(jié)合化學計量學方法判別不同等級白酒基酒。經(jīng)組學分析得到309種化合物后,分別利用PCA、LDA、SVM和BP-ANN四種方法從揮發(fā)性成分的角度對白酒基酒等級進行判別、分析。結(jié)果表明,PCA區(qū)分效果較好,前3個主成分的累計貢獻率達92.22%,另外三種模式識別方法均達到較好的識別效果,訓練集和測試集的最佳識別率均在90%以上,其中BP-ANN在主成分數(shù)為8時,識別效果最優(yōu),其訓練集和測試集識別正確率均達到100%。實驗證明,UPLC-Q-Exactive-MS結(jié)合化學計量學分析方法能根據(jù)白酒基酒中揮發(fā)性成分的差異實現(xiàn)等級的有效判別,為濃香型白酒基酒質(zhì)量等級的劃分提供一定指導作用。