張正勇,宋 超,沙 敏,劉 軍,王海燕
(1.南京財經大學管理科學與工程學院,江蘇南京210023; 2.江蘇省質量安全工程研究院,江蘇南京210023)
紫外可見光譜結合化學計量學方法用以古井貢酒年份快速鑒別
張正勇1,2,宋超1,沙敏1,2,劉軍1,2,王海燕1,2
(1.南京財經大學管理科學與工程學院,江蘇南京210023; 2.江蘇省質量安全工程研究院,江蘇南京210023)
實驗以古井貢酒8年、16年、26年年份酒為對象,研究了基于紫外可見光譜的白酒年份酒快速鑒別方法研發(fā)的可能性。通過采集實驗樣品的紫外可見光譜,構建了該品牌年份酒與紫外可見最大吸收峰(277 nm)強度關系圖,古井貢酒8年酒紫外可見最大吸收峰強度圍繞1.017±0.127范圍波動,古井貢酒16年酒紫外可見最大吸收峰強度圍繞1.855±0.410范圍波動,古井貢酒26年酒紫外可見最大吸收峰強度圍繞2.494±0.130范圍波動,基于此可進行初步的年份酒判別分析。同時,利用古井貢酒年份酒紫外可見光譜全譜數據,運用核主成分分析方法,這是主成分分析法在非線性領域的推廣,可有效避免數據冗余,提高特征提取效率,進而結合最近鄰算法、稀釋識別表示分類器,實現白酒年份酒快速、高效、智能鑒別。結果表明,在交叉驗證實驗條件下識別率可達93.75%。本方案的提出可為白酒年份酒品質保證提供一種簡單、快速的鑒別方法。
核主成分分析; 模式識別; 紫外可見光譜; 年份酒; 古井貢酒
從古井貢酒首次提出年份原漿酒以來,白酒年份酒順應市場需求,迅速成為白酒市場的重要組成部分。在白酒年份酒市場蓬勃發(fā)展的同時,其年份酒也面臨著諸多挑戰(zhàn),如假冒偽劣、以次充好等現象時有報道,迫切需要發(fā)展相應鑒別技術。在白酒年份酒監(jiān)管鑒別技術研究領域,目前尚無適用的國家標準,研究人員提出的主要鑒別技術包括:徐占成[1]提出了白酒年份鑒別揮發(fā)系數法,通過構建白酒年份酒存儲年限與揮發(fā)物含量間的函數關系,實現白酒年份鑒定。楊濤等[2]提出,利用年份酒中Al、Fe、Cu等金屬離子在不同年份酒中含量變化關系,利用酒體黏度與白酒貯存時間關系,利用白酒中微量共軛不飽和雙鍵分子與年份酒貯存時間關系,多個方面鑒別年份酒。秦人偉[3]提出利用碳-14衰變率與年份酒貯存時間關系,鑒別確定年份酒生產年份。本課題組前期研究提出利用拉曼光譜法結合支持向量機算法,實現了白酒年份指數回歸分析[4]。以上研究方法,為白酒年份酒鑒別提供了多種鑒別方案,不過這些方法,或需要較為專業(yè)的大型儀器設備,或分析步驟較為繁瑣、分析時間較長。目前,白酒年份酒市場日益龐大,待檢樣品數量日益增多,如何發(fā)展簡單、實用的快速檢測鑒別技術,成為新的迫切需求。
本研究提出了一種基于紫外可見光譜結合化學計量學算法的古井貢酒年份酒快速鑒別方法。紫外可見光譜儀器價格較為低廉,屬于常用光譜設備,體積較小,便于攜帶,測試步驟也較為省時省力。通過收集多批次不同年份古井貢酒年份酒的紫外可見光譜數據,構建紫外可見吸收峰值與年份酒關系,并結合化學計量學算法,可實現古井貢酒年份快速鑒別。
1.1材料
材料:古井貢酒年份酒購置于安徽古井集團有限責任公司,包括8批次古井貢酒年份酒8年酒,14批次古井貢酒年份酒16年酒,6批次古井貢酒年份酒26年酒。
儀器:T6新世紀型號紫外可見光譜儀,北京普析通用儀器有限責任公司。
1.2數據處理
紫外可見光譜原譜數據使用mapm inmax函數(matlab軟件平臺)實現數據的歸一化操作。歸一化后的紫外可見光譜數據使用princomp函數進行主成分分析(PrincipalComponentAnalysis,PCA),使用KPCA算法進行核主成分分析(Kernel Principal Component Analysis,KPCA)。特征提取算法PCA和KPCA分別結合最近鄰算法(Nearest Neighbor,NN)、稀疏表示分類器(sparse representation classification,SRC)和支持向量機(SupportVectorMachine,SVM)實現對古井貢酒年份酒機器識別。
1.3核主成分分析法(KPCA)
KPCA是PCA在非線性領域的推廣[5-6]。傳統(tǒng)的PCA只考慮了數據的二階統(tǒng)計特性(協(xié)方差矩陣),并未考慮到數據的高階統(tǒng)計特征,所以變換后依然會存在數據間的高階冗余信息。核函數技術是通過非線性核函數把輸入空間映射到高維空間,以期望把低維空間的非線性運算轉換成高維空間的線性運算。因此,KPCA的原理在于首先通過非線性映射將線性不可分的原始樣本輸入空間變換到一個線性可分的高維特征空間,然后在新的空間里進行主成分分析,為避免“維數災難”問題,引用核函數技術,即使用滿足Mercer條件的核函數來替換特征空間中樣本的內積運算。
從本質上說,核函數技術構建了數據空間、特征空間和類別空間之間的非線性變換的橋梁,設xi和xj為數據空間的樣本點,數據空間到特征空間的映射函數為Φ,核函數的基礎是實現向量的內積變換:
通常,非線性變換函數Φ(·)相當復雜,而實際運算過程中用到的核函數K(·,·)則相對簡單得多,這正是核函數技術的巨大優(yōu)勢。
常用的核函數如下:
a.線性(Linear)核函數
b.多項式(Ploynom ial)核函數
其中d是正整數,該函數滿足Mercer條件。
c.高斯(Gaussian)核函數
其中σ為控制核函數高寬的參數。
1.4交叉驗證
本實驗的交叉驗證是結合了傳統(tǒng)K層交叉驗證(KCV)和交叉驗證留一法(Leave-one-out)方法的特點而專門設計的方法。這樣的設計目的:一是在不重復的情況下提高樣本的利用效率;二是提高實驗的穩(wěn)定性,使得每次方法都能在同樣的交叉驗證基礎上進行,以提高方法之間可對比性。具體的方法設計如下:針對6批次古井貢酒26年酒,樣本編號為A1—A6,14批次古井貢酒16年酒,樣本編號為B1—B14,8批次古井貢酒8年酒樣本,編號為C1—C8。根據數學組合的原理,實驗測試樣本選取如下:
A1A2;B1 B2 B3 B4;C1C2
A3A4;B5 B6 B7 B8;C3C4
A5A6;B9 B10 B11 B12;C5C6
A1A2;B13 B14;C7C8
A3A4;B1 B2 B3 B4;C3C4
A5A6;B5 B6 B7 B8;C1C2
A1A2;B9 B10 B11 B12;C7C8
A3A4;B13 B14;C5C6
8次實驗共計60個測試樣本,每次實驗中未被選中的其他樣本作為訓練集,本研究的化學計量學實驗均是基于此交叉驗證條件進行的。
2.1古井貢酒年份酒紫外可見光譜分析
中國白酒屬于蒸餾酒,常用的制酒過程是:取一定配比的糧食,如高粱、玉米等,混合并于發(fā)酵池中發(fā)酵一定時間后,蒸餾獲取基酒,而后貯存數月至數年,使得基酒中各分子充分締合,再經過勾兌、調和,最終制成各具特色的白酒成品酒??梢姇r間是白酒生產過程中關鍵性因素之一,影響著白酒的最終風味。本實驗選取古井貢酒年份酒8年、16年、26年為研究對象,首先采集了實驗樣品的紫外可見光譜圖,如圖1所示,可以看出古井貢酒年份酒在250~400 nm處有1個紫外可見吸收峰,在277 nm處有最大吸收峰,此紫外可見吸收峰可主要歸結于白酒組成成分中不飽和分子的外層電子π—π*躍遷所致,如糖醛分子等[7]。并且,隨著古井貢酒年份的增加,紫外可見最大吸收峰表現出相應增加趨勢,原因可歸結于隨著年份的增加,白酒貯存過程中不飽和鍵分子含量增加所致,如二醛、二酮化合物及其縮合物分子等。
圖1 古井貢酒年份酒紫外可見光譜圖
根據古井貢酒年份酒紫外可見光譜信息,繪制年份與紫外可見光譜最大吸收峰強度關系圖,如圖2所示。古井貢8年酒紫外可見最大吸收峰強度圍繞1.017±0.127范圍波動,古井貢16年酒紫外可見最大吸收峰強度圍繞1.855±0.410范圍波動,古井貢26年酒紫外可見最大吸收峰強度圍繞2.494±0.130范圍波動。據此可以看出隨著古井貢年份酒年代增加,紫外可見最大吸收峰強度值依次增強,古井貢8年酒與古井貢26年酒區(qū)分明顯,借助紫外可見最大吸收峰強度有望實現直接判別,古井貢16年酒最大紫外可見吸收峰介于二者之間,此方法有望用于古井貢酒年份酒快速鑒別。
圖2 古井貢酒年份酒年份與紫外可見光譜最大吸收峰強度關系圖
2.2古井貢酒年份酒鑒別模型分析
借助古井貢酒年份酒紫外可見最大吸收峰值,初步實現古井貢酒年份酒快速鑒別,不過,在古井貢酒16年酒的紫外可見最大吸收峰強度值與古井貢8年酒或26年酒最大吸收峰強度值存在交叉區(qū)域情況時,這種直接判定方法將難以奏效。于是,進一步研究了主成分分析法、核主成分分析法,結合模式識別分類算法,充分利用紫外可見光譜全譜數據,實現古井貢酒年份酒快速鑒別。
PCA與KPCA均為數據特征提取方法,分別將PCA和KPCA算法結合NN、SRC和SVM分類器[8-10],利用古井貢酒年份酒紫外可見光譜數據進行樣本識別分析,表1和表2給出了相應識別效果。從表1可以看出,在選取的主成分累計貢獻率均大于99%的情況下,PCA結合SVM分類模型所得到的識別率最高,達到88.54%,這是由于SVM算法設計在對于有限樣本處理時具備優(yōu)勢所得。從表2可看出,KPCA結合NN分類模型以及KPCA結合SRC分類模型分別在核參數尋優(yōu)條件下,識別率可以達到93.75%,相對較差的KPCA結合SVM模型識別率也可以達到91.67%。其次,不同的分類器對于核函數選擇和參數選取不同,NN和SVM分類器都是在多項式核函數下達到最優(yōu)結果,而SRC在高斯核函數下得到最優(yōu)值。
對比表1和表2可以看出,相比較于PCA,KPCA特征提取的效果更好,在結合3種不同的分類器下,識別率都有所提高,其中,SRC對于特征提取的效果敏感性最高,識別率從52.08%提高到93.75%,SVM敏感性最低,NN次之。分析原因,在于KPCA中核函數的使用為非線性數據的降維提供了可能,在結合分類器下,提高了模型的推廣性。
圖3給出了古井貢酒年份酒結合NN分類器下的主成分分析圖,坐標軸代表著前3個主成分PC1、PC2和PC3。圖4給出了古井貢酒年份酒結合NN分類器下的核主成分分析圖,坐標軸代表著前3個核主成分KPC1、KPC2和KPC3,圖4中核參數的選擇為:Polynom ial,d= 2。對比圖3和圖4可以看出,PCA降維下的古井貢酒不同年份酒樣本之間有重疊,這為分類帶來了困難,而KPCA降維下的樣本分布較好,不同類別樣本實現了良好的分類。
表1 PCA降維方法結合3種分類器的識別率效果
表2 KPCA降維方法結合3種分類器的識別率效果
圖3 古井貢酒年份酒主成分分析圖
圖4 古井貢酒年份酒核主成分分析圖
綜合來看,KPCA相比較于PCA在特征提取上優(yōu)勢明顯,并在實際的降維圖和識別率上保持了一致性。KPCA結合NN、SRC、SVM分類算法分析,實現了古井貢酒年份酒8年、16年、26年的快速鑒別,并在KPCA結合NN模型和KPCA結合SRC模型下,經過核函數調優(yōu),都可以達到93.75%的識別率。
針對白酒年份酒快速鑒別技術的匱乏,本文提出了基于紫外可見光譜結合核主成分分析法、模式識別算法的古井貢酒年份酒快速鑒別方法。利用古井貢酒年份酒紫外可見光譜數據,構建了古井貢酒年份酒年份與紫外可見最大吸收峰強度關系圖,初步實現古井貢酒年份酒直接判別。利用古井貢酒年份酒紫外可見光譜全譜數據,結合核主成分分析與最近鄰算法、稀疏表示分類器,實現了古井貢酒年份酒年份智能識別,識別率達到93.75%。本方案的提出為白酒年份酒的快速鑒別技術的發(fā)展提供了新思路,并可為其他食品、藥品質量安全鑒別技術的開發(fā)等所借鑒。
[1] 徐占成.中國白酒貯存年份科學鑒別技術的研究——“揮發(fā)系數鑒別年份酒的方法”[J].釀酒科技,2009(1):96-98.
[2]楊濤,李國友,莊名揚.中國白酒“年份酒”鑒別方法的研究[J].釀酒,2008,35(5):33-38.
[3]秦人偉.碳-14用于年份酒時間的測定[J].釀酒科技,2014(8):89-93.
[4] 王國祥,王海燕,王虎,等.基于Raman光譜和支持向量機回歸的古井貢酒年份鑒別方法[J].光譜學與光譜分析,2016,36 (3):729-735.
[5]Vinay A,Shekhar V S,Murthy K N B,etal.Face recognition usinggaborwavelet featuresw ith PCA and KPCA-a comparative study[J].Procedia Computer Science,2015,57:650-659.
[6]Musa A B.A comparison of?1-regularizion,PCA,KPCA and ICA for dimensionality reduction in logistic regression[J]. International JournalofMachine Learning and Cybernetics, 2013,5(6):861-873.
[7]Zhang Z,Jiang J,Wangg,etal.Application of twodimensionalcorrelation UV-Visspectroscopy in Chinese liquor Moutaidiscrimination[J].American Journalof Analytical Chem istry,2015,6(5):395-401.
[8]Wright J,Ma Y,Mairal J,etal.Sparse representation for computer vision and pattern recognition[J].Proceedingsof the IEEE,2010,98(6):1031-1044.
[9]MujaM,Lowe DG.Scalablenearestneighboralgorithms for high dimensionaldata[J].IEEETransactionson Pattern Analysisand Machine Intelligence,2014,36(11):2227-2240.
[10]BurgesC JC.A tutorialon supportvectormachines for pattern recognition[J].DataM ining and Know ledge Discovery,1998,2(2):121-167.
Rapid Identification of the Ageofgujinggongjiu Liquor by Ultraviolet Visible Spectroscopy Coup led w ith Chemometric M ethods
ZHANG Zhengyong1,2,SONG Chao1,SHAM in1,2,LIU Jun1,2andWANGHaiyan1,2
1.SchoolofManagementScienceand Engineering,Nanjing University of Financeand Economics,Nanjing,Jiangsu 210023; 2.Jiangsu Research Institute of Quality and Safety Engineering,Nanjing,Jiangsu 210023,China)
In the experiment,Gujinggongjiu Liquorof 8,16 and 26 years respectively wasused as the research object,and the feasibility of using ultravioletvisible spectroscopy coupled w ith chemometricmethods for rapid identification of liquoragewasstudied.The UV-Vis spectra of the experimental samples were collected and then the relationship diagram between liquor age and the intensity of themaximum absorption peak(277 nm)of UV-Vis spectra had been constructed.The intensity ofgujinggongjiu Liquor of 8 yearswas located in the range of 1.017± 0.127.The intensity ofgujinggongjiu Liquorof 16 years and of 26 yearswas located in the range of 1.855±0.410 and in the range of 2.494± 0.130,respectively.Accordingly,prelim inary discriminate analysis of liquor age could be obtained based on the relationship diagram.Meanwhile,totalUV-Vis spectra data ofgujinggongjiu Liquor of 8 years,16 years and 26 yearswere investigated by using kernelprincipal componentanalysis(KPCA),whichwas thegeneralized application in nonlinear field of principal componentanalysis(PCA)and could avoid data redundancy aswellas improve the efficiency of feature extraction.Finally,rapid,efficientand intelligent identification ofgujinggongjiu Liquor of different ages could be achieved by using KPCA combined w ith the nearest neighbor(NN)and sparse representation classification(SRC). The experimental results displayed that the recognition ratewas up to 93.75%.This study provided a simple and rapidmethod for the identification of Baijiu of differentages.
kernel principal componentanalysis;pattern recognition;ultraviolet visible spectroscopy;Baijiu of differentages;Gujinggongjiu Liquor
TS262.3;TS261.7;TS261.4
A
1001-9286(2016)11-0020-04
10.13746/j.njkj.2016237
江蘇省高校自然科學研究面上項目(16KJB150015),國家重大科學儀器設備開發(fā)專項(2013YQ090703),國家自然科學基金(61373058,71433006),科技部港澳臺科技合作專項項目(2014DFM 30080),質檢公益性行業(yè)科研專項(201410173),南京財經大學青年學者支持計劃(2015)基金。
2016-07-26;
2016-09-07
張正勇(1984-),男,安徽霍邱人,講師,博士,E-mail:zyzhang@njue.edu.cn。
王海燕(1968-),女,安徽巢湖人,教授,博士,E-mail:njue_10@163.com。
優(yōu)先數字出版時間:2016-10-12;地址:http://www.cnki.net/kcms/detail/52.1051.TS.20161012.1515.018.htm l。