王海燕,王 虎,王國(guó)祥,劉 軍
(1.南京財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,南京210046;2.江蘇省質(zhì)量安全工程研究院,南京210046)
基于壓縮感知的白酒香型分類
王海燕1,2,王 虎1,王國(guó)祥1,劉 軍1,2
(1.南京財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院,南京210046;2.江蘇省質(zhì)量安全工程研究院,南京210046)
目前多數(shù)白酒分類方法需要進(jìn)行特征選取,但特征選取算法會(huì)增加計(jì)算復(fù)雜度,限制特征數(shù)量,而且選取結(jié)果的好壞直接影響識(shí)別效果。為此,提出應(yīng)用壓縮感知理論對(duì)白酒香型進(jìn)行分類的方法。通過(guò)壓縮感知對(duì)白酒飛行時(shí)間質(zhì)譜進(jìn)行整體分析,運(yùn)用訓(xùn)練數(shù)據(jù)構(gòu)造冗余字典作為稀疏基,選擇高斯隨機(jī)矩陣作為測(cè)量矩陣,通過(guò)求解最小l1范數(shù)得到反映白酒香型特征的稀疏表示,進(jìn)而根據(jù)K近鄰法(KNN)實(shí)現(xiàn)對(duì)白酒香型的分類識(shí)別。將4種不同重構(gòu)算法分別結(jié)合最小冗余誤差和KNN進(jìn)行香型分類,實(shí)驗(yàn)結(jié)果表明,將壓縮感知用于白酒香型分類是可行的,能避免特征選取的問(wèn)題,其中采用稀疏度自適應(yīng)匹配追蹤算法求解l1范數(shù),并根據(jù)KNN進(jìn)行分類的穩(wěn)定性較好,準(zhǔn)確率達(dá)到91.45%。
壓縮感知;飛行時(shí)間質(zhì)譜;稀疏表示;白酒香型;K近鄰法;最小冗余誤差
白酒是一個(gè)復(fù)雜的體系,其中98%~99%的成分都是乙醇和水,它們構(gòu)成了白酒的主體,而約占1%~2%的溶于其中的酸、酯、醇、醛等種類眾多的微量有機(jī)化合物是決定白酒香氣、口感和風(fēng)格的關(guān)鍵[1-2]。目前對(duì)白酒的鑒別,除了理化分析外,主要是通過(guò)品酒師的感官品嘗,但由于人類感覺(jué)器官的靈敏度和工作狀態(tài)受環(huán)境、時(shí)間、心理活動(dòng)等諸多因素的影響,其分析結(jié)果往往帶有一定的主觀性[3]。
近年來(lái),模式識(shí)別技術(shù)與儀器檢測(cè)手段相結(jié)合在白酒分析中的應(yīng)用日益廣泛。其中,常用的分析方法有主成分分析(Principal Component Analysis, PCA)[4]、線性判別分析(LinearDiscriminant Analysis,LDA)[5]、聚類分析[6]、支持向量機(jī)(Support Vector Machine,SVM)[7]等方法。此外,一些新方法和技術(shù)也被運(yùn)用到白酒分析中:文獻(xiàn)[8]通過(guò)構(gòu)建反傳人工神經(jīng)網(wǎng)實(shí)現(xiàn)對(duì)未知白酒樣品進(jìn)行預(yù)報(bào);文獻(xiàn)[9]將可視化陣列傳感器技術(shù)對(duì)代表酒樣進(jìn)行檢測(cè),在可視化區(qū)分基礎(chǔ)上采用統(tǒng)計(jì)分析方法對(duì)結(jié)果進(jìn)行分析。這些方法在一定程度上建立了比較客觀的分類標(biāo)準(zhǔn),但目前大量的識(shí)別算法都集中在提取特征信息上,特征選取的數(shù)量和好壞直接影響到識(shí)別效果。
壓縮感知(Compressive Sensing,CS)是由文獻(xiàn)[10-11]在相關(guān)研究基礎(chǔ)上提出的一種信號(hào)采樣和重建的新理論,使用一定數(shù)量的非相關(guān)測(cè)量值能夠高效地采集可壓縮信號(hào)的信息,這種特性決定了壓縮感知應(yīng)用的廣泛性。目前,關(guān)于CS理論的應(yīng)用研究已經(jīng)涉及諸多領(lǐng)域,例如人臉識(shí)別[12-13]、醫(yī)療成像[14]、生物傳感[15]、語(yǔ)音信號(hào)處理[16]。CS理論的出現(xiàn)和發(fā)展,給高維的譜圖數(shù)據(jù)處理也帶來(lái)了新的啟發(fā):如果可以在某個(gè)空間基下對(duì)譜圖數(shù)據(jù)進(jìn)行稀疏表示,那么特征選取就不再是難點(diǎn),大量的特征將成為算法中可利用的優(yōu)點(diǎn)。應(yīng)用CS理論進(jìn)行識(shí)別分類,可以分為稀疏表示、稀疏重建和樣本歸類3步,最小冗余誤差[17]是常用的一種樣本歸類準(zhǔn)則,它通過(guò)計(jì)算測(cè)試樣本的冗余誤差最小值確定目標(biāo)歸屬類。考慮到不同香型白酒譜圖間差異性較小的特點(diǎn),本文提出一種基于壓縮感知和K近鄰準(zhǔn)則的白酒香型分類方法(CS-KNN),以期為白酒產(chǎn)品的分類鑒別提供新的方法和參考價(jià)值。
壓縮感知問(wèn)題可以化為最小l0范數(shù)問(wèn)題:
其中,Ψ為正交稀疏基矩陣;Φ為觀測(cè)矩陣;x為稀疏向量。解決l0范數(shù)的優(yōu)化問(wèn)題是一個(gè)NP難題,算法復(fù)雜度隨著問(wèn)題規(guī)模的增長(zhǎng)而成指數(shù)增長(zhǎng)。目前解決方案主要有:將最小l0范數(shù)問(wèn)題轉(zhuǎn)化為最小l1范數(shù)問(wèn)題求解[18],或者轉(zhuǎn)求最小l0范數(shù)問(wèn)題的次最優(yōu)解[19-20]。本文分別選擇正交匹配追蹤算法(Orthogonal Matching Pursuit,OMP)、稀疏度自適應(yīng)匹配追蹤算法(Sparsity Adaptive Matching Pursuit, SAMP)、迭代加權(quán)最小二乘算法(Iteratively Reweighted Least Squares,IRLS)以及基追蹤算法(Basis Pursuit,BP)來(lái)求解式(1)。
CS理論表明,滿足約束等距條件(Restricted Isometry Property,RIP)的感知矩陣Θ可以對(duì)稀疏向量進(jìn)行映射并保留信號(hào)特性。用超完備的冗余函數(shù)庫(kù)可以代替基函數(shù),這個(gè)超完備的冗余函數(shù)庫(kù)稱為冗余字典[21]。本文選擇白酒訓(xùn)練樣本集構(gòu)造冗余字典矩陣Ψ,這樣白酒譜圖信號(hào)y在冗余字典下的稀疏表示為x(y=Ψx),只要設(shè)計(jì)滿足RTP約束條件的觀測(cè)矩陣Φ便可對(duì)稀疏向量x進(jìn)行映射處理。已經(jīng)證明當(dāng)觀測(cè)矩陣Φ為高斯隨機(jī)矩陣時(shí),感知矩陣Θ有較大概率滿足RIP條件,因此,本文選擇高斯隨機(jī)矩陣作為觀測(cè)矩陣Φ。
3.1 白酒譜圖CS稀疏求解
給定M類白酒目標(biāo)訓(xùn)練樣本集,記第i類訓(xùn)練集Ei共ni個(gè)樣本,表示為:
其中,vij∈?m×1表示第j個(gè)訓(xùn)練樣本,j=1,2,…,ni,i=1,2,…,M;m為樣本維數(shù);?表示實(shí)數(shù)集。記M類目標(biāo)訓(xùn)練集所有訓(xùn)練樣本為矩陣Ψ,表示為:
其中,Ψ∈?m×n,n=n1+n2+…+ni+…+nM。
設(shè)高斯隨機(jī)測(cè)量矩陣為Φ∈?d×m(d?m),對(duì)白酒測(cè)試樣本y和訓(xùn)練樣本集Ψ進(jìn)行映射處理,獲取擾動(dòng)特征量=Φy和感知矩陣Θ=ΦΨ。分別利用OMP,SAMP,IRLS,BP等算法尋找式(2)的最稀疏解。
上式為白酒信號(hào)特征量在變換域Θ=[θ11,θ12,…,θ1n1,…,θn]下的稀疏表示x。
設(shè)式(2)的最小l0范數(shù)解為x表示為:
則測(cè)試樣本在冗余字典上的稀疏表示為:
如果測(cè)試樣本y屬于第i類,則在理想情況下,x中只有與第i類訓(xùn)練樣本數(shù)據(jù)對(duì)應(yīng)的元素不等于0,其他都為0,但是噪聲、模型誤差以及不同類別樣本間高度相似的影響會(huì)導(dǎo)致x中其他處也會(huì)出現(xiàn)較小的非零值。本文應(yīng)用KNN準(zhǔn)則判別測(cè)試樣本的歸屬類別。
3.2 CS-KNN分類
首先利用CS理論對(duì)白酒TOFMS譜圖進(jìn)行稀疏求解,即對(duì)每一張譜圖求稀疏解得到訓(xùn)練集和測(cè)
(x)表示對(duì)f(x)的估計(jì),當(dāng)a=b時(shí),δ(a,b)= 1;否則δ(a,b)=0。
(3)(x)即是待測(cè)樣本y的類別。
4.1 儀器設(shè)備
實(shí)驗(yàn)使用江蘇省質(zhì)量安全工程研究院與中科院大連化學(xué)物理研究所聯(lián)合設(shè)計(jì)制造的單光子電離-飛行時(shí)間質(zhì)譜儀(SPI-TOFMS),電離源采用的是10.6 eV光子能量的真空紫外燈(VUV),可將電離能小于10.6 eV的樣品電離生成分子離子,譜圖中僅有分子離子峰,碎片峰很少。
4.2 白酒香型識(shí)別
實(shí)驗(yàn)采集3種香型5個(gè)品牌白酒的550張TOFMS譜圖,3種香型白酒譜圖構(gòu)成如下:清香型樣本由50張汾酒譜圖樣本組成,醬香型樣本由不同生產(chǎn)批次的150張茅臺(tái)和50張郎酒譜圖樣本組成,濃香型樣本由不同生產(chǎn)批次的150張瀘州老窖、50張劍南國(guó)寶以及100張不同生產(chǎn)批次的五糧液譜圖樣本組成。白酒樣品的TOFMS譜圖如圖1所示,每張譜圖包含6 250個(gè)數(shù)據(jù)點(diǎn)。
圖1 白酒TOFMS譜圖
由于低頻基線、高頻化學(xué)噪聲、質(zhì)譜儀自身系統(tǒng)誤差以及人為因素導(dǎo)致的樣本間測(cè)量差異等影響,實(shí)驗(yàn)采集得到的白酒譜圖混合了真實(shí)信號(hào)和噪聲,因此需要對(duì)譜圖數(shù)據(jù)進(jìn)行預(yù)處理。本文利用小波軟閾值法去噪,運(yùn)用數(shù)據(jù)約簡(jiǎn)減少譜圖中顯著性譜峰的數(shù)量,將譜圖數(shù)據(jù)標(biāo)準(zhǔn)化以增強(qiáng)不同譜圖間的可比性。通過(guò)優(yōu)化選擇合適的小波基函數(shù)和閾值選擇方法能有效地提高算法的識(shí)別效果。圖2顯示的是茅臺(tái)酒TOFMS譜圖去噪前后信號(hào)對(duì)比。
圖2 茅臺(tái)酒去噪前后TOFMS
選擇其中80%的譜圖(共440張)組成訓(xùn)練樣本集,20%組成測(cè)試樣本集,采用交叉驗(yàn)證的方法估計(jì)CS-KNN算法的分類性能。分別運(yùn)用OMP, SAMP,IRLS以及BP算法解最小l0范數(shù)。圖3顯示的是運(yùn)用SAMP算法求得的濃香型白酒樣本在冗余字典下的稀疏表示。冗余字典由440張訓(xùn)練樣本組成,圖中橫軸樣本序列第1列~第40列為清香型白酒,第41列~第200列為醬香型白酒,第201列~第440列為濃香型白酒。可以看出,濃香型測(cè)試樣本在冗余字典第201列~第440列上具有明顯的稀疏表示系數(shù)。
圖3 測(cè)試樣本(濃香型)稀疏解
在理想情況下,圖3訓(xùn)練樣本序列第1列~第200列的稀疏解為0,但由于噪聲、誤差以及不同香型間譜圖的相似性影響使得這些序列也存在非零值。本文分別運(yùn)用OMP,SAMP,IRLS以及BP算法解最小l0范數(shù),然后分別根據(jù)最小冗余誤差方法和KNN算法對(duì)測(cè)試樣本的稀疏表示按香型進(jìn)行識(shí)別分類,實(shí)驗(yàn)中d取32,K取3。
誤差最小的i對(duì)應(yīng)的類別即為測(cè)試樣本y的類別標(biāo)簽。實(shí)驗(yàn)結(jié)果如表1所示。
表1 根據(jù)最小冗余誤差和KNN的分類結(jié)果比較
最小冗余誤差方法通過(guò)比較不同類別間誤差的大小進(jìn)行分類,KNN方法則利用了不同樣本間的關(guān)系,這對(duì)于高度相似的白酒TOFMS譜圖而言,減少了類別特征選擇不當(dāng)對(duì)分類結(jié)果的影響,表1顯示, 4種算法結(jié)合KNN進(jìn)行分類的準(zhǔn)確率要優(yōu)于根據(jù)最小冗余誤差分類的結(jié)果,其中,SAMP算法結(jié)合KNN進(jìn)行分類的準(zhǔn)確率能達(dá)到91.21%。
IRLS和BP算法屬于2種凸優(yōu)化算法,其特點(diǎn)是需要較少的測(cè)量值就能以很高的概率恢復(fù)原信號(hào),但缺點(diǎn)是計(jì)算復(fù)雜度較高O(N3);OMP和SAMP算法屬于2種貪婪算法,OMP算法繼承了匹配追蹤算法中的原子尋優(yōu)原則,但在殘差更新中對(duì)已選原子集合進(jìn)行施密特正交化以保證迭代的最最優(yōu)性,其復(fù)雜度約為O(Kdm)。當(dāng)步長(zhǎng)為1時(shí), SAMP算法可視為一個(gè)帶有支撐集更新功能的OMP算法,SAMP算法計(jì)算復(fù)雜度要高于OMP算法,隨固定步長(zhǎng)的不同而不同。表1中2種凸優(yōu)化算法的運(yùn)算時(shí)間均高于2種貪婪算法的運(yùn)算時(shí)間,并且因?yàn)镵NN分類需要計(jì)算測(cè)試樣本與每一個(gè)訓(xùn)練樣本的距離,而最小冗余誤差分類只需計(jì)算類別間的誤差即可,所以從表1中也可以看出,每種算法按照KNN準(zhǔn)則分類的時(shí)間都比按最小冗余誤差準(zhǔn)則分類的時(shí)間長(zhǎng)。
由于測(cè)量矩陣Φ是隨機(jī)生成的,因此識(shí)別率和測(cè)量矩陣有關(guān),從而需要進(jìn)一步對(duì)算法的穩(wěn)定性進(jìn)行實(shí)驗(yàn)。圖4為4種重構(gòu)算法分別進(jìn)行100次重復(fù)實(shí)驗(yàn)得到的結(jié)果,表2為重復(fù)實(shí)驗(yàn)分類準(zhǔn)確率均值(mean)及方差(var)的比較。
圖4 重復(fù)實(shí)驗(yàn)結(jié)果
表2 重復(fù)實(shí)驗(yàn)分類準(zhǔn)確率均值及方差比較
從識(shí)別率均值以及波動(dòng)情況來(lái)看,運(yùn)用SAMP算法得到的稀疏解對(duì)白酒譜圖進(jìn)行香型識(shí)別分類的準(zhǔn)確率以及穩(wěn)定性要優(yōu)于其他3種重構(gòu)算法。
表3為不同高斯隨機(jī)矩陣維數(shù)d對(duì)CS-KNN (SAMP)分類的準(zhǔn)確率和運(yùn)行時(shí)間等指標(biāo)的統(tǒng)計(jì)結(jié)果,表中維數(shù)d取值為2j(j=1,2,…,8)。
表3 高斯隨機(jī)矩陣維數(shù)d對(duì)分類結(jié)果的影響
由實(shí)驗(yàn)結(jié)果可知,在不同的映射維數(shù)下,除了256維的情況外,KNN分類時(shí)間均要大于最小冗余誤差分類時(shí)間,且映射維數(shù)d取值越大,分類時(shí)間(主要是l1范數(shù)優(yōu)化求解)也越長(zhǎng)。2種判別準(zhǔn)則在高斯隨機(jī)矩陣32維左右時(shí)均能獲得對(duì)白酒香型識(shí)別的最佳效果。當(dāng)d=2時(shí),CS-KNN分類準(zhǔn)確率為69.82%,隨著維數(shù)d的增大分類準(zhǔn)確率逐漸增高,當(dāng)d=32(25)時(shí),CS-KNN分類準(zhǔn)確率約為91.45%,而當(dāng)維數(shù)大于32維,算法準(zhǔn)確率開始降低。
目前對(duì)白酒香型研究采用的方法有主成分分析、判別函數(shù)、KNN、決策樹模型、AdaBoost算法等。LDF和QDF為以高斯分布為假設(shè)的參數(shù)分類器, CART方法是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)方法,KNN是一種將盲樣決策到其K近鄰中出現(xiàn)頻率最高的模式類別的非參數(shù)方法。通過(guò)這些方法對(duì)儀器檢出白酒譜圖進(jìn)行分析,一定程度上克服了傳統(tǒng)的白酒香型鑒定方法不夠科學(xué)規(guī)范、難適應(yīng)于綜合宏觀的整體評(píng)價(jià)等缺陷。為了對(duì)比本文提出的CS-KNN方法,這里選擇線性判別函數(shù)(LDF)、二次判別函數(shù)(QDF)、決策樹ID3(CART)、K近鄰分類(KNN)等4種分類器對(duì)白酒TOFMS譜圖進(jìn)行香型分類,結(jié)果比較如表4所示。
表4 識(shí)別結(jié)果比較
可以看出,CART(ID3)使用信息增益方法作為屬性選擇標(biāo)準(zhǔn),能獲得89.73%的識(shí)別率,但由于該方法需要頻繁地將白酒TOFMS訓(xùn)練數(shù)據(jù)在主存和高速緩存中換進(jìn)換出,從而使得算法的時(shí)間開銷大。利用PCA降維然后使用判別函數(shù)進(jìn)行處理,雖然獲取分類結(jié)果較快,但識(shí)別率有待提高。KNN屬于一種懶惰的非參數(shù)方法,直接利用KNN算法進(jìn)行分類,精度較低。應(yīng)用本文方法,選擇恰當(dāng)?shù)淖钚0范數(shù)解法以及合適的維數(shù)d能獲得優(yōu)于其他方法的分類效果。
本文提出利用CS方法對(duì)白酒TOFMS譜圖進(jìn)行整體分析,運(yùn)用訓(xùn)練數(shù)據(jù)構(gòu)造冗余字典作為稀疏基,高斯隨機(jī)矩陣為測(cè)量矩陣,以此獲得反映白酒香型特征的稀疏表示,進(jìn)而根據(jù)K近鄰法進(jìn)行分類識(shí)別。本文首先對(duì)白酒香型運(yùn)用4種不同重構(gòu)算法結(jié)合最小冗余誤差和K近鄰法分別進(jìn)行分類,其次考察高斯隨機(jī)矩陣維數(shù)d對(duì)分類結(jié)果的影響。實(shí)驗(yàn)結(jié)果表明,與最小冗余誤差方法相比,基于壓縮感知的白酒香型識(shí)別方法能得到較高的識(shí)別率,但計(jì)算時(shí)間較長(zhǎng)。相較于OMP,SAMP,IRLS算法,SAMP算法能獲得更高的識(shí)別效果。
本文研究是對(duì)現(xiàn)有白酒香型分類方法的有益補(bǔ)充,也是這種方法在白酒分類領(lǐng)域的新應(yīng)用,實(shí)驗(yàn)結(jié)果表明,該方法對(duì)白酒香型進(jìn)行分類是可行的,能避免特征選取的問(wèn)題。但如何設(shè)計(jì)最佳的測(cè)量矩陣,并提高求解最優(yōu)化問(wèn)題的計(jì)算效率還有待進(jìn)一步研究。
[1]徐成勇,郭 波,周 蓮,等.白酒香味成分研究進(jìn)展[J].釀酒科技,2002,(3):38-40.
[2]張永生,魏新軍,韓偉元,等.白酒中微量成分的氣相色譜-質(zhì)譜分析與鑒定[J].釀酒科技,2011,(3):101-103.
[3]陳 華,郁志勇.中國(guó)白酒香型的化學(xué)模式識(shí)別(Ⅰ):主成分分析和因子分析[J].食品科學(xué),2000,21(7): 42-47.
[4]霍丹群,張苗苗,侯長(zhǎng)軍,等.基于主成分分析和判別分析的白酒品牌鑒別方法[J].農(nóng)業(yè)工程學(xué)報(bào),2011, 27(14):297-301.
[5]姜 安,彭江濤,彭思龍,等.酒香型光譜分析和模式識(shí)別計(jì)算分析[J].光譜學(xué)與光譜分析,2010,30(4): 920-923.
[6]陳 華,郁志勇.中國(guó)白酒香型的化學(xué)模式識(shí)別(Ⅱ):聚類分析[J].食品科學(xué),2000,21(8):37-41.
[7]姜 安,彭江濤,彭思龍,等.基于SVM的白酒紅外光譜分析方法研究[J].計(jì)算機(jī)與應(yīng)用化學(xué),2010, 27(2):233-236.
[8]萬(wàn)益群,潘鳳琴,譚 婷.化學(xué)計(jì)量學(xué)用于解析江西白酒的高效液相色譜指紋圖譜[J].食品科學(xué),2009, (4):239-242.
[9]霍丹群,尹猛猛,侯長(zhǎng)軍,等.可視化陣列傳感器技術(shù)鑒別不同香型白酒[J].分析化學(xué),2011,39(4): 516-520.[10]Donoho D L.Compressed Sensing[J].IEEE Transactions on Information Theory,2006,52(4):1289-1306.
[11]Candès E J.Compressive Sampling[C]//Proceedings of ICM’06.[S.l.]:American Mathematical Society, 2006:1433-1452.
[12]Zhu Ningbo,LiShengtao.AKernel-basedSparse Representation Method for Face Recognition[J].Neural Computing and Applications,2012,24(3/4):845-852.
[13]魏冬梅,周衛(wèi)東.采用壓縮感知的人臉識(shí)別算法[J].計(jì)算機(jī)工程,2011,37(18):10-11,15.
[14]Abdulghani A M,Casson A J,Rodriguez-Villegas E.Compressive Sensing Scalp EEG Signals:Implementations and Practical Performance[J].Medical&Biological Engineering&Computing,2012,50(11):1137-1145.
[15]Mohtashemi M,Walburger D K,Peterson M W,et al.Open-target Sparse Sensing of Biological Agents Using DNA Microarray[J].BMCBioinformatics,2011, 12(1):314.
[16]Griffin A,Hirvonen T,Tzagkarakis C,et al.Singlechannel and Multi-channel Sinusoidal Audio Coding Using Compressed Sensing[J].IEEE Transactions on Audio,Speech,and Language Processing,2011,19(5): 1382-1395.
[17]沈 躍,劉國(guó)海,劉 慧.隨機(jī)降維映射稀疏表示的電能質(zhì)量擾動(dòng)多分類研究[J].儀器儀表學(xué)報(bào),2011, 32(6):1371-1376.
[18]Chen S S,DonohoDL,SaundersMA.Atomic Decomposition by Basis Pursuit[J].SIAM Journal on Scientific Computing,1998,20(1):33-61.
[19]Tropp J A,Gilbert A C.Signal Recovery from Random Measurements via Orthogonal Matching Pursuit[J].IEEE Transactions on Information Theory,2007,53(12): 4655-4666.
[20]Needell D,TroppJA.CoSaMP:IterativeSignal Recovery from Incomplete and Inaccurate Samples[J].Applied and Computational Harmonic Analysis,2009, 26(3):301-321.
[21]Du Xiaojiang,Xiao Yang,Dai Fei.Increasing Network Lifetime by Balancing Node Energy Consumption in Heterogeneous SensorNetworks[J].WirelessCommunications and Mobile Computing,2008,8(1):125-136.
編輯 金胡考
Liquor Aroma Classification Based on Compressive Sensing
WANG Haiyan1,2,WANG Hu1,WANG Guoxiang1,LIU Jun1,2
(1.School of Management Science and Engineering,Nanjing University of Finance and Economices,Nanjing 210046,China;
2.Jiangsu Province Institute of Quality and Safety Engineering,Nangjing 210046,China)
Most present liquor classification methods need feature selection,but the feature selection algorithm will increase the computational complexity and limit the number of the characteristics.The selection result directly affects the recognition results.Therefore,this paper applies the Compressive Sensing(CS)theory into holistic analysis for Time-offlight Mass Spectrometry(TOFMS)of liquor.Using the training data to form the over complete dictionary and taking it as a sparse matrix,the Gaussian random matrix builds the measurement matrix.By calculating the minimuml1norm solution,it obtains the sparse representation of the liquor aroma,then realizes liquor aroma recognition based on the KNearest Neighbor(KNN)algorithm.Combining four reconstruction algorithms with minimum residual error and KNN classify liquor aroma,experimental results show that it is feasible to use CS for classification of liquor aroma,and it can avoid the problem of feature selection.Using Sparsity Adaptive Matching Pursuit(SAMP)to solvel1norm and recognition with KNN has a accuracy rate about 91.45%and better stability.
Compressive Sensing(CS);Time-of-flight Mass Spectrometry(TOFMS);sparse representation;liquor aroma;K-Nearest Neighbor(KNN)algorithm;minimum residual error
王海燕,王 虎,王國(guó)祥,等.基于壓縮感知的白酒香型分類[J].計(jì)算機(jī)工程,2015,41(3):172-176,181.
英文引用格式:Wang Haiyan,Wang Hu,Wang Guoxiang,et al.Liquor Aroma Classification Based on Compressive Sensing[J].Computer Engineering,2015,41(3):172-176,181.
1000-3428(2015)03-0172-05
:A
:TP18
10.3969/j.issn.1000-3428.2015.03.033
國(guó)家自然科學(xué)基金資助項(xiàng)目(61373058);國(guó)家自然科學(xué)基金資助面上項(xiàng)目(71373117);國(guó)家重大科學(xué)儀器設(shè)備開發(fā)專項(xiàng)基金資助項(xiàng)目(2013YQ090703);國(guó)家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局應(yīng)急基金資助項(xiàng)目(2012104009);質(zhì)檢公益專項(xiàng)基金資助項(xiàng)目(201410173)。
王海燕(1968-),女,教授、博士,主研方向:模式識(shí)別,食品安全工程;王 虎、王國(guó)祥,碩士研究生;劉 軍,副教授。
2014-03-20
:2014-04-26E-mail:njue2010@163.com