王 雨, 邢建國(guó), 傅 均, 錢(qián) 曙
(浙江工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,浙江 杭州 310018)
啤酒風(fēng)味成分復(fù)雜,其檢測(cè)方法主要有感官品評(píng)法和理化指標(biāo)檢測(cè)法[1]。前者依靠感官主觀評(píng)判,比如香氣和口味的檢測(cè)標(biāo)準(zhǔn)為有無(wú)明顯的麥芽香氣和口味是否純正,容易受到外界干擾和個(gè)體差異的影響;后者準(zhǔn)確度高,但所需檢測(cè)時(shí)間長(zhǎng)、花費(fèi)成本高。電子鼻技術(shù)具有簡(jiǎn)單易用、價(jià)格低廉、準(zhǔn)確率高等優(yōu)點(diǎn),但與生物嗅覺(jué)相比,由于氣敏傳感器的物理特性和數(shù)量的限制,電子鼻存在區(qū)分度低、檢測(cè)時(shí)間長(zhǎng)等問(wèn)題。使用較少的傳感器陣列導(dǎo)致電子鼻的區(qū)分度降低,無(wú)法對(duì)具有高相似度的氣體進(jìn)行有效區(qū)分,限制了電子鼻的應(yīng)用范圍[1~5]。
本文提出一種基于進(jìn)氣流速調(diào)制的電子鼻系統(tǒng),通過(guò)動(dòng)態(tài)改變進(jìn)氣流速替代固定進(jìn)氣流速來(lái)調(diào)節(jié)采樣氣腔中氣體分子的分布,以不同進(jìn)氣流速時(shí)對(duì)應(yīng)的區(qū)間梯度作為特征向量,采用改進(jìn)的自適應(yīng)主成分分析(principal component analysis,PCA)算法進(jìn)行分類。將該系統(tǒng)用于啤酒風(fēng)味的檢測(cè),比較了自適應(yīng)PCA(adaptive PCA,AD—PCA)、支持向量機(jī)(support vector machine,SVM)、高斯混合模型(Gauss mixture model,GMM)幾種分類算法,以驗(yàn)證本文系統(tǒng)的有效性。
系統(tǒng)包括采樣閥、氣體傳感陣列、氣腔、流量計(jì)、流速選擇閥、排氣泵、執(zhí)行單元、數(shù)據(jù)采集單元、數(shù)據(jù)處理單元和計(jì)算機(jī)。如圖1所示,傳感器陣列采用10只金屬氧化物半導(dǎo)體(metal oxide semiconductor,MOS)型氣敏傳感器。流速選擇閥用于選擇進(jìn)氣流速(100,200,300,500 mL/min),能夠?qū)崿F(xiàn)根據(jù)指令自動(dòng)切換進(jìn)氣流速。執(zhí)行單元用于控制采樣閥、流速選擇閥和排廢泵。傳感器數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)采集單元傳輸?shù)綌?shù)據(jù)處理單元,通過(guò)STM32F407的UART-to-USB直接發(fā)送到計(jì)算機(jī),進(jìn)行數(shù)據(jù)處理和分析。
圖1 系統(tǒng)結(jié)構(gòu)框圖
常用的分類算法所需采樣和排廢時(shí)間很長(zhǎng),前后兩次測(cè)量間隔較大。為了提高檢測(cè)速度,本文從信號(hào)的動(dòng)態(tài)響應(yīng)特性提取動(dòng)態(tài)特征,使用不同調(diào)制流速對(duì)應(yīng)的區(qū)間梯度作為特征向量,并采用改進(jìn)的AD—PCA算法進(jìn)行分類。
實(shí)驗(yàn)材料選擇為2017年2月份生產(chǎn)的5種罐裝啤酒,采購(gòu)自當(dāng)?shù)爻?。分別為純生啤酒、嶗山啤酒、青島淡爽型啤酒、青島清爽型啤酒和山水啤酒,原麥汁濃度均為8°P(8 %),酒精度均為≥3.1 %VOL。
5種啤酒各取100 mL,分別置于250 mL錐形瓶中,密封靜置1 h使瓶中達(dá)到飽和狀態(tài),傳感器預(yù)熱1 h。檢測(cè)時(shí),先抽取潔凈空氣60 s,待傳感器輸出穩(wěn)定后,依次以100,200,300,500 mL/min的進(jìn)氣流速進(jìn)行測(cè)試,每種進(jìn)氣流速持續(xù)時(shí)間為20 s,之后自動(dòng)切換到下一個(gè)進(jìn)氣流速,總檢測(cè)時(shí)間為80 s。檢測(cè)結(jié)束后,進(jìn)行2.5 min的排廢,直至傳感器響應(yīng)恢復(fù)基線再進(jìn)行下一次的檢測(cè)。每個(gè)樣本測(cè)25次。
本實(shí)驗(yàn)的電子鼻系統(tǒng)采用的氣敏傳感器如表1[7,8]。
圖2所示曲線為上述傳感器陣列對(duì)純生啤酒的原始響應(yīng)信號(hào),可以看出在20,40,60 s時(shí),會(huì)進(jìn)行進(jìn)氣流速的切換,曲線會(huì)有一個(gè)很明顯的斜率上的變化,響應(yīng)曲線不同于其他進(jìn)氣流速單一的電子鼻。總的測(cè)試時(shí)間為80 s并使用非穩(wěn)態(tài)值進(jìn)行特征提取和分類識(shí)別。本實(shí)驗(yàn)使用的特征向量為每一個(gè)傳感器曲線的第1,20,40,60,80 s時(shí)的動(dòng)態(tài)信號(hào)的區(qū)間梯度值。
表1 實(shí)驗(yàn)所用氣體傳感器
圖2 純生啤酒原始傳感器信號(hào)
圖3為5種啤酒的在4種流速下的PCA三維散點(diǎn)圖,其中圖3(b)~圖3(d)的特征向量分別包含前述流速下的特征向量,最大前3個(gè)主成分貢獻(xiàn)率累積分別為88.7628 %,93.872 4 %,90.637 6 %,89.047 1 %,說(shuō)明采用三維散點(diǎn)圖足以展示這些樣本。
圖3 4種流速下的PCA三維散點(diǎn)圖
可以看出,流速為100 mL/min時(shí),無(wú)法區(qū)分出樣本種類。流速為200 mL/min時(shí),相對(duì)于其他種類的啤酒純生啤酒區(qū)分度比較好,雖然其他種類的啤酒大體上有交集,但也可以很好區(qū)分開(kāi)。流速為300 mL/min時(shí),各樣本已經(jīng)可以很明顯區(qū)分。相同種類啤酒分布比較集中,不同種類的啤酒分布則有一定的距離,但也會(huì)有一些樣本偏離樣本中心,與其他樣本出現(xiàn)交集。如山水啤酒和青島清爽型啤酒之間會(huì)有交集,有可能是實(shí)驗(yàn)操作的原因造成的誤差。流速為500 mL/min時(shí),區(qū)分效果比之前更好一點(diǎn)??傮w上,不同流速的區(qū)間梯度值(即差值)組成的特征向量,同一種類啤酒對(duì)應(yīng)的PCA主成分分布均不完全相同,個(gè)別差別較大。因此,選擇最適合的流速有助于啤酒品種分類。
由表2可以看出,v1(100 mL/min)時(shí),各個(gè)種類的分類正確率比較差。進(jìn)行切換到v2(200 mL/min,其特征向量包含v1的特征向量,下同)后,可以很明顯看到分類正確率有了較大的提高。尤其是青島淡爽型啤酒和山水啤酒提升的最為明顯。在之后v3(300 mL/min)和v4(500 mL/min)可以看出,青島淡爽型啤酒、青島清爽型啤酒、山水啤酒v2(200 mL/min)時(shí)就已經(jīng)達(dá)到最大的分類正確率。而嶗山啤酒、純生啤酒的分類正確率還是會(huì)有小幅度的提升。
表2 AD—PCA分類正確率 %
SVM分類正確率測(cè)試中,每種啤酒的樣本總數(shù)為25個(gè),其中的15個(gè)作為訓(xùn)練集,余下的10個(gè)作為測(cè)試集。訓(xùn)練集總數(shù)為125個(gè),編號(hào)1~125;測(cè)試集總數(shù)為50個(gè),編號(hào)1~50,其中1~10為純生啤酒,11~20為嶗山啤酒,21~30為青島淡爽型啤酒,31~40為青島清爽型啤酒,41~50為山水啤酒。使用的特征矩陣為4次流速下對(duì)應(yīng)的梯度值。
采用GMM算法分類正確率測(cè)試中,使用的特征矩陣為4次流速下對(duì)應(yīng)的差值。數(shù)據(jù)為125×40,5種啤酒種類,每種有25個(gè)樣本。將其中20個(gè)分為訓(xùn)練樣本,剩下5個(gè)為測(cè)試樣本。組成的訓(xùn)練集有100×40,測(cè)試集有25×5。由于特征矩陣為差值,導(dǎo)致數(shù)據(jù)值比較小,根據(jù)模型生成的數(shù)據(jù)會(huì)出現(xiàn)負(fù)值,因此將特征數(shù)據(jù)乘以10。訓(xùn)練集中1~20為純生啤酒,21~40為嶗山啤酒,41~60為青島淡爽型啤酒,61~80為青島清爽型啤酒,81~100為山水啤酒。測(cè)試集中1~5為純生啤酒,6~10為嶗山啤酒,11~15為青島淡爽型啤酒,16~20為青島清爽型啤酒,21~25為山水啤酒。
表3為3種算法的分類正確率對(duì)比。
表3 3種算法的分類正確率 %
本文設(shè)計(jì)了一種基于流速調(diào)制的電子鼻系統(tǒng),應(yīng)用于啤酒分類系統(tǒng)中,證明此系統(tǒng)可以有效縮短電子鼻識(shí)別的時(shí)間,提高分類準(zhǔn)確率。