奉 軻,花中秋,2,伍萍輝,2*,李 彥,曾 艷,王天賜,邱志磊
(1.河北工業(yè)大學(xué)電子信息工程學(xué)院,天津 300401;2.天津市電子材料與器件重點(diǎn)實(shí)驗(yàn)室,天津 300401)
近年來(lái),研究表明糖尿病患者所呼出氣體中的丙酮含量較正常人明顯偏高,健康人群呼氣中的丙酮含量為0.3×10-6~0.8×10-6,而糖尿病患者呼氣中的丙酮含量高于1.7×10-6,部分患者高達(dá)12×10-6[1-3]。將人體呼氣中的丙酮含量作為糖尿病標(biāo)志物,為實(shí)現(xiàn)無(wú)創(chuàng)糖尿病診斷提供可能。人體呼氣中含有多種化合物成分,包括水蒸氣、二氧化碳、氮?dú)獾?。單一氣體傳感器對(duì)人體呼氣中的丙酮含量的檢測(cè)結(jié)果一般不準(zhǔn)確;而氣相色譜分析法雖然能夠勝任這樣的檢測(cè),但是由于其造價(jià)昂貴且不適合即時(shí)檢測(cè),不利于無(wú)創(chuàng)糖尿病診斷技術(shù)的推廣和應(yīng)用。而由多個(gè)具有交叉靈敏特性的氣體傳感器組成的傳感器陣列并結(jié)合模式識(shí)別算法形成的人工嗅覺(jué)系統(tǒng)“電子鼻”可以對(duì)復(fù)雜氣體中含有的氣體成分進(jìn)行定性或定量分析識(shí)別。同時(shí),電子鼻也具有造價(jià)低廉,體積小、功耗低等特點(diǎn),可實(shí)現(xiàn)便攜式設(shè)計(jì)。
目前,電子鼻已經(jīng)在食品、農(nóng)產(chǎn)品檢測(cè)、醫(yī)療領(lǐng)域得到廣泛運(yùn)用[4-13]。鄒小波[14]、潘天紅[15]等采用電子鼻進(jìn)行谷物霉變檢測(cè),識(shí)別正確率分別為90%、92%。俞守華[16]采用電子鼻進(jìn)行有害氣體NH3和H2S識(shí)別檢測(cè),識(shí)別正確率為91%。該文通過(guò)設(shè)計(jì)一個(gè)基于金屬氧化物半導(dǎo)體氣體傳感器與BP神經(jīng)網(wǎng)絡(luò)模式識(shí)別算法的專用電子鼻,用于痕量丙酮?dú)怏w的識(shí)別。由于收集糖尿病患者呼出的氣體較為困難,且儲(chǔ)存樣本氣體不方便,不利用前期算法設(shè)計(jì)與實(shí)驗(yàn)的開展,所以實(shí)驗(yàn)中將通過(guò)多個(gè)MFC模擬配制出糖尿病患者呼氣中含有的痕量丙酮樣本與另兩種干擾氣體樣本進(jìn)行動(dòng)態(tài)測(cè)試采樣。相對(duì)于靜態(tài)測(cè)試采樣,動(dòng)態(tài)測(cè)試中的氣體濃度更接近于實(shí)際氣體濃度,減少了靜態(tài)測(cè)試中手動(dòng)配氣帶來(lái)的實(shí)驗(yàn)誤差;同時(shí)動(dòng)態(tài)測(cè)試能提取氣體瞬態(tài)響應(yīng)過(guò)程中更多有用的信息量。建立BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行識(shí)別分析,并通過(guò)PCA+BP算法相結(jié)合,壓縮了特征矩陣中的特征量,降低BP神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度,提高了算法的收斂速度,從而實(shí)現(xiàn)痕量丙酮?dú)怏w的準(zhǔn)確識(shí)別,為后期電子鼻實(shí)現(xiàn)無(wú)創(chuàng)糖尿病檢測(cè)應(yīng)用提供了參考。
圖1 電子鼻系統(tǒng)框圖
電子鼻系統(tǒng)由采樣模塊、數(shù)據(jù)采集模塊、模式識(shí)別分析模塊組成,其結(jié)構(gòu)如圖1所示。采樣模塊由采樣氣室、不同敏感材料制備的氣體傳感器陣列和傳感器供電模塊組成,其中采樣氣室為電子鼻識(shí)別氣體提供一個(gè)相對(duì)穩(wěn)定的測(cè)試環(huán)境。數(shù)據(jù)采集模塊包括調(diào)理電路、數(shù)據(jù)采集卡和上位機(jī)采集界面。數(shù)據(jù)采集模塊可采集傳感器陣列中多個(gè)傳感器的電壓值隨時(shí)間變化的信息Vn(t)。上位機(jī)采集界面通過(guò)USB通訊控制采集卡,并對(duì)采集的信號(hào)數(shù)據(jù)進(jìn)行預(yù)處理。模式識(shí)別模塊基于MATLAB R2014a軟件平臺(tái)進(jìn)行特征提取與算法模型建立,通過(guò)C#與MATLAB混合編程[17-18],實(shí)現(xiàn)采集樣本數(shù)據(jù)與模式識(shí)別分析的自動(dòng)化與一體化。
實(shí)驗(yàn)中,假設(shè)糖尿病患者呼出氣體由空氣(氮?dú)?、氧氣、二氧化碳、水蒸?和稀有氣體(丙酮)混合而成。為配制模擬糖尿病患者呼出氣體樣本,通過(guò)3個(gè)MFC(氣體流量控制器)將純凈空氣與丙酮?dú)怏w按一定比例混合,配制出含有30×10-6丙酮的氣體作為糖尿病患者的模擬呼氣樣本,同時(shí)配制出另兩種干擾氣體樣本(30×10-6乙醇樣本、15×10-6丙酮與15×10-6乙醇混合樣本)。通過(guò)動(dòng)態(tài)測(cè)試的方法,采集記錄在一個(gè)樣本時(shí)長(zhǎng)(包括先通入目標(biāo)氣體120 s,再通入純凈空氣對(duì)氣室進(jìn)行清洗600 s)內(nèi)的各個(gè)傳感器輸出的電壓值隨時(shí)間變化的數(shù)據(jù)。采集頻率為1 Hz,在720 s的檢測(cè)時(shí)間內(nèi),10個(gè)傳感器采集得到的數(shù)據(jù)可組成一個(gè)10×720的觀測(cè)信號(hào)矩陣X。對(duì)矩陣X的原始數(shù)據(jù)進(jìn)行特征提取,得到樣本氣體的特征子集。通過(guò)自主設(shè)計(jì)的電子鼻系統(tǒng)分別對(duì)這3種目標(biāo)氣體進(jìn)行多次采集,得到訓(xùn)練樣本。以BP神經(jīng)網(wǎng)絡(luò)算法建立識(shí)別模型,并與PCA+BP神經(jīng)網(wǎng)絡(luò)算法相結(jié)合,壓縮特征矩陣中的特征量,降低BP神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度,提高算法的收斂速度,最終實(shí)現(xiàn)痕量丙酮?dú)怏w的準(zhǔn)確識(shí)別。
該電子鼻系統(tǒng)選取對(duì)低濃度氣體具有較高靈敏度的多種商用傳感器(包括5種費(fèi)加羅:TGS2620、TGS2600、TGS822、TGS2602、TGS826,4種煒盛:MQ9、MQ7、MQ135、MQ3以及MS1100)構(gòu)成傳感器陣列,且傳感器之間具有不同敏感特性。傳感器型號(hào)與敏感特性如表1所示。氣體傳感器放置在一個(gè)容積為100 mL的氣室中,通入氣室樣本氣體流速為100 mL/min。較小的容積使目標(biāo)氣體在動(dòng)態(tài)測(cè)試過(guò)程能迅速充滿氣室;而較低的氣體流速讓整個(gè)測(cè)試環(huán)境相對(duì)穩(wěn)定,減少氣流對(duì)傳感器響應(yīng)造成的波動(dòng)影響。陣列中傳感器與目標(biāo)氣體接觸后,由數(shù)據(jù)采集系統(tǒng)采集各個(gè)傳感器信號(hào)。傳感器陣列實(shí)物如圖2所示。
圖2 傳感器陣列實(shí)物圖
表1 傳感器與敏感特性
2.2.1 數(shù)據(jù)采集和數(shù)據(jù)預(yù)處理
采用16通道12 bit精度采集卡對(duì)傳感器陣列中10路獨(dú)立電壓信號(hào)進(jìn)行采集,采集卡每個(gè)通道的采集速率為20次/s。為了減少外界環(huán)境對(duì)采集信號(hào)的影響,對(duì)采集的電壓信號(hào)V0進(jìn)行預(yù)處理。每秒從20個(gè)樣點(diǎn)中隨機(jī)抽取8個(gè)點(diǎn)作為有效數(shù)據(jù),并通過(guò)式(1)對(duì)電壓數(shù)據(jù)進(jìn)行處理,得到第n秒匹配電阻的電壓值V0。
(1)
2.2.2 特征量的提取
該電子鼻系統(tǒng)中含有10個(gè)氣體傳感器,采集生成10個(gè)電壓隨時(shí)間變化的信息V1(t)、V2(t)…V10(t)。測(cè)試樣本采用的是動(dòng)態(tài)測(cè)試方法,整個(gè)過(guò)程包含樣本氣體與敏感層材料吸附、解吸附和恢復(fù)3個(gè)階段,所以應(yīng)提取包含整個(gè)瞬態(tài)響應(yīng)過(guò)程特征的參數(shù)作為特征量。該識(shí)別模型將傳感器的相對(duì)最大響應(yīng)Vmax、吸附階段1 min時(shí)相對(duì)響應(yīng)Va、解吸附階段1 min時(shí)相對(duì)響應(yīng)Vb、整個(gè)過(guò)程相對(duì)響應(yīng)的積分值Vint4個(gè)特征量作為一個(gè)傳感器的特征子集,則10個(gè)傳感器組成包含40個(gè)特征量的特征矩陣。相對(duì)響應(yīng)V由傳感器在目標(biāo)氣體中的響應(yīng)值與基線值求出,如式(2)所示:
V=Vs-V0
(2)
式中:Vs是傳感器響應(yīng)信號(hào),V0作為基線值,是吸附階段開始時(shí)傳感器在純凈空氣中響應(yīng)信號(hào)。
傳感器相對(duì)最大響應(yīng)Vmax:
Vmax=max|V|
(3)
吸附階段1 min時(shí)相對(duì)響應(yīng)Va:
Va=Vs1-V0
(4)
式中:Vs1是吸附階段通入目標(biāo)氣體1 min時(shí)傳感器響應(yīng)信號(hào)。
解吸附階段1 min時(shí)相對(duì)響應(yīng)Vb:
(5)
整個(gè)過(guò)程相對(duì)響應(yīng)的積分值Vint:
(6)
為了給模式識(shí)別算法空間準(zhǔn)備合適的數(shù)據(jù),需要對(duì)特征矩陣中的元素進(jìn)行歸一化處理,使每個(gè)元素處于相同數(shù)量級(jí)。將特征矩陣中的元素映射到[0,1]區(qū)間,如式(7)所示:
(7)
式中:x為特征矩陣中一個(gè)元素,xmin為特征矩陣中最小值,xmax為特征矩陣中的最大值,y為該元素歸一化后的結(jié)果。
該電子鼻的軟件設(shè)計(jì)在C#集成開發(fā)環(huán)境下完成,在C#編寫的界面中調(diào)用MATLAB,實(shí)現(xiàn)C#與MATLAB混合編程。通過(guò)編程實(shí)現(xiàn)控制采集數(shù)據(jù),獲取傳感器陣列中各個(gè)傳感器的電壓信號(hào),并將數(shù)據(jù)存入文本文件;同時(shí)對(duì)原始數(shù)據(jù)進(jìn)行特征提取、歸一化處理等,再對(duì)3種測(cè)試樣本進(jìn)行學(xué)習(xí)訓(xùn)練,從而建立算法模型,最終實(shí)現(xiàn)對(duì)目標(biāo)氣體的分析與識(shí)別。軟件設(shè)計(jì)流程圖如圖3所示。
圖3 軟件設(shè)計(jì)流程圖
該電子鼻系統(tǒng)利用BP誤差反向傳播算法對(duì)采集的數(shù)據(jù)進(jìn)行分析。BP網(wǎng)絡(luò)通過(guò)學(xué)習(xí)和存儲(chǔ)訓(xùn)練樣本的輸入與輸出映射關(guān)系,通過(guò)誤差反向傳播對(duì)網(wǎng)絡(luò)的權(quán)值和偏差進(jìn)行反復(fù)調(diào)整,使實(shí)際輸出與期望輸出盡可能一致。含有多個(gè)隱含層建立的BP算法模型能夠適應(yīng)任何非線性的映射,有利于電子鼻進(jìn)行模式分類[19]。
該特征矩陣中包含了40個(gè)特征量,在進(jìn)行識(shí)別分析時(shí),計(jì)算量較大。為了提高識(shí)別速度與準(zhǔn)確率,需要對(duì)特征矩陣中的元素進(jìn)行壓縮,減小特征量之間的相關(guān)性。主成分分析法(PCA)是一種常用的數(shù)據(jù)壓縮和特征提取的多變量統(tǒng)計(jì)分析方法,能夠去除數(shù)據(jù)間的相關(guān)性[20]。因此,采用主成分分析法對(duì)現(xiàn)有40維的樣本空間進(jìn)行某種正交組合變換,產(chǎn)生新的學(xué)習(xí)樣本空間,并降低其維數(shù)、縮小分量之間相關(guān)性。將這些新的學(xué)習(xí)樣本作為BP神經(jīng)網(wǎng)絡(luò)的輸入,能降低BP神經(jīng)網(wǎng)絡(luò)的復(fù)雜程度,是一個(gè)理想的降維方法。
實(shí)驗(yàn)開始前,先對(duì)傳感器進(jìn)行24 h老化試驗(yàn),使各傳感器基線穩(wěn)定。單次測(cè)試過(guò)程如下:通過(guò)MFC配置氣體樣本,采用動(dòng)態(tài)測(cè)試的方法將目標(biāo)氣體通入氣室120 s,再通入純凈空氣清洗氣室600 s。采集頻率為1 Hz,則整個(gè)瞬態(tài)響應(yīng)過(guò)程中將記錄采集的720個(gè)數(shù)據(jù)點(diǎn)作為原始數(shù)據(jù)。傳感器陣列對(duì)3種樣本氣體的響應(yīng)曲線如圖4~圖6所示??梢?部分傳感器對(duì)于3種樣本氣體響應(yīng)差異性很小,比如S1傳感器TGS822、S3傳感器MQ9、S9傳感器MQ3和S10傳感器MQ135,客觀反映單個(gè)氣體傳感器的交叉敏感性問(wèn)題。
圖4 30×10-6丙酮響應(yīng)曲線
圖5 15×10-6丙酮與15×10-6乙醇混合響應(yīng)曲線
圖6 30×10-6乙醇響應(yīng)曲線
圖7 各主成分貢獻(xiàn)率
對(duì)傳感器的原始數(shù)據(jù)進(jìn)行特征提取與歸一化處理后,使用PCA主成分分析法對(duì)特征數(shù)據(jù)進(jìn)行降維處理。圖7是PCA處理后前4個(gè)主成分的貢獻(xiàn)率。由圖可見前4個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到96%,說(shuō)明前4個(gè)主成分已經(jīng)包含原始特征數(shù)據(jù)中主要的信息。通過(guò)PCA處理后的結(jié)果,將40維的特征數(shù)據(jù)壓縮到4維,而包含的信息量只損失了4%,降低了數(shù)據(jù)的復(fù)雜程度。
圖8是前兩個(gè)主成分繪制的二維PCA圖譜,可見對(duì)于3種樣本的分布呈現(xiàn)一定規(guī)律,30×10-6丙酮樣本集聚于圖中左上方,15×10-6丙酮與15×10-6乙醇混合樣本集聚于圖中中部,而30×10-6乙醇樣本集聚于圖中右下方,說(shuō)明前兩個(gè)主成分特征數(shù)據(jù)已經(jīng)能很好地區(qū)分不同樣本氣體(其中第一主成分占有40%的信息量,第二主成分占有37%的信息量)。
圖8 3種樣本主成分分析結(jié)果
根據(jù)上述分析,對(duì)建立算法模型優(yōu)化。將前4個(gè)主成分作為BP神經(jīng)網(wǎng)絡(luò)輸入層的輸入;輸入節(jié)點(diǎn)為4,隱含層節(jié)點(diǎn)數(shù)設(shè)置為3;輸出層節(jié)點(diǎn)數(shù)設(shè)置為2,設(shè)定30×10-6丙酮的期望輸出為(0,1),30×10-6乙醇的期望輸出為(1,0),15×10-6丙酮15×10-6乙醇混合期望輸出為(1,1)。圖9是對(duì)3種樣本氣體分別進(jìn)行20次采集測(cè)試識(shí)別的結(jié)果。前20個(gè)為丙酮?dú)怏w樣本,錯(cuò)誤識(shí)別2個(gè);中間20個(gè)為乙醇?xì)怏w樣本,錯(cuò)誤識(shí)別1個(gè);后20個(gè)為混合氣體樣本,錯(cuò)誤識(shí)別2個(gè),總體的識(shí)別準(zhǔn)確率為91.7%。隨機(jī)抽取6個(gè)識(shí)別的結(jié)果,如表2所示。
圖9 模型預(yù)測(cè)分類結(jié)果
表2 定性分析結(jié)果
為實(shí)現(xiàn)無(wú)創(chuàng)糖尿病診斷,以金屬氧化物半導(dǎo)體氣敏傳感器陣列為核心,設(shè)計(jì)了一個(gè)用于檢測(cè)糖尿病標(biāo)志物丙酮?dú)怏w的專用型電子鼻。該電子鼻系統(tǒng)通過(guò)3個(gè)MFC模擬配制糖尿病患者呼出的氣體,采用動(dòng)態(tài)測(cè)試方法,并提取整個(gè)瞬態(tài)響應(yīng)過(guò)程中相對(duì)最大響應(yīng)Vmax、吸附階段1 min時(shí)相對(duì)響應(yīng)Va、解吸附階段1 min時(shí)相對(duì)響應(yīng)Vb、整個(gè)過(guò)程相對(duì)響應(yīng)的積分值Vint4個(gè)特征量,從而更近似于人體呼出氣體過(guò)程。相對(duì)于靜態(tài)測(cè)試中只把穩(wěn)態(tài)響應(yīng)值作為特征量,動(dòng)態(tài)測(cè)試能提取識(shí)別氣體更多的信息量,提高了電子鼻系統(tǒng)對(duì)氣體的定性分析能力。通過(guò)PCA+BP算法相結(jié)合,壓縮了特征矩陣中的特征量,降低BP神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜程度,提高了算法的收斂速度。通過(guò)對(duì)模擬糖尿病患者呼氣樣本(30×10-6丙酮)與另兩種干擾氣體樣本的識(shí)別結(jié)果表明,電子鼻能夠解決單個(gè)傳感器交叉敏感性的問(wèn)題,具有較高的痕量丙酮?dú)怏w識(shí)別率。為后期電子鼻實(shí)現(xiàn)無(wú)創(chuàng)糖尿病檢測(cè)應(yīng)用提供了參考。
[1] Di Natale C,Paolesse R,Martinelli E,et al. Solid-State Gas Sensors for Breath Analysis:A Review[J]. Analytica Chimica Acta,2014,824:1-17.
[2] Teshima N,Li J,Toda K,et al. Determination of Acetone in Breath[J]. Analytica Chimica Acta,2005,535(1):189-199.
[3] Righettoni M,Schmid A,Amann A,et al. Correlations Between Blood Glucose and Breath Components from Portable Gas Sensors and PTR-TOF-MS[J]. Journal of Breath Research,2013,7(3):037110.
[4] 殷勇,郝銀鳳,于慧春,等. 基于多特征融合的電子鼻鑒別玉米霉變程度[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(12):254-260.
[5] 石志標(biāo),黃勝全,范雪冰,等. 基于生物嗅覺(jué)的電子鼻研究[J]. 中國(guó)機(jī)械工程,2007,18(23):2810-2813.
[6] 陳星.呼吸檢測(cè)電子鼻及其在肺癌診斷應(yīng)用中的研究[D]. 浙江大學(xué),2008.
[7] 裴高璞,史波林,趙鐳,等. 典型摻假蜂蜜的電子鼻信息變化特征及判別能力[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(增刊1):325-331.
[8] 徐賽,陸華忠,周志艷,等. 基于電子鼻的果園荔枝成熟階段監(jiān)測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(18):240-246.
[9] Marco F L,Sabino C,Tuti G S,et al. Electronic Nose for Pesticides Detection:A First Realization[C]//Metrology for Aero Space(Metro Aero Space),2017 IEEE International Workshop on. IEEE,2017:403-407.
[10] Chiu C,Zhang Z. The Air Quality Evaluation Based on Gas Sensor Array[C]//Semiconductor Technology International Conference(CSTIC),2017 China. IEEE,2017:1-5.
[11] Zhu F,Iwata K,Kishimoto N. Assessing Production of Medicinal Liqueur Using an Electronic Nose[C]//Olfaction and Electronic Nose(ISOEN),2017 ISOCS/IEEE International Symposium on. IEEE,2017:1-2.
[12] 尹芳緣,曾小燕,徐薇薇,等. 基于電子鼻的芒果儲(chǔ)存時(shí)間預(yù)測(cè)方法研究[J]. 傳感技術(shù)學(xué)報(bào),2012,25(9):1199-1203.
[13] 傅均,黃燦欽,章鐵飛,等. 便攜式智能電子鼻系統(tǒng)及其葡萄貨架期評(píng)價(jià)研究[J]. 傳感技術(shù)學(xué)報(bào),2017,30(5):782-788.
[14] 鄒小波,趙杰文. 電子鼻快速檢測(cè)谷物霉變的研究[J]. 農(nóng)業(yè)工程學(xué)報(bào),2004,20(4):121-124.
[15] 潘天紅,陳山,趙德安,等. 電子鼻技術(shù)在谷物霉變識(shí)別中的應(yīng)用[J]. 儀表技術(shù)與傳感器,2005(3):51-52.
[16] 俞守華,董紹嫻,區(qū)晶瑩,等. 豬舍有害氣體NH3、H2S的電子鼻定量識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2009,25(7):153-157.
[17] 李誠(chéng)剛,趙佳寶,陳兆榮,等. Visual C#與MATLAB混合編程在可視化軟件中的應(yīng)用[J]. 軟件,2012,33(2):78-83.
[18] 焦綱領(lǐng),鄧建輝,韓嘯,等. MATLAB與Visual C#混合編程[J]. 海軍航空工程學(xué)院學(xué)報(bào),2008,23(1):109-111.
[19] 李廣超,賀鵬程,孫瑋偉,等. BP網(wǎng)絡(luò)算法在模式識(shí)別中的應(yīng)用[J]. 應(yīng)用技術(shù),2014,1:79-81.
[20] 梁勝杰,張志華,崔立林,等. 基于主成分分析與核獨(dú)立成分分析的降維方法[J]. 系統(tǒng)工程與電子技術(shù),2011,33(9):2144-2148.