潘銘津,何家峰,駱德漢
(廣東工業(yè)大學(xué) 信息工程學(xué)院,廣東 廣州 510000)
在現(xiàn)代社會(huì)中,室內(nèi)的裝修材料大多采用有機(jī)合成材料,這些材料所散發(fā)出來的甲醛、氨氣等室內(nèi)有害氣體,造成室內(nèi)環(huán)境污染,對(duì)居民的身體健康產(chǎn)生較大的惡性影響。研究[1]表明在中國(guó)家庭中,室內(nèi)氣體環(huán)境污染是“病態(tài)建筑綜合征”的一個(gè)危險(xiǎn)因素。在室內(nèi)空氣環(huán)境監(jiān)測(cè)中,對(duì)有害氣體定量分析有多種不同的方法,包括非分散紅外法、氣相色譜法、納氏試劑比色法以及離子選擇電極法。以上提到的方法所采用的儀器操作比較復(fù)雜且不能實(shí)時(shí)實(shí)地地進(jìn)行空氣質(zhì)量檢測(cè)。隨著信息科學(xué)和傳感器等技術(shù)的快速發(fā)展,仿生嗅覺系統(tǒng)憑借其快捷、簡(jiǎn)便和經(jīng)濟(jì)等優(yōu)點(diǎn),在醫(yī)療、食品加工、環(huán)境檢測(cè)等領(lǐng)域已經(jīng)得到了諸多應(yīng)用。
仿生嗅覺系統(tǒng)中的傳感器陣列是由多個(gè)金屬氧化物半導(dǎo)體(Metal-Oxide Semiconductor,MOS)傳感器組成,以此實(shí)現(xiàn)對(duì)不同目標(biāo)氣體信息的采集。同時(shí)因?yàn)镸OS氣體傳感器中的氣敏材料存在交叉敏感特性,因此對(duì)單一目標(biāo)氣體敏感的MOS傳感器暫時(shí)不存在。因此,仿生嗅覺系統(tǒng)需要結(jié)合合適的模式識(shí)別方法對(duì)混合氣體中的各種氣體成分信息進(jìn)行識(shí)別,為各類別的氣體濃度提供信息。
本文將結(jié)合基于仿生嗅覺和卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)[2]的方法對(duì)多元室內(nèi)有害氣體中的每種氣體進(jìn)行定量識(shí)別,從而降低因仿生嗅覺系統(tǒng)中MOS氣敏傳感器存在交叉敏感特性的影響,提高對(duì)目標(biāo)氣體識(shí)別的準(zhǔn)確率。
仿生嗅覺系統(tǒng)是一個(gè)識(shí)別單種或多種氣體的檢測(cè)系統(tǒng),通過利用一組氣體傳感器陣列的響應(yīng)信號(hào)來識(shí)別氣體的電子系統(tǒng),其檢測(cè)結(jié)果得到的是一種圖譜,這種圖譜又被稱為氣味指紋圖譜,該圖譜能描述該氣體物質(zhì)的唯一特征,類似于人類指紋的唯一性。仿生嗅覺系統(tǒng)一般由氣體傳感器陣列、信號(hào)處理和模式識(shí)別方法組成,它可以在幾小時(shí)、幾天甚至數(shù)月的時(shí)間內(nèi)連續(xù)地、實(shí)時(shí)地監(jiān)測(cè)特定位置的氣體信息。仿生嗅覺系統(tǒng)與普通的化學(xué)儀器不同,如色譜儀、光譜儀等,不能直接得到被測(cè)樣品各種成分的定性和定量結(jié)果,而是需要模式識(shí)別方法中不同的識(shí)別算法才能得到被測(cè)樣本中的不同信息。仿生嗅流工作原理圖如圖1所示。
圖1 仿生嗅覺工作原理圖
在仿生嗅覺系統(tǒng)中的模式識(shí)別方法主要由對(duì)氣體信息的特征提取和氣體成分識(shí)別兩個(gè)步驟組成。當(dāng)今,被常用于仿生嗅覺系統(tǒng)的特征提取算法主要有基于線性的方法,例如主成分分析法(Principal Component Analysis,PCA)[3]和線性判別分析法(Latent Dirichlet Allocation,LDA)[4]。這兩種算法在對(duì)單一氣體的分類識(shí)別中效果較好,但是由于室內(nèi)氣體環(huán)境中存在多種氣體,而MOS氣體傳感器陣列對(duì)混合氣體的響應(yīng)信號(hào)是非線性的,因此在一定程度上,難以通過基于PCA算法和LDA算法[5]的線性特征提取方法來提取混合氣體信號(hào)中的非線性特征,從而導(dǎo)致氣體識(shí)別準(zhǔn)確率較低。在氣體識(shí)別的過程中,一般是采用傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine,SVM)等機(jī)器學(xué)習(xí)方法進(jìn)行氣味識(shí)別。但是由于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)在處理氣體數(shù)據(jù)時(shí)需要建立較多的權(quán)值,導(dǎo)致計(jì)算量太大和需要大量樣本進(jìn)行訓(xùn)練。雖然SVM能夠處理小樣本問題,但核函數(shù)的選取和參數(shù)的設(shè)置都直接關(guān)系到氣體識(shí)別的結(jié)果。因此,在仿生嗅覺系統(tǒng)中模式識(shí)別方法的選擇對(duì)系統(tǒng)的性能有著非常重要的影響。
因此,本文提出一種基于仿生嗅覺和卷積神經(jīng)網(wǎng)絡(luò)的算法用以識(shí)別室內(nèi)空氣中的有害氣體成分。該方法利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)MOS傳感器陣列的多維響應(yīng)信號(hào)進(jìn)行特征提取以進(jìn)行室內(nèi)有害氣體成分的識(shí)別,實(shí)現(xiàn)對(duì)室內(nèi)空氣中有害氣體組成成分的高準(zhǔn)確度識(shí)別。
卷積神經(jīng)網(wǎng)絡(luò)是由多層感知機(jī)(Multi-Layer Perception,MLP)演化而來的,由于CNN具有局部連接、權(quán)值共享、降采樣的結(jié)構(gòu)特點(diǎn),使得卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域取得了巨大的成功。CNN相對(duì)于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)的主要區(qū)別在于權(quán)值共享和局部連結(jié)兩個(gè)方面。權(quán)值共享使得卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)更加貼合生物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)的局部連接不像傳統(tǒng)神經(jīng)網(wǎng)絡(luò),等n-1層的每一神經(jīng)元都與第n層的所有神經(jīng)元連接,而是第n-1層的神經(jīng)元與第n層的神經(jīng)元部分連接。這兩個(gè)特點(diǎn)的作用使得網(wǎng)絡(luò)模型比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)具有更低的模型復(fù)雜度,更少的權(quán)值數(shù)量。
1989年,LECUN Y[6]首次將方向傳播算法與權(quán)值共享的卷積神經(jīng)層結(jié)合起來發(fā)明了卷積神經(jīng)網(wǎng)絡(luò),并將其用于美國(guó)郵局的手寫數(shù)字識(shí)別系統(tǒng)中,取得了巨大的成功。CNN的基本結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層以及輸出層構(gòu)成。卷積層用于提取數(shù)據(jù)的特征;池化層[7]用于對(duì)特征的抽樣,可以在使用較少的參數(shù)同時(shí)還能減輕網(wǎng)絡(luò)模型的過擬合程度;全連接層用于把提取的特征圖連接起來,最后通過分類器獲得最終的分類結(jié)果。
卷積層通過多卷積核對(duì)輸入的數(shù)據(jù)進(jìn)行卷積處理并提取出卷積后的特征,即特征圖。即通過一個(gè)卷積核提取出對(duì)應(yīng)的一類特征。因?yàn)樵谕痪矸e核的操作中具有局部連接、參數(shù)共享和多卷積核特性,所以相比較于全連接層,卷積層在提取數(shù)據(jù)的特征時(shí),能在參數(shù)較少的情況下提取出更加豐富的特征。由于卷積結(jié)構(gòu)不受輸入維度的影響且訓(xùn)練深度結(jié)構(gòu)簡(jiǎn)單,因此能有效地對(duì)復(fù)雜的高緯度的輸入進(jìn)行特征提取。卷積層卷積公式為:
(1)
式中:i為第i個(gè)卷積核,g(i)為第i個(gè)卷積核提取得到的特征圖,a為輸入數(shù)據(jù),β為卷積核的偏置,x、y、z為數(shù)據(jù)的維度,在處理一維時(shí)域信號(hào)時(shí),對(duì)其中兩個(gè)維度進(jìn)行簡(jiǎn)化即可。
在完成對(duì)數(shù)據(jù)的卷積后需要對(duì)數(shù)據(jù)使用非線性激活函數(shù)進(jìn)行非線性轉(zhuǎn)換,CNN中常用的激活函數(shù)一般為ReLU,其公式為:
y(i)=f(g(i))=max{0,g(i)},i=1,2,…,q
(2)
池化層通過池化核對(duì)輸入特征向量進(jìn)行降采樣(down sampling)處理,在對(duì)數(shù)據(jù)進(jìn)行降維的同時(shí)更加突出提取的特征。
pl(i,j)=max(j-1)w (3) pl(i,j)=avg(j-1)w (4) 式中:al(i,t)為第l層中第i個(gè)特征圖的第t個(gè)神經(jīng)元,w為卷積核的寬度,j為第j個(gè)池化核。 本文基于一維卷積神經(jīng)網(wǎng)絡(luò)時(shí)序信號(hào)識(shí)別模型1D-CNN[8],針對(duì)仿生嗅覺PEN3電子鼻[9]的采集數(shù)據(jù)特性,提出室內(nèi)有害氣體成分識(shí)別算法。本算法模型框圖如圖2所示。模型框架包含兩個(gè)一維卷積層、一個(gè)池化層、一個(gè)全局最大池化層[10]和一個(gè)輸出層。該模型與傳統(tǒng)的CNN模型相比,是通過加入全局最大池化層以代替?zhèn)鹘y(tǒng)的CNN模型中作為輸出的全連接層。由于全局最大池化層參數(shù)較少,因此用以解決全連接層參數(shù)過多所導(dǎo)致計(jì)算量過大和過擬合的問題。同時(shí)較少的參數(shù)也可以降低模型的復(fù)雜度和模型對(duì)訓(xùn)練樣本數(shù)據(jù)量的要求,適用于現(xiàn)階段仿生嗅覺數(shù)據(jù)量較少的情況。 圖2 本文所提出方法的算法結(jié)構(gòu)圖 室內(nèi)有害氣體一般包括甲醛、氨氣、甲苯和甲醇。因此,本文分別使用三種濃度分別為0.02 mg/m3、0.08 mg/m3、0.16 mg/m3的甲醛氣體,三種濃度分別為0.05 mg/m3、0.15 mg/m3、0.25 mg/m3的氨氣氣體,三種濃度分別為0.05 mg/m3、0.09 mg/m3、0.18 mg/m3的甲苯氣體以及三種濃度為0.05 mg/m3、0.10 mg/m3、0.15 mg/m3的甲醇?xì)怏w構(gòu)成81個(gè)氣體樣本組,然后使用PEN3電子鼻分別對(duì)81個(gè)樣本組進(jìn)行混合氣體數(shù)據(jù)的采集。對(duì)每個(gè)樣本組采集10個(gè)數(shù)據(jù)樣本,最后得到810個(gè)數(shù)據(jù)樣本。 為了說明提出的基于一維卷積神經(jīng)網(wǎng)絡(luò)時(shí)序信號(hào)識(shí)別模型1D-CNN的室內(nèi)有害氣體成分識(shí)別算法的有效性,本文將4.1小節(jié)中通過PEN3電子鼻采集的數(shù)據(jù)樣本集,分別利用PCA+ LDA算法、BP神經(jīng)網(wǎng)絡(luò)以及本文提出的CNN算法進(jìn)行氣體成分識(shí)別實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1~表4所示。 表1 不同算法對(duì)混合氣體中甲醛濃度識(shí)別率的比較 (%) 算法混合氣體中甲醛濃度/(mg/m3)0.020.080.16PCA+LDA65.2362.5563.44BPNN85.1286.3188.52本文算法90.1293.3492.81 表2 不同算法對(duì)混合氣體中氨氣濃度識(shí)別率的比較 (%) 算法混合氣體中氨氣濃度/(mg/m3)0.050.150.25PCA+LDA68.8964.1669.92BPNN88.6389.4590.25本文算法93.4094.7696.25 表3 不同算法對(duì)混合氣體中甲苯濃度識(shí)別率的比較 (%) 算法混合氣體中甲苯濃度/(mg/m3)0.050.090.18PCA+LDA61.3659.5260.47BPNN78.9879.1278.54本文算法88.8987.3688.41 表4 訓(xùn)練參數(shù)數(shù)量的比較 (%) 算法訓(xùn)練參數(shù)數(shù)量BPNN587 373本文算法5 433 由表1~表3可見本文所處提出的室內(nèi)有害氣體成分識(shí)別算法對(duì)混合氣體中各種氣體具有較高的識(shí)別率。表4說明本文提出的室內(nèi)有害氣體成分識(shí)別算法在較高的識(shí)別率情況下,擁有較少的訓(xùn)練參數(shù)數(shù)量。 本文提出一種基于CNN與仿生嗅覺相結(jié)合的室內(nèi)有害氣體成分識(shí)別算法。該方法利用卷積神經(jīng)網(wǎng)絡(luò)權(quán)值共享和加入全局最大池化層,使得神經(jīng)網(wǎng)絡(luò)在擁有較少的訓(xùn)練參數(shù)數(shù)量的情況下,對(duì)室內(nèi)有害氣體具有較高的識(shí)別率。該算法的研究對(duì)仿生嗅覺系統(tǒng)后續(xù)濃度估計(jì)問題的解決具有重要意義。本文提出的算法在濃度回歸實(shí)驗(yàn)上還沒有得到很好的驗(yàn)證。在實(shí)驗(yàn)的過程中還沒考慮到外界因素對(duì)實(shí)驗(yàn)結(jié)果造成的影響,這將是后續(xù)的研究方向。3 室內(nèi)有害氣體成分識(shí)別方法
4 實(shí)驗(yàn)結(jié)果
4.1 數(shù)據(jù)采集
4.2 有害氣體成分識(shí)別實(shí)驗(yàn)
5 結(jié)論