袁 偉, 石 銳
(重慶大學(xué) 計算機學(xué)院,重慶 400044)
基于氣體傳感器動力學(xué)模型的細菌分類研究*
袁 偉, 石 銳
(重慶大學(xué)計算機學(xué)院,重慶400044)
對于氣體傳感器獲得的樣本數(shù)據(jù),常規(guī)的處理方法是基于樣本的表象來提取特征進行分類,具有固有的局限性。基于熱電子發(fā)射理論和等溫吸附理論,對氣體傳感器的電壓響應(yīng)值與溫度、樣本濃度等參數(shù)建立數(shù)學(xué)方程,將方程簡化,構(gòu)造了簡易的響應(yīng)動力學(xué)模型。通過主成分分析,降低樣本維數(shù)。將模型向降維后的樣本數(shù)據(jù)擬合,可得到模型的一組系數(shù),作為樣本的特征值。將特征值集合運用模式識別方法進行訓(xùn)練,測試分類性能。實驗結(jié)果顯示:分類預(yù)測的準確率較高。
氣體傳感器; 肖特基勢壘; 吸附; 特征提?。?動力學(xué)模型; 分類
傳統(tǒng)的疾病檢測主要依靠提取患者的體液,對其化學(xué)成分進行檢測或者將其涂樣到培養(yǎng)基上進行體外培養(yǎng)、識別,上述方法雖然準確度較高,但需要專業(yè)人員進行操作,檢測周期長、操作復(fù)雜,不適應(yīng)快速檢測的需求。
隨著近年來人工嗅覺技術(shù)持續(xù)發(fā)展,電子鼻系統(tǒng)因其易操作、成本低、便攜和現(xiàn)場實時檢測[1,2]的特點而逐漸出現(xiàn)在人們的視野里。
電子鼻是由具有部分專一性的傳感器陣列,結(jié)合相應(yīng)的模式識別算法構(gòu)成的系統(tǒng),用于識別單一成分或復(fù)雜成分的氣體[3],主要由氣味取樣操作器、氣體傳感器陣列和信號處理系統(tǒng)三部分構(gòu)成[2]。
電子鼻系統(tǒng)的運行流程大致如下:系統(tǒng)采集樣本氣體,送入裝有傳感器陣列的氣室,傳感器陣列對該樣本具有一組響應(yīng)值,即原始特征。由于采集的原始數(shù)據(jù)具有較高的稀疏性,一般要進行數(shù)據(jù)預(yù)處理,用相關(guān)方法提取出關(guān)鍵特征,最后運用模式識別領(lǐng)域的方法進行訓(xùn)練和預(yù)測。
1.1 氣敏傳感器工作原理
以常見的SnO2氣體傳感器為闡述樣例。
當金屬氧化物半導(dǎo)體傳感器與空氣接觸時,由于費米(fm)能級差的原因,其表面一般都會吸附氧
(1)
上述過程會造成傳感器表面的電子被吸附的氧所捕獲,半導(dǎo)體表面電子數(shù)量減少,電阻增大;傳感器接觸到還原性氣體(例如H2)后,一般認為O-與還原性氣體之間的作用是影響傳感器電導(dǎo)率的主要因素[4,5]
H2+O-→H2O+e
(2)
上述反應(yīng)會使得被氧捕獲的電子釋放回半導(dǎo)體表面,被測氣體提供給元件敏感材料的電子增多,敏感材料的電阻顯著降低[6]。同時,由反應(yīng)方程式可知在該過程中,有H2O生成,根據(jù)采樣數(shù)據(jù)繪制的濕度響應(yīng)曲線如圖1,印證了該反應(yīng)過程的正確性。
圖1 相對濕度響應(yīng)曲線
1.2 數(shù)據(jù)處理方法
數(shù)據(jù)處理包括數(shù)據(jù)的預(yù)處理和數(shù)據(jù)訓(xùn)練預(yù)測。
預(yù)處理主要是對原始的響應(yīng)數(shù)據(jù)進行去異常點、濾波和特征提取[7]等,特征提取方法主要有:基于傳感器原始響應(yīng)曲線的特征提取[8,9]、基于擬合曲線的特征提取[8,9]、基于變換域的特征提取[10]。
數(shù)據(jù)訓(xùn)練預(yù)測主要是基于統(tǒng)計學(xué)習(xí)方法或者神經(jīng)網(wǎng)絡(luò)來進行分類識別。常用的統(tǒng)計學(xué)習(xí)方法有:樸素貝葉斯法、決策樹、支持向量機等。常用的神經(jīng)網(wǎng)絡(luò)有:反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)、自組織映射(self-organization mapping,SOM)神經(jīng)網(wǎng)絡(luò)等[11]。在提取到樣本的特征后,可以通過上述某一方法進行訓(xùn)練,待訓(xùn)練模型收斂后便能夠?qū)π逻M入的樣本進行分類預(yù)測。
燒結(jié)型SnO2傳感器是N型半導(dǎo)體,由微小晶粒聚集、以晶界相接觸的多晶結(jié)構(gòu)。一般認為其敏感性屬于表面控制型[5,12]。
根據(jù)熱電子發(fā)射理論中的Richardson-Dushman方程[13],可以將傳感器的電阻變化與材料特性、溫度和勢壘變化等變量聯(lián)系起來
(3)
式中J為電流密度;A為Richardson常數(shù),與具體材料有關(guān);k為玻爾茲曼常數(shù);T為絕對溫度;q為電子的電量;Δφ為電勢的變化量;ΔV為電壓的變化量。
由傳感器的電路設(shè)計可知,其兩端加載的電壓幾乎不變,即ΔV→0,那么
(4)
根據(jù)電學(xué)的相關(guān)基本公式,同時為了簡化計算,假設(shè)導(dǎo)體是單位長度、單位面積、單位電壓、單位電場強度,則有
(5)
現(xiàn)需要以半導(dǎo)體與金屬接觸形成肖特基勢壘為例分析其計算勢壘變化量Δφ。
由于半導(dǎo)體與金屬的費米(fm)能級不同,因此,半導(dǎo)體的電子會進入接觸面的金屬側(cè),這樣接觸面的半導(dǎo)體側(cè)就會形成一個寬度為d的耗盡層(近似為勢壘寬度,即耗盡層近似[14]),根據(jù)泊松方程可以得到拋物線形狀的勢壘為
(6)
式中q為載流子電荷數(shù);Nd為施主密度;ε為介電常數(shù);d為勢壘寬度;x為距離界面的距離。在x∈(0~d)的區(qū)域的體電荷密度為qNd,又根據(jù)電中性條件,可知表面電荷密度為-qNs,那么在界面處的電勢為
(7)
式中Ns為表面載流子濃度。又由于勢壘φ的變化是由于傳感器接觸了不同的氣體造成了表面電子濃度的變化,所以有φ與電子的表面覆蓋率θ之間的關(guān)系
(8)
代入式(5)可得
(9)
根據(jù)等溫吸附理論中的Freundlich吸附式[15]可以建立表面覆蓋率與氣體濃度之間的關(guān)系。又在Freundlich函數(shù)中,n一般介于2~3,而在本實驗中p與t有關(guān),不妨假設(shè)氣體濃度與時間成如下分段線性關(guān)系
(10)
為了簡化計算模型,即可以設(shè)在接觸氣體階段的p=at-b,a,b為常數(shù)系數(shù),t為時刻,n=2代入Freundlich吸附式并簡化可得
(11)
式中A,B,C均為待定系數(shù)。根據(jù)傳感器的電路設(shè)計,通過歐姆定律計算可知,最終采集的傳感器響應(yīng)電壓為
(12)
可知傳感器的電壓變化可以近似為Logistic型函數(shù),實際的樣本響應(yīng)曲線證實了模型的推測結(jié)論。如圖2,其中實豎線為傳感器開始接觸樣本氣體的時刻,虛豎線為傳感器停止接觸樣本氣體的時刻。
由于傳感器在未接觸樣本時,仍有一個響應(yīng)基線,需要對上述模型進行修正,可得
(13)
式中A為傳感器對樣本響應(yīng)的最大值;D為從基線開始取得最大響應(yīng)值的1,2的時間點;E為未接觸樣本時的響應(yīng)基線值;B,C均為待定系數(shù),可在Matlab中對樣本響應(yīng)曲線做非線性擬合得到。式(13)即為傳感器的響應(yīng)電壓隨時間變化的簡易動力學(xué)模型。
實驗利用項目自建的電子鼻系統(tǒng)采集了3個種類的細菌代謝物,分別為大腸桿菌34組,金黃葡萄球菌34組,綠膿桿菌34組,共102組樣本,同種類樣本的組內(nèi)有濃度變化。
3.1 實驗步驟
1)由于每一個原始樣本數(shù)據(jù)為34×840維數(shù)據(jù),其有效數(shù)據(jù)非常稀疏,因此對其進行一次PCA處理。以某一樣本為例,得到了其第一主成分(貢獻率77.15 %)和第二主成分(貢獻率14.28 %)。由實驗報告已知實驗的各個階段起始時間,因此,截取從基線階段到采集階段中的一段時間的采集的數(shù)據(jù)作為待擬合數(shù)據(jù),處理后如圖3。
圖3 某樣本進行PCA變換后的響應(yīng)曲線
圖4 PCA變換后的樣本集
2)根據(jù)前文的分析,第一主成分可以用式(13)擬合。從圖3觀察可以知道,第二主成分可以近似用直線y=K擬合。對處理后的樣本數(shù)據(jù)求解擬合參數(shù),最后每個樣本便由“6維特征+1維標簽”組成。
3)由于樣本數(shù)量較少,所以采用交叉驗證方式建模。隨機抽取80 %的樣本作為訓(xùn)練集,剩余20 %的樣本作為測試集,然后在Matlab中構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)和隨機森林,將訓(xùn)練集樣本分別送入訓(xùn)練,待預(yù)測模型收斂后,分別使用測試集測試預(yù)測性能。重復(fù)上述過程10次。
3.2 實驗結(jié)果
表1為經(jīng)過交叉驗證后得到的數(shù)據(jù)。
表1 實驗結(jié)果
實驗屬于三分類問題,實驗結(jié)果中大腸桿菌和金黃葡萄球菌的預(yù)測準確率相對較低,從圖4中也可以看出兩類樣本集的曲線具有較高的相似性,因此,導(dǎo)致了模型的整體預(yù)測準確率受到影響。但總體來說,實驗顯示了模型具有較好的分類預(yù)測能力。
本文從傳感器響應(yīng)變化的本質(zhì),即造成其變化的物理、化學(xué)因素入手,建立了氣體傳感器響應(yīng)的簡易動力學(xué)模型,并且通過模式識別的經(jīng)典方法對模型的準確性進行驗證,顯示出了模型具有較好的分類預(yù)測性能。由于模型簡化了一部分影響因素,而且訓(xùn)練集的樣本數(shù)量相對較少,導(dǎo)致模型在分類大腸桿菌和金黃葡萄球菌的準確率相對綠膿桿菌的識別準確率偏低。因此,下一步的工作將有兩個大方向:在動力學(xué)的基礎(chǔ)上對模型繼續(xù)修正,以便能更加精確地擬合響應(yīng)曲線,同時增加訓(xùn)練集樣本數(shù)量;采用新的模式識別方法。經(jīng)過上述改善后的模型識別率有望得到提升。
[1] Wang Z,Wang C.Is breath acetone a biomarker of diabetes A historical review on breath acetone measurements[J].J Breath Res,2013,7(3):10-16.
[2] 張厚博,梅笑冬,趙 萬,等.用于食醋品質(zhì)預(yù)評價的電子鼻研究[J].傳感器與微系統(tǒng),2013,32(3):62-64.
[3] 閆 嘉.基于電子鼻技術(shù)的人體傷口感染檢測系統(tǒng)構(gòu)建及算法研究[D].重慶: 重慶大學(xué),2013.
[4] 王 康.SnO2基氣敏傳感器的制備與研究[D].威海:山東大學(xué),2013.
[5] 曾 文.SnO2/TiO2體系氣敏性能及其機理研究[D].重慶:重慶大學(xué),2011.
[6] 劉元隆,鐘 榮,胡繼豹.Fe2O3/ZnO復(fù)合氧化物氣敏元件的制備與性能[J].傳感器與微系統(tǒng),2012,31(12):104-106.
[7] 鄒慧琴.基于“氣”仿生嗅覺系統(tǒng)在中藥品質(zhì)整體評價中的方法學(xué)研究[D].北京:北京中醫(yī)藥大學(xué),2013.
[8] 洪雪珍.基于電子鼻和電子舌的櫻桃番茄汁品質(zhì)檢測方法研究[D].杭州:浙江大學(xué),2014.
[9] Mousumi Palit,Bipan Tudu,Nabarun Bhattacharyya,et al.Comparison of multivariate preprocessing techniques as applied to electronic tongue based pattern classification for black tea[J].Analytica Chimica Acta,2010,675:8-15.
[10] 樊 澍.基于量子粒子群的電子鼻傷口感染檢測算法研究[D].重慶:重慶大學(xué),2014.
[11] 杜曉亮.人工神經(jīng)網(wǎng)絡(luò)在空氣質(zhì)量預(yù)測中的應(yīng)用研究[D].濟南:山東大學(xué),2009.
[12] 劉 陽,李 勃,姚有為,等.改善SnO2氣體傳感器氣敏性能的研究進展[J].傳感器與微系統(tǒng),2012,31(12):5-8.
[13] 馬殿飛.Ag/SiNWs肖特基二極管溫敏特性的研究[D].上海:華東師范大學(xué),2011.
[14] 劉恩科,朱秉升,羅晉生.半導(dǎo)體物理學(xué)[M].7版.北京:電子工業(yè)出版社,2008:216-221.
[15] 席彩紅,高曉平,劉國漢.二氧化錫氣體傳感器敏感機理的研究[J].曲阜師范大學(xué)學(xué)報:自然科學(xué)版,2008(2):65-68.
Researchonclassificationofbacteriabasedonkineticsmodelforgassensor*
YUAN Wei, SHI Rui
(CollegeofComputerScience,ChongqingUniversity,Chongqing400044,China)
For sample data acquired by gas sensor,ordinary way is to extract features based on surface pattern of samples,so as to classify,so it has inherent limitation.Based on thermionic emission theory and adsorption theory,a mathematic equation can be built to demonstrate the connection of voltage response values of gas sensor with temperature,sample concentration,etc.A simple model of gas sensor's response kinetics can be derived by simplify the equation before.Through the method of principal component analysis(PCA),the dimensions of samples is reduced.A group of parameters,which will be treated as features of samples eventually,can be settled when fitting the model to the samples.A prediction model will be trained and benchmarked by using the feature sets.The result shows that the kinetics model has a satisfied prediction accuracy in classification, this is for the reason that the model is set up based on reflection of nature of sensor response.
gas sensor; Schottky barrier; adsorption; feature extraction; kinetics model; classification
10.13873/J.1000—9787(2017)11—0018—03
TP 212
A
1000—9787(2017)11—0018—03
2017—01—03
國家國際科技合作項目(2014DFA31560)
袁 偉(1990 -),男,碩士研究生,主要研究方向為模式識別,E-mail:506942891@qq.com。