王秋碩, 謝 濤, 孟祥森, 矯魯平, 蘇維均
(1.北京工商大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,北京 100048;2.煙臺(tái)產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)所,山東 煙臺(tái) 264003)
在微生物作用下,污水管道中會(huì)產(chǎn)生甲烷(CH4)、硫化氫(H2S)、氨氣(NH3)[1]等有害氣體沿管道進(jìn)入居室,人體直接吸入會(huì)給呼吸系統(tǒng)、神經(jīng)系統(tǒng)造成損傷[2],所以,對(duì)污水管道內(nèi)有害氣體進(jìn)行定量檢測(cè)是關(guān)乎民生的重要話題。
常用的多組分氣體檢測(cè)方法依據(jù)檢測(cè)原理可以分為傳統(tǒng)檢測(cè)方法與光學(xué)檢測(cè)方法[3]。傳統(tǒng)檢測(cè)方法是依靠金屬傳感器、電化學(xué)傳感器等方法進(jìn)行檢測(cè);光學(xué)檢測(cè)方法是對(duì)氣體光譜特性的檢測(cè),實(shí)現(xiàn)快速獲取氣體信息,擁有更高的靈敏性與精確度,但光學(xué)檢測(cè)裝置較為精密且龐大,不適用于現(xiàn)場環(huán)境的檢測(cè)。
本文設(shè)計(jì)的檢測(cè)裝置選用基于傳感器陣列[4]的電化學(xué)傳統(tǒng)檢測(cè)方法,實(shí)現(xiàn)對(duì)多組分氣體的現(xiàn)場環(huán)境檢測(cè),并通過最小二乘[5]、支持向量回歸[6](support vector regression)、高斯過程回歸[7](Gaussian process regression)三種基于統(tǒng)計(jì)學(xué)的多元回歸方法進(jìn)行比較,根據(jù)測(cè)試結(jié)果,針對(duì)不同氣體選擇相應(yīng)更為精準(zhǔn)的方法進(jìn)行實(shí)驗(yàn)。
所設(shè)計(jì)的基于傳感器陣列的多組分氣體檢測(cè)系統(tǒng)由氣敏傳感器陣列,信號(hào)預(yù)處理,模式識(shí)別三大部分構(gòu)成。其總體結(jié)構(gòu)如圖1所示。
圖1 系統(tǒng)總體結(jié)構(gòu)
目標(biāo)氣體與敏感材料發(fā)生化學(xué)反應(yīng),結(jié)果通過傳感器電路將化學(xué)信號(hào)轉(zhuǎn)換為電信號(hào),被信號(hào)預(yù)處理單元采集,消除噪聲,特征提取[8],最后采用適合的模式識(shí)別分析方法完成對(duì)數(shù)據(jù)的處理,得到最終氣體信息。
系統(tǒng)選用精度高、成本更低廉的電化學(xué)氣體傳感器作為檢測(cè)元件實(shí)現(xiàn)對(duì)氣體濃度的定量識(shí)別。傳感器受環(huán)境溫度影響較大,而電化學(xué)傳感器具有專門的調(diào)理芯片[9],可對(duì)輸出數(shù)據(jù)進(jìn)行溫度補(bǔ)償,提高檢測(cè)精度。裝置中選用的傳感器分別是:主敏感氣體H2S,檢測(cè)范圍(0~100)×10-6的FECS50—100型;主敏感氣體NO2,檢測(cè)范圍(0~20)×10-6的4NO2-20型;主敏感氣體NH3,檢測(cè)范圍(0~100)×10-6的4NH3-100型傳感器。
1.1.1 硬件結(jié)構(gòu)設(shè)計(jì)
硬件主要分為氣體信息感知電路、微控制器單元(micro controller unit,MCU)信息處理電路、電源電路三大部分,結(jié)構(gòu)如圖2所示。
圖2 系統(tǒng)硬件結(jié)構(gòu)
1.1.2 主控器及電源電路設(shè)計(jì)
為滿足外圍設(shè)備接口與硬件的需求,氣體信息處理電路選取以Cortex3-M3為內(nèi)核的ARM芯片STM32F103VET6為主控芯片[10],并通過線性穩(wěn)壓電源AMS1117—3.3實(shí)現(xiàn) DC5V—3.3 V的電壓轉(zhuǎn)換進(jìn)行3.3 V直流電源供電。
1.1.3 信號(hào)采集調(diào)理電路設(shè)計(jì)
使用ADR391外部基準(zhǔn)電壓芯片、ADG1608模擬多路開關(guān)與AD7790轉(zhuǎn)換芯片進(jìn)行信號(hào)采集。選用TI公司推出的LMP91000系列模擬前端芯片對(duì)電路進(jìn)行調(diào)理,通過對(duì)傳感器輸出的信號(hào)進(jìn)行放大、濾波等基礎(chǔ)處理,實(shí)現(xiàn)對(duì)信號(hào)的誤差修正、量程切換,使傳感器信號(hào)穩(wěn)定輸出。
1.1.4 數(shù)據(jù)存儲(chǔ)與交互電路設(shè)計(jì)
使用STM32內(nèi)部SDIO接口,將數(shù)據(jù)存儲(chǔ)到內(nèi)存卡中;使用TFTLCD2.8寸屏幕,通過 FSMC功能實(shí)現(xiàn)液晶顯示器的驅(qū)動(dòng);使用 CH340G 驅(qū)動(dòng)芯片實(shí)現(xiàn)USB串口功能;使用USR—WIFI232—B2實(shí)現(xiàn)WiFi模塊與MCU進(jìn)行數(shù)據(jù)傳輸。
系統(tǒng)的軟件設(shè)計(jì)主要為微處理器程序,其功能結(jié)構(gòu)如圖3所示。
微處理器系統(tǒng)以 STM32F103VET6作為核心處理單元,獲取并處理氣體傳感器信號(hào)。首先對(duì)外部設(shè)備進(jìn)行初始化設(shè)置以驅(qū)動(dòng)并檢測(cè)裝置是否運(yùn)行正常,確保采集的傳感器數(shù)據(jù)能夠正常準(zhǔn)確存儲(chǔ),并讀取外部 AD 數(shù)據(jù),獲取傳感器信息,對(duì)傳感器電壓信號(hào)進(jìn)行濃度識(shí)別。傳感器原始數(shù)據(jù)及識(shí)別后數(shù)據(jù)以 RTC 實(shí)時(shí)時(shí)鐘為文件名稱存儲(chǔ)到SD 卡,實(shí)現(xiàn)對(duì)數(shù)據(jù)的有序管理。并通過串口及 WiFi 通信實(shí)現(xiàn)數(shù)據(jù)傳輸至電腦進(jìn)行算法處理。
圖3 微處理器功能結(jié)構(gòu)
由于測(cè)量數(shù)據(jù)的差異性,變量間的復(fù)雜關(guān)系,且傳感器特性受環(huán)境影響,使得氣體濃度與傳感器輸出間的關(guān)系變得模糊,所以通過建立回歸分析模型,可以得到變量之間的關(guān)系,并對(duì)未知輸入進(jìn)行輸出預(yù)測(cè)[11]。
最小二乘法適用于線性和一般的非線性回歸分析[12,13];對(duì)于復(fù)雜無規(guī)律的曲線擬合,更適合使用常處理小數(shù)據(jù)的統(tǒng)計(jì)學(xué)方法GPR和 SVR。
2.1.1 最小二乘法
(1)
求解取得最小值時(shí)的參數(shù),可得回歸參數(shù)。其中,fθ(xi)-yi為數(shù)據(jù)的殘差。對(duì)于目標(biāo)模型
S(x)=a0φ0(x)+a1φ1(x)+…+anφn(x)
(2)
(3)
(4)
(5)
通過對(duì)訓(xùn)練集數(shù)據(jù)的計(jì)算,求出矩陣的各項(xiàng)參數(shù),并計(jì)算出I(a0,a1,…an)從而完成模型建立。
2.1.2 高斯過程回歸
GPR對(duì)于處理非線性、小樣本數(shù)據(jù)問題具有很好的適應(yīng)性,泛化能力強(qiáng),可有效地解決回歸預(yù)測(cè)問題。高斯過程是均具有聯(lián)合高斯分布的有限隨機(jī)變量的集合,其特性只由數(shù)據(jù)的均值函數(shù)m(x)與協(xié)方差函數(shù)K(x,x′)決定。形式為
f(x)~GP(m(x),k(x,x′))
(6)
通常m(x)取0則上式轉(zhuǎn)換為矩陣形式為
(7)
式中kij=e-λ‖xi-xj‖2是高斯過程完成學(xué)習(xí)數(shù)據(jù)之間的相關(guān)關(guān)系矩陣。高斯過程回歸則是在此基礎(chǔ)上完成對(duì)數(shù)據(jù)的預(yù)測(cè),對(duì)于一個(gè)新的數(shù)據(jù)X*通過把數(shù)據(jù)代入關(guān)系矩陣中可得到基于該數(shù)據(jù)與原始數(shù)據(jù)的關(guān)系矩陣
(8)
對(duì)于上述的聯(lián)合分布,可以求出其中所有參數(shù),而f*隸屬于正態(tài)分布
f*~N(μ*,δ*)
(9)
式(10)各個(gè)參數(shù)表達(dá)式為
(10)
(11)
使用以統(tǒng)計(jì)學(xué)為基礎(chǔ)的GPR對(duì)非線性曲線的回歸具有較為理想的效果。
2.1.3 支持向量回歸機(jī)
SVR適用于解決小樣本、非線性、高維數(shù)的問題。目標(biāo)是尋找一個(gè)回歸平面,使得集合內(nèi)所有數(shù)據(jù)至該平面的距離最近。求得元素與回歸平面之間的距離為r=d(x)-g(x)其中d(x)為數(shù)據(jù)集,g(x)為回歸平面。應(yīng)用SVR回歸預(yù)測(cè)時(shí)應(yīng)當(dāng)首先選取懲罰系數(shù)C、不敏感系數(shù)ε等參數(shù)[14]。由于數(shù)據(jù)到回歸平面之間的距離不等,所以給定容限值ε防止過擬合,并引入代價(jià)函數(shù)對(duì)距離進(jìn)行修正
cost(x)=max(0,|d(x)-g(x)|-ε)
(12)
(13)
(14)
式中C為懲罰系數(shù),依據(jù)拉格朗日定理,上式轉(zhuǎn)換為對(duì)偶問題,并進(jìn)行計(jì)算得到
(15)
使用MF-4B氣體測(cè)試儀配制H2S,NO2,NH3三種典型氣體構(gòu)成的多組分實(shí)驗(yàn)氣體對(duì)所設(shè)計(jì)的裝置進(jìn)行功能與性能測(cè)試。以實(shí)驗(yàn)環(huán)境溫度為16 ℃,濃度間隔均為1×10-6分別獲取了(0~15)×10-6范圍內(nèi)H2S;(0~11)×10-6范圍內(nèi)NH3;(0~13)×10-6范圍內(nèi)NO2的氣體傳感器數(shù)據(jù),并通過IIR(infinite impulse response)數(shù)字濾波器[15]濾除信號(hào)中較大波動(dòng),使濾波后的數(shù)據(jù)具有穩(wěn)定的狀態(tài),通過對(duì)數(shù)據(jù)進(jìn)行穩(wěn)態(tài)均值處理,即截取穩(wěn)定數(shù)據(jù),去除最大值與最小值后進(jìn)行算數(shù)平均,從而得到該濃度下各傳感器響應(yīng)的特征值如表1所示。
表1 各傳感器在不同濃度的數(shù)據(jù)特征值
回歸模型的準(zhǔn)確性是衡量模型好壞的直接評(píng)價(jià)指標(biāo),回歸數(shù)據(jù)值相對(duì)于實(shí)際值的波動(dòng)越小則回歸模型的準(zhǔn)確性越好,直接指標(biāo)是模型的均方根誤差(mean-square error),衡量擬合數(shù)據(jù)與真實(shí)數(shù)據(jù)差距的參數(shù),越小越好。表達(dá)式為
(16)
本文使用最小二乘、SVR、GPR 三種小樣本數(shù)據(jù)分析方法對(duì)各傳感器特征數(shù)據(jù)進(jìn)行回歸處理,并得到模型誤差參數(shù)。其中使用特征數(shù)據(jù)的80 %進(jìn)行模型建立,20 %的數(shù)據(jù)進(jìn)行模型誤差驗(yàn)證。
表2 最小二乘一階與三階回歸方程
通過設(shè)定最小二乘回歸模型的階數(shù),可完成對(duì)數(shù)據(jù)的線性回歸與非線性回歸。根據(jù)是否考慮傳感器靈敏度的正負(fù)偏差對(duì)輸出電壓的影響,可將模型分為一元線性與多元非線性回歸。通過最小二乘回歸得到各傳感器的回歸方程及測(cè)試數(shù)據(jù)的MSE如表2所示。對(duì)比氣體特征數(shù)據(jù)可以看出,一階模型使數(shù)據(jù)呈現(xiàn)線性化,在一定程度上對(duì)傳感器的特性進(jìn)行了擬合回歸,而三階模型在保留數(shù)據(jù)一定線性關(guān)系的同時(shí),使得數(shù)據(jù)更加貼合數(shù)據(jù)變化趨勢(shì),擁有更好的效果。
SVR回歸曲線貼合數(shù)據(jù)變化趨勢(shì),但模型無法使用具體表達(dá)式表達(dá),SVR 對(duì)于超出訓(xùn)練數(shù)據(jù)外的數(shù)據(jù),回歸預(yù)測(cè)能力較差。使用測(cè)試數(shù)據(jù)計(jì)算,可以得到H2S傳感器回歸模型MSE為0.006 2,NH3傳感器回歸模型MSE為0.092 0,NO2傳感器回歸模型MSE為0.479 934。GPR回歸曲線貼合數(shù)據(jù)變化趨勢(shì),且線性化程度較高。
使用測(cè)試數(shù)據(jù)進(jìn)行誤差測(cè)試得到模型的均方根誤差分別為:H2S 傳感器回歸模型MSE為0.002 9;NH3傳感器 回歸模型MSE為0.1847;NO2傳感器回歸模型MSE為0.058 3。各傳感器經(jīng)過SVR回歸,GVR回歸的模型輸出曲線對(duì)比如圖4所示。
圖4 各傳感器的回歸曲線比較
通過對(duì)比模型均方根誤差可以得出適合各傳感器數(shù)據(jù)的回歸模型為:FECS50-100(H2S)最佳回歸算法是GPR,MSE為0.002 9;4NH3-100(NH3) 最佳回歸算法SVR,MSE為0.092 0;4NO2-20(NO2)最佳回歸算法是一階最小二乘,MSE為0.052 4。
將上述實(shí)驗(yàn)中得到的回歸模型,寫入監(jiān)測(cè)軟件與微處理器程序中,通過 MF-4B 氣體測(cè)試儀檢定校準(zhǔn)裝置產(chǎn)生各傳感的標(biāo)準(zhǔn)氣體,并通過裝置進(jìn)行數(shù)據(jù)測(cè)量,實(shí)際測(cè)試結(jié)果通過數(shù)據(jù)匯總得到檢測(cè)濃度與實(shí)際值之間的檢測(cè)誤差,表3給出了測(cè)試結(jié)果。
表3 實(shí)測(cè)結(jié)果 10-6
使用各傳感器最佳回歸模型進(jìn)行實(shí)際濃度測(cè)量,各傳感器誤差均在 (0~0.6)×10-6范圍內(nèi),達(dá)到了高精度的氣體檢測(cè)的目的。