凌六一, 黃友銳, 王成軍, 胡仁志, 李 昂, 謝品華
1. 安徽理工大學(xué)人工智能學(xué)院, 安徽 淮南 232001 2. 安徽科技學(xué)院, 安徽 鳳陽 233100 3. 中國科學(xué)院安徽光學(xué)精密機(jī)械研究所, 中國科學(xué)院環(huán)境光學(xué)與技術(shù)重點實驗室, 安徽 合肥 230031
非相干寬帶腔增強(qiáng)吸收光譜(IBBCEAS)是近年來發(fā)展起來的一種高靈敏光譜探測技術(shù), 利用高精密光學(xué)諧振腔增強(qiáng)吸收光程來達(dá)到高靈敏探測目的。 目前, IBBCEAS技術(shù)已被廣泛應(yīng)用于大氣痕量氣體NO2[1-8], CHOCHO[1-3], HONO[2, 4, 6-7], HCHO[9-10], NO3[4, 6], I2[11], H2O[4, 11]以及氣溶膠消光[12]等探測。 IBBCEAS儀器可以通過增加諧振腔基長、 提高光源輻射光強(qiáng)以及使用更高反射率鏡片等手段來提高探測靈敏度。 IBBCEAS儀器的這些客觀參數(shù)一旦固定, 又如何進(jìn)一步改善儀器性能仍然值得研究。 如Langridge等[13]通過Allan方差分析, 獲得NO3吸收光譜最佳采集時間為400 s, 將NO3的探測限從0.25 pptv(10 s的采集時間)改善到0.09 pptv; Yi等[6]應(yīng)用IBBCEAS測量NO3, HONO和NO2, 利用Allan方差獲得100 s的最優(yōu)光譜采集時間, NO3和NO2的探測限分別達(dá)到1.7 pptv和1.6 ppbv; Duan等[4]同樣針對HONO和NO2測量, 通過Allan方差分析, 獲得320 s最優(yōu)光譜采集時間下的HONO和NO2探測限分別為0.22 ppbv和0.45 ppbv。 現(xiàn)有研究只是針對光譜采集時間, 利用Allan方差來獲得特定曝光時間下的最佳光譜平均次數(shù)來改善IBBCEAS儀器探測性能。 實際上, 除了光譜采集時間外, IBBCEAS光譜反演波段同樣影響反演結(jié)果和儀器性能。 本工作以IBBCEAS光譜反演大氣NO2濃度為例, 分析了光譜反演波段對NO2擬合結(jié)果及擬合殘差的影響情況, 以最優(yōu)反演準(zhǔn)確度為目標(biāo), 提出了一種利用RBF神經(jīng)網(wǎng)絡(luò)和遺傳算法的機(jī)器學(xué)習(xí)最優(yōu)反演波段確定方法, 并進(jìn)行了驗證。
圖1所示是測量裝置結(jié)構(gòu)示意圖。 其中, 光源LED中心波長約460 nm, 半高寬約25 nm, 鏡片M1和M2在430~480 nm波段內(nèi)具有高反射率。 光路中其他部件的功能說明可參考我們之前的報道[14]。
圖1 IBBCEAS實驗裝置結(jié)構(gòu)示意圖
利用IBBCEAS寬帶吸收光譜, 在某反演波段內(nèi)將測得的吸收系數(shù)與被測氣體吸收截面進(jìn)行最小二乘擬合, 就可以獲得被測氣體的濃度。 基于LED光源的非相干寬帶腔增強(qiáng)吸收光譜系統(tǒng), 由于LED半高寬一般只有20~30 nm, 而光學(xué)諧振腔的鏡片反射率是波長的函數(shù), 可能會出現(xiàn)LED輻射光譜峰值波長與鏡片反射率的峰值波長存在較大差距, 另外LED半高寬又很窄, 導(dǎo)致兩者波段的重疊程度不高。 這種情況下, 如果光譜反演波段選擇不當(dāng), 被測氣體濃度的擬合結(jié)果有可能會產(chǎn)生較大偏差。 圖2給出了IBBCEAS裝置中鏡片反射率曲線、 LED輻射譜以及被測氣體NO2的吸收截面。 其中, 鏡片反射率是根據(jù)氮?dú)夂秃夥肿訉η粌?nèi)入射光的不同Rayleigh散射消光得到。 在444 nm處反射率曲線不是很平滑, 可能是因濾光片缺陷所導(dǎo)致, 最大鏡片反射率(~0.998 7)出現(xiàn)在458 nm處, 與LED峰值波長(460 nm)相差約2 nm, 鏡片反射率曲線與LED光譜的匹配程度較好。
圖2 430~480 nm波段內(nèi)的鏡片反射率、 LED譜和 NO2吸收截面
以某條IBBCEAS吸收譜為例, 分別在具有不同中心波長和帶寬的反演波段下對NO2進(jìn)行濃度擬合, 得到反演波段與NO2濃度擬合相對誤差、 殘差譜標(biāo)準(zhǔn)偏差之間的關(guān)系。 如圖3所示, 當(dāng)反演波段的中心波長(即中心點)一定時, 反演波段的寬度越窄, 殘差譜的標(biāo)準(zhǔn)偏差就越小, 這是因為寬度變得越窄, 殘差譜中包含的噪聲數(shù)據(jù)就越少; 而NO2濃度擬合相對誤差基本上表現(xiàn)出相反的變化規(guī)律, 隨著反演波段寬度變窄, 尤其是寬度小于26 nm后, 濃度擬合相對誤差明顯增加, 因為在太窄的吸收光譜中能夠精確擬合出NO2濃度的差分吸收結(jié)構(gòu)不夠, 反演波段寬度為10 nm時, 擬合結(jié)果甚至出現(xiàn)了奇異值(扣除奇異值后, 導(dǎo)致了圖3中10 nm寬度的數(shù)據(jù)點不連續(xù))。 而當(dāng)反演波段的寬度達(dá)到一定程度時(如超過38 nm), 吸收光譜中包含了足夠的NO2差分吸收結(jié)構(gòu), 濃度擬合相對誤差基本上維持在一個較低水平。
圖3 不同反演波段下NO2的相對擬合誤差(a)和殘差譜標(biāo)準(zhǔn)偏差(b)
Fig.3 Fitting results in different retrieval ranges for NO2
當(dāng)反演波段的寬度一定時, 任何寬度下殘差譜標(biāo)準(zhǔn)偏差與反演波段中心波長之間均表現(xiàn)出高度一致的變化規(guī)律, 反演波段中心波長位于460 nm附近區(qū)域, 即LED光譜峰值和最大鏡片反射率所在區(qū)域(見圖2), 殘差譜標(biāo)準(zhǔn)偏差呈現(xiàn)低值, 隨著反演波段中心波長變短, 殘差譜標(biāo)準(zhǔn)偏差呈明顯增長趨勢。 如圖2所示, 在短波長區(qū)域(435~450 nm), 由于鏡片反射率下降明顯, 吸收光程遠(yuǎn)低于長波長處, 盡管短波長區(qū)域NO2具有較大的吸收截面, 但NO2總的吸收特性和測量信噪比不及長波長區(qū)域, 因此殘差譜標(biāo)準(zhǔn)偏差呈現(xiàn)高值。 對于NO2濃度擬合相對誤差來說, 它與反演波段中心波長之間的關(guān)系表現(xiàn)出波動性, 尤其是當(dāng)反演波段寬度較窄時, 這種波動性更加明顯。 盡管反演波段寬度較大時, 波動性減小, 但仍然存在。 對于IBBCEAS定量探測系統(tǒng)來說, 如何減小測量誤差是關(guān)鍵。 IBBCEAS系統(tǒng)的測量誤差主要來源于鏡片反射率、 被測氣體吸收截面以及氣體在腔內(nèi)的損耗情況, 但如果反演波段選擇不當(dāng), 就會產(chǎn)生很大的擬合誤差, 同樣會降低探測系統(tǒng)的定量準(zhǔn)確性。
反演波段與相對擬合誤差之間的關(guān)系很難用某個函數(shù)來進(jìn)行描述, 而RBF神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性擬合能力, 能逼近任意非線性函數(shù)。 優(yōu)化方法中, 使用RBF神經(jīng)網(wǎng)絡(luò)來描述反演波段與相對擬合誤差之間的非線性關(guān)系, 將抽象的反演波段用起始波長和截止波長這兩個參數(shù)來具體表示, 并將它們作為神經(jīng)網(wǎng)絡(luò)的輸入量, 網(wǎng)絡(luò)輸出量為相對擬合誤差。
2.1.1 樣本數(shù)據(jù)
圖4 RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和測試樣本
2.1.2 訓(xùn)練結(jié)果
將樣本數(shù)據(jù)按照4∶1比例分成學(xué)習(xí)樣本和測試樣本兩部分, 分別用于RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練和測試。 圖5給出了學(xué)習(xí)訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò)對測試樣本的預(yù)測結(jié)果, 圖中插圖為預(yù)測結(jié)果與實際擬合相對誤差之間的線性擬合。 可以看出, RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果與實際值在趨勢上基本保持一致, 兩者的線性擬合斜率為0.984, 相關(guān)性R2=0.901, 說明RBF神經(jīng)網(wǎng)絡(luò)得到了有效訓(xùn)練。
圖5 RBF神經(jīng)網(wǎng)絡(luò)測試結(jié)果
遺傳算法是一種通過模擬大自然中生物個體進(jìn)化過程搜索最優(yōu)解(個體)的方法。 使用遺傳算法搜索最優(yōu)反演波段, 個體即為反演波段, 用起始波長、 截止波長組合進(jìn)行編碼, 隨機(jī)產(chǎn)生若干個體形成種群。 以RBF神經(jīng)網(wǎng)絡(luò)的輸出作為個體適應(yīng)度, 經(jīng)過多代種群進(jìn)化過程后, 獲得適應(yīng)度最優(yōu)個體, 即獲得最優(yōu)反演波段, 具體的優(yōu)化流程見圖6。 設(shè)置種群規(guī)模為100個體, 所有個體中的參數(shù)“起始波長”和“截止波長”均限制在430~480 nm之間, 個體交叉與變異概率均為0.2, 種群進(jìn)化代數(shù)設(shè)置為100, 圖7給出了算法執(zhí)行后種群平均適應(yīng)度和最優(yōu)個體適應(yīng)度隨進(jìn)化代數(shù)的變化情況。 可以看出, 種群平均適應(yīng)度逐步逼近最優(yōu), 說明種群個體進(jìn)化進(jìn)行了有效的優(yōu)勝劣汰過程, 所有個體均向最優(yōu)個體進(jìn)化。 種群進(jìn)化第61代時, 最優(yōu)個體出現(xiàn), 對應(yīng)的最優(yōu)適應(yīng)度為3.584%, 最優(yōu)反演波段為445.78~479.44 nm。
圖6 反演波段遺傳算法優(yōu)化流程圖
圖7 遺傳算法適應(yīng)度曲線
擬合NO2參考吸收截面到最優(yōu)反演波段(445.78~479.44 nm)內(nèi)的某條IBBCEAS吸收光譜, 光譜擬合如圖8所示。 擬合得到的NO2濃度為14.21 ppbv, 擬合殘差標(biāo)準(zhǔn)偏差為1.5×10-8cm-1, 擬合誤差為0.59 ppbv, 相對擬合誤差為4.15%, 與遺傳算法尋優(yōu)得到的最優(yōu)適應(yīng)度(3.584%)存在一定偏差, 是由RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差所引起。
圖8 最優(yōu)反演波段下的大氣NO2濃度擬合實例
選擇相同帶寬的4個典型反演波段, 與最優(yōu)反演波段下的NO2擬合結(jié)果進(jìn)行對比。 其中3個波段分別以最大鏡片反射率所在波長(458 nm)、 LED峰值波長(460 nm)以及兩者平均值(459 nm)為中心點, 第4個波段覆蓋NO2在430~450 nm內(nèi)的強(qiáng)吸收結(jié)構(gòu), 這4個反演波段分別為441.17~474.83, 443.17~476.83, 442.17~475.83和432.68~466.34 nm, 擬合結(jié)果見表1。 在最優(yōu)反演波段下, 無論是擬合誤差、 相對擬合誤差還是擬合殘差標(biāo)準(zhǔn)偏差, 均低于其他4個反演波段, 光譜擬合質(zhì)量達(dá)到最優(yōu)。 對比結(jié)果表明, 利用機(jī)器學(xué)習(xí)來確定IBBCEAS光譜擬合的最優(yōu)反演波段是可行的。
表1 某條NO2吸收光譜在不同反演波段的擬合結(jié)果對比
以基于LED光源的非相干寬帶腔增強(qiáng)吸收光譜技術(shù)定量探測大氣NO2為例, 分析了吸收光譜反演波段對NO2擬合結(jié)果的影響情況, 當(dāng)諧振腔鏡片反射率曲線與LED輻射譜不能很好匹配時, 反演波段選擇會比較困難。 利用光譜擬合樣本數(shù)據(jù)進(jìn)行RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí), 獲得反演波段與擬合誤差之間的非線性映射關(guān)系, 以反演波段為個體特征數(shù)據(jù)、 RBF神經(jīng)網(wǎng)絡(luò)輸出為個體適應(yīng)度, 利用遺傳算法獲得了最優(yōu)反演波段。 結(jié)果證明, 利用神經(jīng)網(wǎng)絡(luò)結(jié)合遺傳算法的機(jī)器學(xué)習(xí)方法, 可以獲取IBBCEAS光譜最優(yōu)反演波段, 降低了濃度擬合誤差。