鄭傳濤, 馬琰銘, 劉大勇, 劉 洋, 宋 芳
(吉林大學(xué) a. 電子科學(xué)與工程學(xué)院; b. 通信工程學(xué)院, 長春 130012)
“信息論”是電子學(xué)科研究生專業(yè)的必修課程, 揭示了信息的本質(zhì)特性和規(guī)律, 其主要研究如何提高信息系統(tǒng)的可靠性、 有效性、 保密性和認證性, 以及使信息系統(tǒng)最優(yōu)化[1-3]。近年來, 在信息理論的指導(dǎo)下, 信息技術(shù)不斷發(fā)展, 在自然科學(xué)與社會科學(xué)等領(lǐng)域也有所延伸, 誕生了如光學(xué)信息論、 醫(yī)學(xué)信息論等新分支、 新領(lǐng)域[4-5]。信息論將信息的傳遞作為一種統(tǒng)計現(xiàn)象考慮, 因此具有一定的普適性, 對其他學(xué)科的發(fā)展具有一定的指導(dǎo)意義[1,6]。
在教學(xué)方面, 學(xué)習(xí)信息論的基礎(chǔ)是理解信息的概念和掌握基于概率統(tǒng)計的信息度量方法, 因此需要從感性的認知和嚴謹?shù)臄?shù)學(xué)推導(dǎo)兩個層次入手。在傳統(tǒng)的信息論教學(xué)中, 基本概念、 公式推導(dǎo)和習(xí)題講解占據(jù)課堂的主體部分, 而缺乏對信息論具體應(yīng)用的直觀講解。因此, 針對信息論教學(xué)中該環(huán)節(jié)的缺失, 發(fā)揮信息論對信息本質(zhì)研究的指導(dǎo)作用, 需要建立一套能輔助講解信息論有關(guān)概念、 且實驗現(xiàn)象直觀的教研系統(tǒng)。在科研方面, 波長調(diào)制光譜技術(shù)是一種高靈敏的吸收光譜技術(shù), 具有選擇性好、 壽命長、 精度高和靈敏度高等優(yōu)點, 并能實現(xiàn)對待測氣體的實時檢測[7-8], 近年已成為衡量氣體檢測領(lǐng)域的研究熱點。該技術(shù)在掃描氣體吸收線的同時使用高頻正弦波調(diào)制可調(diào)諧激光二極管, 通過對光電探測器的輸出信號進行正交鎖相放大處理, 得到正比于氣體濃度的諧波信號。測量過程伴隨著信息的傳輸, 根據(jù)信號不增性原理, 探測到的信號相對于真值發(fā)生了信息的損失, 這意味著測得數(shù)據(jù)的有效性受損[4,6,9]。為定量評估測量數(shù)據(jù)的有效性, 需要在建立系統(tǒng)數(shù)學(xué)模型的基礎(chǔ)上通過信息論的有關(guān)理論對傳感信息進行評估。因此, 建立紅外氣體傳感系統(tǒng)的信息度量方法在科研方面也具有重要意義。
針對信息論教學(xué)需求以及波長調(diào)制光譜技術(shù)理論分析和科研需要, 筆者采用Matlab軟件建立了波長調(diào)制光譜技術(shù)的理論模型, 仿真了激光調(diào)制、 氣體吸收、 光電轉(zhuǎn)換和諧波提取等各個環(huán)節(jié)。結(jié)合信息論中噪聲熵、 信道傳輸矩陣、 信息傳輸效率等相關(guān)原理, 定義了最小可分辨的濃度間隔。根據(jù)波長調(diào)制光譜技術(shù)理論模型, 評估了系統(tǒng)噪聲的主要來源, 研究了系統(tǒng)噪聲對最小可分辨間隔的影響。根據(jù)系統(tǒng)實際測量數(shù)據(jù), 計算了系統(tǒng)的最小可分辨間隔。應(yīng)用實踐表明, 該紅外氣體傳感信息度量教學(xué)科研系統(tǒng)及相關(guān)方法, 滿足了信息論課程教學(xué)要求以及波長調(diào)制光譜技術(shù)的科研需要, 取得了較好的教學(xué)與科研效果。
如圖1a所示, 紅外氣體傳感系統(tǒng)通過測量實際氣體濃度(假設(shè)為X), 得到測量濃度(假設(shè)為Y), 由于傳感系統(tǒng)受光學(xué)、 電學(xué)等噪聲的影響, 測量濃度Y呈現(xiàn)一定的隨機性。因此通過Y得到的關(guān)于X的信息與其客觀存在的信息并不嚴格相等, 即造成了傳感信息的損失。紅外吸收光譜法具有靈敏度高、 響應(yīng)速度快和非接觸測量等優(yōu)點, 可調(diào)諧二極管激光吸收光譜技術(shù)是一種經(jīng)典的紅外吸收光譜檢測技術(shù)[8]??刂萍す獠ㄩL掃描氣體的特征吸收譜線, 當(dāng)激光與待測氣體相互作用時, 根據(jù)朗伯-比爾定律, 波長位于氣體吸收線附近的光能量被氣體分子吸收, 導(dǎo)致透射光強度減弱。通過光電探測器探測光強的變化, 可反演得到待測氣體的濃度信息[8,10]??烧{(diào)諧二極管激光吸收光譜技術(shù)主要包括直接吸收光譜與波長調(diào)制光譜兩種技術(shù)類型。在波長調(diào)制光譜技術(shù)中, 激光器的驅(qū)動信號中疊加了調(diào)制作用的高頻正弦信號, 利用鎖相放大技術(shù)提取出二次諧波信號, 降低了隨機噪聲的影響。波長調(diào)制光譜技術(shù)的原理如圖1b所示。
圖1 基于波長調(diào)制光譜的紅外氣體傳感系統(tǒng)的信息傳遞模型與檢測原理Fig.1 Information transmission model and detection principle of infrared gas sensing system based on wavelength modulation spectroscopy
激光器的驅(qū)動信號由起掃描作用的三角波和起調(diào)制作用的高頻正弦波疊加形成, 激光器的驅(qū)動電流為
i(t)=i0+ibcos(wt)
(1)
其中i0為激光器的偏置電流,ib為電流調(diào)制幅度,w為調(diào)制信號的角頻率。輸出激光的波數(shù)與光強分別為
v(t)=v0+vmcos(wt)
(2)
I0(t)=I0+ηI0cos(wt)
(3)
其中v0為光源的中心頻率,vm為頻率調(diào)制幅度,I0為初始光強,η為光強調(diào)制系數(shù)。透射光I與入射光I0滿足朗伯-比爾定律
I(v)=I0(v)exp[-α(v)CL]
(4)
其中α(v)為吸收系數(shù),L為吸收光程,C為待測氣體濃度。在弱吸收條件下, 滿足α(v)CL?1, 則式(4)可近似為
I(v)=I0(v)[1-α(v)CL]
(5)
將α(v)進行傅里葉展開, 得到
(6)
其中An為吸收系數(shù)的n級傅里葉級數(shù)的系數(shù), 當(dāng)vm較小時,An正比于α(v)的n階導(dǎo)數(shù), 且n次諧波信號的幅值Sn如下[10]
(7)
Sn∝I0CLAn
(8)
可見,Sn正比于初始光強、 氣體濃度、 吸收光程和吸收系數(shù)的n級傅里葉級數(shù)的系數(shù)。因此, 只要測得n次諧波的幅值, 根據(jù)標(biāo)定關(guān)系可得到氣體濃度。在實際應(yīng)用中一般使用二次諧波信號表征氣體濃度[10-15]。
使用Matlab軟件對上述基于波長調(diào)制光譜的氣體檢測過程進行仿真。選取位于3 291 nm處的甲烷吸收線, 設(shè)置甲烷濃度為100×10-6。掃描信號----三角波的頻率為5 Hz, 調(diào)制信號----正弦波的頻率為5 000 Hz。仿真得到的透射光強I的波形如圖2a所示。在吸收波長處, 由于激光光強被氣體分子吸收, 信號出現(xiàn)了凹陷。將該信號分別與頻率為10 000 Hz的同相和正交信號相乘, 再進行低通濾波, 得到同相分量(I)與正交分量(Q)。由于低通濾波的信號可能為負, 因此, 在兩分量中加入固定的偏置保證信號為正值, 將這兩個信號平方相加后開方, 從而消除相位差的影響。實際測得的信號波形如圖2b所示。進行基線擬合后(見圖2c), 得到了幅值正比于氣體濃度的二次諧波信號, 如圖2d所示。
圖2 波長調(diào)制光譜技術(shù)的仿真結(jié)果Fig.2 Simulation results of wavelength modulation absorption spectroscopy technique
根據(jù)圖1a, 測量氣體濃度過程是一個傳遞信息過程。假設(shè)待測氣體濃度是已知的、 確定的值, 但在測量中, 由于噪聲影響, 實際測得濃度值會分布在一個特定的范圍內(nèi), 如果測量幾個比較接近的真值, 實際測得的幾組濃度值可能會發(fā)生交疊。此時, 對一個特定的測量值, 不能確定這個測量值對應(yīng)的真值。與精確的濃度信息相比, 得到的濃度信息比較模糊, 即在這個過程中存在信息的損失。因此, 需要建立一種傳感信息度量方法, 可定量描述測量過程中信息的損失及其對測量濃度的影響。根據(jù)香農(nóng)信息論, 即使測得氣體濃度, 獲得一部分關(guān)于實際氣體濃度的信息量, 但對實際氣體濃度X仍然存在不確定性。此時, 通過傳感系統(tǒng)的轉(zhuǎn)移矩陣可描述信息傳輸與損失情況[1], 進而使用傳感系統(tǒng)的信息傳遞效率和最小可分辨濃度間隔可評估傳感系統(tǒng)的信息傳輸有效性。
將發(fā)送信源(氣體的真實濃度)用隨機變量X表示, 其取值為{x1,x2,…,xn},n為濃度的取值個數(shù)。通過傳感系統(tǒng)處理后, 輸出變量(測量的氣體濃度)為Y, 取值為{y1,y2,…,yr}。如果沒有噪聲,X與Y存在確定的對應(yīng)關(guān)系, 如測量x1, 接收端必然接收到y(tǒng)1??紤]傳感系統(tǒng)的噪聲, 發(fā)送某個x時, 傳感器輸出的y不是確定值。該過程采用轉(zhuǎn)移概率描述, 即
P(y|x)=P(y=yb|x=xa),b=1,2,…,r;a=1,2,…,n
(9)
式(9)給出了當(dāng)實際的氣體濃度為xa時, 傳感器輸出濃度為yb的概率??紤]所有實際濃度與測量濃度的情況, 可將傳感器的轉(zhuǎn)移特性寫為矩陣形式, 如表1所示。
轉(zhuǎn)移矩陣描述了實際濃度與測量濃度之間的轉(zhuǎn)移關(guān)系, 可進一步使用平均互信息描述通信后得到的信息量。信源X的信息量與Y的信息量可分別表示為
(10)
(11)
表1 轉(zhuǎn)移矩陣
通過傳感器輸出濃度Y獲得的關(guān)于實際濃度X的信息量稱為互信息量, 計算式如下
I(X;Y)=H(X)+H(Y)-H(XY)
(12)
其中H(XY)為X、Y的聯(lián)合信息量, 可由
(13)
計算。其中P(xy)=P(x)P(y|x)為聯(lián)合概率密度。
轉(zhuǎn)移矩陣建立了實際濃度與測量濃度的相互關(guān)系, 由轉(zhuǎn)移矩陣和式(12)可計算傳感系統(tǒng)輸出的信息量[4,9]。在度量紅外氣體檢測系統(tǒng)的檢測精度時, 可將傳感器等效為離散有噪信道, 其輸入是一組離散氣體濃度值, 如100×10-6、110×10-6、120×10-6。受噪聲影響, 當(dāng)設(shè)定濃度為100×10-6時, 測得的濃度可能偏離實際值, 從而造成了混淆。假設(shè)待測的氣體具有多個濃度值, 將測得的濃度值量化后劃分至指定區(qū)間, 用區(qū)間頻率代替概率, 可計算出轉(zhuǎn)移概率。將每個濃度區(qū)間的轉(zhuǎn)移概率寫成矩陣的形式, 可得轉(zhuǎn)移矩陣, 再結(jié)合式(10)~式(13)可定量計算信息量的損失。
為衡量在一定濃度范圍內(nèi)測量濃度的混淆程度, 可選擇多組等概率的氣體樣品作為輸入信源X的符號集。在實際應(yīng)用中, 可依次配置這些濃度的氣體樣品, 各樣品間互不干擾, 因此可認為選擇每個氣體濃度的概率相等, 此時可得H(X)=-log2(1/n), 其中n為待測氣體樣品個數(shù)。
計算互信息時, 首先確定輸入變量X與輸出變量Y可能的取值, 輸入變量取值為設(shè)置的濃度。針對輸出變量, 首先, 確定測得濃度的最大值與最小值; 其次, 對采集到的數(shù)據(jù)進行量化和分組, 統(tǒng)計各組的頻次, 計算出轉(zhuǎn)移概率P(y|x); 然后, 計算Y的概率分布P(y)和H(Y); 最后, 計算XY的聯(lián)合概率分布P(xy)和聯(lián)合熵H(XY), 最終計算得到互信息量I(X;Y)。
定義紅外氣體傳感器的信息傳遞效率η, 用于衡量系統(tǒng)傳輸信息的能力,η越大, 說明系統(tǒng)傳輸傳感信息的能力越強, 受到的干擾越小。即有
(14)
圖3 當(dāng)實際濃度X={100,101,102,103,104,105}×10-6時, 模擬得到的傳感器測量濃度的分布Fig.3 Under the case of practical concentrationinformation source X={100,101,102,103,104,105}×10-6,the simulated distribution of the measured concentration
作為示例, 選取6個等間隔的濃度點{100,101,102,103,104,105}×10-6作為傳感器的輸入信源X, 此時n=6, 濃度間隔Δx=1×10-6。通過模擬方法, 隨機生成了間隔為1×10-6、 標(biāo)準差為0.5×10-6的6組濃度數(shù)據(jù), 每個濃度點下生成10 000個濃度值。對各組濃度數(shù)據(jù)進行高斯擬合, 得到各個濃度測量值的歸一化頻數(shù)曲線, 如圖3所示。輸出濃度的取值范圍為(98~107)×10-6。由于將傳感器等效為離散有噪信道, 將連續(xù)的歸一化頻數(shù)曲線離散化, 得到一組用于構(gòu)建轉(zhuǎn)移矩陣的離散濃度點。令離散化的濃度間隔為Δy=0.1×10-6, 將離散化區(qū)間內(nèi)的頻數(shù)累加作為該區(qū)間濃度點的頻數(shù), 比如[100×10-6,100.1×10-6]區(qū)間, 統(tǒng)一使用區(qū)間左端點(100×10-6)作為區(qū)間濃度以及累加后的頻數(shù)值作為區(qū)間頻率。根據(jù)圖3概率分布, 計算離散化后各區(qū)間的概率分布, 從而得到傳感器的輸出信源Y。發(fā)送信源的熵H(X)=-1/6log2(1/6)=2.585(bit/符號), 接收信源的熵H(Y)=6.081(bit/符號), 聯(lián)合熵H(XY)=6.952(bit/符號), 平均互信息I(X;Y)=H(X)+H(Y)-H(XY)=1.714(bit/符號), 對應(yīng)的信息傳遞效率η=66.4%。
在保持輸入濃度間隔不變的前提下(即保持Δx=1×10-6), 通過改變測量濃度的標(biāo)準差(定義為σ, 代表傳感系統(tǒng)的噪聲水平)與濃度間隔(表明傳感系統(tǒng)區(qū)分濃度的能力)的比值研究接收端獲得的互信息與信息傳遞效率的變化, 二者可分別通過式(12)、 式(14)計算得到。如圖4a所示, 隨著σ/Δx的增大,I(X;Y)與η逐漸降低, 這是由于當(dāng)Δx不變時, 隨著σ的增大, 不同組中的測量數(shù)據(jù)的重疊程度增大, 使測量濃度之間變得更難以區(qū)分, 即信息量降低。在一定的噪聲水平下(即σ一定時), 當(dāng)互信息量達到輸入信息量即η=100%時, 定義相應(yīng)的濃度間隔為傳感器的最小可分辨濃度間隔Δxmin。根據(jù)圖4, 計算得到傳感系統(tǒng)的最小可分辨間隔為Δxmin=2.8×10-6。其中X={100,101,102,103,104,105}×10-6。
圖4 信息傳遞效率、 互信息量隨標(biāo)準差與濃度間隔比值的變化曲線Fig.4 Curve of information transmission efficiency and mutual information versus the ratio between the standard deviation and concentration interval
為評估實際的紅外氣體傳感系統(tǒng)的信息傳遞效率, 選擇吸收較強的中紅外3 038.5 cm-1的甲烷吸收線作為目標(biāo)吸收線, 建立了基于波長調(diào)制光譜技術(shù)的中紅外甲烷檢測系統(tǒng)。使用中心發(fā)射波長為3 291 nm的帶間級聯(lián)激光器, 氣室的光程為26 m, 采用熱電制冷紅外探測器探測紅外光信號。通過測量氮氣背景下的系統(tǒng)輸出濃度評估系統(tǒng)的噪聲水平。
圖5a給出了對系統(tǒng)背景噪聲進行長時間測量得到的甲烷濃度值, 測量時間為2 000 s, 標(biāo)準差σ=0.15×10-6。圖5b給出了測量濃度的頻數(shù)分布直方圖與概率分布的擬合曲線??梢钥闯? 測量的濃度數(shù)據(jù)近似服從高斯分布。利用圖5a得到的濃度分布, 將發(fā)送信源X的濃度個數(shù)設(shè)置為6組, 濃度間隔設(shè)置為Δx=0.1×10-6。
傳感器實際測得的濃度(接收信源Y)分布如圖5c所示。圖5d給出了系統(tǒng)艾倫標(biāo)準差隨積分時間的變化曲線。當(dāng)積分時間為1 s時, 艾倫標(biāo)準差為0.15×10-6(等于標(biāo)準差)。隨著積分時間的增加, 艾倫標(biāo)準差逐漸下降, 系統(tǒng)的穩(wěn)定性隨之增強。當(dāng)積分時間為200 s時, 艾倫標(biāo)準差達到0.02×10-6。
圖5 在氮氣環(huán)境下, 對傳感器背景濃度數(shù)據(jù)的測量、 分布和艾倫標(biāo)準差分析Fig.5 Measurement results, distribution and Allan deviation analysis on background concentration of the sensor system in N2 atmosphere
通過改變濃度間隔Δx, 探究了Δx對傳感器的互信息和信息傳遞效率的影響, 如圖6a,圖6b所示。隨著Δx的增大, 互信息量增加, 當(dāng)Δx足夠大時, 互信息等于信源的信息熵, 此時信息傳遞效率為100%。當(dāng)積分時間分別為1 s、5 s、10 s、20 s、100 s和200 s時, 最小可分辨的濃度間隔分別為0.83×10-6、0.78×10-6、0.56×10-6、0.44×10-6、0.22×10-6和0.11×10-6。圖6c為最小可分辨濃度間隔隨積分時間的變化曲線。隨著積分時間的增加, 最小可分辨濃度間隔逐漸減小, 對應(yīng)的噪聲水平隨之降低, 系統(tǒng)穩(wěn)定性提高。
圖6 不同積分時間下, 對傳感器互信息、 信息傳遞效率和最小可分辨濃度間隔的分析Fig.6 Analysis of mutual information, information transmission efficiency and the minimum resolvable concentration interval of the sensor system
筆者針對“信息論”課程的教學(xué)需求、 波長調(diào)制光譜技術(shù)的噪聲分析與傳感系統(tǒng)的長時間工作穩(wěn)定性評估的需要, 首先建立了紅外氣體傳感系統(tǒng)的信息傳輸模型以及波長調(diào)制光譜技術(shù)的理論模型, 使用Matlab軟件對波長調(diào)制光譜技術(shù)進行了仿真。結(jié)合“信息論”中相關(guān)理論, 給出了轉(zhuǎn)移矩陣、 信源熵、 互信息等數(shù)學(xué)表達式, 分析了氣體傳感系統(tǒng)的信息傳遞效率、 最小可分辨濃度間隔等特性。利用傳感器長時間穩(wěn)定性的實際測量結(jié)果, 分析了傳感系統(tǒng)的信息傳遞效率、 最小可分辨濃度間隔隨系統(tǒng)積分時間的變化特性。本文給出的紅外氣體傳感系統(tǒng)的信息度量方法滿足“信息論”課程的教學(xué)需求以及波長調(diào)制光譜技術(shù)的科研需要, 取得了較好的教學(xué)與科研效果。