(1. 山東科技大學 測繪科學與工程學院,山東 青島 266590;2. 齊魯工業(yè)大學(山東省科學院) 海洋儀器儀表研究所,山東 青島 266061;3. 自然資源部 第一海洋研究所,山東 青島 266061)
海水溶解氧是維持海洋生物生存的重要物質,是評價水體受污染情況的重要指標??焖贉蚀_、長期連續(xù)地監(jiān)測水體溶解氧濃度對于海洋環(huán)境保護、水質生態(tài)危機預報預警、海岸帶綜合修復狀況評價以及科學指導水產養(yǎng)殖都具有重要意義[1]?,F有的基于熒光猝滅原理的光學溶解氧傳感器,尤其是國產傳感器存在連續(xù)工作穩(wěn)定性可靠性差、易污染、易生物附著、測量數據易漂移等問題[1]。究其原因,在于不論何種測控應用場景,依賴各類傳感器測量獲得的結果均存在一定程度的數據不確定性。這種不確定性來源于操作誤差、儀器設備精確度、傳輸干擾或數據處理誤差等因素,因此必須對測控系統的傳感器輸出采取必要處理,確保數據有效性。
現階段,各類測控場景應用最多的方法是信息融合,也稱數據融合。其主要思想是以多種渠道或多組測量獲取的數據全體為依據,采用一定的算法邏輯,開展數據篩選、提前和整合,獲得的融合后數據比原始數據更加真實、可信。針對這類問題,文獻[2-5]進行了多傳感器測量數據融合的相關探索和研究。然而在各類工控領域,獨立傳感器測量或多傳感器獨立分布、組網測量的方式仍在被廣泛使用,而且對這類獨立使用的傳感器測量數據的不確定性剔除和融合處理方面的研究仍較少[6-8]。最常用的算術平均法,計算量少、速度快,但是對所有樣本采用同樣權值進行運算,融合結果易受到各種不確定性因素的影響。文獻[6]設計了一種基于統計加權的融合算法,依據測量結果偏離融合結果的程度賦予不同權值,能在一定程度上削弱主觀因素對融合值的影響,但存在迭代計算量大、收斂速度慢的缺陷。文獻[7]介紹了一種基于最大熵的測量結果估計方法,單選用樣本概率作為數據融合權系數,難以削弱融合結果對不確定性因素的敏感程度。文獻[8]提出一種改進的分批估計融合算法,但算法的應用必須以傳感器測量值樣本符合正態(tài)分布特性為前提,存在明顯局限性。因此,研究單傳感器測量系統數據融合方法來提高測量數據準確性和可靠性,仍具有十分重要的意義。
本研究在自主研制的HJY1-1型光學溶解氧傳感器的基礎上[9],從Shannon提出的信息熵概念[10-13]出發(fā),針對該型溶解氧傳感器標定數據融合問題,提出一種基于信息熵的單傳感器數據融合處理方法,力圖解決上述算法在單傳感器測控系統適用性與測量數據分布局限性方面的不足。在此基礎上,結合光學溶解氧傳感器標定實驗測量數據,對方法有效性作出評估。
本方法主要思想是:首先利用最大熵方法(maximum entropy method,MEM)估計獲得離散傳感器數據的概率分布[13],然后根據求得的標定實驗測量的不確定度確定置信區(qū)間,依托該置信區(qū)間,進行粗差辨別和剔除[14-17]。最后,針對有效標定數據,計算樣本自信息量與信息比率,根據定義的融合權系數完成數據融合處理,得到最終的融合結果。該方法步驟如流程圖1所示。
最大熵方法是指在僅能獲知局部信息的條件下對開展系統狀態(tài)估計時, 所選擇的合理狀態(tài)應為信息熵值最大且符合約束條件的那組, 是現有條件下能做出的唯一公正的選擇, 所有選擇的其他狀態(tài)都代表改變了原有假設或添加了其他約束,無法做到不偏不倚[14]。因此,對于單傳感器測量控制系統而言,如果條件只允許獲得傳感器測量值樣本數據,而不能夠根據已有條件獲得該獨立傳感器輸出測量值的概率分布的,就能夠利用該最大熵方法,獲得該獨立傳感器測量輸出值最公平的概率分布情況。
對于光學溶解氧傳感器標定實驗,假設每組濃度梯度處,水體溶解氧含量穩(wěn)定后,待標定傳感器對溶解氧濃度參數進行k次獨立重復測量,獲得的樣本數據表示為m1,m2,…,mk。由于實際標定實驗中,對每組溶解氧濃度梯度處的測量為有限次,因此,獲得的測量列是一列離散值。由Shannon信息熵定義,計算測量列最大離散熵來估計樣本數據的概率分布形式。
離散隨機變量M的最大離散熵為:
(1)
其中,P(mi)為每組溶解氧濃度梯度處的測量數據樣本的概率,其滿足約束條件為:
(2)
其中,〈fn(mi)〉為若干函數fn(mi)的期望值,N為期望函數的個數。
運用拉格朗日乘數法可計算該概率分布及對應的最大熵,計算公式如式(3)、(4)所示。
(3)
(4)
其中,λ0和λn為引入的相應拉格朗日乘數,Hmax為所求的最大離散熵。
對于光學溶解氧傳感器標定實驗這類獨立傳感器重復測量的情形,在獲取溶解氧傳感器測量示值作為樣本點的基礎上,依據離散標定數據列的方差與數學期望,構造該標定實驗數據的期望函數,進行后續(xù)運算處理。
當單傳感器獨立使用時,整個測控系統采集的有效監(jiān)測數據不足或采樣頻率不高、次數較少的情況下,獲得的有效樣本空間的大小將不足以滿足統計規(guī)律,難以獲得測量值的概率分布。傳統的、建立在數理統計基礎上的粗差判別準則將很難適用[16]。
在獲得最大離散熵概率分布的基礎上,估計出測量列的概率密度函數為P(mi),故離散測量列的不確定度為:
(5)
進一步地,以此置信區(qū)間為依據,判定不在該區(qū)間范圍內的數據為粗差,剔除這些粗差后獲得新的純凈數據序列,開展后續(xù)融合處理。
由Shannon信息熵定義可知,信息熵是信息量的度量,是衡量不確定性程度的指標[11,13]。根據測量樣本數據的不確定性大小來分配不同的權系數,進行數據融合,能夠有效削弱融合結果對不確定性因素的敏感程度[16-17]。因此,基于信息熵的數據融合理論,可以用來進行單傳感器測量數據的修正處理。
對于光學溶解氧傳感器標定實驗這類單傳感器獨立重復觀測,需要借助自信息量I(mi)來表征不同濃度梯度下的每組傳感器測量樣本mi所攜帶的信息。同時,可以借助信息熵來表征樣本總體的測量不確定程度。在此基礎上,通過定義每個樣本自身的信息比率來表征其在樣本總體中的不確定性。顯然,在工程實際應用中,對于每個單傳感器輸出測量值,距離真值越遠,則表示該測量值產生的概率越低,對應的自信息量越豐富;相反地,測差值距離真值越近,該測量值產生的概率越高,對應的自信息量越微弱。由此可知,傳感器測量數據自信息量與融合時相應的權系數呈反比關系。
根據以上分析,設計的適用于光學溶解氧傳感器標定數據處理的融合算法步驟如下:
1) 根據獲得的離散測量樣本,估計數據的最大熵分布;
2) 求出標定實驗中,每種情況下傳感器測量輸出值的自信息量I(mi);
3) 計算信息比率ηi,即單個測量數據在總體測量數據中的不確定性程度,即:
(6)
其中,I(mi)=-logP(mi)。
4) 規(guī)定數據融合權系數,進行歸一化處理,有:
(7)
5) 針對剔除粗差后的有效數據,進行數據融合,即:
(8)
圖2 光學溶解氧傳感器新型標定裝置與HJY1-1型光學溶解氧傳感器
采用如圖2所示的光學溶解氧傳感器新型標定裝置,對HJY1-1型光學溶解氧傳感器進行標定實驗。利用獲取的標定實驗數據,對本方法的有效性進行評估。
針對任意設定溫度下的每一處溶解氧濃度點,均可以獲得如表1所示的一組測量樣本數據。表1中數據表示用同一款光學溶解氧傳感器在同一溫度和同一溶解氧濃度條件下,連續(xù)進行多次采樣,獲得的8個溶解氧濃度測量樣本數據。此處設定的環(huán)境水溫為5 ℃,水體溶解氧含量保持恒定,采用國標碘量法(GB 7489—87)測得的結果為8.37 mg·L-1。
表1 光學溶解氧傳感器在設定溫度及濃度情況下8個樣本數據
選取測量樣本數據的絕對誤差和均方誤差作為衡量數據融合效果的精度指標。表1中,8組測量數據的期望和方差分別為:
離散測量數據樣本概率分布滿足的約束條件有:
運用MATLAB軟件,根據最大熵方法,按照拉格朗日乘數法計算得到拉格朗日系數,分別為:-4.69、0.69、5.97,進而可得該組離散測量數據概率分布為:
P(mi)=exp[4.69-0.69mi-5.97(mi-9.39)2]。
最大離散熵為:
Hmax=1.819 9。
測量數據自信息量為:
I(mi)=-[4.69-0.69mi-5.97(mi-8.39)2]。
表1中8組測量數據對應的概率和自信息量如表2所列。
表2 本情況下8組溶解氧傳感器測量輸出值的概率以及對應自信息量
圖3 測量數據的自信息量和概率分布曲線
結合表2中數據,可得該組溶解氧濃度條件下全部測量數據的自信息量以及最大熵分布曲線圖,詳見圖3。不難得出下面結論,若傳感器測量輸出結果距離溶解氧含量真值(即國標碘量法測定溶解氧濃度)越遠,其自信息量越大、概率越?。痪嚯x溶解氧含量真值越近,自信息量越小、概率越大。
由測量數據的最大離散熵概率分布,可得測量的不確定度為:
故可以推定,該組測量數據的有效置信區(qū)間為:
依據該有效置信區(qū)間,進行粗大誤差判別。經過判斷,該組測量數據8個樣本中,第3、5、7個樣本包括粗大誤差,必須被剔除出有效測量序列。在獲得自信息量的基礎上,根據算法公式(7)融合權系數的定義,計算剩余5個離散測量樣本融合權系數,進行測量數據融合運算。需要特別說明的是,當離散的傳感器測量數據列已經完成粗差剔除工作后,不同的數據組合,不影響后續(xù)的融合權確定和最終融合結果的運算。綜上所述,該組測量樣本的數據融合結果為8.36 mg·L-1,具體運算數據如表3所列。
表3 本組實驗條件下5個純凈測量結果融合權系數情況
針對該組測量數據,選取除本算法外的其他多種算法進行數據融合計算。統一將國標碘量法的測點結果8.37 mg·L-1作為真值,選取絕對誤差和均方誤差作為判定融合效果的精度指標,與文獻[6-8]中各種方法及傳統算術平均法融合結果對比如表4所列。
表4 5種算法數據融合結果對比
從表4可看出,以水體溶解氧濃度測量的國標碘量法測量結果(8.37 mg·L-1)為標準,基于信息熵的數據融合算法擁有最小的絕對誤差,并且均方誤差也顯著降低。因此,基于信息熵理論針對光學溶解氧傳感器標定數據融合提出的算法,能夠明顯提高傳感器整體的工作可靠性和測量數據穩(wěn)定性,有效提升標定實驗的效果。
針對光學溶解氧傳感器標定過程的各濃度梯度處標定測量樣本有效融合的問題,提出一種基于標定實驗離散測量數據信息熵的數據融合算法,解決了國產光學溶解氧傳感器標定過程中的單傳感器測量數據處理的難題。該算法從獨立傳感器測量數據最大離散熵入手,獲得樣本數據的概率分布,進而計算離散測量數據的不確定度,并據此進行粗差剔除。在此基礎上,對置信區(qū)間內的有效測量數據,通過自信息量與權系數的計算,進行合理數據融合。結合HJY1-1光學溶解氧傳感器標定應用實例,驗證了該算法能夠有效避免單傳感器測量使用情況下的各種不確定、非線性因素對測量結果的影響。對比其他4種算法,本文算法在多種精度指標上均表現出明顯優(yōu)勢,能夠有效提升測量數據的準確性和可靠性。與此同時,針對光學溶解氧傳感器標定實驗進行的相關研究,對于其他各類海洋傳感器的實驗室標定校準工作,均能提供一定的參考和借鑒。不足之處在于,本次實驗覆蓋的溫度區(qū)間有限,獲得的有效算例不夠豐富,在后續(xù)研究工作中,將進一步完善充實。