孫 策,李傳奇,白 冰,楊 圭,王 茜
(1.山東大學(xué)土建與水利學(xué)院,濟(jì)南 250061;2. 山東省水利綜合事業(yè)服務(wù)中心,濟(jì)南 250013)
隨著我國工業(yè)化進(jìn)程與城市化進(jìn)程的不斷加快,公眾對于生態(tài)環(huán)境安全的需求不斷提升,但與此同時各類?;闷返牟粩嗍褂脤?dǎo)致突發(fā)水污染事件頻發(fā)。自2012-2017年我國突發(fā)環(huán)境事件2 657 起,其中突發(fā)性水污染事件占95%以上[1]。事件成因主要包括污染物違規(guī)排放、生產(chǎn)事故泄露、自然災(zāi)害等[2]。目前,我國突發(fā)水污染事故的研究主要集中在水環(huán)境質(zhì)量監(jiān)測、污染事件預(yù)警與快速模擬、風(fēng)險評估、處置技術(shù)、應(yīng)急決策支持等方面[ 3],對突發(fā)水污染事件精準(zhǔn)溯源的研究相對較少[4, 5]。河流突發(fā)性水污染事故溯源,也稱為污染源識別定位問題,或源參數(shù)識別。其基于監(jiān)測的濃度數(shù)據(jù),追蹤定位進(jìn)入河道的污染物質(zhì)的來源,尋找出污染源泄露節(jié)點、泄露時間、泄露強(qiáng)度等污染源的關(guān)鍵信息。
實際情況中想要實現(xiàn)污染物精準(zhǔn)溯源是十分困難的,傳統(tǒng)的識別模型需要大量的先驗信息,以污染物的泄露歷史,污染物衍生的化學(xué)產(chǎn)品以及精準(zhǔn)的事故環(huán)境監(jiān)測數(shù)據(jù)作為支撐[6]。然而在水環(huán)境監(jiān)測中,想要實現(xiàn)對各類污染物空間位置全覆蓋式的實時監(jiān)控,是極不現(xiàn)實的。因此用具有代表性的幾個監(jiān)測斷面的監(jiān)測數(shù)據(jù)來反映整個監(jiān)測區(qū)域水環(huán)境的水質(zhì)情況是最常見的監(jiān)測方法。如何利用有限的監(jiān)測數(shù)據(jù),反演出污染源位置等關(guān)鍵信息,這就需要一套行之有效的追溯污染源的方法?,F(xiàn)有的識別方法主要有直接法、優(yōu)化法和概率統(tǒng)計法[7]。直接法通過及時反演控制方程,重建觀測污染物的歷史分布,解決了溯源問題。李云良等[8]用粒子示蹤耦合模型,并結(jié)合野外粒子示蹤實驗來調(diào)查鄱陽湖洪水期污染物遷移路徑;優(yōu)化方法則通過最小化污染物濃度觀測值與預(yù)測值的差值,從而得到污染源參數(shù)的識別值。湯雪萍等[9]利用移動水質(zhì)監(jiān)測平臺,結(jié)合行為規(guī)劃法和濃度梯度法進(jìn)行污染源定位識別;概率統(tǒng)計法通過對事件的發(fā)生概率進(jìn)行估計,不斷改進(jìn)基于似然函數(shù)的識別值來識別污染源的參數(shù),主要方法有貝葉斯推理、最小相對熵等。朱嵩等[10]建立了基于貝葉斯推理的反演數(shù)學(xué)模型,進(jìn)而求解水動力-水質(zhì)耦合數(shù)學(xué)模型的點源強(qiáng)度與位置的聯(lián)合識別。
本文基于貝葉斯-蒙特卡洛方法,采用適用性更強(qiáng)的M-H采樣方法和GIBBS采樣方法來處理二維污染物排放的溯源問題。并對M-H采樣方法做了一定的改進(jìn):在每一次根據(jù)建議分布生成樣本值時,增加一個判斷樣本值是否滿足于后驗概率密度函數(shù)的條件,以使根據(jù)建議分布生成的樣本值更快更準(zhǔn)確地趨近于真實值。最后運(yùn)用算例對比分析了兩種采樣方法各自的優(yōu)點,并分析了兩種采樣方法在計算精度和計算維度上的差異性。
依據(jù)質(zhì)量守恒原理和連續(xù)性法則,河道中任一點污染物擴(kuò)散及對流基本方程式為[11]:
(1)
式中:C(x,y,z,t)為t時刻控制體積單元內(nèi)污染物的濃度,mg/L;xyz為坐標(biāo)位置,m;t為污染物排放時長,s;k為污染物降解系數(shù),s-1;ux、uy、uz分別為污染物沿xyz方向的平均流速,m/s;Dx,Dy,Dz分別為污染物在x,y,z方向的彌散系數(shù),m/s;S為源匯項。
由于三維模型求解復(fù)雜,且污染物在垂向擴(kuò)散速度遠(yuǎn)小于橫向擴(kuò)散,因此可將三維模型轉(zhuǎn)化為二維模型[12]。
(2)
由于實際河流受到河岸影響,污染物在水體中的擴(kuò)散受到邊界限制并產(chǎn)生反射,將其作為影響因素,此時污染物濃度的解析解為:
C=C1+C2+C3
(3)
式中:C1,C2,C3分別為污染源、近岸邊反射、遠(yuǎn)岸邊反射在點(x,y)處產(chǎn)生的質(zhì)量濃度增量,其各自的計算表達(dá)式為:
(4)
(5)
(6)
考慮到河流寬度一般較大,所以假設(shè)岸邊的反射次數(shù)為1次[13],即n=1,b=0,此時得到污染源下游河段斷面上污染物濃度隨時空變化的規(guī)律為:
(7)
式中:m為污染物排放總量,g;B為河道寬度,m;其余符號意義同前。
在一定的溫度范圍內(nèi),k1與溫度關(guān)系的表達(dá)式為:
k1=k20θ(T-20)
(8)
式中:k1,k20為溫度分別為T℃和20 ℃時的耗氧速率系數(shù),d-1;θ為溫度校正因子,為無量綱經(jīng)驗系數(shù)。一般情況下,當(dāng)溫度為10~37 ℃時,校正因子取1.047。
河流中的垂向擴(kuò)散與明渠流中的擴(kuò)散相似,可采用對數(shù)流速分布形式,得到河流垂向擴(kuò)散系數(shù):
Dz=0.067hu
(9)
(10)
式中:h為河流平均水深,m;u為河流摩阻流速,m/s;i為水力坡度;g為重力加速度,m/s2。
對于順直的河流,F(xiàn)USCGER[14]收集了多個實驗資料,統(tǒng)計得到橫向擴(kuò)散系數(shù)平均值的估算式為:
Dy=0.23hu*
(11)
若流速分布資料缺乏,可采用經(jīng)驗公式粗略估算縱向擴(kuò)散系數(shù)。FISCHER[15]提出經(jīng)驗公式:
Dx=0.11u2B2/hu*
(12)
在貝葉斯統(tǒng)計的情況下,所有未知參數(shù)都被視為隨機(jī)變量,它們的分布是從已知信息中得出的[15,16]。因此,貝葉斯統(tǒng)計為不確定性分析提供了嚴(yán)格的方法,可為管理決策提供關(guān)鍵信息[17]。貝葉斯推理基于以下公式[18]:
(13)
式中:p(X|Y)為X的后驗概率分布函數(shù),表示獲得觀測值Y后參數(shù)X的分布規(guī)律;p(X)為先驗概率分布函數(shù),表示由資料及經(jīng)驗獲得的參數(shù)X的分布規(guī)律;p(Y|X)為似然函數(shù),表示模型參數(shù)與觀測值的擬合程度。
但是未知參數(shù)的后驗分布一般為復(fù)雜的高維非常見分布,要實現(xiàn)對這些分布的直接計算十分困難,這就使得貝葉斯推斷方法應(yīng)用于實踐中時受到很大的限制。然而,近幾十年來,蒙特卡羅方法,特別是馬爾可夫鏈蒙特卡羅(MCMC)算法,已被應(yīng)用于獲得參數(shù)的數(shù)值總結(jié)[19]。
在統(tǒng)計學(xué)中,馬爾可夫鏈蒙特卡羅(MCMC)方法是一類基于構(gòu)造一個馬爾可夫鏈的概率分布抽樣算法,該馬爾可夫鏈具有理想的平穩(wěn)分布[20, 21]。其基本思想是對比較復(fù)雜或無明確數(shù)學(xué)表達(dá)式的概率分布p進(jìn)行抽樣,得到一個大量服從p的隨機(jī)向量序列,并通過建立合適的抽樣算法使該序列滿足馬爾科夫鏈的性質(zhì),即新狀態(tài)的參數(shù)只依賴于目前的參數(shù)狀態(tài),而與之前的參數(shù)狀態(tài)無關(guān)[22]。
基于此,溯源問題可以轉(zhuǎn)化為對后驗概率密度函數(shù)的抽樣問題。在貝葉斯方法的基礎(chǔ)上構(gòu)建出待反演參數(shù)的后驗概率密度函數(shù),依賴于MCMC方法對其進(jìn)行抽樣。本文采用適用性較強(qiáng)的M-H采樣方法和Gibbs采樣方法進(jìn)行采樣,兩種方法的基本思路及步驟如下[23]。
M-H采樣方法步驟:
(3)生成新的參數(shù)狀態(tài)下模型的模擬結(jié)果,計算模擬值與觀測值之間的納什系數(shù)(NSE);
(4)產(chǎn)生一個0~1間均勻分布的隨機(jī)數(shù)u,若α>u且NSE滿足提前設(shè)定的精度范圍,則xi+1=x*,否則xi+1=xi,且i值加1;
(5)重復(fù)步驟(2)~(3),得到一系列參數(shù)的抽樣值,進(jìn)而可進(jìn)行參數(shù)后驗規(guī)律的統(tǒng)計。
GIBBS采樣方法步驟:
(4)按順序依次從相應(yīng)條件概率分布中得到每一個參數(shù)新的抽樣值;
(6)重復(fù)步驟(2)~(5),得到一系列參數(shù)的抽樣值,進(jìn)而可進(jìn)行參數(shù)后驗規(guī)律的統(tǒng)計。
可以看出,M-H采樣方法和GIBBS采樣方法在生成新的參數(shù)狀態(tài)時有著很大的不同。M-H采樣方法每次給所有參數(shù)一個新的狀態(tài),且生成新的參數(shù)狀態(tài)時借助于建議分布,故為了判斷建議分布選取的合理性,每一次采樣都要通過計算接受概率判斷是否接受該狀態(tài)。而Gibbs采樣方法則借助于已知的條件概率分布逐次生成每一個參數(shù)新的狀態(tài),通過坐標(biāo)軸的輪換采樣來確保每一次采樣的合理性。
為方便計算,此次研究中以點源岸邊污染物瞬時排放為例對M-H采樣方法和GIBBS采樣方法進(jìn)行計算,以對比分析兩種方法各自的優(yōu)越性及其之間的差異性。此次研究選取長約8 500 m,寬約1 200 m的河段作為研究對象,縱向和橫向的水流平均速度可以利用渦輪流速儀測得,ux=21.6 m/min,uy=0.3 m/min,橫向擴(kuò)散系數(shù) 和縱向擴(kuò)散系數(shù) 由所測數(shù)據(jù)代入式(7)、式(8)計算得到。同時河段的水體深度h取1.0 m,通過查閱資料得到模擬污染物的羅丹明B在類似環(huán)境的河流里的降解系數(shù)k=0.1 d-1。河段的水文水質(zhì)參數(shù)如表1和表2所示[24]。設(shè)定在河流某斷面發(fā)現(xiàn)污染情況的時間為初始監(jiān)測時間,隨后每隔25 min監(jiān)測1次,共得到12個該斷面的監(jiān)測數(shù)據(jù)。
表1 河流已知水文參數(shù)表Tab.1 River known hydrological parameter table
表2 河流待反演水文參數(shù)表Tab.2 River to be inverted hydrological parameter table
將表1及表2的數(shù)據(jù)代入公式(3),可以得到研究中監(jiān)測斷面的污染物濃度觀測序列,如圖1所示??梢钥闯鲇^測斷面污染物的濃度近似于正態(tài)分布,最高值約在開始觀測后的第110 min。需要進(jìn)行反演計算的未知參數(shù)有污染物排放位置x(以觀測斷面為坐標(biāo)原點,污染物排放量m,污染物排放時間t(為距離首次得到污染物濃度數(shù)據(jù)的時間)。本研究采用上下限區(qū)間的均勻分布作為待反演參數(shù)的先驗分布。其對應(yīng)的先驗分布概率密度函數(shù)分別為:
(14)
(15)
(16)
為了更符合現(xiàn)實情況并證明選用算法的適用性,可以在污染物觀測數(shù)據(jù)上疊加一個觀測誤差,這里設(shè)定觀測誤差εi=Ti(m,x,t|X)-Yi服從正態(tài)分布N(0,0.52),設(shè)θ=(m,x,t)為待反演參數(shù),因此考慮了誤差概率分布的似然函數(shù)可定義為:
(17)
此時污染源參數(shù)的后驗概率密度函數(shù)可表示為:
(18)
式中:P(θ)為待反演參數(shù)的先驗分布;σ為觀測誤差所服從正態(tài)分布的標(biāo)準(zhǔn)差;N為觀測點得到的濃度值個數(shù);Yi為觀測點測得的濃度值大??;ci為根據(jù)污染物擴(kuò)散模型模擬出的觀測點污染物濃度理論值大小。
圖1 觀測斷面污染物濃度序列值Fig.1 Observed section pollutant concentration sequence value
分別采用M-H采樣方法和GIBBS采樣方法對待反演參數(shù)的后驗概率密度函數(shù)進(jìn)行抽樣計算,為得到較穩(wěn)定的抽樣結(jié)果,對兩種方法均迭代計算了2 萬次,抽樣的結(jié)果如圖2及圖3所示。
由抽樣結(jié)果可以得到,M-H采樣方法的抽樣結(jié)果分布很緊湊,污染物排放位置確定為距離觀測斷面4 500 m,污染物排放時間距離第一次在觀測斷面得到污染物濃度100 min,污染物排放量在1 t附近。而GIBBS采樣的抽樣結(jié)果分布接近于正態(tài)分布,污染物排放位置在4 400~4 600 m,污染物排放時間為距離第一次在觀測斷面得到污染物濃度的95~105 min,污染物排放量0.99~1.01 t,但每一個未知參數(shù)分布的峰值與M-H采樣得到的結(jié)果是較一致的。
圖2 M-H抽樣結(jié)果Fig.2 M-H sampling result
圖3 GIBBS抽樣結(jié)果Fig.3 GIBBS sampling results
為進(jìn)一步分析對比兩種抽樣方法的溯源效果,對兩種方法分別進(jìn)行了以下操作:繪制抽樣過程中的迭代曲線(見圖4、5);剔除掉迭代前期不穩(wěn)定的結(jié)果,此次研究中根據(jù)實驗結(jié)果情況剔除掉了前200次迭代的結(jié)果,對迭代后期較穩(wěn)定的數(shù)據(jù)進(jìn)行統(tǒng)計分析(見表3)。
表3 M-H與GIBBS方法誤差統(tǒng)計表Tab.3 M-H and GIBBS method error statistics
圖4 M-H法迭代曲線Fig.4 M-H method iteration curve
圖5 Gibbs法迭代曲線Fig.5 Gibbs method iteration curve
通過分析M-H抽樣方法與GIBBS抽樣方法的抽樣結(jié)果,迭代曲線以及誤差統(tǒng)計表可以得到兩種方法各自的優(yōu)點及其之間的差異性:
(1)M-H抽樣方法的計算精度更高。從抽樣結(jié)果圖可以看出,3個待反演的參數(shù)都極為接近真實值。但需要的計算時間也更長,這是因為每一次通過建議分布計算的值還要進(jìn)行接受概率的計算。不難看出,由于接受概率的存在,在數(shù)據(jù)維度更高的情況下,需要的計算時間會更長。
(2)GIBBS抽樣方法的計算精度略低于M-H抽樣方法,其抽樣得到的待反演參數(shù)的分布區(qū)間相對較寬。但GIBBS抽樣需要的計算時間較短,這是因為GIBBS抽樣中沒有判斷接受概率的環(huán)節(jié),故其在高維數(shù)據(jù)的計算中具有一定的優(yōu)勢。
(3)對迭代情況而言,兩種算法的收斂程度均較好,能夠較快的在迭代計算中趨近于真實值。
(4)對計算誤差而言,兩種方法對于3個待反演參數(shù)的計算誤差都遠(yuǎn)小于5%,計算精度很高。M-H算法中對于污染物排放位置和排放量的計算結(jié)果是相對準(zhǔn)確的。
(1)基于MCMC方法的M-H抽樣方法和GIBBS抽樣方法能夠準(zhǔn)確地對突發(fā)點源岸邊污染物瞬時排放事件進(jìn)行溯源,其計算結(jié)果接近于真實值,能夠有效地解決點源岸邊污染物瞬時排放的溯源問題。
(2)本研究中的創(chuàng)新點為對M-H采樣方法做了改進(jìn):根據(jù)建議分布采樣時先判斷所取樣本值是否使后驗概率密度函數(shù)有意義,如果無意義則重新根據(jù)建議分布采樣,再判斷接受概率是否滿足條件。這樣可以有效加快迭代時的收斂速度,使待反演參數(shù)的抽樣值更快地趨近于目標(biāo)值。從計算結(jié)果可以看出這樣的改進(jìn)是比較有效的。改進(jìn)的M-H抽樣方法在計算精度上要高于GIBBS抽樣方法,但由于添加了抽樣的判斷條件其計算時間也較長。而GIBBS抽樣方法在高維數(shù)據(jù)的處理上具有一定的優(yōu)勢。
(3)通過案例應(yīng)用, 一方面論證了采用概率方法,即通過對后驗概率密度函數(shù)抽樣從而進(jìn)行突發(fā)水污染溯源的可行性;另一方面也說明本研究采用的改進(jìn)的M-H抽樣方法與傳統(tǒng)的GIBBS抽樣方法相比在提高計算精度,精確溯源污染源信息方面的優(yōu)勢所在。
□