張春梅, 賈云霞, 李曉云, 王 晨
(1. 太原市環(huán)境監(jiān)測中心站, 山西 太原 030002; 2. 山西大學 物理電子工程學院, 山西 太原 030006)
改革開放以來, 我國經(jīng)濟發(fā)展和社會建設取得了巨大的成就, 但與此同時, 人們的環(huán)境保護意識淡薄、 人類的各種活動與自然環(huán)境的不和諧也導致了各類環(huán)境問題的出現(xiàn). 近年來, 特別是黨的十八大以來, 生態(tài)文明建設得到高度重視, 我國總體環(huán)境得到了一定程度的改善, 但具體環(huán)境狀態(tài)依舊不容樂觀. 2016年, 全國338個地級及以上城市中, 有84個城市環(huán)境空氣質(zhì)量達標, 占全部城市數(shù)的24.9%; 254個城市環(huán)境空氣質(zhì)量超標, 占75.1%; 平均優(yōu)良天數(shù)比例為78.8%, 比2015年上升2.1個百分點; 平均超標天數(shù)比例為21.2%. 超標項主要包括細顆粒(PM2.5)、 可吸入顆粒物(PM10)、 二氧化氮(NO2)、 二氧化硫(SO2)和一氧化碳(CO)等[1].
目前, 環(huán)境保護已經(jīng)成為我國可持續(xù)發(fā)展的重要環(huán)節(jié)和關(guān)鍵任務, 而全國范圍內(nèi)環(huán)境污染問題突出, 特別是工業(yè)園區(qū)在污染監(jiān)測、 控制、 管理等方面存在較多問題,工業(yè)園區(qū)聚集了大量的工業(yè)企業(yè), 在推動各地區(qū)工業(yè)發(fā)展、 經(jīng)濟技術(shù)及科學發(fā)展方面發(fā)揮著重要作用. 近年來工業(yè)園區(qū)(經(jīng)濟園區(qū))在各地繁榮興盛起來, 甚至有不少園區(qū)已經(jīng)取得了一定的經(jīng)濟效益, 成為推動地區(qū)經(jīng)濟增長的重要因素. 然而眾多工業(yè)園區(qū)在其實際發(fā)展中也排放出大量污染物, 成分復雜, 監(jiān)測的范圍廣, 導致園區(qū)環(huán)保監(jiān)測出現(xiàn)網(wǎng)絡建設缺乏系統(tǒng)規(guī)劃、 決策因子缺乏代表性、 監(jiān)管規(guī)范不完善等問題. 工業(yè)園區(qū)的空氣質(zhì)量不僅直接影響園區(qū)自身的環(huán)境水平, 而且影響著所在區(qū)域甚至整個城市的大氣環(huán)境. 如何對工業(yè)園區(qū)內(nèi)不同類型的企業(yè)進行廢氣排放方面的有效管理, 已經(jīng)成為園區(qū)環(huán)境管控乃至城市環(huán)境保護的重點工作.
通常情況下, 由于工業(yè)園區(qū)成分復雜, 加之地形、 時間等限制因素, 不能準確直接定位污染排放企業(yè)的位置. 目前, 主要以兩種思路研究廢氣污染溯源模型與方法: ① 基于數(shù)理統(tǒng)計、 概率論而形成. 此種思路基于大氣擴散的數(shù)值分布, 運用各種算法統(tǒng)計分析確定排放源的位置; ② 以優(yōu)化理論為契機, 在確定目標函數(shù)的基礎上, 計算出其最優(yōu)化解[2]. 殷鳳蘭等人主要從概率統(tǒng)計學的角度展開研究, 首先確定點源位置、 個數(shù), 并基于最佳攝動量正則化算法得出污染源強數(shù)值[3]; 文獻[4]中定義了氣體泄漏源、 反算污染源參數(shù), 首先通過模式搜索法進行定義, 然后以貝葉斯推理法進行計算. 此種算法通常以經(jīng)驗為依據(jù)假設模型參數(shù), 需觀測大量數(shù)據(jù)進行分析, 計算量大, 適用于氣體泄漏的溯源工作. 對于優(yōu)化理論方法在氣體溯源的研究方面, 駱蓓、 鄒吉然、 史陽、 張久鳳等學者[5-8]基于氣體濃度的實際觀測值及其理論計算值, 確定目標函數(shù)然后再利用各種人工智能算法求解目標函數(shù)的最優(yōu)解. 本文提出的基于案例推理的氣體污染溯源方法, 可以突破單一氣體追溯的限制, 以整個工業(yè)園區(qū)作為研究對象, 綜合園區(qū)環(huán)境和周邊, 綜合分析氣體污染源.
圖 1 案例推理模型Fig.1 Case-based reasoning model
案例推理即CBR(Case-based Reasoning)技術(shù)最早出現(xiàn)在Roger Schank對計算機和人的提醒和學習理論的動態(tài)記憶的描述中[9], 是智能領(lǐng)域中應用比較多的關(guān)于知識的問題求解方式和學習方法, 它對已有的經(jīng)驗和案例作為知識單位進行存儲, 核心思想是利用過去解決類似問題的經(jīng)驗來解決新的問題. R4 模型是CBR中應用最普遍的一種模型, 如圖 1 所示, 通常包含4大步驟: ① 案例表示; ② 案例檢索; ③ 案例修正; ④ 案例學習. 圖 1 較為詳實地介紹了CBR的整個過程.
案例表示即以結(jié)構(gòu)化的形式描述相關(guān)知識. 選擇何種案例方式, 則何種描述方式將對整個案例的效率、 性能形成較大的影響. 有很多方法都可用于案例表示, 一般認為只要適用于知識表示, 其通常也適用于案例表示.
現(xiàn)階段最為典型的案例表示方法主要有: 語義網(wǎng)、 框架表示、 本體描述等, 每種方法各具優(yōu)缺點, 適用的范圍也各不相同. 案例表示實際上就是對已知案例的一種描述, 同一案例可以有不同的表示方式, 而不同的表示方式對案例推理的性能影響也不盡相同, 案例表示合理可以使推理變得簡單高效, 不合理的表示會使推理辨識繁瑣和低效.
本體描述語言是案例表示的一種形式, 常用于對異構(gòu)知識的表示中. 本體表示具有邏輯性、 易于表示、 清晰度較高, 所以被普遍應用. 本文基于此建立廢氣污染溯源通用本體模型.
案例檢索是CBR非常重要的過程, 直接影響著案例推理的效率和結(jié)果, 也是CBR步驟中專家學者的研究重點, 目前已經(jīng)形成了豐富的案例檢索法, 其中決策樹法、 最近相鄰法得以最普遍的應用.
在廢氣污染溯源推理案例檢索過程中, 采用了計算相似度的檢索方案, 考慮到影響因子的特殊性, 即具有模糊性、 不確定性等特點, 所以在計算相似度時采用直覺模糊粗糙集方法.
盡管案例匹配時能找到與待解決問題匹配度很高的相似案例, 但是自然因素和社會環(huán)境瞬息萬變, 很難保證匹配案例和待解決問題完全一致, 所以必然會形成不同的解決方案. 基于此, 應結(jié)合其它方法進行修正. 本文引入專家意見法, 希望通過此法提高修正的可靠性, 將通過案例檢索已經(jīng)解決的案例交由專家系統(tǒng)進行調(diào)整, 對其不合理的部分進行修正以提高案例匹配的準確度.
案例學習是指新問題解決后的最終方案保存至案例庫, 以供后續(xù)問題參照, 使得推理系統(tǒng)案例和知識不斷得到補充和完善. 因此, 案例學習步驟體現(xiàn)了案例推理自學習、 自適應的特點. 本文采用最簡單的案例學習方法把已解決問題作為案例補充到案例庫.
追溯污染氣體排放源頭、 定位污染排放企業(yè)是管理廢氣污染時需要解決的重要問題, 很多學者以往的溯源研究一直局限于園區(qū)本身條件來進行溯源, 本文提出基于案例推理對廢氣污染進行溯源的推理方法. 溯源推理總體思路就是首先根據(jù)其他工業(yè)園區(qū)污染溯源案例庫, 與待解決的工業(yè)園區(qū)案例信息進行檢索匹配, 找出與之相匹配的最佳案例, 然后根據(jù)匹配案例比較分析得出廢氣溯源結(jié)果.
在設計廢氣污染溯源推理本體模型時主要以環(huán)境領(lǐng)域的有關(guān)概念為依據(jù), 結(jié)合領(lǐng)域?qū)<业慕?jīng)驗、 知識描述廢氣污染源[10], 同時所形成的廢氣污染溯源推理主體必須得到領(lǐng)域?qū)<业恼J可, 從而正確闡釋說明影響本體概念的要素. 本文定義廢氣污染溯源推理本體模型, 構(gòu)建了廢氣污染溯源推理的指標體系并給定指標間的關(guān)系, 如圖 2 所示.
廢氣污染溯源推理案例是基于廢氣污染溯源本體模型進行案例表示, 廢氣污染溯源推理案例包含了本體中關(guān)鍵影響因子, 并表明影響因子的相互作用. 案例搜集主要收集了國內(nèi)近幾年來各工業(yè)園區(qū)的有關(guān)案例, 并總結(jié)分析了其污染類型、 環(huán)境因素、 爆發(fā)情況等等, 最終得出表 1 的結(jié)果.
表 1 廢氣污染溯源案例庫部分案例信息
由于篇幅有限, 表 1 僅僅列舉了案例庫中的部分案例及部分案例信息, 案例庫實際收集整理了183個工業(yè)園區(qū)案例.
圖 2 廢氣污染溯源本體表示 Fig.2 The source of exhaust pollution traceability
2.2.1 復雜網(wǎng)絡關(guān)聯(lián)特性模型
圖 3 廢氣污染溯源總網(wǎng)絡表示Fig.3 Total network representation of exhaust pollution traceability
廢氣擴散過程中會涉及到氣體之間、 氣體與外界環(huán)境之間的相互作用, 周邊環(huán)境(包括自然和人文環(huán)境)的各種物質(zhì)都會通過一定的相互作用聯(lián)系在一起, 這種聯(lián)系或大或小, 相互作用的強度也存在一定差異性. 考慮到擴散內(nèi)部的實際情況, 即內(nèi)部關(guān)系復雜加之尚未能明確擴散機制, 所以為了更為準確地描述廢氣污染擴散, 本文引入復雜網(wǎng)絡關(guān)聯(lián)特性模型.
節(jié)點之間的連線段用來表示各個概念之間的相互關(guān)系, 節(jié)點集合形成點集V(V={v1,v2,…,vi,vn}), 其中Vi表示第i個節(jié)點, 網(wǎng)絡節(jié)點總數(shù)為n, 連線集合形成邊集合E(E={e1,e2,…,ej,…,em}), 表示第j條邊, 邊總數(shù)為m.
在廢氣污染溯源過程中, 結(jié)合影響因子的性質(zhì), 一般認為影響因子可細分為子網(wǎng)絡、 總網(wǎng)絡. 前者用于細分后者的屬性, 后者表示污染案例的綜合屬性. 具體如圖 3, 圖 4 所示.
圖 4 廢氣污染溯源子網(wǎng)絡表示Fig.4 Network representation of exhaust gas pollution traceability
根據(jù)廢氣污染溯源總網(wǎng)絡和子網(wǎng)絡影響因子集合表示如下.
總網(wǎng)絡集合形式:V={自然環(huán)境, 排放類型, 經(jīng)濟因素, 人文環(huán)境}.
自然環(huán)境:V1={光照強度, 地理位置, 濕度, 空氣溫度, 風速, 風向, 大氣穩(wěn)定度, 周邊環(huán)境, 地面覆蓋物}.
排放類型:V2={突發(fā)泄漏, 持續(xù)排放, 間斷排放}.
經(jīng)濟因素:V3={處理投資力度, 二次污染}.
人文環(huán)境:V4={人口流動性, 人口密集度, 廢氣處理方式}.
總網(wǎng)絡中Vi表示總網(wǎng)絡的第i個影響因子,Vik表示第i個子網(wǎng)絡的第k個影響因子.
2.2.2 網(wǎng)絡節(jié)點[11]權(quán)重優(yōu)化確定
(1)
Uk用于表示信息節(jié)點的難易程度, 利用式(2)即可計算
(2)
式中:Uk用于說明k個節(jié)點的網(wǎng)絡效率, 是衡量節(jié)點重要性的重要指標.Uk越大, 該節(jié)點與其他節(jié)點間的傳輸效率越高, 網(wǎng)絡效率越好, 該節(jié)點在網(wǎng)絡中的作用越大.
根據(jù)圖 2 和圖 3 給出的總網(wǎng)絡與子網(wǎng)絡間相互關(guān)系可求得該網(wǎng)絡特征參數(shù)為
λ=[3,2,2,3];λ+=[0,2,1,2];λ-=[3,0,1,1],
δ表示節(jié)點之間的直接連接度, 若兩個節(jié)點之間有連線則δ=1, 否則δ=0.
將以上參數(shù)代入式(2)中可得總網(wǎng)絡中各節(jié)點的重要性
網(wǎng)絡中節(jié)點對案例匹配結(jié)果影響的重要程度與節(jié)點間相互關(guān)系及網(wǎng)絡節(jié)點拓撲結(jié)構(gòu)相關(guān). 為了描述這種節(jié)點貢獻度, 引入節(jié)點貢獻度矩陣概念, 計算式如(3)所示.
(3)
式中:k表示網(wǎng)絡節(jié)點度的平均值, 從式(3)中可以看出:Hc表示所有節(jié)點之間的作用強度. 但是節(jié)點的網(wǎng)絡效率除了與其他節(jié)點間的作用用關(guān), 還與自身的網(wǎng)絡效率有關(guān), 因此節(jié)點貢獻度矩陣
(4)
結(jié)合節(jié)點貢獻度矩陣分析可知: 通過分析節(jié)點間拓撲關(guān)系及位置信息可說明節(jié)點的貢獻度. 節(jié)點貢獻度矩陣HEij表示第j個節(jié)點對第i個節(jié)點的貢獻值. 考慮節(jié)點自身的網(wǎng)絡效率和對其他節(jié)點的網(wǎng)絡效率, 定義節(jié)點總網(wǎng)絡貢獻度
(5)
對節(jié)點總網(wǎng)絡節(jié)點貢獻度矩陣歸一化得到網(wǎng)絡節(jié)點權(quán)重
(6)
由此得到總網(wǎng)絡的節(jié)點權(quán)重為ω=[ 0.364 9,0.135 1,0.135 1,0.364 9]. 各子網(wǎng)絡節(jié)點權(quán)重分別為
ω1=[0.032 1,0.042 5,0.238 5,0.123 1,0.221 4,0.008 4,0.019 2,0.132 1,0.182 7],
ω2=[0.314 9,0.457 1,0.238 0],
ω3=[0.268 7,0.573 4,0.167 9],
ω4=[0.418 9,0.357 1,0.234 0].
2.2.3 案例匹配
案例庫中的節(jié)點屬性一般可分為3種類型: ① 選項型; ② 數(shù)值型; ③ 布爾型. 對于持續(xù)排放、 突發(fā)泄露等布爾型和選項型數(shù)據(jù), 在匹配案例時, 需要對比屬性值, 假設經(jīng)對比完全相同, 則認為其節(jié)點的屬性匹配度為1, 不同或者案例節(jié)點缺失則節(jié)點屬性匹配度為0. 對于濕度、 風速等數(shù)值型節(jié)點屬性, 考慮復雜環(huán)境下的數(shù)值模糊度, 所以選用直覺模糊粗糙集匹配[12]方法.
令集合為R, ?x∈R中的上近似和下近似分別表示為x+和x-, 則模糊集S可表示為
S={〈S,μS-(x),μS+(x),λS-(x),λS+(x)〉|?x∈x},
(7)
式中:μS-∶S-→(0,1),μS+∶S+→(0,1)分別代表S的下近似隸屬度函數(shù)和上近似隸屬度函數(shù), 分別用來表示案例節(jié)點的負面影響和可能的負面影響.
λS-∶S-→(0,1),λS-∶S+→(0,1)分別代表S的下近似非隸屬度函數(shù)和上近似非隸屬度函數(shù), 分別用來表示案例節(jié)點的正面影響和可能的正面影響.
以濕度為例, 結(jié)合實踐經(jīng)驗定義濕度對廢氣溯源推理的正面影響和負面影響, 得到濕度正面隸屬度函數(shù)λ(SD)和濕度負面隸屬度函數(shù)μ(SD), 如式(8)和式(9)所示.
(8)
(9)
式中:λ(SD),μ(SD)均作為模糊粗糙集的下近似. 同理, 其他數(shù)值型均可用λ和μ表示.
對于非空論域X={x1,x2,…,xn}上的模糊粗糙集S1和S2, 相似度計算[13]如式(10)所示.
(10)
式中:πS1(x)=1-μS1(x)-λS1(x),πS2(x)=1-μS2(x)-λS2(x),πS1(x),πS2(x)分別刻畫了S1,S2自身存在的粗糙程度.
在案例匹配時, 需要綜合考慮案例總網(wǎng)絡以及子網(wǎng)絡的節(jié)點貢獻度和節(jié)點間貢獻度求解案例對比相似度, 案例綜合相似度
(11)
式中:Spq表示案例p和案例q的相似度;ωi表示總網(wǎng)絡中第i個節(jié)點的貢獻度;ωij表示第i個子網(wǎng)絡中第j個節(jié)點的貢獻度;Mij表示第i個子網(wǎng)絡中第j個節(jié)點的相似度, 求解實際問題和案例庫中每個案例的相似度進行比較, 確定匹配案例, 即案例中相似度最大的, 并對比0.5, 當案例最大相似度大于等于0.5 時匹配案例可用, 此時可將該案例交由專家審閱, 如果通過專家審閱即可用于實際項目. 相反的如果相較于 0.5 該案例的最大相似度較小, 則說明當前案例庫中并無可匹配于待解決的問題. 這不僅有助于形成有交性的決策結(jié)果同時可確保更新后案例庫的準確性.
針對廢氣污染溯源案例推理方法進行驗證, 以案例庫中衡水循環(huán)經(jīng)濟園區(qū)的案例信息為例, 獲取案例信息情況如表 2 所示.
表 2 衡水循環(huán)經(jīng)濟園區(qū)案例庫相關(guān)信息
首先使用本文所采用的案例匹配方法對布爾型與選項型屬性節(jié)點進行匹配, 匹配后得出與衡水循環(huán)經(jīng)濟園區(qū)相匹配的包括案例庫中的案例4柳州洛維工業(yè)園區(qū)、 案例7臨沂工業(yè)園區(qū)、 案例8菏澤魯宏工業(yè)園區(qū)等案例; 然后使用本文所采用的模糊粗糙集進行數(shù)值型屬性節(jié)點匹配, 在此基礎上可確定匹配篩選案例及衡水案例情況.
結(jié)合Ih=52%, 篩選各案例濕度I4=38 μg/m3,I7=57 μg/m3,I8=43 μg/m3, 結(jié)合模糊計算公式, 確定直覺模糊粗值.S={〈S,μS-(x),μS+(x),λS-(x),λS+(x)〉|?x∈X}}, 具體為
案例(衡水循環(huán)經(jīng)濟園區(qū))濕度與其它案例濕度相似度可用式(10)計算.
M(Ih,I4)=0.532 4,
(16)
M(Ih,I7)=0.943 4,
(17)
M(Ih,I8)=0.523 2.
(18)
按照上述所有方法計算確定所有數(shù)值型的相似度, 與布爾型及選項型的相似度一起代入式(9)可算出綜合貢獻度分別為
Sh4=0.362 7,
(19)
Sh7=0.563 9,
(20)
Sh8=0.482 1.
(21)
通過對比表明: 案例7的綜合貢獻度大于閥值(0.5), 且最大, 因而本文將該案例作為衡水循環(huán)經(jīng)濟園區(qū)廢氣污染溯源的最佳匹配案例, 溯源結(jié)果與案例7臨沂工業(yè)園區(qū)的結(jié)果一致, 污染均來源于園區(qū)西南角的化工企業(yè), 與案例庫的信息相一致, 從而證明了本文所提方法的準確性.
本文針對工業(yè)園區(qū)廢氣污染溯源的實際應用問題, 構(gòu)建了廢氣污染溯源推理本體模型進行案例表示, 并在案例搜索的過程中構(gòu)建了復雜網(wǎng)絡關(guān)聯(lián)特性模型, 定義了節(jié)點貢獻度的概念和網(wǎng)絡貢獻度公式, 同時引入直覺模糊粗糙集進行案例匹配, 基于案例推理方法實現(xiàn)了廢氣污染的溯源工作, 借助衡水循環(huán)經(jīng)濟園區(qū)真實案例進行案例推理方法實現(xiàn), 實驗結(jié)果表明了該方法的推理準確性.