張建龍 ,解建倉
(1. 山西省水利建設(shè)開發(fā)中心,山西 太原 030002;2. 西安理工大學(xué) 西北水資源與環(huán)境生態(tài)教育部重點實驗室,陜西 西安 710048))
隨著社會經(jīng)濟的高速發(fā)展,我國水資源逐漸呈現(xiàn)出短缺的趨勢。如果對煤礦開采過程中產(chǎn)生的礦井疏干水作為水資源加以處理利用,實現(xiàn)礦井水資源化,則有以下優(yōu)勢:1)開辟了新水源,減少了淡水資源開采量,增加了資源化后的經(jīng)濟效益[1-2];2)緩解了礦區(qū)及周邊區(qū)域水資源矛盾,減少了污水排放量,使水資源的利用更加經(jīng)濟合理;3)減輕了礦井水對地表水系的污染,堵住污染源,美化了礦區(qū)環(huán)境[3]。因此,礦井疏干水的資源化是解決煤礦缺水和礦井水污染環(huán)境的最佳選擇。但是礦井疏干水的利用是一項復(fù)雜的系統(tǒng)工程,具有涉及部門廣、問題多、風(fēng)險高、管理復(fù)雜等特點[4-5],因此,礦井疏干水開發(fā)利用需要建立完善的平臺管理體系,以實現(xiàn)對礦井疏干水的管理和決策,降低因高風(fēng)險引起的損失,以及實現(xiàn)礦井水事件的應(yīng)急管理。
以事例推理(CBR)理論為基本思想,利用檢索、重用、修正和保存的推理過程,進行礦井水資源開發(fā)利用的風(fēng)險管理。主要過程包括:1)根據(jù)新問題特征屬性,從事例庫中檢索出與新問題相似的事例或事例集;2)選擇最相似的事例,或通過事例組合,形成新的解決方案;3)修正建議的解決方案;4)將確認(rèn)的新事例存入事例庫,供后續(xù)使用。
礦井疏干水風(fēng)險管理決策支持系統(tǒng)的主要任務(wù)是突發(fā)事故的推理決策和經(jīng)驗案例庫的建立及維護,事件發(fā)生后通過尋求相似度范圍內(nèi)相似事件,立即對此做出決策;如果事件庫中還沒有相似事件,就將此事件加入事件庫,以充實事件庫的事例。
基于文本的案例推理 TCBR 是 CBR 機制的分支,是為了進行非結(jié)構(gòu)化的自然語言表示的文檔的提取而產(chǎn)生的,與傳統(tǒng) CBR 的不同之處是案例通過信息實體(IES)描述,而推理則通過構(gòu)建案例提取網(wǎng)(CRN)實現(xiàn)[6]。因此,本文采用 TCBR 推理機制進行風(fēng)險管理的研究。
礦井疏干水風(fēng)險管理決策支持系統(tǒng)采用 B/S 架構(gòu),所有用戶均可以通過內(nèi)部局域網(wǎng)或者互連網(wǎng)進行操作[7]。通常,系統(tǒng)是基于案例庫、知識庫、模型庫、數(shù)據(jù)庫的系統(tǒng),由于純文本案例的特殊性,礦井疏干水應(yīng)急管理決策支持系統(tǒng),并沒有引入知識庫及模型庫,取而代之的是信息實體庫和 2 個關(guān)系庫,但這 2 種結(jié)構(gòu)都存在難以對推理結(jié)果進行修正的問題。為此本研究以數(shù)據(jù)作為底層支持,以風(fēng)險管理、知識庫、案例庫及模型庫作為業(yè)務(wù)層,以此為基礎(chǔ)建立視圖層。
2.1.1 案例庫的建立
案例庫建設(shè)主要分為 2 個階段,第 1 階段為案例庫建設(shè)之初的管理,主要是礦井疏干水歷年風(fēng)險事故事件的錄入,當(dāng)初始案例庫建立起來后,進入第 2 階段案例庫的維護,如添加、刪除、學(xué)習(xí)的過程,具體操作過程分為以下幾個步驟:
1)經(jīng)驗案例資料的收集。對有關(guān)礦井疏干水管理資料進行整理,對事件過程進行描述,規(guī)范表達。
2)信息的分解。將所有入庫信息表達成關(guān)鍵字的形式,建立事件推理的邏輯過程,提供相似事件的相似率,參照專家決策實現(xiàn)信息全集庫的建立。
3)根據(jù)信息之間的區(qū)別程度提供信息的相似率,結(jié)合專家意見,對信息關(guān)鍵字進行比較。
4)信息實體與事件之間的關(guān)聯(lián)關(guān)系。系統(tǒng)中所有案例與信息實體之間的關(guān)聯(lián)關(guān)系由事故處置專家擬定,在系統(tǒng)運行過程中會有所調(diào)整,以使得系統(tǒng)對當(dāng)前問題進行更有針對性的推理。
5)信息實體之間的關(guān)聯(lián)關(guān)系維護。系統(tǒng)中所有信息實體之間的關(guān)聯(lián)關(guān)系由事故處置專家擬定,在系統(tǒng)運行過程中會有所調(diào)整,以使得系統(tǒng)對當(dāng)前問題進行更針對性的推理。
2.1.2 案例庫的實現(xiàn)環(huán)境
系統(tǒng)實現(xiàn)過程中采用 JAVA 語言環(huán)境,具有面向?qū)ο蟆?shù)據(jù)庫操作方便和開發(fā)周期短等特點。采用 MYSQLS.5 為后臺數(shù)據(jù)庫,操作系統(tǒng)為 Windows XP。按上述過程及方法建立案例庫,在 MYSQLS.5 中存儲案例及信息實體,案例和信息實體是分開存儲的,案例與信息實體的相關(guān)關(guān)系由關(guān)聯(lián)表存儲,案例的增加和刪減對其他案例與信息實體的關(guān)系是沒有影響的。如果用于表示當(dāng)前案例的信息實體不夠充分,可以修改信息實體表或增加信息實體,這種修改并不影響當(dāng)前案例庫中的設(shè)置。這體現(xiàn)了信息實體表示案例的靈活性,不像 CBR 中案例由固定結(jié)構(gòu)的特征向量表示,這種表示結(jié)構(gòu)隨時可以發(fā)生變化,而不影響其他案例和信息實體。
案例的檢索和匹配是系統(tǒng)的關(guān)鍵步驟,是從事例庫中找出與當(dāng)前求解問題最相似的事例(或事例集)。案例檢索與匹配的步驟如下:
1)案例的抽象及相似案例的鏈接。信息實體是在信息傳播中攜帶信息的媒介,是信息賴以附載的物質(zhì)基礎(chǔ)。如何判斷 2 個案例是否表達相近的含義,根據(jù) CRN 網(wǎng)的結(jié)構(gòu)特征,可以采用相似度函數(shù)判斷即
式中:對于案例描述 c,c1和 c2分別為 2 個案例;e1和 e2分別為信息實體的子集,若 E 為系統(tǒng)信息實體的全集,則 e1∈ E,可以看出,越不相近的 2 個案例的函數(shù)值會越大。
2)CRN 和 IES。IES 是 CNR 中知識描述的最小單元,通常情況下使用多個信息實體描述 1 個實例,各個實例由不同的信息實體描述。不同信息實體之間有相似性,信息實體可以看作是實例的關(guān)鍵字,且具有以下特征:不同的信息實體之間有相似關(guān)聯(lián)性;信息實體根據(jù)表達意義進行分類;不同信息實體與它表達內(nèi)容的關(guān)聯(lián)程度可以不同;信息實體是有層次的,不同的自然語言表達可以對應(yīng)相同的信息實體。例如:“礦井水”、“疏干水”、“煤礦水”可以同時對應(yīng) 1 個相同的信息實體 “礦井疏干水”,這是一個 2 層的樹形匹配結(jié)構(gòu)。
CRN 除要在數(shù)據(jù)庫中存儲案例和信息實體,還必須存在如下 2 個關(guān)系:相似性,表示不同信息實體之間的相似程度,用 σ (e1, e2) 表示;相關(guān)性,表示某一信息實體和案例描述之間的相關(guān)度,用 ρ (e, c) 表示。
CRN 的構(gòu)建過程主要包括以下 3 個步驟:
Step1。根據(jù)提出的問題,將其解析為不同信息實體的子集 e。此時,與案例庫中所有的信息實體 E 相比較,當(dāng)問題描述中出現(xiàn)該信息實體 e∈ E,則有 α0(e) = 1,否則 α0(e) = 0。通過這一步的解析,最終可以得到解析后信息實體的集合 Q0={e|α0(e) = 1, e∈ E}。
Step 2。對于實例庫中的任一信息實體 e∈ E,計算信息體間的相似性,即
式中:e1, e2, …, es∈Q0;ω 為加權(quán)函數(shù);ε0為閾值,表示所提取的信息實體與集合 Q0中所有信息實體的相似關(guān)系的最小值。
通過式(2)和集合 Q0可以激活另外一些信息實體,激活的過程可以無限擴展,這些信息實體與 Q0中的信息實體取并集構(gòu)成 Q1={e|α0(e) = 1, α0(e) ≥ ε0, e∈ E},且滿足 α1(e)>ε0, ε0≥ 0。激活的過程可以表示為
式中:e1, e2, … , es∈Qt-1,且 Qt-1={e|αt-1(e) ≥ εm};εm是閾值。
Step 3。計算與當(dāng)前問題相關(guān)聯(lián)的信息體與案例庫中每個案例的相關(guān)性,計算公式為:
式中:e1, e2, … , es∈Q0是與當(dāng)前問題相關(guān)聯(lián)的信息實體的集合 Qt中的信息實體。為減少計算量和節(jié)省計算時間,又不影響計算效果,在相關(guān)性計算時僅選擇與 Qt中的信息相關(guān)聯(lián)的案例集合 c 即可。
3)問題的推理和求解。利用相關(guān)度的計算 α2(c)進行相關(guān)案例解決方案的提取,結(jié)合構(gòu)建好的 CRN 網(wǎng)絡(luò)解決方案的提取。根據(jù)計算結(jié)果的大小,只需按照 α2(c) 的值從大到小排列案例,值越大表明當(dāng)前案例與問題相關(guān)程度越大,一般通過設(shè)置閾值來選擇關(guān)聯(lián)度大閾值的幾個案例作為最終問題解決的建議。
在事例推理中,除了相似性和相關(guān)性的計算,另外一個重要的環(huán)節(jié)就是經(jīng)驗的學(xué)習(xí),只有通過不斷的學(xué)習(xí)、修正,案例庫中的案例才能更加滿足各種查詢條件,使得對決策支持的準(zhǔn)確度不斷地提高。在經(jīng)驗學(xué)習(xí)過程中,最重要的是把案例材料轉(zhuǎn)化成為系統(tǒng)中案例的結(jié)構(gòu),并且能將信息實體與該案例的相關(guān)程度體現(xiàn)出來。當(dāng)新舊礦井水資源利用風(fēng)險事例的相似度小于預(yù)先設(shè)定的閾值 0.6 時,將新事例添加到事例庫中;當(dāng)新舊礦井水資源利用風(fēng)險事例相似度在 0.6~0.9 之間時,調(diào)整之后的事例可以被添加在事例庫中,如果優(yōu)于被檢索出的事例,則可以替換原有的事例;當(dāng)新舊礦井水資源利用風(fēng)險事例相似度大于 0.9 時,新事例可以被丟棄。
因此,經(jīng)驗學(xué)習(xí)的流程顯得更為重要,根據(jù)系統(tǒng)特性、信息實體及案例庫之間的關(guān)系,繪制的經(jīng)驗學(xué)習(xí)流程圖如圖 1 所示。
圖1 可以看出系統(tǒng)對新案例的學(xué)習(xí)過程為:
圖1 經(jīng)驗學(xué)習(xí)流程圖
1)當(dāng) 1 個礦井水資源利用風(fēng)險新案例進入系統(tǒng),系統(tǒng)要進行案例的相似性判斷,以判斷案例庫中是否已經(jīng)存在相似的案例文檔;
2)使用字符串匹配的方式對礦井水資源利用風(fēng)險新案例進行解析,將其轉(zhuǎn)化成為信息實體子集;
3)設(shè)置解析的信息實體與礦井水資源利用風(fēng)險新案例的相關(guān)度,對于滿足設(shè)置相關(guān)度要求的信息實體直接存入相關(guān)關(guān)系庫,而出現(xiàn)的新信息實體則存入信息實體庫,最終存入相關(guān)關(guān)系庫。
以案例庫的實現(xiàn)環(huán)境為基礎(chǔ),結(jié)合案例的建立和存貯、檢索與匹配,以及經(jīng)驗學(xué)習(xí)的實現(xiàn),進行平臺風(fēng)險推理功能模塊的設(shè)計,主要包括:用戶輸入事故現(xiàn)象描述,中文分詞,匹配信息實體與關(guān)鍵字集合,迭代擴充信息實體集合,給出推薦的解決方案,案例學(xué)習(xí),推理流程如圖 2 所示。
礦井疏干水資源開發(fā)利用風(fēng)險管理系統(tǒng)的研究是基于礦井企業(yè)風(fēng)險決策需求,實現(xiàn)對礦井疏干水的管理和決策,降低因高風(fēng)險引起的損失。此系統(tǒng)實現(xiàn)礦井水事件的應(yīng)急管理,完成對風(fēng)險事件的拆分、學(xué)習(xí)、應(yīng)急預(yù)案、專家決策功能,最終提出應(yīng)急方案。主要功能包括: 案例查詢、應(yīng)急機制、事件描述、學(xué)習(xí)機制、風(fēng)險推理及事件管理。
圖2 風(fēng)險推理流程
本研究將人工智能領(lǐng)域中的 TCBR 技術(shù)應(yīng)用于礦井水資源開發(fā)利用風(fēng)險管理中,以事例推理理論為指導(dǎo)思想,針對基于 TCBR 的風(fēng)險管理中需要解決的關(guān)鍵問題進行分析和研究,并提出相應(yīng)的解決思路和方法。TCBR 風(fēng)險管理能夠充分利用案例資源,從成功風(fēng)險管理事例中借鑒經(jīng)驗,使風(fēng)險處理更加快速、準(zhǔn)確和智能化;該方法不僅能夠處理定量因素,而且可以將專家和專業(yè)人員的經(jīng)驗知識融入到風(fēng)險管理中,使得管理結(jié)果更合理、可行,并且可以實現(xiàn)知識的重用;同時,TCBR 風(fēng)險管理模式,符合人們的認(rèn)知和思維過程,推理過程具有生動形象的特點,推理結(jié)果易于理解和接受。
基于 TCBR 的風(fēng)險管理模式是提高礦井水資源利用效率的有益探索,為礦井水資源的開發(fā)利用提供風(fēng)險管理對策及保障手段。風(fēng)險管理研究是十分復(fù)雜的系統(tǒng)問題,在后續(xù)的研究和應(yīng)用中,應(yīng)進一步提高對礦井水開發(fā)利用中各環(huán)節(jié)的風(fēng)險狀態(tài)進行準(zhǔn)確描述的研究,以更好地解決案例特征抽取的關(guān)鍵問題。
[1] 李福勤,李碩,何緒文,等. 煤礦礦井水處理工程存在的問題及對策[J]. 中國給水排水,2012, 28 (2): 18-20.
[2] 常雨. 煤礦礦井水回用處理工程設(shè)計[D]. 太原:山西大學(xué),2011: 38-42.
[3] 邵立南. 礦井水井下處理與復(fù)用技術(shù)研究[D]. 北京:中國礦業(yè)大學(xué),2009: 15-19.
[4] 傅成誠,梅凡民,馬建宏,等. 我國煤礦礦井水資源化現(xiàn)狀[J]. 現(xiàn)代礦業(yè),2009 (3): 15-17.
[5] 陳洪彪. 礦井疏干水開發(fā)利用可行性研究[J]. 煤炭技術(shù),2005, 24 (6): 100-101.
[6] 李贇. 基于事例推理的城市公共設(shè)施應(yīng)急管理決策支持系統(tǒng)的研究[D]. 北京:北京交通大學(xué),2009: 8-13.
[7] 羅軍剛,解建倉,陳田慶. 基于事例推理技術(shù)的水庫洪水調(diào)度研究與應(yīng)用[J]. 水科學(xué)進展,2009, 20 (1): 32-39.