摘要:為了將水工程調(diào)度與新一代信息技術(shù)進(jìn)行深度融合,立足流域水工程調(diào)度業(yè)務(wù)需求,按照知識(shí)建模、知識(shí)抽取、知識(shí)存儲(chǔ)以及知識(shí)應(yīng)用的總體思路,提出了合理可行的水工程聯(lián)合調(diào)度知識(shí)圖譜構(gòu)建與應(yīng)用總體技術(shù)方案,以及場(chǎng)景驅(qū)動(dòng)的水工程聯(lián)合調(diào)度本體構(gòu)建方法。具體闡述了結(jié)構(gòu)化、非結(jié)構(gòu)化信息挖掘與知識(shí)抽取技術(shù)以及基于Neo4j圖數(shù)據(jù)庫的知識(shí)索引與可視化,并從防洪調(diào)度、水資源調(diào)配兩個(gè)方面探索知識(shí)圖譜的應(yīng)用實(shí)例與發(fā)展方向。研究初步實(shí)現(xiàn)了調(diào)度知識(shí)圖譜構(gòu)建全流程貫通,可為知識(shí)圖譜在水工程聯(lián)合調(diào)度領(lǐng)域的進(jìn)一步發(fā)展與應(yīng)用提供借鑒。
關(guān) 鍵 詞:水工程聯(lián)合調(diào)度; 知識(shí)圖譜; 本體構(gòu)建; 防洪調(diào)度; 水資源調(diào)配
中圖法分類號(hào): TP399
文獻(xiàn)標(biāo)志碼: A
DOI:10.16232/j.cnki.1001-4179.2024.09.001
0 引 言
在過去二十余年,隨著許多新建水工程的建成投運(yùn),流域水工程聯(lián)合調(diào)度面臨群組規(guī)模巨大、拓?fù)浣Y(jié)構(gòu)復(fù)雜、干支流來水情勢(shì)隨機(jī)、演進(jìn)復(fù)雜、保護(hù)對(duì)象眾多、防洪興利多目標(biāo)矛盾突出等難題,水工程群調(diào)度系統(tǒng)優(yōu)化運(yùn)行已發(fā)展為多區(qū)域、多標(biāo)準(zhǔn)、多目標(biāo)、多約束和多場(chǎng)景的全景優(yōu)化問題[1-2]。為有效實(shí)現(xiàn)水庫、堤防、蓄滯洪區(qū)等多類水工程聯(lián)合調(diào)度,水工程調(diào)度領(lǐng)域與新一代信息技術(shù)進(jìn)行了深度融合,機(jī)器學(xué)習(xí)、優(yōu)化理論、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘、模式識(shí)別等人工智能技術(shù)與方法已被廣泛應(yīng)用至水工程調(diào)度建模、優(yōu)化、解算過程中[3-6],顯著提升了大規(guī)模水工程群組調(diào)度演算的時(shí)效性與計(jì)算精度。智能方法的應(yīng)用使中國(guó)水工程調(diào)度正由“經(jīng)驗(yàn)調(diào)度”向“智能調(diào)度”轉(zhuǎn)變。在此背景下,中國(guó)各大流域也逐步建成了如國(guó)家防汛抗旱指揮系統(tǒng)、長(zhǎng)江流域控制性水利工程綜合調(diào)度系統(tǒng)、黃河水量調(diào)度管理系統(tǒng)等在內(nèi)的水利專業(yè)系統(tǒng)平臺(tái)。
但現(xiàn)有調(diào)度系統(tǒng)仍存在數(shù)字化基礎(chǔ)支撐欠缺、智能應(yīng)用不足等問題,尚無法對(duì)多類別工程的聯(lián)合調(diào)度規(guī)則進(jìn)行有機(jī)集成,難以動(dòng)態(tài)協(xié)調(diào)防洪工程體系的攔、分、蓄、排能力[7]。亟需采取行之有效的水利要素提取與整理手段,對(duì)海量水工程調(diào)度領(lǐng)域基礎(chǔ)數(shù)據(jù)信息進(jìn)行清洗與梳理,厘清工程調(diào)度規(guī)程方案,挖掘工程調(diào)控影響下控制斷面水位、流量等水利要素的變化規(guī)律,并結(jié)合歷史調(diào)度案例、調(diào)度方案預(yù)案文本等,通過知識(shí)圖譜技術(shù)體系將經(jīng)驗(yàn)知識(shí)與規(guī)律總結(jié)并進(jìn)行結(jié)構(gòu)化存儲(chǔ)進(jìn)而構(gòu)建水工程調(diào)度知識(shí)圖譜,以增強(qiáng)對(duì)知識(shí)信息的處理和反饋能力,達(dá)到輔助提升防洪調(diào)度智能決策水平的目的。
在水利信息化、智慧化大的背景下,構(gòu)建水工程調(diào)度知識(shí)圖譜是實(shí)現(xiàn)防洪調(diào)度智能化水平提升的核心關(guān)鍵技術(shù)之一[8],也是本文的主要研究目標(biāo)。知識(shí)圖譜是2012年5月由谷歌公司首次發(fā)布,其利用圖譜中的概念上下位關(guān)系、屬性類型及約束、圖模型中實(shí)體間的關(guān)聯(lián)關(guān)系,根據(jù)業(yè)務(wù)場(chǎng)景定義的關(guān)系推理規(guī)則,實(shí)現(xiàn)不一致性檢測(cè)、推斷補(bǔ)全、知識(shí)發(fā)現(xiàn)、知識(shí)溯源、輔助推理決策等各類知識(shí)推理應(yīng)用[9-12]。知識(shí)圖譜按應(yīng)用范圍可劃分為通用知識(shí)圖譜和領(lǐng)域(行業(yè))知識(shí)圖譜,其中水利知識(shí)圖譜屬于領(lǐng)域知識(shí)圖譜范疇。知識(shí)圖譜構(gòu)建包括知識(shí)建模、知識(shí)抽取、知識(shí)存儲(chǔ)、知識(shí)融合、知識(shí)計(jì)算等關(guān)鍵技術(shù),以及知識(shí)推理和知識(shí)更新等維護(hù)技術(shù)[13-14]。
縱觀國(guó)內(nèi)外水利知識(shí)圖譜構(gòu)建與應(yīng)用研究現(xiàn)狀,該技術(shù)在水利行業(yè)應(yīng)用研究總體較少。在涉及調(diào)度知識(shí)圖譜構(gòu)建方面:李安強(qiáng)[15]圍繞流域水工程防洪調(diào)度業(yè)務(wù),按照“單元-網(wǎng)絡(luò)-圖譜”的總體思路,構(gòu)建了水工程防洪調(diào)度本體,建設(shè)了防洪調(diào)度規(guī)則庫與知識(shí)圖譜。馮鈞等[16]基于大語言模型,圍繞水工程調(diào)度業(yè)務(wù)詳細(xì)闡述了數(shù)據(jù)清洗、本體構(gòu)建、知識(shí)抽取及存儲(chǔ)等水利領(lǐng)域知識(shí)圖譜構(gòu)建方式,探索了大語言模型在構(gòu)建知識(shí)圖譜過程中的創(chuàng)新應(yīng)用。顧麗等[17]提出了一種基于DataG的水庫調(diào)度規(guī)程知識(shí)圖譜構(gòu)建方法,初步實(shí)現(xiàn)了水庫調(diào)度方式的智能檢索與推理。在調(diào)度知識(shí)圖譜應(yīng)用方面:黃艷[18]、劉昌軍[19]等分別針對(duì)流域防洪“四預(yù)”項(xiàng)目建設(shè)需求,從知識(shí)平臺(tái)框架、知識(shí)庫、知識(shí)引擎、知識(shí)平臺(tái)軟件等方面探索了以知識(shí)圖譜技術(shù)在數(shù)字孿生流域平臺(tái)建設(shè)中發(fā)揮的應(yīng)用實(shí)效。陳勝等[20]基于知識(shí)圖譜實(shí)現(xiàn)了不同工況下工程預(yù)報(bào)-調(diào)度方案的自動(dòng)生成,克服了傳統(tǒng)基于人工方法構(gòu)建水工程聯(lián)合調(diào)度計(jì)算方案導(dǎo)致工作效率低且容易產(chǎn)生人為錯(cuò)誤的缺點(diǎn)。總體來看,知識(shí)圖譜在水利行業(yè),尤其是水工程調(diào)度領(lǐng)域的應(yīng)用尚處于起步階段,由于缺乏對(duì)數(shù)據(jù)關(guān)系梳理和業(yè)務(wù)邏輯的深度認(rèn)知,與電商、城市交通、電力等行業(yè)相比,還存在較大差距[21]。尤其是在多工程聯(lián)合調(diào)度本體構(gòu)建、調(diào)度規(guī)則與調(diào)度響應(yīng)關(guān)系等知識(shí)抽取以及防洪、水資源等多業(yè)務(wù)目標(biāo)智能支撐等方面的研究仍有所欠缺,亟需進(jìn)一步強(qiáng)化知識(shí)圖譜的構(gòu)建與應(yīng)用研究。
為此,本文圍繞流域水工程聯(lián)合調(diào)度實(shí)際業(yè)務(wù)需求,自上而下構(gòu)建水工程聯(lián)合調(diào)度本體,完成聯(lián)合調(diào)度知識(shí)建模;在此基礎(chǔ)上,以聯(lián)合調(diào)度規(guī)則與工程調(diào)度響應(yīng)關(guān)系為核心建立多源數(shù)據(jù)信息挖掘與知識(shí)抽取技術(shù)框架;基于Neo4j圖數(shù)據(jù)庫完成知識(shí)存儲(chǔ)與索引展示;最后,研究從防洪調(diào)度、水資源調(diào)度兩個(gè)方面探討知識(shí)圖譜的應(yīng)用實(shí)例與發(fā)展方向。
1 水工程聯(lián)合調(diào)度知識(shí)圖譜構(gòu)建
水工程聯(lián)合調(diào)度知識(shí)圖譜可按照調(diào)度相關(guān)基礎(chǔ)數(shù)據(jù)準(zhǔn)備、水工程調(diào)度本體構(gòu)建、數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)、基于圖數(shù)據(jù)庫的知識(shí)存儲(chǔ)與呈現(xiàn)技術(shù)流程來構(gòu)建。本文的技術(shù)路線如圖1所示。
1.1 知識(shí)圖譜構(gòu)建的信息需求
知識(shí)圖譜的構(gòu)建需要海量數(shù)據(jù)與知識(shí)進(jìn)行支撐,所需數(shù)據(jù)包含歷史及實(shí)時(shí)水雨情、工情等質(zhì)量較高的結(jié)構(gòu)化知識(shí)數(shù)據(jù),也包含調(diào)度規(guī)劃報(bào)告、險(xiǎn)情上報(bào)資料等文件中的文字、圖片、網(wǎng)頁數(shù)據(jù)等半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。其中,也可從數(shù)據(jù)更新頻率角度將知識(shí)圖譜構(gòu)建數(shù)據(jù)劃分為靜態(tài)數(shù)據(jù)與動(dòng)態(tài)數(shù)據(jù)信息。靜態(tài)數(shù)據(jù)主要包括工程基礎(chǔ)特性信息、流域拓?fù)浣Y(jié)構(gòu)、年鑒數(shù)據(jù)資料等更新頻次較低的數(shù)據(jù),動(dòng)態(tài)數(shù)據(jù)信息主要包括實(shí)時(shí)監(jiān)測(cè)信息,即控制站監(jiān)測(cè)降雨、水位、流量信息,還包括業(yè)務(wù)計(jì)算方案信息。
1.2 水工程聯(lián)合調(diào)度知識(shí)圖譜本體構(gòu)建
在知識(shí)圖譜構(gòu)建過程中,知識(shí)建模是第一步也是最重要的步驟。知識(shí)建模重點(diǎn)是對(duì)目標(biāo)領(lǐng)域的知識(shí)體系,即本體的構(gòu)建,主要用于定義目標(biāo)領(lǐng)域中事物的類型及描述事物的屬性。本體刻畫了一個(gè)領(lǐng)域的基本框架,基于本體框架添加具體的數(shù)據(jù)就可以構(gòu)建一個(gè)簡(jiǎn)單的知識(shí)圖譜。水工程調(diào)度知識(shí)體系(本體)可認(rèn)為是關(guān)于工程調(diào)度決策過程中數(shù)據(jù)與知識(shí)的集合,包含調(diào)度領(lǐng)域相關(guān)的概念、屬性以及概念之間的關(guān)系。水工程調(diào)度知識(shí)體系(本體)可通過人工編輯的方式進(jìn)行自上而下手動(dòng)構(gòu)建,也可通過數(shù)據(jù)驅(qū)動(dòng)的方式進(jìn)行自下而上自動(dòng)化構(gòu)建。
基于現(xiàn)有較為成熟的水工程聯(lián)合調(diào)度方案,工程調(diào)度考慮的要素大多從水情、工情及險(xiǎn)情災(zāi)情出發(fā),進(jìn)一步判斷單一工程及工程群組的調(diào)度運(yùn)行方式,決策層次及邏輯較為清晰。考慮到采用基于大數(shù)據(jù)的自下而上自動(dòng)構(gòu)建本體方法,仍存在領(lǐng)域數(shù)據(jù)量不足、構(gòu)建過程需要專家進(jìn)行修正等問題。為此,研究依托現(xiàn)有調(diào)度決策流程,提出了基于規(guī)則場(chǎng)景重構(gòu)的水工程聯(lián)合調(diào)度知識(shí)體系建模方法,具體包含流域水-工-險(xiǎn)-災(zāi)基礎(chǔ)信息本體構(gòu)建與場(chǎng)景驅(qū)動(dòng)的水工程聯(lián)合調(diào)度本體構(gòu)建兩部分內(nèi)容。
1.2.1 流域水-工-險(xiǎn)-災(zāi)基礎(chǔ)信息本體構(gòu)建
流域基礎(chǔ)信息種類繁多,在實(shí)時(shí)調(diào)度中較為關(guān)注的信息包括:水工程拓?fù)浣Y(jié)構(gòu),歷史與實(shí)時(shí)的水、工、險(xiǎn)、災(zāi)統(tǒng)計(jì)信息以及水庫等重要控制工程的特征水位、庫容等基本特征參數(shù)信息等。為此,可定義水庫、堤防、蓄滯洪區(qū)、取水口等工程節(jié)點(diǎn),控制站節(jié)點(diǎn),防洪保護(hù)區(qū),河段節(jié)點(diǎn);同時(shí),還包括水情、工情、社會(huì)經(jīng)濟(jì)指標(biāo)、基本參數(shù)節(jié)點(diǎn)。工情節(jié)點(diǎn)屬性包括水庫水位、入庫流量,水情節(jié)點(diǎn)屬性包括歷史與預(yù)報(bào)的水位流量過程,取水口節(jié)點(diǎn)屬性包括用水戶信息等?;谒こ炭臻g拓?fù)浣Y(jié)構(gòu),以及不同河段與工程、控制站之間的上下位關(guān)系及從屬關(guān)系,構(gòu)建了具有通用性的水-工-險(xiǎn)-災(zāi)基礎(chǔ)信息本體概念設(shè)計(jì),如圖2所示。
1.2.2 場(chǎng)景驅(qū)動(dòng)的水工程聯(lián)合調(diào)度本體構(gòu)建
在實(shí)際調(diào)度決策中,針對(duì)不同量級(jí)、不同遭遇組合的來水場(chǎng)景,相應(yīng)工程運(yùn)用組合、調(diào)度方式以及應(yīng)對(duì)措施均不同,需根據(jù)不同水雨情信息,實(shí)時(shí)對(duì)工程調(diào)度方式進(jìn)行決策。為此,研究提出了場(chǎng)景驅(qū)動(dòng)的水工程聯(lián)合調(diào)度本體構(gòu)建方法,主要包括水文要素等級(jí)劃分、基于調(diào)度規(guī)則的場(chǎng)景重構(gòu)、水工程聯(lián)合調(diào)度本體構(gòu)建三部分內(nèi)容。
(1) 水文要素等級(jí)劃分。
來水形勢(shì)研判貫穿整個(gè)水工程調(diào)度決策過程,實(shí)時(shí)與歷史水情信息往往以連續(xù)的時(shí)間序列存儲(chǔ)與展示,此類連續(xù)性的時(shí)序數(shù)據(jù)并不適應(yīng)知識(shí)圖譜的查詢使用。為此,需結(jié)合現(xiàn)有規(guī)則知識(shí)對(duì)流域來水進(jìn)行離散分級(jí),便于使用知識(shí)圖譜進(jìn)行場(chǎng)景與相應(yīng)調(diào)度規(guī)則的快速識(shí)別與索引。以洪水防御業(yè)務(wù)為例,流域各控制站點(diǎn)均有對(duì)應(yīng)設(shè)計(jì)洪水資料,資料中規(guī)定了不同設(shè)計(jì)頻率的洪水特征值,因此可根據(jù)GB/T 22482-2008《水文情報(bào)預(yù)報(bào)規(guī)范》將洪水量級(jí)按表1劃分。同時(shí),對(duì)于部分重點(diǎn)河段,可基于河段不同等級(jí)堤防的超高水位信息,根據(jù)T/CHES-2023《流域超標(biāo)準(zhǔn)洪水防御預(yù)案編制導(dǎo)則》,采用控制站水位對(duì)洪水進(jìn)行等級(jí)劃分,如當(dāng)沙市水位小于44.50 m時(shí)為標(biāo)準(zhǔn)量級(jí)洪水,水位達(dá)到45.00,46.50,47.00 m時(shí)分別為超3級(jí)、超2級(jí)、超1級(jí)洪水,不同量級(jí)洪水下相應(yīng)的防洪保護(hù)目標(biāo)以及調(diào)度方式也有所不同。
(2) 基于調(diào)度規(guī)則的場(chǎng)景重構(gòu)。
流域水情、工情綜合研判需同時(shí)考慮流域多個(gè)控制站水文要素信息以及多個(gè)水工程的工情信息,為此可根據(jù)歷史調(diào)度經(jīng)驗(yàn),結(jié)合不同來水條件下各水文要素的分級(jí)分段情況,通過建立不同場(chǎng)景判別規(guī)則,將不同來水情況劃分成不同的來水場(chǎng)景,將不同工程的狀態(tài)信息劃分成不同的工情場(chǎng)景,并將兩者結(jié)合形成不同的場(chǎng)景歸集,如圖3所示。此種劃分本質(zhì)上是通過人工標(biāo)注方式將不同來水標(biāo)注成相應(yīng)場(chǎng)景的批次,以便后續(xù)更好地索引出不同水情、工情場(chǎng)景下的工程調(diào)度方式、調(diào)度響應(yīng)關(guān)系以及災(zāi)損變化函數(shù)和洪水應(yīng)對(duì)措施等。同時(shí),也可采用聚類方法,如系統(tǒng)聚類、K-means聚類、層次聚類算法、譜聚類等方法進(jìn)行自動(dòng)劃分。
(3) 水工程聯(lián)合調(diào)度本體構(gòu)建。
水工程聯(lián)合調(diào)度本體主要圍繞工程調(diào)度規(guī)則以及歷史調(diào)度案例兩部分構(gòu)建。針對(duì)工程調(diào)度規(guī)則,需將調(diào)度規(guī)則的文字化描述轉(zhuǎn)化成計(jì)算機(jī)能夠理解的邏輯語言,如在水工程調(diào)度規(guī)則描述中,往往關(guān)聯(lián)工程控制目標(biāo)、工程啟用時(shí)機(jī)、聯(lián)合調(diào)度運(yùn)用方式、調(diào)度響應(yīng)關(guān)系等。其中各個(gè)工程啟用時(shí)機(jī)需充分考慮步驟(2)中不同的水情、工情場(chǎng)景節(jié)點(diǎn)。以場(chǎng)景為驅(qū)動(dòng),可將啟用工程群組進(jìn)行關(guān)聯(lián),不同工程進(jìn)一步關(guān)聯(lián)該種場(chǎng)景下的調(diào)度方式節(jié)點(diǎn)和調(diào)度響應(yīng)關(guān)系節(jié)點(diǎn),調(diào)度控制方式節(jié)點(diǎn)屬性值包括固定攔蓄、固定下泄、補(bǔ)償調(diào)度等,調(diào)度響應(yīng)關(guān)系節(jié)點(diǎn)屬性值可包括攔蓄水量與控制站水位流量降幅之間的關(guān)系,部分調(diào)度規(guī)則的知識(shí)描述框架及概化設(shè)計(jì)圖如圖3所示。
針對(duì)調(diào)度案例,其往往包含大量工程的調(diào)度過程及部分總結(jié)性描述,相對(duì)于調(diào)度規(guī)則方案,水工程的啟用時(shí)機(jī)、運(yùn)用方式與控制變量往往需要通過專家識(shí)別或者通過計(jì)算機(jī)進(jìn)行知識(shí)要素抽取,抽取后的知識(shí)要素仍可按照?qǐng)D3描述的知識(shí)體系進(jìn)行存儲(chǔ)。
1.3 多源數(shù)據(jù)信息挖掘與知識(shí)抽取技術(shù)
在知識(shí)圖譜構(gòu)建過程中,實(shí)體抽取與關(guān)系發(fā)現(xiàn)等知識(shí)提取步驟是知識(shí)圖譜形成的前提,也是知識(shí)圖譜構(gòu)建的核心研究?jī)?nèi)容。待提取的數(shù)據(jù)信息往往包括結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)信息,針對(duì)不同類型的數(shù)據(jù)源需采用不同方式進(jìn)行抽取。
1.3.1 結(jié)構(gòu)化信息挖掘與關(guān)系發(fā)現(xiàn)
針對(duì)水情、工情、險(xiǎn)情、災(zāi)情中結(jié)構(gòu)化程度較高的數(shù)據(jù)庫表數(shù)據(jù)信息,可直接采用D2R(Database to RDF)技術(shù)將數(shù)據(jù)庫信息轉(zhuǎn)換成RDF三元組信息。
針對(duì)水利領(lǐng)域存在的大量水工程調(diào)度過程、來水過程等時(shí)間序列信息,此類“顯式”過程信息中可進(jìn)一步挖掘得到不同水-工-險(xiǎn)-災(zāi)要素間的互饋?zhàn)兓?guī)律。例如,以水工程調(diào)度響應(yīng)關(guān)系為例,n個(gè)工程聯(lián)合調(diào)度對(duì)控制站預(yù)見期內(nèi)的水位降幅序列如式(1)所示。
Δh=f1(Q1,t1)+f2(Q2,t2)+…+fn(Qn,tn)
(1)
式中:Qi為第i個(gè)水工程預(yù)見期內(nèi)的攔蓄/分洪過程;t為攔蓄/分洪時(shí)段;fi為第i個(gè)水工程調(diào)度對(duì)控制站的調(diào)度響應(yīng)關(guān)系??刹捎幂^為常用的機(jī)理模型模擬-樣本生成-關(guān)系抽取的方式,對(duì)物理流域中不同水文要素之間的變化響應(yīng)關(guān)系進(jìn)行關(guān)系識(shí)別與量化表征。以長(zhǎng)江中下游區(qū)域?yàn)槔?,通過構(gòu)建率參后的工程調(diào)度-流域水動(dòng)力演進(jìn)耦合模型,輸入不同典型來水過程進(jìn)行調(diào)算,可以得到城陵磯站不同水位抬升條件下各站點(diǎn)的超額洪量值。在此基礎(chǔ)上,也可以通過改變工程調(diào)度方式,如改變分蓄洪區(qū)的分洪天數(shù),得到蓄滯洪區(qū)運(yùn)用對(duì)不同站點(diǎn)調(diào)度的影響。對(duì)于實(shí)際調(diào)度案例或者樣本較少的情況,可以通過隨機(jī)模擬的方式模擬生成來水樣本進(jìn)行調(diào)算,已有學(xué)者[22-23]進(jìn)一步采用機(jī)器學(xué)習(xí)方法,對(duì)不同地區(qū)組合、不同來水量級(jí)條件下水庫攔蓄對(duì)下游控制站的調(diào)度影響關(guān)系進(jìn)行了函數(shù)化擬合。
1.3.2 非結(jié)構(gòu)化數(shù)據(jù)信息挖掘
針對(duì)部分純文本等非結(jié)構(gòu)化信息,現(xiàn)有研究較多采用預(yù)訓(xùn)練大語言模型進(jìn)行文本分類、自動(dòng)標(biāo)注、知識(shí)抽取等自然語言生成處理工作?,F(xiàn)階段,基于預(yù)訓(xùn)練模型的水利領(lǐng)域知識(shí)抽取主要有流水線式抽?。≒ipline)和聯(lián)合抽取(Joint Extraction)兩種方式。流水線式抽取就是把關(guān)系抽取的任務(wù)分為兩個(gè)步驟:首先進(jìn)行實(shí)體識(shí)別,再基于抽取的實(shí)體來識(shí)別實(shí)體與實(shí)體之間的關(guān)系。聯(lián)合抽取的方式則同時(shí)完成實(shí)體與關(guān)系的抽取。兩種方式的前置關(guān)鍵步驟均是對(duì)樣本進(jìn)行實(shí)體與關(guān)系的識(shí)別與標(biāo)注,需結(jié)合知識(shí)體系中定義的實(shí)體、屬性,采用對(duì)樣本語句進(jìn)行手動(dòng)標(biāo)注的方式。當(dāng)標(biāo)注樣本滿足一定數(shù)量要求后,可依托領(lǐng)域小樣本對(duì)預(yù)訓(xùn)練的大模型參數(shù)進(jìn)行微調(diào),獲得滿足調(diào)度領(lǐng)域知識(shí)抽取基本需求的實(shí)體與關(guān)系抽取模型。例如,蓄滯洪區(qū)防洪避險(xiǎn)轉(zhuǎn)移設(shè)施描述文本的知識(shí)抽取流程圖如圖4所示,結(jié)合上述流程可將文本中的知識(shí)要素信息轉(zhuǎn)換成json等結(jié)構(gòu)化數(shù)據(jù)文件進(jìn)行存儲(chǔ)。
1.4 基于Neo4j的知識(shí)存儲(chǔ)與索引展示
縱觀水利領(lǐng)域及其他領(lǐng)域的知識(shí)圖譜相關(guān)研究,主流的知識(shí)存儲(chǔ)方式一般有兩種選擇:一個(gè)是通過RDF(資源描述框架)規(guī)范存儲(chǔ)格式來進(jìn)行存儲(chǔ),比較常用的有Jena等;更為常用的是使用圖數(shù)據(jù)庫來進(jìn)行知識(shí)要素存儲(chǔ),較為常用的是開源的Neo4j圖數(shù)據(jù)庫。Neo4j是一個(gè)高性能的NOSQL圖數(shù)據(jù)庫,支持千億級(jí)別的節(jié)點(diǎn)、關(guān)系、標(biāo)簽的存儲(chǔ),其在關(guān)聯(lián)查詢的效率上會(huì)比傳統(tǒng)的關(guān)系數(shù)據(jù)庫存儲(chǔ)查詢方式有顯著的提高。尤其是涉及2~3跳的關(guān)聯(lián)查詢,基于知識(shí)圖譜的查詢效率會(huì)高出幾千倍甚至幾百萬倍。為此,本文采用Neo4j圖數(shù)據(jù)庫對(duì)城陵磯不同水位降幅目標(biāo)下需要啟用水工程種類、數(shù)量、規(guī)模、次序等進(jìn)行了存儲(chǔ)與可視化呈現(xiàn),可用于服務(wù)實(shí)時(shí)防洪調(diào)度方案的快速推送。例如在當(dāng)前水情下若需要將城陵磯站水位降低0.8 m,則可通過知識(shí)圖譜索引預(yù)存的調(diào)度方案,如圖5所示。
需依次啟用錢糧湖、大通湖東、共雙茶垸與洪湖東分塊,同時(shí)不同蓄滯洪區(qū)的投入容積、啟用天數(shù)、啟用次序也可一并索引呈現(xiàn)。
2 知識(shí)圖譜智能應(yīng)用
2.1 多工程聯(lián)合防洪調(diào)度應(yīng)用
知識(shí)圖譜在水工程防洪領(lǐng)域應(yīng)用研究相對(duì)較多,以防洪調(diào)度場(chǎng)景為例,知識(shí)圖譜可實(shí)現(xiàn)水情要素快速分析、險(xiǎn)情災(zāi)情實(shí)時(shí)評(píng)估、調(diào)度方案的快速推選等功能。以水工程智能調(diào)度為例,根據(jù)決策者選取的水工程,快速索引出其關(guān)聯(lián)的防洪控制站點(diǎn),工程的運(yùn)用時(shí)機(jī)、調(diào)度方式以及對(duì)不同關(guān)聯(lián)站點(diǎn)的調(diào)度響應(yīng)關(guān)系等。其中,調(diào)度響應(yīng)關(guān)系是實(shí)現(xiàn)工程調(diào)度快速模擬的關(guān)鍵核心。一方面可直接索引預(yù)訓(xùn)練好的機(jī)器學(xué)習(xí)參數(shù),驅(qū)動(dòng)機(jī)器學(xué)習(xí)模型預(yù)測(cè)不同工況下的調(diào)度影響;另一方面也可根據(jù)當(dāng)前水雨情狀態(tài),直接采用“最鄰近抽樣”的方式,選取歷史典型調(diào)度案例,移用歷史典型洪水調(diào)度效果,對(duì)當(dāng)前洪水進(jìn)行推演,如圖6所示。
通過知識(shí)圖譜提供的以知識(shí)為中心的支持模式,其涵蓋知識(shí)獲取、知識(shí)構(gòu)建、知識(shí)服務(wù)等,可以較好地針對(duì)單一工程對(duì)不同站點(diǎn)的調(diào)度響應(yīng)關(guān)系進(jìn)行提取、存儲(chǔ)與調(diào)用。但若涉及多工程聯(lián)合防洪運(yùn)用時(shí),一方面多工程對(duì)應(yīng)多站點(diǎn)的調(diào)度知識(shí)體系難以構(gòu)建;另一方面,由于來水地區(qū)組成多樣、工程啟用次序與運(yùn)用方式眾多、自身攔蓄洪效率差異較大等因素的存在,組合運(yùn)用工況十分復(fù)雜,難以直接通過海量工況模擬來量化表征工程組合運(yùn)用效果,也難以精準(zhǔn)確定工程組合運(yùn)用的調(diào)度響應(yīng)關(guān)系。為此,在實(shí)際洪水防御時(shí),可以將知識(shí)圖譜索引得到的不同工程對(duì)控制站的調(diào)度響應(yīng)關(guān)系,按照調(diào)度方案中擬定的工程運(yùn)用方式進(jìn)行同時(shí)或錯(cuò)時(shí)疊加,來初步判定工程聯(lián)合運(yùn)用效果。
下面以城陵磯附近的錢糧湖、大通湖東、共雙茶垸、洪湖東分塊、圍堤湖、澧南垸、西官垸7處重要蓄滯洪區(qū)進(jìn)行分洪模擬分析。以1931、1954、1998、1999年典型洪水作為輸入,上述蓄滯洪區(qū)分別按照其分洪能力同時(shí)開始進(jìn)行理想分洪設(shè)置,分洪時(shí)間控制為5 d??赏ㄟ^知識(shí)圖譜索引出不同水情條件下蓄滯洪區(qū)對(duì)控制站調(diào)度響應(yīng)關(guān)系,如圖7所示。通過式(1)進(jìn)行蓄滯洪區(qū)對(duì)城陵磯站調(diào)度效果疊加,將索引疊加結(jié)果與基于水動(dòng)力學(xué)模型的組合模擬結(jié)果進(jìn)行對(duì)比,結(jié)果見表2。由表2可知,知識(shí)圖譜索引疊加模擬結(jié)果略高于基于水動(dòng)力學(xué)模型的組合模擬結(jié)果,兩者在不同典型年條件下對(duì)各站點(diǎn)水位降幅間的RMSE均在5 cm左右,均方根誤差較小。同時(shí)以1954年調(diào)度結(jié)果可知,圖8、9展示了1954、1998年采用兩種方式計(jì)算得到的調(diào)度效果對(duì)比圖。由圖可知,兩者整體過程偏差較小,水位降幅最大值誤差在可接受范圍內(nèi),因此可認(rèn)為兩者模擬效果類似。由于基于知識(shí)圖譜的蓄滯洪區(qū)組合模擬方式能實(shí)現(xiàn)“毫秒級(jí)”的快速模擬,因此該種方法能夠在滿足一定誤差要求的情況下,極大提升模擬效率。
2.2 水資源調(diào)配知識(shí)圖譜構(gòu)建與應(yīng)用
知識(shí)圖譜在防洪領(lǐng)域研究相對(duì)較多,也形成了一些落地應(yīng)用,但在水資源調(diào)配領(lǐng)域的研究較少。在水資源調(diào)配領(lǐng)域,經(jīng)過多年的研究已經(jīng)凝練形成了大量研究成果,但成果均存儲(chǔ)于在水資源綜合規(guī)劃、水量分配方案、水量調(diào)度計(jì)劃、工程運(yùn)行計(jì)劃、應(yīng)急調(diào)度預(yù)案文本中,尚未形成數(shù)字化、邏輯化的知識(shí)結(jié)構(gòu),難以支撐宏觀水資源配置以及具體的水量調(diào)度方案生成,為此亟需構(gòu)建長(zhǎng)江流域水庫群供水調(diào)度與用水管控知識(shí)庫,驅(qū)動(dòng)融合水資源配置專業(yè)模型,通過經(jīng)驗(yàn)知識(shí)的利用和智能研判能力提升,實(shí)現(xiàn)結(jié)合經(jīng)驗(yàn)和人工智能的水資源配置決策,進(jìn)一步加快模型計(jì)算效率,提升不同場(chǎng)景下水資源配置方案的合理性??傮w來看水資源調(diào)配知識(shí)庫建設(shè)可分為4個(gè)建設(shè)內(nèi)容。
2.2.1 流域水資源調(diào)配方案庫
不同流域、區(qū)域的水量調(diào)配方案中不同指標(biāo)的計(jì)算存在一定差異,且部分指標(biāo)如需水量、水資源承載力、可供水量等尚未形成標(biāo)準(zhǔn)規(guī)范導(dǎo)則。為此,可以圍繞不同流域、區(qū)域的年度水量調(diào)度計(jì)劃、水量分配方案,將流域水資源調(diào)度范圍、調(diào)度體系、年度水情、工情和水資源狀況等基礎(chǔ)信息,以及流域地表水可分配水量、流域需水類別、河道內(nèi)外需水量、不同規(guī)劃水平年不同來水頻率下各用水單元水量分配指標(biāo)的具體數(shù)量及指標(biāo)計(jì)算方式進(jìn)行知識(shí)抽取,結(jié)合經(jīng)驗(yàn)知識(shí)構(gòu)建調(diào)配方案知識(shí)體系,按照既定的體系完成價(jià)值信息存儲(chǔ),構(gòu)建流域水量調(diào)度方案庫。
2.2.2 水資源調(diào)配規(guī)則庫
構(gòu)建包含各流域水資源配置規(guī)則、工程供水調(diào)度規(guī)則、應(yīng)急調(diào)度規(guī)則等的規(guī)則庫。其中,水資源配置規(guī)則一方面來源于現(xiàn)有標(biāo)準(zhǔn)導(dǎo)則以及水量分配方案中的調(diào)度原則,另一方面需從現(xiàn)有調(diào)度方案中進(jìn)行總結(jié)凝練,具體提取內(nèi)容包括水平年條件、水資源量預(yù)報(bào)情況、水資源配置目標(biāo)與原則,以及不同行業(yè)用水次序、供需水計(jì)算方式等。工程供水調(diào)度規(guī)則、應(yīng)急調(diào)度規(guī)則知識(shí)提取內(nèi)容包括水工程名稱、調(diào)度目標(biāo)(調(diào)度控制斷面、控制指標(biāo))、調(diào)度方式(補(bǔ)水量、補(bǔ)水時(shí)間)等。
2.2.3 水資源調(diào)配量化關(guān)系庫
通過歷史與模擬供水調(diào)度案例,總結(jié)凝練工程調(diào)度與缺水?dāng)嗝嫜a(bǔ)水情況以及流域整體缺水率變化之間的關(guān)系,構(gòu)建單一工程、工程群組水資源調(diào)配量化關(guān)系庫,支撐應(yīng)急抗旱調(diào)度方案生成及補(bǔ)水效果評(píng)價(jià)。
2.2.4 取用水管控知識(shí)庫
將干旱條件下不同類型、不同地區(qū)取水口管控方式進(jìn)行邏輯化存儲(chǔ),支撐實(shí)時(shí)應(yīng)急抗旱調(diào)度模擬。
通過建立流域水資源調(diào)配知識(shí)庫,使水量分配方案相關(guān)指標(biāo)計(jì)算分析向準(zhǔn)定量化、定量化轉(zhuǎn)變,實(shí)現(xiàn)常規(guī)條件及應(yīng)急狀況下的水量分配方案的快速生成與滾動(dòng)調(diào)整,最終為流域水資源管理與調(diào)配業(yè)務(wù)應(yīng)用“四預(yù)”提供知識(shí)支撐。
3 結(jié) 語
本文立足于流域水工程調(diào)度業(yè)務(wù)需求,按照知識(shí)建模、知識(shí)抽取、知識(shí)存儲(chǔ)以及知識(shí)應(yīng)用的總體思路,提出了合理可行的水工程調(diào)度知識(shí)圖譜構(gòu)建與應(yīng)用總體技術(shù)方案,有效支撐了調(diào)度領(lǐng)域數(shù)據(jù)挖掘與分析、智能調(diào)度預(yù)演、方案精準(zhǔn)決策以及全過程可視化功能。在知識(shí)建模方面,設(shè)計(jì)了水-工-險(xiǎn)-災(zāi)基礎(chǔ)信息本體,重點(diǎn)圍繞調(diào)度業(yè)務(wù)流程,建立了場(chǎng)景驅(qū)動(dòng)的水工程聯(lián)合調(diào)度本體;分別針對(duì)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)信息,提出了涵蓋基于機(jī)器學(xué)習(xí)的時(shí)序數(shù)據(jù)關(guān)系挖掘技術(shù)、基于預(yù)訓(xùn)練模型的文本信息知識(shí)抽取技術(shù),并以長(zhǎng)江流域蓄滯洪區(qū)為例,介紹了調(diào)度響應(yīng)關(guān)系提取與避險(xiǎn)轉(zhuǎn)移文本信息提取技術(shù)與方法;在此基礎(chǔ)上,基于Neo4j圖數(shù)據(jù)庫展示了調(diào)度案例的實(shí)例化存儲(chǔ)與索引功能;最后圍繞防洪與水資源兩大業(yè)務(wù)模塊,闡述了知識(shí)圖譜驅(qū)動(dòng)下多工程聯(lián)合防洪調(diào)度應(yīng)用場(chǎng)景實(shí)現(xiàn)流程并驗(yàn)證了合理性,探索了水資源調(diào)配知識(shí)圖譜構(gòu)建內(nèi)容與方法。研究初步實(shí)現(xiàn)了調(diào)度知識(shí)圖譜構(gòu)建全流程貫通,可為知識(shí)圖譜在水工程聯(lián)合調(diào)度領(lǐng)域進(jìn)一步發(fā)展與應(yīng)用提供借鑒。
參考文獻(xiàn):
[1] 王權(quán)森.長(zhǎng)江上游水庫群防洪系統(tǒng)全景調(diào)度及風(fēng)險(xiǎn)評(píng)估與決策方法[D].武漢:華中科技大學(xué),2021.
[2] 金興平.對(duì)長(zhǎng)江流域水工程聯(lián)合調(diào)度與信息化實(shí)現(xiàn)的思考[J].中國(guó)防汛抗旱,2019,29(5):12-17.
[3] CHEN J,ZHONG P A,ZHANG Y,et al.A decomposition-integration risk analysis method for real-time operation of a complex flood control system[J].Water Resources Research,2017,53(3):2490-2506.
[4] 謝雨祚,郭生練,鐘斯睿,等.金沙江下游梯級(jí)水庫發(fā)電出力區(qū)間優(yōu)化研究[J].武漢大學(xué)學(xué)報(bào)(工學(xué)版),2024,57(3):267-276.
[5] 鄒強(qiáng),丁毅,肖揚(yáng)帆,等.以三峽為核心的長(zhǎng)江上游水庫群防洪優(yōu)化調(diào)度策略[J].人民長(zhǎng)江,2023,54(12):8-14.
[6] WEI C C,HSU N S.Optimal tree-based release rules for real-time flood control operations on a multipurpose multireservoir system[J].Journal of Hydrology,2009,365(3/4):213-222.
[7] 黃艷,喻杉,巴歡歡.2020年長(zhǎng)江流域水工程聯(lián)合防洪調(diào)度實(shí)踐[J].中國(guó)防汛抗旱,2021,31(1):6-14.
[8] 馮鈞,朱躍龍,王云峰,等.面向數(shù)字孿生流域的知識(shí)平臺(tái)構(gòu)建關(guān)鍵技術(shù)[J].人民長(zhǎng)江,2023,54(3):229-235.
[9] 肖仰華.知識(shí)圖譜與認(rèn)知智能[J].張江科技評(píng)論,2019(4):30-33.
[10]DUAN C F,ZHENG X Z,LI R,et al.Urban flood vulnerability knowledge-graph based on remote sensing and textual bimodal data fusion[J].Journal of Hydrology,2024,633:131010.
[11]LU Y,ZHAO R,WEN X,et al.Medical named entity recognition model based on knowledge graph enhancement[J].International Journal of Pattern Recognition and Artificial Intelligence,2024,38(4):2450004.
[12]HAO X J,JI Z,LI X H,et al.Construction and application of a knowledge graph[J].Remote Sensing,2021,13:2511.
[13]劉嶠,李楊,段宏,等.知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2016,53(3):582-600.
[14]漆桂林,高桓,吳天星.知識(shí)圖譜研究進(jìn)展[J].情報(bào)工程,2017,3(1):4-25.
[15]李安強(qiáng).長(zhǎng)江流域超標(biāo)準(zhǔn)洪水調(diào)度與風(fēng)險(xiǎn)調(diào)控關(guān)鍵技術(shù)[M].武漢:長(zhǎng)江出版社,2021.
[16]馮鈞,暢陽紅,陸佳民,等.基于大語言模型的水工程調(diào)度知識(shí)圖譜的構(gòu)建與應(yīng)用[J].計(jì)算機(jī)科學(xué)與探索,2024,18(6):1637-1647.
[17]顧麗,陳瑜彬.基于DataG的水庫調(diào)度規(guī)程知識(shí)圖譜構(gòu)建方法[J].水電能源科學(xué),2023,41(7):80-83.
[18]黃艷,喻杉,羅斌,等.面向流域水工程防災(zāi)聯(lián)合智能調(diào)度的數(shù)字孿生長(zhǎng)江探索[J].水利學(xué)報(bào),2022,53(3):253-269.
[19]劉昌軍,劉業(yè)森,武甲慶,等.面向防洪“四預(yù)”的數(shù)字孿生流域知識(shí)平臺(tái)建設(shè)探索[J].中國(guó)防汛抗旱,2023,33(3):34-41.
[20]陳勝,劉業(yè)森,魏耀麗.基于知識(shí)圖譜的水工程聯(lián)合調(diào)度計(jì)算方案生成技術(shù)研究[J].水利信息化,2022(2):11-15.
[21]馮鈞,杭婷婷,陳菊,等.領(lǐng)域知識(shí)圖譜研究進(jìn)展及其在水利領(lǐng)域的應(yīng)用[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,49(1):26-34.
[22]周建中,賈本軍,王權(quán)森,等.廣域預(yù)報(bào)信息驅(qū)動(dòng)的水庫群實(shí)時(shí)防洪全景調(diào)度研究[J].水利學(xué)報(bào),2021,52(12):1389-1403.
[23]黃艷,張振東,李琪,等.智慧長(zhǎng)江建設(shè)關(guān)鍵技術(shù)難點(diǎn)與解決方案的思考與探索[J].水利學(xué)報(bào),2023,54(10):1141-1150.
(編輯:鄭 毅)
Research on construction and application of knowledge graph for joint scheduling of water projects
HUANG Yan1,2,3,WANG Quansen3,4,LU Chengwei3,5,6,GUAN Xiong7,ZHENG Hao4,ZHOU Tao4,8
(1.Changjiang Water Resources Commission of Ministry of Water Resources,Wuhan 430010,China; 2.Three Gorges University,Yichang 443002,China; 3.Intelligent Yangtze River Innovation Team of CWRC,Wuhan 430010 China; 4.Changjiang River Scientific Research Institute,Changjiang Water Resources Commission of Ministry of Water Resources,Wuhan 430010,China; 5.Changjiang Survey,Planning,Design and Research Co.,Ltd.,Wuhan 430010,China; 6.Key Laboratory of Basin Water Security of Hubei Province,Wuhan 430010,China; 7.Changjiang Spatial Information Technology Engineering Co.,Ltd.,Wuhan 430010,China; 8.Hubei Key Laboratory of Smart Yangtze River and Hydropower Science,Yichang 443002,China)
Abstract:
In order to deeply integrate water projects dispatch and new generation information technology,based on the business needs of water projects joint scheduling in basins,this paper outlined a reasonable technical scheme for the construction and application of knowledge graph for water projects joint scheduling,which follows a general idea of knowledge modeling,knowledge extraction,knowledge storage and knowledge application.The research innovatively proposed a scenario-driven ontology construction method for water projects joint scheduling,and elaborated structured and unstructured information mining techniques,knowledge extraction,completed the knowledge indexing and visualization functions based on the Neo4j graph database,and explored the application examples and development direction of the knowledge graph from the aspects of flood control scheduling and water resources allocation.The research initially realizes the whole process of scheduling knowledge graph construction,which can provide reference for further development of knowledge graph in the field of water projects joint scheduling.
Key words:
water projects joint scheduling; knowledge graph; ontology construction; flood control scheduling; water resources allocation