高海翔,苗璐,劉嘉寧,林湘寧,董鍇,何祥針
(1.廣東電網(wǎng)有限責(zé)任公司電力調(diào)度控制中心,廣東 廣州 510600;2.華中科技大學(xué) 電氣與電子工程學(xué)院,湖北 武漢 430074)
隨著電力系統(tǒng)規(guī)模的日益增大,新的知識(shí)不斷涌入,系統(tǒng)中的知識(shí)總量呈爆炸式增長(zhǎng),其原因主要包括[1-2]:①電力系統(tǒng)的規(guī)模增大,動(dòng)態(tài)特性日趨復(fù)雜,調(diào)度控制方法也越發(fā)復(fù)雜;②電力系統(tǒng)中的測(cè)控和通信裝置不斷升級(jí),同步相量測(cè)量裝置(phasor measurement unit,PMU)大量接入,數(shù)據(jù)的分辨率、精度和傳輸帶寬增加;③光伏、海上風(fēng)電等新型裝置接入電網(wǎng),在改變電網(wǎng)特性的同時(shí)也增加了新的知識(shí);④電力市場(chǎng)化改革不斷推進(jìn),電力系統(tǒng)的業(yè)務(wù)鏈條逐步細(xì)化,新的業(yè)務(wù)不斷拓展。
這些電力系統(tǒng)中的新知識(shí)呈現(xiàn)出復(fù)雜和多變的特性:知識(shí)結(jié)構(gòu)復(fù)雜,異構(gòu)化知識(shí)不斷增加;知識(shí)更迭迅速,更新頻率逐漸縮短[3]。
面對(duì)電力系統(tǒng)中急劇增長(zhǎng)的新知識(shí),傳統(tǒng)的知識(shí)組織和管理方式已經(jīng)無(wú)法滿足當(dāng)前電力系統(tǒng)的需要。當(dāng)前,以知識(shí)表示和知識(shí)推理為基礎(chǔ)的知識(shí)庫(kù)在電力系統(tǒng)中得到了較多應(yīng)用,如結(jié)合傳統(tǒng)專家系統(tǒng)的智能決策系統(tǒng)[4-6]、故障定位系統(tǒng)[7-8]和輸電網(wǎng)規(guī)劃決策[9]等。但是,這些知識(shí)庫(kù)大多依賴于專家提取、整理并將數(shù)據(jù)以圖表形式存儲(chǔ)于數(shù)據(jù)庫(kù)的傳統(tǒng)知識(shí)管理方式,其所能夠存儲(chǔ)的知識(shí)結(jié)構(gòu)較為單一,且每次更新都需要專業(yè)技術(shù)人員花費(fèi)大量時(shí)間。特別對(duì)于電力調(diào)度、設(shè)備管理、數(shù)據(jù)交互、業(yè)務(wù)查詢等知識(shí)更迭迅速的領(lǐng)域,現(xiàn)有的知識(shí)管理方式已經(jīng)嚴(yán)重滯后于系統(tǒng)的發(fā)展需要。電力系統(tǒng)亟需新型、自動(dòng)、智能的知識(shí)組織、存儲(chǔ)、提取、推理方法和工具。
為了實(shí)現(xiàn)有效的知識(shí)組織和管理,已有研究將計(jì)算機(jī)領(lǐng)域中近年來(lái)廣泛應(yīng)用的知識(shí)圖譜(knowledge graph)技術(shù)引入電力系統(tǒng)領(lǐng)域。知識(shí)圖譜是以圖的形式表現(xiàn)客觀世界中的實(shí)體及其相互關(guān)系的知識(shí)庫(kù),是大數(shù)據(jù)時(shí)代人工智能符號(hào)主義的知識(shí)表達(dá)方式之一。知識(shí)圖譜由谷歌公司(Google)于2012年提出,此后在互聯(lián)網(wǎng)、金融、醫(yī)藥等領(lǐng)域得到了迅猛發(fā)展和廣泛應(yīng)用[10-11]。自知識(shí)圖譜被加入谷歌公司的搜索引擎后,其規(guī)模在7個(gè)月內(nèi)擴(kuò)大了3倍。至2016年,谷歌公司構(gòu)建的知識(shí)圖譜已擁有超過(guò)5億個(gè)實(shí)體和700億條實(shí)體關(guān)系信息[12]。在當(dāng)今的互聯(lián)網(wǎng)領(lǐng)域,知識(shí)圖譜已經(jīng)成為語(yǔ)義搜索、智能問(wèn)答、知識(shí)推理等多種知識(shí)智能服務(wù)的基礎(chǔ)技術(shù)之一[13]。知識(shí)圖譜可以有效組織、管理和利用海量信息,實(shí)現(xiàn)智能化的知識(shí)抽取、推理、存儲(chǔ)和檢索,其特性及應(yīng)用場(chǎng)景與電力系統(tǒng)的需要十分契合。
在已有綜述電力系統(tǒng)知識(shí)圖譜的文獻(xiàn)中,文獻(xiàn)[14]介紹了知識(shí)圖譜在智能電網(wǎng)建設(shè)中的意義和具體的應(yīng)用場(chǎng)景,文獻(xiàn)[15]介紹了電力系統(tǒng)領(lǐng)域知識(shí)的中文專業(yè)詞典和知識(shí)圖譜的構(gòu)建分析方法,文獻(xiàn)[16]簡(jiǎn)要探討了知識(shí)圖譜在電力系統(tǒng)領(lǐng)域的應(yīng)用思考。現(xiàn)有的綜述性文獻(xiàn)并未對(duì)電力系統(tǒng)知識(shí)圖譜的特性以及構(gòu)建中的關(guān)鍵技術(shù)展開(kāi)詳細(xì)介紹,也尚未深入探討電力系統(tǒng)知識(shí)圖譜可能的應(yīng)用場(chǎng)景和研究方向。其他有關(guān)電力系統(tǒng)知識(shí)圖譜的文獻(xiàn)則更多地聚焦于某個(gè)具體應(yīng)用場(chǎng)景,探討知識(shí)圖譜在設(shè)備運(yùn)維檢修[17-18]、調(diào)度故障處理[19]、電力客服[20]和電網(wǎng)信息搜索[21]等場(chǎng)景中的構(gòu)建和應(yīng)用。值得指出的是,電力系統(tǒng)知識(shí)圖譜目前的應(yīng)用場(chǎng)景還較為有限,大多是對(duì)原有智能系統(tǒng)應(yīng)用的直接擴(kuò)展。例如,設(shè)備運(yùn)維檢修知識(shí)庫(kù)和信息管理系統(tǒng)原為語(yǔ)義網(wǎng)(semantic web)的典型應(yīng)用場(chǎng)景,調(diào)度事故決策原為智能專家系統(tǒng)的典型應(yīng)用場(chǎng)景,將知識(shí)圖譜應(yīng)用于這些場(chǎng)景是對(duì)原有場(chǎng)景的進(jìn)一步擴(kuò)展和深化。事實(shí)上,知識(shí)圖譜作為優(yōu)質(zhì)的對(duì)知識(shí)的組織、存儲(chǔ)、獲取和查詢的人工智能方法,在電力系統(tǒng)領(lǐng)域具有更為廣闊的應(yīng)用潛力和前景。
本文在綜述相關(guān)研究文獻(xiàn)的基礎(chǔ)上,闡述電力系統(tǒng)知識(shí)圖譜技術(shù)的概念及其應(yīng)用。首先,介紹電力系統(tǒng)知識(shí)圖譜的概念及其在電力系統(tǒng)知識(shí)管理中的優(yōu)勢(shì)。其次,分別介紹電力系統(tǒng)知識(shí)圖譜的自頂向下和自底向上2種構(gòu)建方法。再次,結(jié)合電力系統(tǒng)知識(shí)圖譜的特性,總結(jié)知識(shí)圖譜在電力系統(tǒng)中的典型應(yīng)用場(chǎng)景。最后,在分析當(dāng)前研究熱點(diǎn)的基礎(chǔ)上,指出知識(shí)圖譜在電力系統(tǒng)中應(yīng)用的關(guān)鍵問(wèn)題和可能的研究方向。
知識(shí)圖譜是以圖的形式表現(xiàn)客觀世界中的實(shí)體及其相互關(guān)系的結(jié)構(gòu)化語(yǔ)義知識(shí)庫(kù)[13]。在知識(shí)圖譜中,實(shí)體間關(guān)系的基本組成單位為“實(shí)體-關(guān)系-實(shí)體”三元組,實(shí)體的屬性特征則使用“屬性-值”對(duì)來(lái)表示[22]。在知識(shí)圖譜中,“實(shí)體”是知識(shí)圖譜的基本元素,“關(guān)系”是不同實(shí)體之間的關(guān)系,“屬性”是對(duì)實(shí)體的說(shuō)明,“值”為實(shí)體屬性的具體數(shù)值。事實(shí)上,如果將屬性視為實(shí)體與屬性值之間的映射關(guān)系,那么“屬性-值”對(duì)也可轉(zhuǎn)化為“實(shí)體-關(guān)系-實(shí)體”的三元組。如果用節(jié)點(diǎn)表示實(shí)體,用邊表示實(shí)體間的關(guān)系或?qū)嶓w的屬性,那么在知識(shí)圖譜中,實(shí)體(節(jié)點(diǎn))間通過(guò)關(guān)系(邊)相互連接,形成網(wǎng)狀的圖知識(shí)結(jié)構(gòu),構(gòu)成對(duì)客觀世界中知識(shí)的符號(hào)化表達(dá)方式[23]。
知識(shí)圖譜本質(zhì)上是一種語(yǔ)義網(wǎng)[24-25],其發(fā)展歷程可追溯至20世紀(jì)50年代提出的“知識(shí)圖譜”(mapping knowledge domain)[26]和語(yǔ)義網(wǎng)絡(luò)(semantic network)[27-28]。當(dāng)然,當(dāng)今的知識(shí)圖譜與之前提出的“知識(shí)圖譜”相比,從概念到內(nèi)容都已經(jīng)出現(xiàn)了較大的變遷和擴(kuò)展。
按照應(yīng)用領(lǐng)域劃分,知識(shí)圖譜可以分為通用知識(shí)圖譜(generic knowledge graph)與領(lǐng)域知識(shí)圖譜(domain knowledge graph)2類[29]。通用知識(shí)圖譜中存儲(chǔ)的知識(shí)為全面性、常識(shí)性的知識(shí),不局限于特定應(yīng)用領(lǐng)域范圍[30-31],其典型應(yīng)用場(chǎng)景為互聯(lián)網(wǎng)中的智能搜索引擎,這類圖譜對(duì)知識(shí)廣度的要求較高,而對(duì)知識(shí)準(zhǔn)確度的要求相對(duì)較低。領(lǐng)域知識(shí)圖譜面向特定行業(yè)領(lǐng)域,也稱行業(yè)知識(shí)圖譜[32],這類圖譜中存儲(chǔ)的知識(shí)主要為專業(yè)性的領(lǐng)域知識(shí)。
電力系統(tǒng)知識(shí)圖譜是將知識(shí)圖譜技術(shù)應(yīng)用于電力系統(tǒng)領(lǐng)域的技術(shù)形式,屬于領(lǐng)域知識(shí)圖譜,其典型應(yīng)用場(chǎng)景包括知識(shí)管理、輔助分析和支持決策等[11]。電力系統(tǒng)知識(shí)圖譜具有多種分類方式:按照?qǐng)D譜中存儲(chǔ)電力知識(shí)的實(shí)體種類劃分,電力系統(tǒng)知識(shí)圖譜可分為文本知識(shí)圖譜、圖像知識(shí)圖譜和多模態(tài)知識(shí)圖譜[33];按照實(shí)體的存儲(chǔ)規(guī)模劃分,電力系統(tǒng)知識(shí)圖譜可分為基于單樣本的知識(shí)圖譜和基于樣本集的知識(shí)圖譜[34];按照?qǐng)D譜中實(shí)體數(shù)據(jù)的存儲(chǔ)和表達(dá)方式劃分,電力系統(tǒng)知識(shí)圖譜可分為資源描述框架數(shù)據(jù)庫(kù)知識(shí)圖譜和圖數(shù)據(jù)庫(kù)知識(shí)圖譜[35]。
從邏輯結(jié)構(gòu)上,電力系統(tǒng)知識(shí)圖譜可以劃分為數(shù)據(jù)層(data layer)和模式層(schema layer)[13]。知識(shí)在這2個(gè)層次中均以“實(shí)體-關(guān)系-實(shí)體”三元組或“屬性-值”對(duì)的形式存儲(chǔ)。
數(shù)據(jù)層存儲(chǔ)事實(shí)和實(shí)例,數(shù)據(jù)層中的實(shí)體一般為電力系統(tǒng)中較為具體的實(shí)際事物,如人、電網(wǎng)設(shè)備、組織機(jī)構(gòu)、地點(diǎn)、日期時(shí)間以及電網(wǎng)中的具體操作等。模式層存儲(chǔ)概念、規(guī)則、公理和約束條件,模式層中的實(shí)體一般為電力系統(tǒng)中經(jīng)過(guò)提煉的抽象名詞,也稱本體[36]。在人工智能領(lǐng)域,本體被定義為清晰、規(guī)范化、可用語(yǔ)義描述的概念模型[37],如電力術(shù)語(yǔ)、物理量及公式等。模式層中的本體描述知識(shí)的概念層次體系,是模式層中事實(shí)的概念模板。
在電力系統(tǒng)知識(shí)圖譜中,模式層是數(shù)據(jù)層的概念模型和邏輯抽象,數(shù)據(jù)層是模式層的實(shí)例化和事實(shí)應(yīng)用[36]。例如,調(diào)度事故處置的原則性知識(shí)存儲(chǔ)于模式層,而某次具體的事故處置過(guò)程則存儲(chǔ)于數(shù)據(jù)層。由于模式層具備知識(shí)的概念提煉和邏輯推理的特性,因而一般可將模式層視為電力系統(tǒng)知識(shí)圖譜的核心。一般來(lái)說(shuō),專業(yè)應(yīng)用的電力系統(tǒng)知識(shí)圖譜對(duì)知識(shí)的深度和準(zhǔn)確性要求較高,因此需要構(gòu)建較為精確的模式層[38]。而通用領(lǐng)域的電力系統(tǒng)知識(shí)圖譜,如電力維基百科、電力政策知識(shí)圖譜等,則更側(cè)重?cái)?shù)據(jù)層中實(shí)體數(shù)目的擴(kuò)充,一般難以構(gòu)建比較規(guī)范的模式層[39],部分圖譜可能只有數(shù)據(jù)層而沒(méi)有模式層[40]。
電力系統(tǒng)規(guī)模龐大、結(jié)構(gòu)復(fù)雜,隨著信息化推進(jìn)和電力業(yè)務(wù)拓展,電力的發(fā)、輸、變、配、用等各生產(chǎn)和服務(wù)環(huán)節(jié)每時(shí)每刻都在產(chǎn)生海量的數(shù)據(jù)和知識(shí)。從知識(shí)特點(diǎn)上講,這些電力系統(tǒng)中的知識(shí)具有以下特點(diǎn)[41-42]:①專業(yè)性——電力系統(tǒng)中的知識(shí)具有較高的專業(yè)門檻,其知識(shí)的種類繁多,形式復(fù)雜;②關(guān)聯(lián)性——電力系統(tǒng)中的知識(shí)都不是孤立存在的,不同事件之間可能存在關(guān)聯(lián)或依賴關(guān)系;③協(xié)同性——電力系統(tǒng)中的決策往往無(wú)法由單一專業(yè)作出,必須協(xié)同多專業(yè)共同決策;④異構(gòu)性——電力系統(tǒng)中的知識(shí)不僅由結(jié)構(gòu)化數(shù)據(jù)構(gòu)成,還包含很多非結(jié)構(gòu)化數(shù)據(jù),而且這些數(shù)據(jù)的格式和維度都可能不同。這些龐大、分散、多源、異構(gòu)的數(shù)據(jù)共同構(gòu)成了電力系統(tǒng)中的知識(shí)。
面對(duì)這些海量知識(shí),傳統(tǒng)的依賴于人工的知識(shí)管理方式難以準(zhǔn)確表達(dá)知識(shí)間的關(guān)聯(lián)和協(xié)同關(guān)系,也難以實(shí)現(xiàn)異構(gòu)知識(shí)的抽取、管理和利用,極大地影響了知識(shí)的管理和利用效率。與傳統(tǒng)的知識(shí)表達(dá)方式相比,電力系統(tǒng)知識(shí)圖譜的優(yōu)勢(shì)主要體現(xiàn)在以下3個(gè)方面[15,31,36]:
a)準(zhǔn)確性。知識(shí)圖譜將不同結(jié)構(gòu)化的實(shí)體通過(guò)知識(shí)相互連接,更為準(zhǔn)確地表達(dá)知識(shí)之間的關(guān)聯(lián)和協(xié)同關(guān)系,從而將圖譜中的異構(gòu)信息組織起來(lái)成為相互聯(lián)系、可以被利用的知識(shí)。而傳統(tǒng)數(shù)據(jù)庫(kù)僅通過(guò)表格和字段來(lái)組織和展示數(shù)據(jù),難以準(zhǔn)確描述信息間的關(guān)系,使得數(shù)據(jù)之間較為孤立。
b)智能性。知識(shí)圖譜改變了傳統(tǒng)的數(shù)據(jù)檢索方式,可通過(guò)知識(shí)推理實(shí)現(xiàn)概念和邏輯層面的深層次檢索,更為符合電力系統(tǒng)用戶天然的檢索需求。此外,電力系統(tǒng)知識(shí)圖譜的構(gòu)建技術(shù)也包含了自動(dòng)化的知識(shí)更新和學(xué)習(xí)技術(shù),能夠通過(guò)不斷更新和學(xué)習(xí)持續(xù)提高圖譜的智能性。而傳統(tǒng)數(shù)據(jù)庫(kù)大多采用基于字符串匹配或者超鏈接等字面意義上的檢索方式,無(wú)法實(shí)現(xiàn)知識(shí)推理,更新難度較大。
c)可解釋性。不同于神經(jīng)網(wǎng)絡(luò)提供的黑盒模型,知識(shí)圖譜基于邏輯符號(hào)表達(dá)的推理過(guò)程對(duì)人是可解釋的,因此基于知識(shí)圖譜的電網(wǎng)輔助決策系統(tǒng)不僅能夠給出決策結(jié)果,還可以提供決策的依據(jù)和過(guò)程。通過(guò)理解決策過(guò)程,增加人對(duì)決策結(jié)果的信賴度,更好地提升輔助決策效果。這一點(diǎn)也是傳統(tǒng)的智能決策系統(tǒng)難以實(shí)現(xiàn)的。
電力系統(tǒng)知識(shí)圖譜的構(gòu)建方法可分為3種:自頂向下(top-down)、自底向上(bottom-up)和兩者混合[43],以下主要介紹自頂向下、自底向上2種方法。
自頂向下方法先構(gòu)建知識(shí)圖譜的模式層,然后再構(gòu)建數(shù)據(jù)層[43]。在自頂向下構(gòu)建中,首先根據(jù)現(xiàn)有的結(jié)構(gòu)化數(shù)據(jù)或?qū)<抑R(shí)庫(kù)構(gòu)造模式層中的本體及其相互關(guān)系,形成對(duì)應(yīng)的概念模型和規(guī)則關(guān)系,然后再依照此模式從數(shù)據(jù)中抽取實(shí)體,構(gòu)造數(shù)據(jù)層[30]。由此可見(jiàn),自頂向下構(gòu)建方法是從抽象到具體,先有概念而后有具體實(shí)現(xiàn)的構(gòu)建過(guò)程。自頂向下構(gòu)建方法包括本體學(xué)習(xí)和實(shí)體學(xué)習(xí)2個(gè)步驟[28],如圖1所示。
圖1 電力系統(tǒng)知識(shí)圖譜自頂向下構(gòu)建方法Fig.1 Top-down construction method of the knowledge graph for power systems
2.1.1 本體學(xué)習(xí)
本體學(xué)習(xí)構(gòu)建知識(shí)圖譜的模式層,主要包括術(shù)語(yǔ)抽取、概念抽取、關(guān)系抽取以及規(guī)則學(xué)習(xí)4個(gè)步驟[28]。
a)術(shù)語(yǔ)抽取。術(shù)語(yǔ)是知識(shí)圖譜中的實(shí)體、概念在電力系統(tǒng)領(lǐng)域?qū)I(yè)化的固定表示形式。術(shù)語(yǔ)抽取的目標(biāo)是獲取用于表示電力系統(tǒng)中概念或本體的專業(yè)標(biāo)記集合。術(shù)語(yǔ)抽取的主要方法包括基于規(guī)則的方法、基于字典的方法和基于統(tǒng)計(jì)的方法等[30]。
b)概念抽取。在術(shù)語(yǔ)抽取的基礎(chǔ)上,進(jìn)一步對(duì)電力系統(tǒng)中的概念進(jìn)行抽取。概念是更加抽象、具有代表性和概括性的術(shù)語(yǔ),能夠代表一定范疇內(nèi)部的全部實(shí)體。例如,“線路”這一概念可代表“架空線”“電纜”“混合線路”等多個(gè)術(shù)語(yǔ)本體。概念抽取的方法包括基于規(guī)則的方法、基于統(tǒng)計(jì)的方法以及兩者相結(jié)合的方法等[29]。
c)關(guān)系抽取。關(guān)系抽取用于構(gòu)建概念之間的關(guān)系。對(duì)于電力系統(tǒng)中的概念,通過(guò)識(shí)別數(shù)據(jù)源中概念間的語(yǔ)義關(guān)聯(lián)關(guān)系,從而將其關(guān)系抽取出來(lái)。關(guān)系抽取方法包括基于詞法模式的方法、基于百科的方法和基于共現(xiàn)分析的方法等[18]。
d)規(guī)則學(xué)習(xí)。規(guī)則學(xué)習(xí)是指在本體抽取過(guò)程中,對(duì)包含了實(shí)體、關(guān)系的通用句式或者模板進(jìn)行學(xué)習(xí)的過(guò)程。在模式層中提煉得到的規(guī)則,可用于數(shù)據(jù)層的實(shí)體抽取中。常用的規(guī)則學(xué)習(xí)方法是基于自舉的方法[30]。
2.1.2 實(shí)體學(xué)習(xí)
實(shí)體學(xué)習(xí)構(gòu)建電力系統(tǒng)知識(shí)圖譜的數(shù)據(jù)層,在本體學(xué)習(xí)的基礎(chǔ)上,抽取數(shù)據(jù)中的實(shí)體及關(guān)系信息。這些抽取的實(shí)體可以根據(jù)其所對(duì)應(yīng)的概念,按照模式層的關(guān)系層次組成實(shí)體間的結(jié)構(gòu)關(guān)系。實(shí)體學(xué)習(xí)的主要關(guān)鍵技術(shù)包括實(shí)體對(duì)齊和實(shí)體填充[30]。
a)實(shí)體對(duì)齊。實(shí)體對(duì)齊是指將同一實(shí)體的不同表達(dá)方式歸一化的知識(shí)融合過(guò)程,也稱共指消歧(coreference resolution)。在原數(shù)據(jù)中,同一個(gè)實(shí)體可能由于語(yǔ)言習(xí)慣、使用范圍和應(yīng)用領(lǐng)域的不同而存在不同的表示方式。例如,在實(shí)際使用中,“#1母線”可能具有“#1M”“1#母線”“1M”等多種不同的表示方式。實(shí)體對(duì)齊將這些表達(dá)方式合并,使用全局唯一的標(biāo)志表征此實(shí)體,從而達(dá)到有效精簡(jiǎn)圖譜中實(shí)體數(shù)量、提高構(gòu)建和檢索效率的目的。實(shí)體對(duì)齊的方法包括基于概率的方法和基于機(jī)器學(xué)習(xí)的方法等[11]。
b)實(shí)體填充。實(shí)體填充為已獲得的實(shí)體增加描述,使得實(shí)體能夠更好地被人理解和區(qū)分。實(shí)體填充增加的描述數(shù)據(jù)包括實(shí)體屬性和實(shí)體同義名稱等[11]。例如,“#1母線”實(shí)體可填充的屬性包括“設(shè)備類型”“維護(hù)單位”“設(shè)備型號(hào)”“間隔數(shù)量”等。
自底向上方法先構(gòu)建電力系統(tǒng)知識(shí)圖譜的數(shù)據(jù)層,然后再構(gòu)建模式層[38,40]。在自底向上構(gòu)建中,首先從現(xiàn)有的結(jié)構(gòu)化數(shù)據(jù)或電力百科中提取實(shí)體、屬性和關(guān)系加入數(shù)據(jù)層,然后對(duì)這些知識(shí)要素進(jìn)行歸納,將其抽象為本體概念,并最終形成模式層。由此可見(jiàn),自底向上構(gòu)建是從具體到抽象,先有具體實(shí)現(xiàn)而后歸納抽象為概念規(guī)則的構(gòu)建過(guò)程[24]。自底向上構(gòu)建方法包括信息抽取、知識(shí)融合和知識(shí)加工3個(gè)步驟[34,44],如圖2所示。
圖2 電力系統(tǒng)知識(shí)圖譜自底向上構(gòu)建方法Fig.2 Bottom-up construction method of the knowledge graph for power systems
2.2.1 信息抽取
信息抽取從數(shù)據(jù)中抽取實(shí)體、屬性與實(shí)體間的相互關(guān)系。信息抽取的關(guān)鍵步驟包括實(shí)體抽取、關(guān)系抽取和屬性抽取[45]。
a)實(shí)體抽取。實(shí)體抽取從數(shù)據(jù)中抽取實(shí)體,實(shí)體抽取質(zhì)量對(duì)知識(shí)圖譜的構(gòu)建效率和質(zhì)量影響很大,是信息抽取的基礎(chǔ)和關(guān)鍵步驟。實(shí)體抽取的方法包括基于字典的方法、基于規(guī)則的方法、基于統(tǒng)計(jì)的方法和基于機(jī)器學(xué)習(xí)的方法等[29]。
b)關(guān)系抽取。關(guān)系抽取從語(yǔ)料數(shù)據(jù)中抽取實(shí)體之間的關(guān)聯(lián)關(guān)系,將離散的實(shí)體關(guān)聯(lián)起來(lái)形成網(wǎng)狀的知識(shí)結(jié)構(gòu)。常用的關(guān)系抽取方法包括基于規(guī)則的方法和基于學(xué)習(xí)的方法[46],其中后者又分為有監(jiān)督、半監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)。
c)屬性抽取。屬性抽取從數(shù)據(jù)中抽取實(shí)體的屬性信息,對(duì)實(shí)體進(jìn)行完整描述。由于實(shí)體的屬性可視為實(shí)體與屬性值之間的描述關(guān)系,所以可將屬性抽取問(wèn)題視為關(guān)系抽取問(wèn)題。從數(shù)據(jù)來(lái)源上區(qū)分,屬性抽取方法包括源于百科的方法和源于其他數(shù)據(jù)的方法[44]。
2.2.2 知識(shí)融合
由于數(shù)據(jù)來(lái)源和質(zhì)量的不同,信息抽取得到的數(shù)據(jù)層中可能存在大量的冗余和錯(cuò)誤,因此需要通過(guò)知識(shí)融合對(duì)這些抽取得到的數(shù)據(jù)進(jìn)行梳理和規(guī)范化整合。知識(shí)融合的關(guān)鍵步驟包括實(shí)體對(duì)齊和實(shí)體消歧[46]。
a)實(shí)體對(duì)齊。實(shí)體對(duì)齊與自頂向下構(gòu)建中的實(shí)體對(duì)齊類似,主要解決同一實(shí)體采用不同表達(dá)方式的問(wèn)題,將同一實(shí)體的不同表達(dá)方式歸一化表示。這兩者的不同在于,自頂向下構(gòu)建中的實(shí)體對(duì)齊主要針對(duì)數(shù)據(jù)源數(shù)據(jù),而知識(shí)融合中的實(shí)體對(duì)齊針對(duì)數(shù)據(jù)層中已經(jīng)抽取得到的實(shí)體數(shù)據(jù)。例如,如果已經(jīng)抽取得到“#1母線”“#1M”“1#母線”“1M”等多個(gè)實(shí)體,那么實(shí)體對(duì)齊過(guò)程會(huì)將這些實(shí)體合并為一個(gè)實(shí)體,用標(biāo)準(zhǔn)的“#1母線”對(duì)其進(jìn)行命名,并對(duì)這些實(shí)體的屬性、與其他實(shí)體的關(guān)聯(lián)關(guān)系等進(jìn)行合并。
b)實(shí)體消歧。實(shí)體消歧主要解決不同實(shí)體采用相同名稱的問(wèn)題,從而建立準(zhǔn)確的實(shí)體鏈接。在電力系統(tǒng)的實(shí)際語(yǔ)言環(huán)境中,經(jīng)常存在某個(gè)名稱對(duì)應(yīng)多個(gè)具體實(shí)體的問(wèn)題。例如,“#1母線”可以用于代表不同變電站內(nèi)的母線,也可以表示同一個(gè)變電站中不同電壓等級(jí)的母線。通過(guò)實(shí)體消歧,可以根據(jù)實(shí)體的不同屬性和關(guān)聯(lián)關(guān)系,區(qū)分這些不同實(shí)體。實(shí)體消歧的主要方法是聚類法[46]。
2.2.3 知識(shí)加工
知識(shí)加工是對(duì)已構(gòu)建好的實(shí)體網(wǎng)絡(luò)進(jìn)行抽象,將實(shí)體抽象為本體,由數(shù)據(jù)層構(gòu)建模式層的過(guò)程。知識(shí)加工的關(guān)鍵步驟包括本體構(gòu)建、知識(shí)推理和質(zhì)量評(píng)估[33]。
a)本體構(gòu)建。本體構(gòu)建將實(shí)體進(jìn)行抽象,進(jìn)而構(gòu)建本體。本體構(gòu)建既可以采用人工構(gòu)建,也可采用數(shù)據(jù)驅(qū)動(dòng)構(gòu)建。其中,數(shù)據(jù)驅(qū)動(dòng)構(gòu)建包含3個(gè)關(guān)鍵步驟:實(shí)體并列關(guān)系相似度計(jì)算、實(shí)體上下位關(guān)系抽取以及本體生成[46]。
b)知識(shí)推理。知識(shí)推理從模式層中已有的本體關(guān)系出發(fā),經(jīng)過(guò)推理建立新的關(guān)系。知識(shí)的推理方法包括基于邏輯的推理和基于圖的推理[33]。知識(shí)推理可以拓展和豐富圖譜中存儲(chǔ)的知識(shí),從現(xiàn)有知識(shí)中發(fā)掘新的知識(shí),是電力系統(tǒng)知識(shí)圖譜構(gòu)建的關(guān)鍵環(huán)節(jié)。例如,知識(shí)圖譜可以從電力系統(tǒng)連鎖事故實(shí)例的發(fā)展過(guò)程中識(shí)別系統(tǒng)的薄弱環(huán)節(jié),從而采取相應(yīng)的預(yù)防措施提升系統(tǒng)安全性。知識(shí)推理是知識(shí)圖譜的知識(shí)發(fā)現(xiàn)功能的核心環(huán)節(jié),其具有廣闊的應(yīng)用范圍。從層次上,知識(shí)推理不僅可用于模式層,也可應(yīng)用于數(shù)據(jù)層;從內(nèi)容上,知識(shí)推理不僅可用于關(guān)系推理,也可用于屬性推理;從階段上,知識(shí)推理不僅可用于知識(shí)圖譜構(gòu)建,也可用于知識(shí)圖譜更新和學(xué)習(xí)。
c)質(zhì)量評(píng)估。通過(guò)本體構(gòu)建和知識(shí)推理得到的模式層中可能存在錯(cuò)誤,如本體識(shí)別錯(cuò)誤、關(guān)系推理錯(cuò)誤或者邏輯錯(cuò)誤等。質(zhì)量評(píng)估通過(guò)量化知識(shí)的可信度,舍棄可信度較低的知識(shí),提高模式層的質(zhì)量。質(zhì)量評(píng)估的方法包括基于隨機(jī)抽取的方法、基于深度學(xué)習(xí)的方法和采用專家人工評(píng)定的方法等[33]。
電力系統(tǒng)中的知識(shí)在不斷增加和更新,知識(shí)圖譜在建成后還需要?jiǎng)討B(tài)構(gòu)建和迭代更新,不斷增加新的知識(shí)、刪除舊的知識(shí)并相應(yīng)調(diào)整知識(shí)圖譜的結(jié)構(gòu)。知識(shí)圖譜的更新包括數(shù)據(jù)層的更新和模式層的更新[20]。相對(duì)而言,數(shù)據(jù)層更新對(duì)知識(shí)圖譜的整體架構(gòu)影響較小,而模式層更新的影響較大;因此,知識(shí)圖譜的數(shù)據(jù)層往往可以采取自動(dòng)化的更新方式,而模式層更新則往往需要人工確認(rèn)和審核。
從更新方式上分,電力系統(tǒng)知識(shí)圖譜的更新可以分為增量更新和全量更新[47]。增量更新是以新增數(shù)據(jù)作為輸入對(duì)知識(shí)圖譜進(jìn)行更新,其資源消耗較??;全量更新是以更新后的全量數(shù)據(jù)作為輸入,從零開(kāi)始重新構(gòu)建知識(shí)圖譜,其資源消耗較大。
知識(shí)圖譜技術(shù)已經(jīng)在互聯(lián)網(wǎng)、金融、醫(yī)療等專業(yè)領(lǐng)域具有較為成熟的應(yīng)用,本文結(jié)合電力系統(tǒng)知識(shí)圖譜的特點(diǎn),介紹其在電力系統(tǒng)中的典型應(yīng)用。
電力系統(tǒng)的正常運(yùn)行依賴于各個(gè)業(yè)務(wù)系統(tǒng)間的數(shù)據(jù)傳遞和相互配合,而這些業(yè)務(wù)系統(tǒng)是先后在不同年代、不同平臺(tái)上建設(shè)的,它們所使用的數(shù)據(jù)庫(kù)、操作平臺(tái)和具體的數(shù)據(jù)結(jié)構(gòu)均可能不同,由此導(dǎo)致自動(dòng)化系統(tǒng)中大量異構(gòu)的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)出現(xiàn),例如不同格式的電網(wǎng)拓?fù)浜瓦\(yùn)行數(shù)據(jù)、電力設(shè)備信息、地理環(huán)境數(shù)據(jù)、氣象數(shù)據(jù)、音頻視頻和大量不同格式的文本數(shù)據(jù)等。為了實(shí)現(xiàn)這些異構(gòu)數(shù)據(jù)之間的溝通交互和信息集成,電力系統(tǒng)需要在不同平臺(tái)間加入大量的數(shù)據(jù)轉(zhuǎn)換接口和中間環(huán)節(jié)。這些數(shù)據(jù)平臺(tái)各自相對(duì)獨(dú)立,數(shù)據(jù)之間缺乏聯(lián)系,難以實(shí)現(xiàn)快速、跨平臺(tái)的數(shù)據(jù)檢索和集成管理。異構(gòu)數(shù)據(jù)管理和集成成為制約電網(wǎng)自動(dòng)化水平提高的瓶頸[48-51]。
電力系統(tǒng)知識(shí)圖譜繼承了本體和語(yǔ)義網(wǎng)技術(shù)在異構(gòu)數(shù)據(jù)集成和管理方面的優(yōu)勢(shì)[25]。在知識(shí)圖譜中,實(shí)體可以由不同結(jié)構(gòu)的數(shù)據(jù)構(gòu)成,這些實(shí)體通過(guò)關(guān)系相互連接形成網(wǎng)狀結(jié)構(gòu)。利用電力系統(tǒng)知識(shí)圖譜,可以有效組織、存儲(chǔ)和查詢電力系統(tǒng)中的異構(gòu)數(shù)據(jù),構(gòu)建可被各業(yè)務(wù)系統(tǒng)共享的電網(wǎng)運(yùn)行知識(shí)庫(kù)[41,52-54]。電力系統(tǒng)知識(shí)圖譜在異構(gòu)數(shù)據(jù)管理方面的典型業(yè)務(wù)場(chǎng)景,包括在能源互聯(lián)網(wǎng)中的能源數(shù)據(jù)管理[24]和包含眾多設(shè)備異構(gòu)化信息的電力設(shè)備信息管理[55],進(jìn)而建立電力系統(tǒng)中全業(yè)務(wù)貫通的統(tǒng)一數(shù)據(jù)中心[14]。數(shù)據(jù)中心將收集到的、分散在各個(gè)專業(yè)數(shù)據(jù)庫(kù)中的異構(gòu)數(shù)據(jù)整理起來(lái),實(shí)現(xiàn)跨專業(yè)的統(tǒng)一知識(shí)管理、數(shù)據(jù)關(guān)聯(lián)推理和數(shù)據(jù)檢索服務(wù)。統(tǒng)一數(shù)據(jù)中心可以實(shí)現(xiàn)電力系統(tǒng)中數(shù)據(jù)的“一處錄入、全網(wǎng)使用”,保障數(shù)據(jù)的真實(shí)性、完整性和一致性,減少跨專業(yè)數(shù)據(jù)檢索和溝通所需的人力資源成本。
隨著電力系統(tǒng)中知識(shí)總量的不斷增長(zhǎng),對(duì)知識(shí)的智能搜索和深度問(wèn)答需求也在逐漸增加。例如,社會(huì)公眾需要查詢電力能源相關(guān)政策、電力系統(tǒng)基礎(chǔ)科普知識(shí)和安全用電常識(shí)等,電力市場(chǎng)主體需要查詢電力市場(chǎng)規(guī)定需要披露的公開(kāi)信息和相關(guān)的發(fā)文通知,電網(wǎng)公司的員工需要查詢公司內(nèi)部的規(guī)程規(guī)章、公司內(nèi)部的辦事業(yè)務(wù)流程和所需材料等。傳統(tǒng)的搜索引擎僅能夠?qū)崿F(xiàn)簡(jiǎn)單的關(guān)鍵字匹配和檢索,缺乏靈活、智能和個(gè)性化的知識(shí)檢索方式,因此部分場(chǎng)合仍采取人工咨詢的方式,占用了較多的人力資源和溝通成本[21]。
電力系統(tǒng)知識(shí)圖譜可以實(shí)現(xiàn)智能化的搜索和深度問(wèn)答,采用知識(shí)圖譜技術(shù)的智能化人工助手能夠像人一樣與客戶聊天,也被稱為“聊天機(jī)器人”。當(dāng)用戶發(fā)起檢索時(shí),搜索引擎可以借助知識(shí)圖譜對(duì)用戶查詢的關(guān)鍵字進(jìn)行解析和推理,將其映射到具體概念或?qū)嶓w上,然后根據(jù)圖譜中的關(guān)聯(lián)關(guān)系,向用戶返回高質(zhì)量的搜索結(jié)果[46]。通過(guò)電力系統(tǒng)知識(shí)圖譜,智能語(yǔ)義搜索不僅可以通過(guò)上下文理解用戶所查詢的具體內(nèi)容,避免相同名稱引起的歧義,還可以提供與搜索結(jié)果相關(guān)的結(jié)構(gòu)化背景和相關(guān)知識(shí),使得搜索結(jié)果更為準(zhǔn)確和豐富。電力系統(tǒng)知識(shí)圖譜技術(shù)在智能搜索與深度問(wèn)答方面的典型場(chǎng)景包括電網(wǎng)模型本體智能問(wèn)答系統(tǒng)[19,56]、調(diào)度自動(dòng)化系統(tǒng)業(yè)務(wù)與流程檢索[51]和電力設(shè)備質(zhì)量綜合管理查詢系統(tǒng)[57]等。電力系統(tǒng)知識(shí)圖譜使得人機(jī)交互不僅可以使用傳統(tǒng)的搜索方式,還可以采用正常對(duì)話的形式。當(dāng)用戶提出問(wèn)題后,人工智能會(huì)對(duì)問(wèn)題進(jìn)行語(yǔ)義分析并將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并在檢索到答案后以自然語(yǔ)言的方式解答用戶的問(wèn)題或者執(zhí)行用戶指令[41,46]。例如當(dāng)用戶以“八月份電費(fèi)多少”這樣的問(wèn)題來(lái)查詢電費(fèi)時(shí),電力系統(tǒng)知識(shí)圖譜不僅能夠準(zhǔn)確識(shí)別問(wèn)題并回答,還可以給出按天和按時(shí)段的用電量統(tǒng)計(jì)分布,進(jìn)而針對(duì)性地給出節(jié)約用電的建議,如“中午時(shí)段將空調(diào)調(diào)高一度,一個(gè)月可以節(jié)約3%的電費(fèi)”。據(jù)統(tǒng)計(jì),1個(gè)省級(jí)電網(wǎng)客戶服務(wù)熱線受理的工單數(shù)年均數(shù)量可達(dá)400萬(wàn)條[20],且涉及業(yè)務(wù)咨詢、故障報(bào)修、投訴申訴等多種供電服務(wù)類型。使用電力系統(tǒng)知識(shí)圖譜可以大幅提高電力公司受理用戶服務(wù)的效率、縮減用戶等待時(shí)間、提升用戶體驗(yàn),使電網(wǎng)企業(yè)更好地為用戶服務(wù)。
電力系統(tǒng)的調(diào)度決策實(shí)質(zhì)上是對(duì)多維數(shù)據(jù)的處理和推理過(guò)程,這些需要處理的數(shù)據(jù)既包含當(dāng)前電網(wǎng)的實(shí)際狀態(tài)和事故的具體信息,也包含調(diào)度規(guī)范規(guī)程、故障處置預(yù)案、已有事故的處理過(guò)程和經(jīng)驗(yàn)等。調(diào)度決策就是調(diào)度員根據(jù)這些多維數(shù)據(jù),結(jié)合自己的工作經(jīng)驗(yàn)和專業(yè)知識(shí),推理事故發(fā)生的原因和處置方法,制訂調(diào)度決策隔離故障,減少停電損失,并使電力系統(tǒng)恢復(fù)到正常運(yùn)行狀態(tài)的過(guò)程?,F(xiàn)有的調(diào)度自動(dòng)化系統(tǒng)無(wú)法理解這些多維信息所代表的深層次含義,也無(wú)法利用這些信息實(shí)現(xiàn)事故處置的推理和決策;因此,當(dāng)前的電網(wǎng)調(diào)度仍然依賴于調(diào)度員的人工決策,而調(diào)度員在處理海量信息時(shí)受限于人的反應(yīng)速度和思考能力,難以在海量故障信息中及時(shí)準(zhǔn)確地識(shí)別故障并作出決策。此外,調(diào)度專家的經(jīng)驗(yàn)也難以傳承和積累[18]。
電力系統(tǒng)知識(shí)圖譜可以實(shí)現(xiàn)電力系統(tǒng)的調(diào)度輔助決策。目前,電力系統(tǒng)知識(shí)圖譜在輔助決策方面的典型場(chǎng)景包括電網(wǎng)調(diào)度控制決策[18,58-59]和電力通信網(wǎng)智慧大腦[60]等。圖譜對(duì)事故處理所需的多維數(shù)據(jù)進(jìn)行抽取、表達(dá)、學(xué)習(xí)、組織和存儲(chǔ),當(dāng)事故發(fā)生后根據(jù)事故特征對(duì)知識(shí)圖譜進(jìn)行檢索和推理,提供相關(guān)知識(shí)和決策方案為調(diào)度員提供輔助參考。對(duì)于事故處理中的部分非關(guān)鍵環(huán)節(jié),如故障初報(bào)、保護(hù)信息匯總、日志記錄、信息通報(bào),都可以由知識(shí)圖譜直接調(diào)用相關(guān)模塊完成,從而減少事故處理期間對(duì)調(diào)度員的干擾,使調(diào)度員能夠?qū)⒕杏谑鹿侍幚碇?。知識(shí)圖譜基于邏輯符號(hào)表達(dá)的推理過(guò)程對(duì)人是可解釋的,理解決策過(guò)程可以增加人對(duì)決策結(jié)果的信賴度,進(jìn)而增加輔助決策的實(shí)用性。根據(jù)每次的決策實(shí)踐效果,知識(shí)圖譜可以不斷更新完善,從而為決策提供全方位、多層次、動(dòng)態(tài)化的支持。
在理論算法層面,目前知識(shí)圖譜技術(shù)的研究熱點(diǎn)為如何改進(jìn)知識(shí)圖譜的建模方式和檢索算法,實(shí)現(xiàn)更加快速、智能、高效的圖譜構(gòu)建、知識(shí)檢索和推理應(yīng)用。典型的研究包括:文獻(xiàn)[61]提出了基于共享嵌入方案的多語(yǔ)言實(shí)體對(duì)齊技術(shù),通過(guò)嵌入學(xué)習(xí)過(guò)程和自學(xué)習(xí)對(duì)齊過(guò)程,利用文本語(yǔ)料庫(kù)附帶的監(jiān)督信號(hào)來(lái)改善實(shí)體對(duì)齊效果;文獻(xiàn)[62]探索了知識(shí)圖譜的多層次擴(kuò)展,將層次化和網(wǎng)絡(luò)可視化結(jié)合,構(gòu)建了統(tǒng)一數(shù)據(jù)表示的層次知識(shí)圖譜模型;文獻(xiàn)[63]提出了以貝葉斯網(wǎng)絡(luò)為知識(shí)表示和推理框架的知識(shí)圖譜知識(shí)檢索技術(shù),將知識(shí)圖譜中描述的領(lǐng)域知識(shí)與用戶行為記錄中蘊(yùn)含的知識(shí)進(jìn)行有效融合;文獻(xiàn)[64]用神經(jīng)模型對(duì)知識(shí)圖譜中的三元組進(jìn)行建模,從而可以根據(jù)學(xué)習(xí)過(guò)程構(gòu)建關(guān)系模型,并能夠準(zhǔn)確預(yù)測(cè)三元組的正確性;文獻(xiàn)[65]提出了基于辯論動(dòng)力學(xué)的知識(shí)圖自動(dòng)推理新方法,從而創(chuàng)建了能夠保持競(jìng)爭(zhēng)性預(yù)測(cè)準(zhǔn)確性的可解釋方法。
由于知識(shí)圖譜在電力系統(tǒng)領(lǐng)域的研究尚處于起步階段,已有研究更多地聚焦于探討知識(shí)圖譜在電力系統(tǒng)中具體的應(yīng)用場(chǎng)景,以及在這些場(chǎng)景中如何構(gòu)建相應(yīng)的電力系統(tǒng)知識(shí)圖譜。當(dāng)前知識(shí)圖譜在電力系統(tǒng)領(lǐng)域的應(yīng)用場(chǎng)景還比較有限,大多是原有智能系統(tǒng)應(yīng)用場(chǎng)景的直接擴(kuò)展,如電網(wǎng)運(yùn)行知識(shí)庫(kù)、信息管理系統(tǒng)、電力系統(tǒng)輔助決策等,將知識(shí)圖譜應(yīng)用于這些場(chǎng)景是原有應(yīng)用場(chǎng)景的擴(kuò)展和深化。然而,知識(shí)圖譜作為優(yōu)質(zhì)的知識(shí)組織、存儲(chǔ)、獲取和查詢方法,在電力系統(tǒng)領(lǐng)域具有更為廣闊的應(yīng)用前景和潛力。為了擴(kuò)展知識(shí)圖譜技術(shù)在電力系統(tǒng)中的應(yīng)用場(chǎng)景,可能存在以下關(guān)鍵問(wèn)題和研究方向。
目前,電力系統(tǒng)中的知識(shí)大多分散存儲(chǔ)于各個(gè)不同的數(shù)據(jù)庫(kù)中,而且存在專業(yè)性強(qiáng)、異構(gòu)性高、關(guān)聯(lián)性大等特性,因此相比通用領(lǐng)域,電力系統(tǒng)知識(shí)圖譜的構(gòu)建中存在以下難題[58]:
a)電力系統(tǒng)知識(shí)圖譜構(gòu)建所能夠獲得的數(shù)據(jù)源較少,沒(méi)有成熟的開(kāi)放語(yǔ)料庫(kù)可供訓(xùn)練和學(xué)習(xí),缺乏足量可復(fù)用的知識(shí)源。而在通用領(lǐng)域,數(shù)據(jù)來(lái)源較多,而且已有較為成熟的開(kāi)放語(yǔ)料庫(kù)。
b)電力系統(tǒng)知識(shí)圖譜可供學(xué)習(xí)的數(shù)據(jù)一般比較零散、非結(jié)構(gòu)化、質(zhì)量不一,在知識(shí)圖譜構(gòu)建過(guò)程中本體、實(shí)體等知識(shí)的抽取難度較大,難以制訂統(tǒng)一化的抽取規(guī)則。在開(kāi)放通用領(lǐng)域,出現(xiàn)次數(shù)多的實(shí)體一般是用戶更為關(guān)注、也即更為關(guān)鍵的實(shí)體。然而在電力系統(tǒng)的語(yǔ)料數(shù)據(jù)中,很多關(guān)鍵概念的出現(xiàn)次數(shù)并不一定很多。如果采用通用的知識(shí)抽取方法,這些概念就有可能在抽取中被棄置。
c)電力系統(tǒng)知識(shí)圖譜構(gòu)建時(shí)需要分別對(duì)各專業(yè)的業(yè)務(wù)需求和經(jīng)驗(yàn)進(jìn)行梳理和分類,不同專業(yè)間的業(yè)務(wù)壁壘可能導(dǎo)致知識(shí)圖譜構(gòu)建方法適用范圍的局限性。
因此,電力系統(tǒng)知識(shí)圖譜無(wú)法直接采用與通用領(lǐng)域相同的構(gòu)建方法,必須針對(duì)性地對(duì)其構(gòu)建方法展開(kāi)研究,并在應(yīng)用于不同專業(yè)時(shí)對(duì)其進(jìn)行差異化調(diào)整。后續(xù)研究需在理解電力系統(tǒng)知識(shí)特性的基礎(chǔ)上,挖掘不同專業(yè)中知識(shí)表達(dá)的固定模式,研發(fā)適用于電力系統(tǒng)的自動(dòng)化知識(shí)抽取方法,從而提升知識(shí)圖譜構(gòu)建的規(guī)模和精確性。此外,電力系統(tǒng)中存在一些比較晦澀難懂的專業(yè)術(shù)語(yǔ)和表達(dá)方式,這些術(shù)語(yǔ)和方式難以簡(jiǎn)單從字面意義上理解,也難以完全通過(guò)機(jī)器學(xué)習(xí)過(guò)程準(zhǔn)確納入知識(shí)圖譜。因此電力系統(tǒng)知識(shí)圖譜的構(gòu)建必須有專家參與,由專家對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)注,使數(shù)據(jù)包含一定的語(yǔ)義信息用于機(jī)器理解和學(xué)習(xí)。如何篩選需要專家標(biāo)注的數(shù)據(jù)、如何使得機(jī)器讀懂專家標(biāo)注的語(yǔ)料信息、如何在保證準(zhǔn)確性的前提下盡量減少構(gòu)建過(guò)程中所需的專家工作量,都是電力系統(tǒng)知識(shí)圖譜構(gòu)建中需要研究的關(guān)鍵技術(shù)和難題。
知識(shí)推理是電力系統(tǒng)知識(shí)圖譜知識(shí)發(fā)現(xiàn)的主要方式。通過(guò)電力系統(tǒng)知識(shí)圖譜的知識(shí)推理,有助于知識(shí)圖譜挖掘出現(xiàn)有數(shù)據(jù)中沒(méi)有明確表達(dá)的隱含關(guān)聯(lián)關(guān)系,從而使知識(shí)圖譜更好地理解人的思路。這些關(guān)聯(lián)關(guān)系可能在技術(shù)人員日常交流時(shí)作為無(wú)需特意指出的常識(shí)或者默認(rèn)前提,從而使得知識(shí)圖譜更好地滿足電力系統(tǒng)中知識(shí)管理、檢索和決策的需求。同時(shí),知識(shí)推理也有助于知識(shí)圖譜挖掘出新的知識(shí)關(guān)聯(lián)關(guān)系,從而豐富電力系統(tǒng)中的知識(shí),并反過(guò)來(lái)促進(jìn)人的思考和提升對(duì)電力系統(tǒng)的理解。
在現(xiàn)有電力系統(tǒng)知識(shí)圖譜的研究中,尚未提出有效的知識(shí)推理方法。為了實(shí)現(xiàn)電力系統(tǒng)知識(shí)圖譜的知識(shí)推理,一方面要研究符號(hào)化的自動(dòng)知識(shí)推理方式,結(jié)合已有的基于圖和基于邏輯的推理方法,分別設(shè)計(jì)模式層和數(shù)據(jù)層的推理方法,并給出新知識(shí)在2個(gè)層次間相互印證和啟發(fā)的機(jī)制。另外一方面,需要制訂知識(shí)推理的評(píng)判指標(biāo)和驗(yàn)證流程,通過(guò)指標(biāo)對(duì)推理出的知識(shí)進(jìn)行評(píng)判和篩選,綜合利用邏輯判斷、仿真分析、實(shí)例驗(yàn)證等方法,剔除不合理的知識(shí)、保留更為合理的知識(shí),并最后提交專家進(jìn)行鑒別和篩選。
當(dāng)前電力系統(tǒng)處于史無(wú)前例的發(fā)展變革中,新廠站、新線路、新設(shè)備不斷接入,增量配電網(wǎng)業(yè)務(wù)逐漸推進(jìn),市場(chǎng)化改革使得電網(wǎng)運(yùn)營(yíng)方式和調(diào)度模式不斷變化,電力系統(tǒng)中的知識(shí)也在經(jīng)歷不斷增加和更新?lián)Q代,因而電力知識(shí)圖譜也需要不斷地學(xué)習(xí)和更新。
現(xiàn)有研究中,電力知識(shí)圖譜的更新技術(shù)對(duì)人工干預(yù)的依賴性較大,導(dǎo)致知識(shí)圖譜更新的工作量很大??梢灶A(yù)見(jiàn),隨著知識(shí)不斷積累,依靠人工制訂規(guī)則和逐條檢視等圖譜更新模式所需的人力資源將大幅增加,而且其更新頻率也將無(wú)法滿足電力系統(tǒng)的實(shí)際需要。特別是將知識(shí)圖譜應(yīng)用于電力調(diào)度輔助決策中時(shí),由于電力系統(tǒng)狀態(tài)隨著負(fù)荷分布、發(fā)電出力、系統(tǒng)拓?fù)涞任锢砹康淖兓鴮?shí)時(shí)變化,電力系統(tǒng)的控制原則和事故處置過(guò)程也可能隨時(shí)變化,電力系統(tǒng)知識(shí)圖譜的更新頻率也必須與之匹配,才能夠在事故發(fā)生時(shí)給出與系統(tǒng)實(shí)際相符的實(shí)用決策建議。研究電力系統(tǒng)知識(shí)圖譜的自動(dòng)化增量更新方法,制訂指標(biāo)對(duì)其更新質(zhì)量進(jìn)行評(píng)估,并在更新質(zhì)量過(guò)低時(shí)及時(shí)舍棄更新或?qū)で笕斯じ深A(yù),進(jìn)而通過(guò)反復(fù)迭代提高自動(dòng)化更新質(zhì)量,減少更新過(guò)程對(duì)人工干預(yù)的依賴,同樣是電力系統(tǒng)知識(shí)圖譜的重要研究方向之一。
在當(dāng)今的大數(shù)據(jù)時(shí)代,各行業(yè)知識(shí)都面臨爆炸式增長(zhǎng),知識(shí)的表達(dá)和組織方式成為了各專業(yè)領(lǐng)域的研究熱點(diǎn)。知識(shí)圖譜是以圖的形式存儲(chǔ)實(shí)體及實(shí)體間關(guān)系的知識(shí)庫(kù),可以實(shí)現(xiàn)有效的知識(shí)組織、管理和利用。為了將知識(shí)圖譜技術(shù)應(yīng)用于電力系統(tǒng),本文介紹了電力系統(tǒng)知識(shí)圖譜的概念、構(gòu)建方法及其應(yīng)用場(chǎng)景。
目前知識(shí)圖譜技術(shù)在電力系統(tǒng)中的應(yīng)用研究尚處于初步階段,針對(duì)現(xiàn)有研究的不足,本文提出了知識(shí)圖譜在電力系統(tǒng)中應(yīng)用的關(guān)鍵問(wèn)題和可能的研究方向,以期為后續(xù)研究提供參考。