林冠強 李惠松
[摘? ? 要]面向越來越復(fù)雜的電網(wǎng)領(lǐng)域,采用智能化技術(shù)構(gòu)建了新型電網(wǎng)知識圖譜(Knowledge Graph—KG),結(jié)合大數(shù)據(jù)和云計算的多元化服務(wù)需求,分析知識圖譜在電網(wǎng)中的應(yīng)用。針對知識圖譜共建、共享需求,設(shè)計出知識圖譜框架與本體庫,提出切實的知識識別與關(guān)系抽取的實用化方法,為大規(guī)模知識圖譜構(gòu)建提供實用化技術(shù)支持,改善電網(wǎng)業(yè)務(wù)文件數(shù)字化自動提取水平和電網(wǎng)知識檢索技術(shù),降低專業(yè)要求,同時提升電網(wǎng)知識圖譜構(gòu)建效率。
[關(guān)鍵詞]電網(wǎng)領(lǐng)域;智能化技術(shù);知識圖譜;知識識別;關(guān)系抽取
[中圖分類號]TP18 [文獻標志碼]A [文章編號]2095–6487(2021)04–00–02
Construction and Application of Power Grid Knowledge Graph
Lin Guan-qiang,Li Hui-song
[Abstract]Facing the increasingly complex power grid field, intelligent technology is adopted to construct a new power grid knowledge graph (KG—Knowledge Graph), combining the diversified service requirements of big data and cloud computing, and analyzing the application of knowledge graph in the power grid. In response to the requirements of co-construction and sharing of knowledge graphs, a knowledge graph framework and ontology library are designed, and practical methods of knowledge identification and relationship extraction are proposed, which provide practical technical support for large-scale knowledge graph construction. Improve the digital automatic extraction level of power grid business documents and power grid knowledge retrieval technology, reduce professional requirements, and improve the efficiency of power grid knowledge map construction.
[Keywords]power grid field; intelligent technology; knowledge graph; knowledge recognition; relation extraction
2012年,為了進一步改善網(wǎng)絡(luò)搜索的質(zhì)量與速度,美國Google公司首次提出了知識圖譜(Knowledge Graph—KG)這一說法,其中涉及三個方面:實體、屬性和關(guān)系。實體通常為客觀存在的事物,屬性通常用來表達事物的特征,關(guān)系通常用來實現(xiàn)實體之間或者實體與屬性之間的互聯(lián)。實際上,KG為語義網(wǎng)絡(luò),KG中前兩個方面對應(yīng)語義網(wǎng)絡(luò)的節(jié)點,而后一個方面對應(yīng)語義網(wǎng)絡(luò)的邊。針對各種數(shù)據(jù)形式,KG構(gòu)建方法為:抽取,融合,表示,驗證與推理(圖1)。數(shù)據(jù)來源有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),抽取方法有三類,屬性抽取、關(guān)系抽取和實體抽取。依據(jù)不同的領(lǐng)域,KG主要分為兩大類:通用領(lǐng)域和專業(yè)領(lǐng)域。前者涵蓋面廣,包含的信息量豐富,然而專業(yè)性不高;后者具有一定的針對性,從而實現(xiàn)數(shù)據(jù)的深度挖掘。
隨著電網(wǎng)的不斷發(fā)展和完善,產(chǎn)生了大量的電網(wǎng)數(shù)據(jù),通過利用這些數(shù)據(jù),有利于提高電網(wǎng)的智能化水平。目前,電網(wǎng)提出能源物聯(lián)網(wǎng)的概念,關(guān)鍵是建立滿足電網(wǎng)需要的智能化電力知識平臺。本文基于知識圖譜技術(shù),結(jié)合KG技術(shù)和電網(wǎng)知識,形成電網(wǎng)專業(yè)KG,抽取電網(wǎng)裝置的運行信息、管理數(shù)據(jù)和文獻信息等數(shù)據(jù),構(gòu)建電網(wǎng)KG。把電網(wǎng)中各方面的知識進行深度的融合,智能挖掘電網(wǎng)中的有用信息,引導(dǎo)和拓展新的電網(wǎng)發(fā)展方向。
1 電網(wǎng)KG構(gòu)建
由于電網(wǎng)沒有建立統(tǒng)一的知識平臺,甚至每個部門設(shè)置了不同的信息庫,使得電網(wǎng)生產(chǎn)、運行和服務(wù)等各個環(huán)節(jié)均形成了大量的信息,例如,電流、電壓和頻率的變化,開關(guān)狀態(tài)的改變,電表信息。電網(wǎng)信息化的持續(xù)發(fā)展,產(chǎn)生的電網(wǎng)數(shù)據(jù)量越來越多,所需時間越來越短。然而,這些數(shù)據(jù)輸出沒有統(tǒng)一的格式,不僅含有結(jié)構(gòu)化數(shù)據(jù),也存在各類非結(jié)構(gòu)化數(shù)據(jù),包括文本、音視頻。KG中針對多源數(shù)據(jù)來說,結(jié)構(gòu)化數(shù)據(jù)通常能夠直接進行知識融合;半結(jié)構(gòu)化數(shù)據(jù)需要采用篩選的辦法,消除干擾數(shù)據(jù),進行知識抽取,從而規(guī)范數(shù)據(jù),形成結(jié)構(gòu)化數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)通常為文本信息,知識抽取過程比較復(fù)雜,包括實體識別、屬性抽取和關(guān)系抽取三個方面。
電網(wǎng)KG構(gòu)建,能夠把電網(wǎng)各種數(shù)據(jù)重新進行整合,從而方便數(shù)據(jù)的管理與查找,形成真正意義的電網(wǎng)智能化。為了構(gòu)建電網(wǎng)KG,首先需要全面獲取電網(wǎng)術(shù)語,通過這些術(shù)語形成電網(wǎng)專業(yè)KG基礎(chǔ)。術(shù)語抽取采用形式化方法,根據(jù)電力相關(guān)的置信度,分析該術(shù)語的可靠性。然而,如果該術(shù)語使用的概率比較小,會降低術(shù)語的重要性,增加該術(shù)語的統(tǒng)計難度。進一步設(shè)置電網(wǎng)專業(yè)詞典,有利于理解相關(guān)專業(yè)術(shù)語,增進電網(wǎng)知識學(xué)習(xí),促進電網(wǎng)發(fā)展,如圖2所示。
通過電網(wǎng)專業(yè)詞典能夠查找相關(guān)信息,有助于理解這些專業(yè)術(shù)語,降低KG的構(gòu)建難度。這些術(shù)語來源包括論文數(shù)據(jù)、百科數(shù)據(jù)和其他數(shù)據(jù),然后初步構(gòu)建術(shù)語語義圖,依據(jù)置信度進行排序,基于語義相似度的詞條進行匹配,最后基于隸屬度的定義抽取。電網(wǎng)專業(yè)詞典是KG基本數(shù)據(jù),對于詞典中數(shù)據(jù)的量和質(zhì)要求非常高,量不足使得覆蓋面不廣,質(zhì)不高使得定義不準確,均難以達到實際效果。然而,整個電網(wǎng)存在的設(shè)備儀器眾多,專業(yè)術(shù)語龐雜,同一設(shè)備可能存在多個定義名稱,提高了專業(yè)詞典的抽取難度。因此,專業(yè)詞典確定過程中,需要進行人工確認,進一步限制了詞典中數(shù)據(jù)的量和質(zhì)。目前,隨著電力物聯(lián)網(wǎng)的建設(shè),采用大數(shù)據(jù)和云計算等先進技術(shù),以及人工智能的普及,使得電網(wǎng)KG的構(gòu)建成為可能,基本涵蓋了電網(wǎng)的各個領(lǐng)域,包括變壓器本體、輸電線路、配電物聯(lián)網(wǎng)、柔性交流系統(tǒng)、網(wǎng)絡(luò)控制、信息安全等。
2 電網(wǎng)KG應(yīng)用分析
近些年,電網(wǎng)得到大力發(fā)展,信息化普及程度較高,積累了大量運行數(shù)據(jù),具有非常高的資源與需求價值,為電網(wǎng)KG的構(gòu)建提供了前提條件。電網(wǎng)KG的應(yīng)用領(lǐng)域涉及多個學(xué)科,主要分為應(yīng)用層和感知層,應(yīng)用層分為配電物聯(lián)網(wǎng)和新一代智能電表,配電物聯(lián)網(wǎng)的應(yīng)用組件分為停電管理、電能質(zhì)量監(jiān)測和自動無功補償,其中停電管理含有網(wǎng)絡(luò)發(fā)令和一體化電網(wǎng)平臺;電能質(zhì)量監(jiān)測含有電能監(jiān)控和電力參數(shù)測量;自動無功補償含有環(huán)網(wǎng)接線和配電網(wǎng)無功補償系統(tǒng)。新一代智能電表支撐技術(shù)分為即插即用、邊緣計算和非介入式電荷分解,其中即插即用含有實時性測試和模塊化測試;邊緣計算含有流數(shù)據(jù)處理和計算遷移;非介入式電荷分解含有數(shù)據(jù)處理、事件檢測、特征提取和負荷識別。感知層可以分為智能終端和能源路由器,智能終端的支撐技術(shù)分為輸電類終端和配電類終端,前者主要為交換機,后者主要為網(wǎng)絡(luò)設(shè)備;能源路由器的支撐技術(shù)為路由器,包括交換機設(shè)備、背板總線、信息外網(wǎng)和局域網(wǎng)交換機。
通過這些學(xué)科的知識挖掘發(fā)現(xiàn),未來電網(wǎng)發(fā)展的熱點領(lǐng)域有人工智能、網(wǎng)絡(luò)安全、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈和芯片,因此,該KG的建立,能夠有效指導(dǎo)電網(wǎng)的發(fā)展。電網(wǎng)專業(yè)詞典和KG的構(gòu)建,以及和現(xiàn)代科技的強力結(jié)合,給電網(wǎng)研究指明了方向。這種智能化信息化方式,極大提高了電網(wǎng)的運維水平和管理效率,節(jié)約了大量的人力物力和財力成本,使得電網(wǎng)決策更加科學(xué)合理。未來電網(wǎng)在配電物聯(lián)網(wǎng)、新一代智能電表、輸電物聯(lián)網(wǎng)、電力金融、負荷分解、電能質(zhì)量監(jiān)測、線路監(jiān)測、配電終端、電能計量、停電管理和用電安全等方面,將更多地融合可視化、虛擬現(xiàn)實、語音識別、安全性和隱私、機器人、推薦系統(tǒng)、自然語言處理、多媒體、機器學(xué)習(xí)、物聯(lián)網(wǎng)、信息檢索、人機交互、數(shù)據(jù)庫、數(shù)據(jù)挖掘、計算機視覺、計算機圖形學(xué)和人工智能等技術(shù)。
采用人工智能技術(shù),形成電網(wǎng)KG,結(jié)合電網(wǎng)的應(yīng)用領(lǐng)域與人工智能的應(yīng)用領(lǐng)域進行分析,深入數(shù)據(jù)挖掘,得到以往的數(shù)據(jù)研究情況,判斷以后的研究方向。目前采用的技術(shù)有:循環(huán)神經(jīng)網(wǎng)絡(luò)技術(shù)、交叉創(chuàng)新笛卡爾智能分析技術(shù)和長短期記憶網(wǎng)絡(luò)技術(shù)等。依照數(shù)據(jù)采集數(shù)量,建立某個領(lǐng)域的研究模型。
3 結(jié)束語
電網(wǎng)KG的構(gòu)建和應(yīng)用,有利于解決電網(wǎng)專業(yè)知識碎片化的問題,聚焦現(xiàn)代智能技術(shù),從各類數(shù)據(jù)庫出發(fā),開展電網(wǎng)KG構(gòu)建,研發(fā)云數(shù)據(jù)中心KG管理平臺。在此基礎(chǔ)上,開發(fā)基于知識圖譜智能分析模塊,為電網(wǎng)建立大規(guī)模、共享型的KG資源,提供知識計算服務(wù),從而充分發(fā)揮大數(shù)據(jù)和KG的價值。
參考文獻
[1] 俞陽.基于知識圖譜的電力知識平臺關(guān)鍵技術(shù)研究[D].南京:東南大學(xué),2018.
[2] BIZER C,LEHMANN J,KOBILAROV G,et al.DBpedia-a crystallization point for the web of data[J].Web Semantics:Science,Services and Agents on the World Wide Web,2019,7(3):154-165.
[3] 郭云峰,韓龍,皮立華,等.知識圖譜在大數(shù)據(jù)中的應(yīng)用[J].電信技術(shù),2015,1(6):25-29.
[4] WANG J Z,DU Z,PAYATTAKOOL R,et al.A new method to measure the semantic similarity of GO terms[J].Bioinformatics,2017,23(10):1274-1281.
[5] 傅質(zhì)馨,李瀟逸,袁越.泛在電力物聯(lián)網(wǎng)關(guān)鍵技術(shù)探討[J].電力建設(shè),2019,40(5):5-16.
[6] ZHAO L,ZHANG Q.Mapping knowledge domains of Chinese digital library research output,2014–2019[J].Scientometrics,2020,9(1):51-87.
[7] 蔣瑋,周穎,陳舒淇,等.電網(wǎng)基建工程數(shù)據(jù)挖掘及知識圖譜構(gòu)建技術(shù)研究[J].電力信息與通信技術(shù),2021,19(2):15-22.
[8] 武斌,張賓,周晶,孫博,等.知識圖譜在電力領(lǐng)域的應(yīng)用與思考[J].科技經(jīng)濟導(dǎo)刊,2020,28(16):33.