林冠強 李惠松
[摘? ? 要]面向越來越復雜的電網(wǎng)領域,采用智能化技術構建了新型電網(wǎng)知識圖譜(Knowledge Graph—KG),結合大數(shù)據(jù)和云計算的多元化服務需求,分析知識圖譜在電網(wǎng)中的應用。針對知識圖譜共建、共享需求,設計出知識圖譜框架與本體庫,提出切實的知識識別與關系抽取的實用化方法,為大規(guī)模知識圖譜構建提供實用化技術支持,改善電網(wǎng)業(yè)務文件數(shù)字化自動提取水平和電網(wǎng)知識檢索技術,降低專業(yè)要求,同時提升電網(wǎng)知識圖譜構建效率。
[關鍵詞]電網(wǎng)領域;智能化技術;知識圖譜;知識識別;關系抽取
[中圖分類號]TP18 [文獻標志碼]A [文章編號]2095–6487(2021)04–00–02
Construction and Application of Power Grid Knowledge Graph
Lin Guan-qiang,Li Hui-song
[Abstract]Facing the increasingly complex power grid field, intelligent technology is adopted to construct a new power grid knowledge graph (KG—Knowledge Graph), combining the diversified service requirements of big data and cloud computing, and analyzing the application of knowledge graph in the power grid. In response to the requirements of co-construction and sharing of knowledge graphs, a knowledge graph framework and ontology library are designed, and practical methods of knowledge identification and relationship extraction are proposed, which provide practical technical support for large-scale knowledge graph construction. Improve the digital automatic extraction level of power grid business documents and power grid knowledge retrieval technology, reduce professional requirements, and improve the efficiency of power grid knowledge map construction.
[Keywords]power grid field; intelligent technology; knowledge graph; knowledge recognition; relation extraction
2012年,為了進一步改善網(wǎng)絡搜索的質量與速度,美國Google公司首次提出了知識圖譜(Knowledge Graph—KG)這一說法,其中涉及三個方面:實體、屬性和關系。實體通常為客觀存在的事物,屬性通常用來表達事物的特征,關系通常用來實現(xiàn)實體之間或者實體與屬性之間的互聯(lián)。實際上,KG為語義網(wǎng)絡,KG中前兩個方面對應語義網(wǎng)絡的節(jié)點,而后一個方面對應語義網(wǎng)絡的邊。針對各種數(shù)據(jù)形式,KG構建方法為:抽取,融合,表示,驗證與推理(圖1)。數(shù)據(jù)來源有結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù),抽取方法有三類,屬性抽取、關系抽取和實體抽取。依據(jù)不同的領域,KG主要分為兩大類:通用領域和專業(yè)領域。前者涵蓋面廣,包含的信息量豐富,然而專業(yè)性不高;后者具有一定的針對性,從而實現(xiàn)數(shù)據(jù)的深度挖掘。
隨著電網(wǎng)的不斷發(fā)展和完善,產(chǎn)生了大量的電網(wǎng)數(shù)據(jù),通過利用這些數(shù)據(jù),有利于提高電網(wǎng)的智能化水平。目前,電網(wǎng)提出能源物聯(lián)網(wǎng)的概念,關鍵是建立滿足電網(wǎng)需要的智能化電力知識平臺。本文基于知識圖譜技術,結合KG技術和電網(wǎng)知識,形成電網(wǎng)專業(yè)KG,抽取電網(wǎng)裝置的運行信息、管理數(shù)據(jù)和文獻信息等數(shù)據(jù),構建電網(wǎng)KG。把電網(wǎng)中各方面的知識進行深度的融合,智能挖掘電網(wǎng)中的有用信息,引導和拓展新的電網(wǎng)發(fā)展方向。
1 電網(wǎng)KG構建
由于電網(wǎng)沒有建立統(tǒng)一的知識平臺,甚至每個部門設置了不同的信息庫,使得電網(wǎng)生產(chǎn)、運行和服務等各個環(huán)節(jié)均形成了大量的信息,例如,電流、電壓和頻率的變化,開關狀態(tài)的改變,電表信息。電網(wǎng)信息化的持續(xù)發(fā)展,產(chǎn)生的電網(wǎng)數(shù)據(jù)量越來越多,所需時間越來越短。然而,這些數(shù)據(jù)輸出沒有統(tǒng)一的格式,不僅含有結構化數(shù)據(jù),也存在各類非結構化數(shù)據(jù),包括文本、音視頻。KG中針對多源數(shù)據(jù)來說,結構化數(shù)據(jù)通常能夠直接進行知識融合;半結構化數(shù)據(jù)需要采用篩選的辦法,消除干擾數(shù)據(jù),進行知識抽取,從而規(guī)范數(shù)據(jù),形成結構化數(shù)據(jù);非結構化數(shù)據(jù)通常為文本信息,知識抽取過程比較復雜,包括實體識別、屬性抽取和關系抽取三個方面。
電網(wǎng)KG構建,能夠把電網(wǎng)各種數(shù)據(jù)重新進行整合,從而方便數(shù)據(jù)的管理與查找,形成真正意義的電網(wǎng)智能化。為了構建電網(wǎng)KG,首先需要全面獲取電網(wǎng)術語,通過這些術語形成電網(wǎng)專業(yè)KG基礎。術語抽取采用形式化方法,根據(jù)電力相關的置信度,分析該術語的可靠性。然而,如果該術語使用的概率比較小,會降低術語的重要性,增加該術語的統(tǒng)計難度。進一步設置電網(wǎng)專業(yè)詞典,有利于理解相關專業(yè)術語,增進電網(wǎng)知識學習,促進電網(wǎng)發(fā)展,如圖2所示。
通過電網(wǎng)專業(yè)詞典能夠查找相關信息,有助于理解這些專業(yè)術語,降低KG的構建難度。這些術語來源包括論文數(shù)據(jù)、百科數(shù)據(jù)和其他數(shù)據(jù),然后初步構建術語語義圖,依據(jù)置信度進行排序,基于語義相似度的詞條進行匹配,最后基于隸屬度的定義抽取。電網(wǎng)專業(yè)詞典是KG基本數(shù)據(jù),對于詞典中數(shù)據(jù)的量和質要求非常高,量不足使得覆蓋面不廣,質不高使得定義不準確,均難以達到實際效果。然而,整個電網(wǎng)存在的設備儀器眾多,專業(yè)術語龐雜,同一設備可能存在多個定義名稱,提高了專業(yè)詞典的抽取難度。因此,專業(yè)詞典確定過程中,需要進行人工確認,進一步限制了詞典中數(shù)據(jù)的量和質。目前,隨著電力物聯(lián)網(wǎng)的建設,采用大數(shù)據(jù)和云計算等先進技術,以及人工智能的普及,使得電網(wǎng)KG的構建成為可能,基本涵蓋了電網(wǎng)的各個領域,包括變壓器本體、輸電線路、配電物聯(lián)網(wǎng)、柔性交流系統(tǒng)、網(wǎng)絡控制、信息安全等。
2 電網(wǎng)KG應用分析
近些年,電網(wǎng)得到大力發(fā)展,信息化普及程度較高,積累了大量運行數(shù)據(jù),具有非常高的資源與需求價值,為電網(wǎng)KG的構建提供了前提條件。電網(wǎng)KG的應用領域涉及多個學科,主要分為應用層和感知層,應用層分為配電物聯(lián)網(wǎng)和新一代智能電表,配電物聯(lián)網(wǎng)的應用組件分為停電管理、電能質量監(jiān)測和自動無功補償,其中停電管理含有網(wǎng)絡發(fā)令和一體化電網(wǎng)平臺;電能質量監(jiān)測含有電能監(jiān)控和電力參數(shù)測量;自動無功補償含有環(huán)網(wǎng)接線和配電網(wǎng)無功補償系統(tǒng)。新一代智能電表支撐技術分為即插即用、邊緣計算和非介入式電荷分解,其中即插即用含有實時性測試和模塊化測試;邊緣計算含有流數(shù)據(jù)處理和計算遷移;非介入式電荷分解含有數(shù)據(jù)處理、事件檢測、特征提取和負荷識別。感知層可以分為智能終端和能源路由器,智能終端的支撐技術分為輸電類終端和配電類終端,前者主要為交換機,后者主要為網(wǎng)絡設備;能源路由器的支撐技術為路由器,包括交換機設備、背板總線、信息外網(wǎng)和局域網(wǎng)交換機。
通過這些學科的知識挖掘發(fā)現(xiàn),未來電網(wǎng)發(fā)展的熱點領域有人工智能、網(wǎng)絡安全、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈和芯片,因此,該KG的建立,能夠有效指導電網(wǎng)的發(fā)展。電網(wǎng)專業(yè)詞典和KG的構建,以及和現(xiàn)代科技的強力結合,給電網(wǎng)研究指明了方向。這種智能化信息化方式,極大提高了電網(wǎng)的運維水平和管理效率,節(jié)約了大量的人力物力和財力成本,使得電網(wǎng)決策更加科學合理。未來電網(wǎng)在配電物聯(lián)網(wǎng)、新一代智能電表、輸電物聯(lián)網(wǎng)、電力金融、負荷分解、電能質量監(jiān)測、線路監(jiān)測、配電終端、電能計量、停電管理和用電安全等方面,將更多地融合可視化、虛擬現(xiàn)實、語音識別、安全性和隱私、機器人、推薦系統(tǒng)、自然語言處理、多媒體、機器學習、物聯(lián)網(wǎng)、信息檢索、人機交互、數(shù)據(jù)庫、數(shù)據(jù)挖掘、計算機視覺、計算機圖形學和人工智能等技術。
采用人工智能技術,形成電網(wǎng)KG,結合電網(wǎng)的應用領域與人工智能的應用領域進行分析,深入數(shù)據(jù)挖掘,得到以往的數(shù)據(jù)研究情況,判斷以后的研究方向。目前采用的技術有:循環(huán)神經(jīng)網(wǎng)絡技術、交叉創(chuàng)新笛卡爾智能分析技術和長短期記憶網(wǎng)絡技術等。依照數(shù)據(jù)采集數(shù)量,建立某個領域的研究模型。
3 結束語
電網(wǎng)KG的構建和應用,有利于解決電網(wǎng)專業(yè)知識碎片化的問題,聚焦現(xiàn)代智能技術,從各類數(shù)據(jù)庫出發(fā),開展電網(wǎng)KG構建,研發(fā)云數(shù)據(jù)中心KG管理平臺。在此基礎上,開發(fā)基于知識圖譜智能分析模塊,為電網(wǎng)建立大規(guī)模、共享型的KG資源,提供知識計算服務,從而充分發(fā)揮大數(shù)據(jù)和KG的價值。
參考文獻
[1] 俞陽.基于知識圖譜的電力知識平臺關鍵技術研究[D].南京:東南大學,2018.
[2] BIZER C,LEHMANN J,KOBILAROV G,et al.DBpedia-a crystallization point for the web of data[J].Web Semantics:Science,Services and Agents on the World Wide Web,2019,7(3):154-165.
[3] 郭云峰,韓龍,皮立華,等.知識圖譜在大數(shù)據(jù)中的應用[J].電信技術,2015,1(6):25-29.
[4] WANG J Z,DU Z,PAYATTAKOOL R,et al.A new method to measure the semantic similarity of GO terms[J].Bioinformatics,2017,23(10):1274-1281.
[5] 傅質馨,李瀟逸,袁越.泛在電力物聯(lián)網(wǎng)關鍵技術探討[J].電力建設,2019,40(5):5-16.
[6] ZHAO L,ZHANG Q.Mapping knowledge domains of Chinese digital library research output,2014–2019[J].Scientometrics,2020,9(1):51-87.
[7] 蔣瑋,周穎,陳舒淇,等.電網(wǎng)基建工程數(shù)據(jù)挖掘及知識圖譜構建技術研究[J].電力信息與通信技術,2021,19(2):15-22.
[8] 武斌,張賓,周晶,孫博,等.知識圖譜在電力領域的應用與思考[J].科技經(jīng)濟導刊,2020,28(16):33.