亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        電力設(shè)備健康管理知識圖譜:基本概念、關(guān)鍵技術(shù)及研究進展

        2022-02-17 09:40:40李銀強王洪濤黃文琦侯佳萱
        電力系統(tǒng)自動化 2022年3期
        關(guān)鍵詞:電力設(shè)備圖譜運維

        李 剛,李銀強,王洪濤,謝 慶,黃文琦,侯佳萱

        (1. 華北電力大學(xué)控制與計算機工程學(xué)院,河北省保定市 071003;2. 復(fù)雜能源系統(tǒng)智能計算教育部工程研究中心(華北電力大學(xué)),河北省保定市 071003;3. 華北電力大學(xué)電氣與電子工程學(xué)院,河北省保定市 071003;4.南方電網(wǎng)數(shù)字電網(wǎng)研究院有限公司,廣東省廣州市 510670)

        0 引言

        電力設(shè)備(如發(fā)電機、變壓器、繼電保護裝置等)狀態(tài)評估(如風(fēng)電機組狀態(tài)預(yù)測、變壓器剩余壽命、輸電線路狀態(tài)監(jiān)測等)對保障電力系統(tǒng)安全穩(wěn)定運行有著重要的理論意義[1]。隨著智能電網(wǎng)體系的不斷完善,電力設(shè)備的類型、數(shù)量、工況復(fù)雜性大幅增加。以變壓器為例,國家電網(wǎng)有限公司在運110 kV及以上電壓等級變壓器已達30 000 余臺[2]。隨著投運設(shè)備的增加,存在于電力設(shè)備健康管理全生命周期各環(huán)節(jié)中的大量相關(guān)知識也大幅增加,如何有效管理和利用這些知識,是電力設(shè)備精細化運維與健康管理的重要內(nèi)容之一。已有研究將計算機領(lǐng)域中近年來廣泛應(yīng)用的知識圖譜(knowledge graph)技術(shù)引入電力系統(tǒng)領(lǐng)域[3]。

        知識圖譜的概念最初由Google 公司于2012 年提出[4],Google 知識圖譜通過三元組對“概念實體”、“屬性”和“關(guān)系”等核心要素進行形式化描述,以最小的代價將大規(guī)模網(wǎng)絡(luò)信息有效組織起來,實現(xiàn)了互聯(lián)網(wǎng)領(lǐng)域的數(shù)億實體、屬性和關(guān)聯(lián)關(guān)系的可視化存儲、組織和管理[5]。知識圖譜可定義為形如(h,r,t)的三元組,其中h為頭實體,r為關(guān)系,t為尾實體。知識圖譜本質(zhì)上是一個有向圖。通過網(wǎng)狀拓撲結(jié)構(gòu)對知識進行更好的串聯(lián)和呈現(xiàn),它可以對多源異構(gòu)數(shù)據(jù)進行整合和知識提取,包含了實體之間更豐富的語義關(guān)聯(lián),并且可以結(jié)合推理得到的隱含信息為用戶提供個性化服務(wù),被廣泛應(yīng)用于智能搜索、智能問答、文本分類等領(lǐng)域[6]。國外在知識圖譜構(gòu)建方面 起 步 較 早,較 為 知 名 的 有YAGO[7]、Wikidata[8]。國內(nèi)已有不少互聯(lián)網(wǎng)和研究機構(gòu)在知識圖譜構(gòu)建方面做了相應(yīng)工作,比如上海交通大學(xué)最早構(gòu)建的中文知識圖譜平臺zhishi.me;百度推出的中文知識圖譜搜索;復(fù)旦大學(xué)GDM 實驗室推出的中文知識圖譜展示平臺等[9]。

        知識圖譜作為人工智能領(lǐng)域的一個重要分支,目前在各個領(lǐng)域均開始有一些初步的研究,在電力領(lǐng)域尚屬起步階段。例如,文獻[10]根據(jù)調(diào)度自動化系統(tǒng)的源碼、配置文件、數(shù)據(jù)庫和專家經(jīng)驗整理出離散的調(diào)度知識,構(gòu)建了調(diào)度自動化系統(tǒng)知識圖譜,用于業(yè)務(wù)知識的動態(tài)搜索;文獻[11]采用電力詞典抽取缺陷信息實體,構(gòu)建了電力設(shè)備缺陷知識圖譜,用于故障缺陷信息的檢索;文獻[12]利用知識圖譜建立了面向智能變電站的搜索引擎,開發(fā)了安全措施自動生成系統(tǒng),對二次檢修的效率以及安全措施的準(zhǔn)確性有一定提高;文獻[13]基于知識圖譜技術(shù)構(gòu)建了以Neo4j 圖數(shù)據(jù)庫為支撐的電網(wǎng)信息搜索引擎,較之于傳統(tǒng)的搜索引擎可更便捷、快速、準(zhǔn)確地獲取信息;文獻[14]針對電網(wǎng)業(yè)務(wù)數(shù)據(jù)無法跨專業(yè)貫通、數(shù)據(jù)資源無法被智能分析與管理等問題,提出基于全業(yè)務(wù)統(tǒng)一數(shù)據(jù)中心的知識圖譜構(gòu)建方法,實現(xiàn)了運檢數(shù)據(jù)的自動匹配;文獻[15]從電網(wǎng)調(diào)度規(guī)則、故障預(yù)案以及人工經(jīng)驗知識中進行知識抽取,構(gòu)建了電網(wǎng)故障調(diào)度知識圖譜,用于輔助配電網(wǎng)故障決策診斷。當(dāng)前,知識圖譜在電力系統(tǒng)中的應(yīng)用尚屬起步階段,應(yīng)用場景并不明確,并且缺乏對關(guān)鍵技術(shù)的深入研究,如知識圖譜的構(gòu)建、知識推理、圖譜補全等。文獻[10,12,14]采用基于模板的方法進行圖譜構(gòu)建,靈活性較低,難以應(yīng)對時變的數(shù)據(jù),而文獻[11,15]則是采用了機器學(xué)習(xí)的方法和針對文本處理特定的方法進行圖譜構(gòu)建,需要在特征工程上耗費大量精力。

        綜上,知識圖譜在電力系統(tǒng)的各業(yè)務(wù)環(huán)節(jié)均有所研究,但并未形成一套有效的知識圖譜構(gòu)建方法,對知識圖譜的應(yīng)用也處于起步階段。在電力設(shè)備健康管理中存在著大量的專業(yè)業(yè)務(wù)知識,如何構(gòu)建完備的知識圖譜,并在此基礎(chǔ)上挖掘其應(yīng)用價值,實現(xiàn)設(shè)備的精細化運維以及知識和健康管理的良性互動,是當(dāng)前及今后一段時間內(nèi),能源電力系統(tǒng)推動數(shù)字化轉(zhuǎn)型的重要方向之一。

        1 知識圖譜技術(shù)體系

        1.1 知識圖譜構(gòu)建方法

        知識圖譜可以分為不限領(lǐng)域知識圖譜(通用知識圖譜)和限定領(lǐng)域知識圖譜(領(lǐng)域知識圖譜)[16]。通用知識圖譜涵蓋面廣,其知識來自各行各業(yè),而領(lǐng)域知識圖譜則是面向特定行業(yè)進行知識抽取,需要有豐富的領(lǐng)域背景知識。本節(jié)將對知識圖譜的構(gòu)建方法及其關(guān)鍵技術(shù)進行詳細介紹,如圖1 所示。由于當(dāng)前不同文獻對知識圖譜中所出現(xiàn)的部分術(shù)語表述有差異,本文嘗試做了梳理,如附錄A 表A1所示[17-21]。

        圖1 知識圖譜構(gòu)建過程Fig.1 Construction process of knowledge graph

        1.1.1 自頂向下

        自頂向下(top down)的構(gòu)建方法可分為本體學(xué)習(xí)(ontology learning)、實體學(xué)習(xí)(entity learning)?!氨倔w”是對知識圖譜在概念層面的定義,定義了知識圖譜構(gòu)建的規(guī)則、概念,本體較為抽象。例如,在構(gòu)建電力設(shè)備健康管理知識圖譜時,首先需要對電力設(shè)備進行分類,這個分類就是本體。而本體中的具體對象就是實體,如變壓器、氣體絕緣金屬封閉開關(guān)設(shè)備(GIS)等。本體學(xué)習(xí)的目的是從當(dāng)前語料、文本中提取行業(yè)術(shù)語,習(xí)得本體的概念,抽取本體之間的關(guān)系完成本體層的構(gòu)建,制定數(shù)據(jù)層實體、關(guān)系抽取規(guī)則。實體學(xué)習(xí)則是在本體學(xué)習(xí)的基礎(chǔ)上對數(shù)據(jù)進行實體、關(guān)系抽取,并完成實體對齊任務(wù),獲得實體的統(tǒng)一描述,如“局放”、“局部放電”、“局部放電故障”,均可歸納為“局部放電故障”,然后進行實體填充獲得完備的實體表述。

        1.1.2 自底向上

        自底向上(bottom up)的構(gòu)建方法可分為知識抽?。╧nowledge extraction)、知識融合(knowledge fusion)、知識加工。知識抽取包含:1)實體抽取(entity extraction);2)關(guān) 系 抽 ?。╮elationship extraction);3)屬性抽取,從數(shù)據(jù)源中抽取實體,獲取實體之間的關(guān)聯(lián)關(guān)系,通過關(guān)系將實體連接起來構(gòu)成知識網(wǎng),最后進行實體信息抽取。知識融合包括:1)實體對齊(entity alignment),自底向上的實體對齊同自頂向下實體對齊,都是對同一實體的不同表達去噪得到統(tǒng)一描述;2)實體消歧(entity disambiguation),是對知識圖譜中存在多種含義的實體進行區(qū)分,如“變壓器”,可指代“110 kV 變壓器”,也可指代“220 kV 變壓器”,通過實體消歧可將具有同樣名稱的實體進行區(qū)分;3)屬性值填充,目的是將抽取的屬性按照實體進行匹配,以完善實體。知識加工包括:本體構(gòu)建、質(zhì)量評估、知識推理(knowledge reasoning),通過計算實體相似度形成本體層與數(shù)據(jù)層結(jié)合形成知識圖譜,通過人工或者自動化的方式對知識圖譜質(zhì)量進行評估,最后對知識圖譜進行推理,發(fā)現(xiàn)其中包含的錯誤實體關(guān)系對或者隱性知識。

        1.2 知識圖譜構(gòu)建中的關(guān)鍵技術(shù)

        構(gòu)建知識圖譜所涉及的關(guān)鍵技術(shù)可分為2 種:一是構(gòu)建知識圖譜本身所需的關(guān)鍵技術(shù),如實體抽取、實體關(guān)系抽取、實體-關(guān)系聯(lián)合抽?。╦oint extraction of entity relations)等,屬于自然語言處理的范疇;二是知識圖譜的本源技術(shù),如圖譜完善,旨在通過現(xiàn)有的知識挖掘出新的知識、不斷完善知識圖譜。本文接下來將從實體抽取、關(guān)系抽取、知識推理等幾個關(guān)鍵環(huán)節(jié)做詳細介紹。

        1.2.1 實體抽取

        實體抽取又稱命名實體識別,其任務(wù)包括識別文中提及的命名實體,消除實體的歧義,并將抽取的實體與知識庫中的對象連接起來[22]。實體抽取方法可分為傳統(tǒng)實體抽取方法、基于機器學(xué)習(xí)的抽取方法和基于神經(jīng)網(wǎng)絡(luò)的抽取方法[23]。傳統(tǒng)方法多依靠領(lǐng)域?qū)<抑贫ǔ槿∫?guī)則和模板完成實體抽取,自動化程度較低,適用于小數(shù)據(jù)集?;谝?guī)則的方法往往需要大量的語言學(xué)知識,且費時費力、可移植性不好。目前,部分實體抽取任務(wù)被機器學(xué)習(xí)算法解決[24]。基于統(tǒng)計機器學(xué)習(xí)的實體抽取方法通常需要進行特征工程如數(shù)據(jù)升維、降維、量化等,對特征選擇要求較高,同時需要大規(guī)模語料集。而深度學(xué)習(xí)方法可以實現(xiàn)特征的自動學(xué)習(xí),采用低維、稠密的實值向量表示數(shù)據(jù),避免對人工和專家知識的嚴重依賴。近年來,基于深度學(xué)習(xí)的實體抽取方法受到關(guān)注[25]。通常采用機器學(xué)習(xí)或者深度學(xué)習(xí)的方法能夠較為靈活地抽取實體。例如,文獻[26]提出一種基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)(BiLSTM)與條件隨機場(CRF)的神經(jīng)網(wǎng)絡(luò)模型,用于序列標(biāo)注與實體抽取任務(wù),較之于隱馬爾可夫模型(HMM)和CRF 實驗效果更好;文獻[27]采用BiLSTM+CRF 構(gòu)建了二次設(shè)備功能缺陷知識圖譜;在復(fù)雜的電力實體抽取任務(wù)中傳統(tǒng)方式以及基于監(jiān)督學(xué)習(xí)的方式難以應(yīng)對,因此,文獻[28]分別使用了BiLSTM 與CRF 模型進行電力實體抽取,同樣獲得了不錯的表現(xiàn)。

        1.2.2 關(guān)系抽取

        關(guān)系抽取又稱實體關(guān)系抽取,通過從文本中抽取未知的實體關(guān)系并加入知識圖譜中,它是知識圖譜構(gòu)建的關(guān)鍵任務(wù)[29]。同樣,關(guān)系抽取可分為基于模式匹配的關(guān)系抽取、基于機器學(xué)習(xí)的關(guān)系抽取、基于深度學(xué)習(xí)的關(guān)系抽?。?0-31]。關(guān)系抽取和實體抽取密不可分,通常進行實體抽取的模型和方法對關(guān)系抽取同樣適用。早期采用的方法大多基于模式匹配的關(guān)系抽取,即通過領(lǐng)域?qū)<抑贫P(guān)系抽取規(guī)則,然后與數(shù)據(jù)進行匹配完成關(guān)系抽取任務(wù)?;谝?guī)則的關(guān)系抽取方法的缺點是對跨領(lǐng)域的可移植性較差、人工標(biāo)注成本較高以及召回率較低[30]。目前,關(guān)系抽取任務(wù)逐漸被機器學(xué)習(xí)替代,基于統(tǒng)計的機器學(xué)習(xí)方法首先需要大量人工標(biāo)注的語料庫,然后再進行特征抽取和選擇,利用不同的機器學(xué)習(xí)算法訓(xùn)練分類模型,自動抽取、發(fā)現(xiàn)新的實體對及其關(guān)系[32]?;趥鹘y(tǒng)機器學(xué)習(xí)的關(guān)系抽取方法在特征提取過程中存在誤差傳播問題,而深度學(xué)習(xí)因其能夠自動學(xué)習(xí)更高階語義特征并具有較高的精確度,逐漸成為實體關(guān)系抽取領(lǐng)域新的研究熱點[33]。文獻[34]就采用了基于注意力機制的門控循環(huán)神經(jīng)網(wǎng)絡(luò)進行電力實體關(guān)系抽取,與傳統(tǒng)方法相比可獲得更高的準(zhǔn)確度。

        1.2.3 實體-關(guān)系聯(lián)合抽取

        實體抽取和關(guān)系抽取作為構(gòu)建知識圖譜中最重要的2 個任務(wù),其抽取質(zhì)量直接關(guān)系著最終知識圖譜的質(zhì)量,通常它們是2 個分離的任務(wù),但存在以下問題:傳統(tǒng)的關(guān)系抽取劃分為2 個流水線式的子任務(wù),即命名實體識別和關(guān)系分類,實體抽取的誤差會傳播至關(guān)系分類,即前一個子任務(wù)的錯誤會累積到下一個子任務(wù),導(dǎo)致性能較差;同時流水線式模式還忽略了2 個任務(wù)之間的相關(guān)性,尤其是在實體抽取時沒有利用到關(guān)系信息[35-36]。針對此情況,越來越多的研究集中在單個模式中同時抽取實體和關(guān)系,通常稱之為“實體-關(guān)系聯(lián)合抽取”,因充分利用了上下文信息,在抽取的結(jié)果上往往有更好的表現(xiàn)。但在目前電力系統(tǒng)相關(guān)知識圖譜構(gòu)建中尚無應(yīng)用。

        1.2.4 圖譜完善

        圖譜完善又稱圖譜補全,即通過挖掘缺失實體、關(guān)系或者發(fā)現(xiàn)新的知識,對知識圖譜進行完善,被廣泛應(yīng)用到知識圖譜上游應(yīng)用中,是提高知識圖譜質(zhì)量的重要方法[37]。例如,目前規(guī)模較大的開放知識圖譜Freebase 中,有75% 的人沒有國籍信息,Dbpedia 中有60%的人物實體沒有相關(guān)的出生地信息等。這時使用圖譜完善技術(shù)對其中缺失或者錯誤的實體、關(guān)系進行補全或糾正就顯得尤為重要,尤其是對領(lǐng)域知識圖譜進行補全工作,能夠幫助人們更好地理解潛在的專業(yè)知識。與圖譜完善對應(yīng)的是知識推理,即從現(xiàn)有數(shù)據(jù)中推斷出新的實體關(guān)系,并對圖譜進行反饋、豐富[38]。圖譜完善和知識推理都可以對當(dāng)前圖譜中存在的錯誤或缺失信息進行糾正,但圖譜完善僅對圖譜進行完善補全工作,而知識推理則更注重在完善圖譜的同時發(fā)現(xiàn)隱性知識,幫助人們獲得更高階的知識表示,因此,圖譜完善可以看作是知識推理的子任務(wù)。

        當(dāng)前電力領(lǐng)域知識圖譜的構(gòu)建工作大部分是沒有進行質(zhì)量評估的,不能形成對知識圖譜質(zhì)量的全局把控,在圖譜完善和知識推理方面還有待完善。

        2 知識圖譜在電力設(shè)備健康管理中的應(yīng)用

        當(dāng)前電力設(shè)備健康管理工作所使用的數(shù)據(jù)多為一段時間連續(xù)的在線監(jiān)測數(shù)據(jù),如電壓、電流、油色譜,或者采用紅外、紫外、設(shè)備外觀圖像進行故障分類與診斷,忽略了日常巡檢累積的大量電力文本語料,同時大量使用數(shù)據(jù)驅(qū)動的方法進行健康管理工作,最直接的問題便是結(jié)果的可解釋性,基于符號主義的知識圖譜在文本數(shù)據(jù)挖掘和可解釋性方面有較好的優(yōu)勢。隨著知識圖譜技術(shù)的發(fā)展,研究者提出了諸多知識圖譜驅(qū)動的智能問答、商品推薦、數(shù)據(jù)挖掘范式,展現(xiàn)了知識圖譜廣闊的應(yīng)用前景[39],其在電力領(lǐng)域的應(yīng)用也逐漸開始。因此,本章首先分析電力設(shè)備健康管理知識圖譜的特點,然后給出知識圖譜在電力設(shè)備健康管理中的應(yīng)用場景。

        2.1 電力設(shè)備健康管理知識圖譜的特點

        電力系統(tǒng)數(shù)據(jù)已呈現(xiàn)海量化、多樣化和快速化的大數(shù)據(jù)特征[40],包含文本、圖像、音頻等這樣的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),這些多樣性的數(shù)據(jù)導(dǎo)致了在構(gòu)建電力設(shè)備健康管理知識圖譜時,在知識和信息的表示上呈現(xiàn)多模態(tài)的特點。

        從所構(gòu)建的圖譜來看,電力設(shè)備健康管理知識圖譜涵蓋如下3 個方面:1)最基本的知識圖譜,其知識來源為關(guān)系型數(shù)據(jù)庫、文本、文檔等結(jié)構(gòu)化數(shù)據(jù),用途為管理結(jié)構(gòu)化知識和圖譜可視化;2)多模態(tài)圖譜,多模態(tài)知識圖譜將多模態(tài)知識(文本、視頻、圖片)進行整合,可為用戶提供多個不同維度的知識,還可以實現(xiàn)不同模態(tài)數(shù)據(jù)之間的跨模態(tài)交互[41]。例如,電力設(shè)備故障診斷和健康管理中通常有基于紅外光譜數(shù)據(jù)[42]、紫外光譜數(shù)據(jù)[43]、振動信號[44]等方法。通過神經(jīng)網(wǎng)絡(luò)提取這些非結(jié)構(gòu)化數(shù)據(jù)特征進行分類,可得到設(shè)備故障類型的文本描述,有助于圖譜構(gòu)建,常見的方法有卷積神經(jīng)網(wǎng)絡(luò)、目標(biāo)檢測,通過預(yù)先標(biāo)注的故障類型和設(shè)備類型進行模型訓(xùn)練,從而得到圖片中設(shè)備或者故障類型的文本描述;3)事理圖譜,又稱事件圖譜,以事件為節(jié)點,以事件關(guān)系為邊,能夠較好地表現(xiàn)事件之間的耦合關(guān)系,實現(xiàn)事件因果關(guān)系的預(yù)測[45]。例如,當(dāng)設(shè)備發(fā)生故障時,由于設(shè)備故障具有較強的耦合性和因果關(guān)系,構(gòu)建電力設(shè)備事理圖譜可有效進行故障溯源,明晰故障原因、部位,極大提高運維的靈活程度。

        電力設(shè)備健康管理知識圖譜應(yīng)具有更好的知識表達能力,涵蓋豐富的電力設(shè)備信息,因其應(yīng)用場景特定,加之電力行業(yè)積累的海量數(shù)據(jù),能對電力設(shè)備知識做到較完備的表示。另外,無論是從保證用電安全的角度,還是確保巡檢人員安全的角度,所構(gòu)建的圖譜在參與輔助決策時應(yīng)具有良好的知識表達能力,這就要求所構(gòu)建的知識圖譜較之于通用知識圖譜應(yīng)擁有更細粒度的知識。

        2.2 電力設(shè)備健康管理知識圖譜構(gòu)建分析

        通常在完成本體構(gòu)造、實體和關(guān)系抽取任務(wù)后便可得到知識圖譜的大體框架,但正如前文所述,實體和關(guān)系抽取的質(zhì)量將影響最終知識圖譜的質(zhì)量,所以在構(gòu)建知識圖譜之前須確保抽取的實體及關(guān)系有著較高的準(zhǔn)確率。當(dāng)前不少工作是將實體抽取和關(guān)系抽取視為2 個分離的任務(wù),故本文對實體-關(guān)系聯(lián)合抽取做了相應(yīng)回顧。實體、關(guān)系分離抽取存在的最大問題就是忽視了誤差傳播因素,隨著自然語言處理(NLP)的快速發(fā)展,必將涌現(xiàn)出一系列實體-關(guān)系聯(lián)合抽取方法,以獲得高質(zhì)量的實體及關(guān)系。在知識圖譜構(gòu)建完成之后須進行圖譜完善以及知識推理工作,并對現(xiàn)有的知識圖譜進行反饋得到更為全面的知識圖譜。同時,數(shù)據(jù)的不斷累積將導(dǎo)致關(guān)鍵數(shù)據(jù)稀疏情況的出現(xiàn),所以,如何從海量數(shù)據(jù)中獲取目標(biāo)數(shù)據(jù)也是知識圖譜構(gòu)建過程中的一大難題。因此,本節(jié)將從數(shù)據(jù)準(zhǔn)備、圖譜構(gòu)建、圖譜完善等方面展開論述,詳細介紹電力設(shè)備健康管理知識圖譜的構(gòu)建過程,總體框架如圖2 所示。

        圖2 電力設(shè)備健康管理知識圖譜構(gòu)建過程Fig.2 Construction process of health management knowledge graph of power equipment

        2.2.1 數(shù)據(jù)準(zhǔn)備

        電力系統(tǒng)運行、檢修和管理過程中產(chǎn)生的海量全景狀態(tài)數(shù)據(jù)通常存儲在生產(chǎn)管理系統(tǒng)(PMS)、管控平臺、文件系統(tǒng)、數(shù)據(jù)中臺等,并夾雜著大量的噪聲[46],這就需要研究如何從高噪聲、價值密度稀疏的數(shù)據(jù)中有效挖掘目標(biāo)數(shù)據(jù)及其潛在價值。通常通用知識圖譜可以通過網(wǎng)絡(luò)爬蟲的形式增加數(shù)據(jù)集以獲得更多數(shù)據(jù),但對于電力知識圖譜來說,該方法具有一定的局限性;此外,在知識抽取環(huán)節(jié),通常開放領(lǐng)域知識圖譜可采用開放眾包的方式來加快知識抽取過程,但是電力數(shù)據(jù)通常有保密性要求,文本標(biāo)注環(huán)節(jié)只能在電力行業(yè)內(nèi)部進行,進一步加大了知識圖譜構(gòu)建的難度,可在開源第三方工具(如Jieba 分詞)的基礎(chǔ)上增加電力設(shè)備數(shù)據(jù)模板(如借助行業(yè)內(nèi)規(guī)范、白皮書等),進一步加快抽取過程,并形成標(biāo)簽供使用。

        其中,電力設(shè)備數(shù)據(jù)的稀疏性主要表現(xiàn)為:設(shè)備故障存在偶然性,歷史數(shù)據(jù)及在線監(jiān)測數(shù)據(jù)中故障樣本偏少,導(dǎo)致現(xiàn)有故障診斷算法由于數(shù)據(jù)分布不均使得診斷效果低下。針對此種情況,需選取合適的方法對故障樣本進行擴充。例如,文獻[47]提出一種基于注意力機制的對抗生成網(wǎng)絡(luò),可實現(xiàn)輸電線路中螺栓缺陷樣本的生成,有效擴充了可用于訓(xùn)練的樣本集。

        2.2.2 圖譜構(gòu)建

        知識圖譜的構(gòu)建方式通常可分為自頂向下、自底向上和混合方式3 種[29],電力設(shè)備健康管理知識圖譜屬于領(lǐng)域知識圖譜,通常采用自頂向下和自底向上相結(jié)合的混合構(gòu)建方式,即先定義本體層,然后在數(shù)據(jù)層進行知識抽取,同時反復(fù)更新本體層,再將新得的知識添加至本體中完成圖譜構(gòu)建,靈活性較高。

        普通圖譜只由實體和關(guān)系組成,而多模態(tài)圖譜需對數(shù)據(jù)做出意圖理解,然后將所識別的意圖加入實體或者關(guān)系中;事件圖譜則是將事件和事件關(guān)系作為圖譜的實體和關(guān)系。依靠傳統(tǒng)的基于模板的方法較難處理海量電力數(shù)據(jù),缺點在于處理速度較慢,且實體和關(guān)系抽取精度不高。因此,針對多模態(tài)圖譜和事件圖譜,可考慮使用自動化方法進行實體和關(guān)系抽取、意圖理解、事件抽取等,其中深度學(xué)習(xí)方法前景較好。

        屬性在知識圖譜中起到的作用是描述實體,然而,實體屬性填充面臨著如下的困境:1)由于電力設(shè)備健康管理中的實體多為電力設(shè)備或器件,而在線監(jiān)測系統(tǒng)會大量采集其相關(guān)屬性和指標(biāo),如果全部加入知識圖譜中會導(dǎo)致圖譜規(guī)模過于龐大影響上層應(yīng)用;2)所采集的數(shù)據(jù)具有一定的不完備性,可能存在指標(biāo)缺失的情況,因此,將何種指標(biāo)作為屬性還有待進一步研究。

        2.2.3 圖譜完善

        圖譜完善可看作是知識推理的子任務(wù),因此,可使用相同的模型及算法來簡化完善流程以及知識推理過程。常用的方法有基于規(guī)則的推理、基于分布式表示的推理和基于神經(jīng)網(wǎng)絡(luò)的推理[38]。其中,基于分布式表示的推理在應(yīng)對大規(guī)模知識圖譜推理時表現(xiàn)了良好的伸縮性和效率,能更為有效地推斷出新的知識[48]。而電力設(shè)備在線監(jiān)測數(shù)據(jù)、巡檢數(shù)據(jù)、維修記錄等源源不斷的信息,導(dǎo)致知識圖譜的規(guī)模也會不斷增大,基于規(guī)則的推理靈活性較低,難以應(yīng)對時變數(shù)據(jù),泛化力較差?;谏窠?jīng)網(wǎng)絡(luò)的推理模型復(fù)雜度高且可解釋性差。因此,在需要進行知識的快速推理、明晰故障原因的場景下,知識推理和圖譜完善可選擇基于分布式表示的推理,主要以多關(guān)系嵌入模型(TransE)[49]為主,后續(xù)衍生出了超平面知識圖譜嵌入(TransH)[50]、自適應(yīng)稀疏矩陣圖譜完善(TranSparse)[51]等模型,其思想是將實體和關(guān)系映射到低維空間向量,利用語義表達式進行推理,充分利用了知識圖譜中的結(jié)構(gòu)信息,方法簡單,適用于大規(guī)模知識圖譜,但基于分布式表示的推理方法在建立推理模型時沒有考慮先驗知識,只考慮滿足知識圖譜中事實三元組的約束條件,缺乏更深層次的成分信息,限制了推理能力。由于電力設(shè)備運行的特殊性,可考慮犧牲計算時間,采用基于神經(jīng)網(wǎng)絡(luò)的推理方法以獲得更準(zhǔn)確的結(jié)果。該推理方法依靠深度學(xué)習(xí)模型的自學(xué)習(xí)能力抽取特征,然后利用其記憶推理能力建立實體關(guān)系預(yù)測模型。

        綜上所述,選取何種方式進行知識推理以獲得隱性知識,依賴于具體的應(yīng)用場景。

        2.3 電力設(shè)備健康管理知識圖譜的典型應(yīng)用場景

        目前,知識圖譜在電力領(lǐng)域尚處于起步階段,在電力設(shè)備健康管理的應(yīng)用和落地方面,可參考其他領(lǐng)域應(yīng)用的成功經(jīng)驗并結(jié)合行業(yè)特點進行分析。文獻[52]指出,知識圖譜可用于電力調(diào)度故障處理、電力巡檢工單處理、電力客服智能問答,未來在智能搜索、智能推薦、智能問答、智能決策等應(yīng)用上也有較好潛力。因此,本節(jié)在現(xiàn)有工作的基礎(chǔ)上,詳細闡述電力設(shè)備健康管理知識圖譜的應(yīng)用場景,總體如附錄A 圖A1 所示。

        2.3.1 電力設(shè)備知識管理

        電力設(shè)備知識來源于2 個方面:1)設(shè)備固有特性所組成的知識,如電力變壓器是由銅、鐵、紙等材料組成的復(fù)雜設(shè)備;2)人為經(jīng)驗知識,如檢測變壓器套管故障可依據(jù)其測量溫度。前者是設(shè)備固有的屬性和知識,可直接進行知識抽?。缓笳叩闹R卻是動態(tài)變化的,并受限于科技發(fā)展程度、從業(yè)者經(jīng)驗等。早期健康管理工作可借助專家經(jīng)驗展開,但是隨著電力設(shè)備投運數(shù)量的大幅增加,其所蘊含的知識也快速增長,這些知識零散地分布在在線監(jiān)測系統(tǒng)、設(shè)備運行日志、電力巡檢工單中,僅依靠專家經(jīng)驗難以應(yīng)對快速增長的業(yè)務(wù)需求。因此,對這些海量多源異構(gòu)數(shù)據(jù)進行處理并提取有用知識,形成電力設(shè)備知識管理系統(tǒng),用于指導(dǎo)健康管理工作將是未來的應(yīng)用場景之一,運用知識圖譜可更快捷、高效地抽取和管理知識,為其他需要知識圖譜的場景提供數(shù)據(jù)保證。

        2.3.2 健康管理輔助決策

        設(shè)備健康管理輔助決策包含3 個階段:問答生成、搜索匹配和決策策略生成及推薦。問答生成面向的是機對機和人-機問答。機對機是由故障診斷系統(tǒng)評判后交由知識圖譜進行處理,診斷結(jié)果一般比較規(guī)范,便于機器處理和理解。但人-機問答則需先理解人為意圖,并將得到的數(shù)據(jù)處理成知識圖譜可計算的三元組數(shù)據(jù),然后送至知識圖譜進行匹配操作,得到歷史類似應(yīng)對方案。例如,文獻[53]就將用戶意圖轉(zhuǎn)化為了訴求子圖并與知識圖譜中的故障描述匹配得到運維方案。在進行匹配時往往會得到多個結(jié)果,但是選取何種方案需要考慮運維方案給電力系統(tǒng)帶來的影響,在此種情況下需要對生成的運維方案進行評分,并借助專家經(jīng)驗綜合評定得到最優(yōu)解。較之于傳統(tǒng)的決策方式,更加全面地考慮了輔助決策會給電力系統(tǒng)帶來的影響,并且可以為每個電力設(shè)備制定獨特的巡檢和運維方式。

        2.3.3 數(shù)據(jù)+知識驅(qū)動的計算引擎

        目前,電力行業(yè)正在積極部署數(shù)字化轉(zhuǎn)型戰(zhàn)略,數(shù)據(jù)中臺的建設(shè)就是內(nèi)涵之一,通過有效整合數(shù)據(jù)、發(fā)揮數(shù)據(jù)價值,可為電力設(shè)備數(shù)字化轉(zhuǎn)型提供良好的數(shù)據(jù)基礎(chǔ)。電力設(shè)備故障預(yù)測與健康管理目前主要分為數(shù)據(jù)驅(qū)動、模型驅(qū)動及混合方法3 類[2]。在電力數(shù)字化轉(zhuǎn)型的背景下,基于數(shù)據(jù)驅(qū)動的電力設(shè)備狀態(tài)評估和健康管理也必將邁上新的臺階。知識驅(qū)動和數(shù)據(jù)驅(qū)動策略各有優(yōu)劣,前者過于依靠知識的質(zhì)量、準(zhǔn)則、專家意見以及其他可提供支撐的數(shù)據(jù),后者僅依賴數(shù)據(jù)質(zhì)量[54]。數(shù)據(jù)驅(qū)動的方法多基于機器學(xué)習(xí)和深度學(xué)習(xí),數(shù)據(jù)稀疏性嚴重制約了該方法在設(shè)備健康管理中的發(fā)展。知識驅(qū)動的方法多依賴專家經(jīng)驗,此類方法具有較強的主觀性,并且需要大量的人為經(jīng)驗積累,如何整合存在于其中的知識是個難點。人類所能理解的知識對計算機而言較難計算和理解,而知識圖譜的出現(xiàn)就很好地解決了這個問題,它能從多模態(tài)數(shù)據(jù)和多源異構(gòu)數(shù)據(jù)中提取知識,更好地對知識進行建模,將其轉(zhuǎn)變?yōu)橛嬎銠C可計算的數(shù)據(jù)或者程序。例如,文獻[55]提出了一種基于數(shù)據(jù)和知識聯(lián)合驅(qū)動的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。單一依靠數(shù)據(jù)驅(qū)動或知識驅(qū)動具有很大的局限性,數(shù)據(jù)驅(qū)動表現(xiàn)為不可解釋性,知識驅(qū)動表現(xiàn)為主觀性,二者結(jié)合后在消除不可解釋性帶來的影響的同時也減少了知識的主觀性。

        2.3.4 自動化運維問答機器人

        知識圖譜廣泛應(yīng)用的另一個場景就是自動問答系統(tǒng),旨在利用知識圖譜中的事實來回答自然語言問題。它使普通用戶能夠通過自然語言方便地訪問大型知識圖譜中有價值但復(fù)雜的信息,這也是一個具有挑戰(zhàn)性的問題[56]。自動化運維問答機器人屬于知識推理的高階應(yīng)用,對比傳統(tǒng)的巡檢運維方式,運維人員需查閱大量的操作手冊和處置規(guī)范,自動問答機器人通過理解問答,在知識圖譜中進行搜索、推理得到答案,可幫助巡檢運維人員快速查找問題,得到故障應(yīng)急處置方案和巡檢方案,明晰故障原因等,達到隨時隨地、所問即所得的目標(biāo),在最大程度上提高運維的靈活性。隨著智能終端在電力系統(tǒng)中的廣泛應(yīng)用,自動問答機器人可有效與智能設(shè)備集成,形成嵌入運管系統(tǒng)中的中間件,而問題答案的質(zhì)量則依賴于所構(gòu)建知識圖譜或者知識庫的質(zhì)量。例如,文獻[57]詳細總結(jié)了自動問答中的關(guān)鍵技術(shù)、評價標(biāo)準(zhǔn)、潛在挑戰(zhàn)等問題,可為運維問答機器人的構(gòu)建提供參考。

        2.3.5 設(shè)備家族缺陷故障分析

        電力設(shè)備的采購?fù)ǔJ谴笈?、集中采購,往往同一廠商生產(chǎn)的同一批次設(shè)備存在類似的缺陷和故障,不同廠家的產(chǎn)品質(zhì)量也不盡相同。當(dāng)某一電力設(shè)備發(fā)生故障時,就要進行設(shè)備家族缺陷跟蹤,對同一批在運電力設(shè)備安排巡檢,可有效避免由于家族缺陷帶來的故障,也能為設(shè)備狀態(tài)的多維度和差異化評價提供支撐,形成電力設(shè)備多維度狀態(tài)評價的指標(biāo)體系[58]。

        傳統(tǒng)的故障溯源工作涉及的設(shè)備數(shù)量較多,并且設(shè)備數(shù)據(jù)離散地存儲在電力系統(tǒng)中,實現(xiàn)故障溯源是不小的挑戰(zhàn)。在原有電力設(shè)備家族缺陷分析方法上應(yīng)用知識圖譜、知識推理及圖分析技術(shù),可實現(xiàn)知識的多跳推理和知識發(fā)現(xiàn),挖掘隱含的實體關(guān)系對,可為健康管理工作提供新的思路。例如,文獻[59]使用知識圖譜對設(shè)備家族缺陷進行分析,構(gòu)建了電力設(shè)備質(zhì)量綜合管理系統(tǒng),可得到設(shè)備疑似家族性缺陷的概率并排序,便于用戶判斷其他相關(guān)設(shè)備發(fā)生潛在缺陷故障的可能性。

        2.3.6 設(shè)備知識智能搜索引擎

        谷歌最初提出知識圖譜的目的是為了構(gòu)建下一代搜索引擎,它可實現(xiàn)語義搜索,將用戶意圖轉(zhuǎn)變?yōu)橹R圖譜能夠理解的三元組進行匹配得到結(jié)果,在語義搜索的基礎(chǔ)上還可以將搜索結(jié)果進行可視化展示。在知識圖譜上也可以進行關(guān)系搜索,獲得實體之間的關(guān)系。例如,搜索套管,可能會得到(套管,屬于,變壓器)、(套管,產(chǎn)生,過熱故障)這樣的三元組事實,便于對結(jié)果的理解。區(qū)別于傳統(tǒng)的搜索方式,基于知識圖譜的搜索引擎能在知識推理的基礎(chǔ)上進行多跳搜索,獲得更多的潛在知識。

        隨著電網(wǎng)規(guī)模的不斷擴大,投運的電力設(shè)備越來越多,積累的設(shè)備運維日志、在線監(jiān)測數(shù)據(jù)、行業(yè)標(biāo)準(zhǔn)文件等也呈現(xiàn)上升趨勢,日常設(shè)備健康管理工作都需在這些文件中進行搜索獲得想要的答案,而目標(biāo)內(nèi)容通常零散存在于各類文件和系統(tǒng)中,不能僅僅依靠單一文檔制定相應(yīng)的維護方案,通常是結(jié)合多個文件使結(jié)果更加精確、全面。而不同的巡檢人員在面對同樣的情況時可能會有不同的意見,如何使用較少的描述得到完備的搜索結(jié)果也是需要考慮的問題,知識圖譜的出現(xiàn)就為設(shè)備知識的檢索提供了全新的思路,可將圖譜中相關(guān)聯(lián)知識以及隱藏知識經(jīng)過整合以后反饋給用戶。

        3 電力設(shè)備健康管理對知識圖譜技術(shù)的需求

        3.1 融合促進電網(wǎng)一張圖業(yè)務(wù)

        能源互聯(lián)網(wǎng)的技術(shù)內(nèi)涵是運用新一代信息通信技術(shù),將電力用戶及其設(shè)備、電網(wǎng)企業(yè)及其設(shè)備、發(fā)電企業(yè)及其設(shè)備、電工裝備企業(yè)及其設(shè)備有機連接起來,通過信息廣泛交互和充分共享,通過數(shù)字化管理手段大幅提升能源生產(chǎn)、消費和相關(guān)領(lǐng)域的安全、質(zhì)量和效率[60]。能源互聯(lián)網(wǎng)的構(gòu)建離不開“電網(wǎng)一張圖”業(yè)務(wù)的推進,其內(nèi)涵是將電力系統(tǒng)中存在的各個子系統(tǒng)通過融合方式形成圖拓撲結(jié)構(gòu),這也是能源電力系統(tǒng)實現(xiàn)數(shù)字化轉(zhuǎn)型的途徑之一。此外,電力系統(tǒng)輸、變、配環(huán)節(jié)連通的各類電力設(shè)備天然形成了物理拓撲結(jié)構(gòu),也為電網(wǎng)一張圖的構(gòu)建提供了支撐。目前,電網(wǎng)一張圖的構(gòu)建還處于初步階段,受限于數(shù)據(jù)及構(gòu)建方法,一定時間內(nèi)建立完整大規(guī)模的圖結(jié)構(gòu)還較為困難,可在單獨的領(lǐng)域開展先試工作,再將各個分散的圖進行融合。

        電力設(shè)備健康管理知識圖譜在數(shù)據(jù)的計算和存儲上與電網(wǎng)一張圖所使用的技術(shù)路線基本一致,都需要將數(shù)據(jù)存放在圖數(shù)據(jù)庫,這就確保了數(shù)據(jù)來源的一致性。知識圖譜本質(zhì)是由實體和關(guān)系構(gòu)成的圖結(jié)構(gòu),在空間結(jié)構(gòu)上與電網(wǎng)一張圖相同,從可計算性上保證了一致性。例如,文獻[61]就提出一種電力圖計算平臺用于取代傳統(tǒng)關(guān)系型數(shù)據(jù)庫的計算方法,展示了圖計算在電力系統(tǒng)中應(yīng)用的可行性。

        建立電力設(shè)備健康管理知識圖譜可有效感知電力設(shè)備運行質(zhì)量,而該過程需要解決數(shù)據(jù)-知識融合問題。長期以來,大數(shù)據(jù)融合主要集中在多源數(shù)據(jù)的統(tǒng)一訪問上,缺乏對知識的理解,數(shù)據(jù)結(jié)構(gòu)松散,沒有解釋數(shù)據(jù)背后的含義。因此,數(shù)據(jù)融合應(yīng)與知識理解并行,盡可能形成機理模型,發(fā)現(xiàn)數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系[62]。

        因此,健康管理知識圖譜可視作電網(wǎng)一張圖的一部分,知識圖譜完成知識計算后再融入電網(wǎng)一張圖中,通過打通數(shù)據(jù)壁壘,從設(shè)備健康管理環(huán)節(jié),延伸至輸、變、配環(huán)節(jié),最終延伸至整個能源互聯(lián)網(wǎng)領(lǐng)域,實現(xiàn)多圖譜融合計算,如附錄A 圖A2 所示,其中,附錄A 圖A2 左側(cè)部分是本文在已有數(shù)據(jù)的基礎(chǔ)上構(gòu)建的一個電力設(shè)備健康管理知識圖譜(示例)。本文給出一個變壓器運維知識圖譜,見本文支撐數(shù)據(jù),供感興趣的讀者參考閱讀。附錄B 表B1 與B2 為變壓器實體信息及實體關(guān)系三元組舉例。

        3.2 全生命周期健康管理的多知識圖譜融合

        一般情況下,為了契合各業(yè)務(wù)場景的需要,構(gòu)建圖譜時會為每個業(yè)務(wù)方單獨開發(fā)知識圖譜,方便與業(yè)務(wù)方共同管理數(shù)據(jù)。然而,隨著業(yè)務(wù)及管理層級的深入,就會發(fā)現(xiàn)單個業(yè)務(wù)知識圖譜因為規(guī)模較小,在文本語義理解類任務(wù)上非常受限,此時就需要將多個知識圖譜進行融合,打通知識邊界。例如,針對某電力設(shè)備可以構(gòu)建其知識圖譜,針對電力設(shè)備的某類故障也可以構(gòu)建其知識圖譜。由于不同的知識圖譜信息來源不同,其知識描述體系也是不同的,多知識圖譜融合不是簡單地把知識圖譜合并,而是要發(fā)現(xiàn)圖譜中的等價實例,如何對知識圖譜進行融合表示,對于建立統(tǒng)一的大規(guī)模知識圖譜意義重大[63]。知識圖譜融合涉及多種技術(shù),這里就不展開介紹,讀者可參閱文獻[64]。

        多知識圖譜融合后的電力設(shè)備健康管理,在知識表示上會更為豐富,在事實呈現(xiàn)上會更加精確,在跨度上囊括了設(shè)備出廠、投運、檢修、報廢等環(huán)節(jié)的知識,對上層應(yīng)用的支撐效果更好,進行知識推理能獲得更多潛在知識,明晰數(shù)據(jù)之間的聯(lián)系,為健康管理工作提供新的思路,讓傳統(tǒng)的運維巡檢方式由感知變?yōu)檎J知。

        3.3 促進健康管理數(shù)字化轉(zhuǎn)型

        電力系統(tǒng)數(shù)字化轉(zhuǎn)型方興未艾,傳感技術(shù)、通信技術(shù)、智能電力裝備以及電力系統(tǒng)集成化、智能化技術(shù)快速發(fā)展,為電網(wǎng)可觀性、可控性以及智能化的提升帶來巨大機遇[65]。電力設(shè)備健康管理作為電力系統(tǒng)中的關(guān)鍵一環(huán),保障著設(shè)備安全和用電安全,在能源轉(zhuǎn)型與碳中和背景下,借助知識圖譜技術(shù)促進健康管理數(shù)字化轉(zhuǎn)型迫在眉睫。

        “數(shù)據(jù)先行”是數(shù)字化轉(zhuǎn)型過程中的基礎(chǔ)工作,通過挖掘企業(yè)積累的數(shù)據(jù)中的價值,有助于改變傳統(tǒng)業(yè)務(wù)架構(gòu)。例如,文獻[66]將數(shù)字化轉(zhuǎn)型的共性歸結(jié)為技術(shù)、價值、結(jié)構(gòu)和財務(wù)方面的變化。電力設(shè)備健康管理數(shù)字化轉(zhuǎn)型中,同樣需要引入新的技術(shù),一方面是新型傳感技術(shù)和在線監(jiān)測技術(shù)的更新迭代,另一方面則是更為有效的數(shù)據(jù)管理方法、電力設(shè)備狀態(tài)評估算法、更加智能的設(shè)備健康管理方案推薦算法。知識圖譜技術(shù)的引入可滿足數(shù)據(jù)知識管理的需求,而基于知識圖譜的推薦算法也能較好地契合智能運維的推薦場景,將基于經(jīng)驗的運維方式轉(zhuǎn)變?yōu)橹R導(dǎo)向的運維,提前發(fā)現(xiàn)設(shè)備存在的運行風(fēng)險,將事后維修轉(zhuǎn)變?yōu)轭A(yù)防性維修,在評估結(jié)構(gòu)上改變了傳統(tǒng)模式,加入知識的解釋之后更能闡釋數(shù)據(jù)和故障的因果關(guān)系,做到定點、定向精準(zhǔn)運維服務(wù)。從2020 年發(fā)布的《中國知識圖譜應(yīng)用趨勢報告》[67]來看,能源電力領(lǐng)域作為勞動密集型企業(yè),吸收了大量的勞動資源,業(yè)務(wù)復(fù)雜,面臨著知識難以積累、人員培訓(xùn)難度大等痛點,在數(shù)字化轉(zhuǎn)型過程中需要加快推進領(lǐng)域知識庫的建立。利用知識圖譜,可打通底層數(shù)據(jù),將數(shù)據(jù)形成知識,整合行業(yè)知識形成知識中臺,賦能上層應(yīng)用。

        4 對未來發(fā)展的展望

        4.1 知識圖譜賦能智能運維

        電力設(shè)備智能運維強調(diào)2 個方面:一是設(shè)備具有智能性,二是對設(shè)備的運維管理方案具有智能性。設(shè)備的智能性是指基于對自身的智能感知、狀態(tài)分析與健康管理而具備自主思維,可通過在電力設(shè)備本體(或邊緣側(cè))配置嵌入式傳感器與人工智能模塊,完成本體信息采集、就近計算與信息交互,使電力設(shè)備本身具備“智慧”功能[68]。運維管理方案的智能性體現(xiàn)在系統(tǒng)能夠根據(jù)當(dāng)前設(shè)備運行的狀態(tài)、風(fēng)險給出最佳的巡檢方案,將設(shè)備風(fēng)險降到最低。由于故障的發(fā)生具有不確定性,定期巡檢仍難以應(yīng)對突發(fā)情況,智能運維就需要增加靈活性來應(yīng)對電力設(shè)備故障的不確定性。傳感設(shè)備的大量投入緩解了數(shù)據(jù)瓶頸問題,但是運維方案的生成、故障的推理溯源卻是當(dāng)前電力設(shè)備健康管理有待深入的問題,知識圖譜技術(shù)的出現(xiàn)可有效解決智能運維方案生成及故障推理溯源。

        開放領(lǐng)域中知識圖譜技術(shù)最為廣泛的應(yīng)用場景就是推薦系統(tǒng),通過對知識圖譜中的節(jié)點進行聚類和分布式表示,以獲得特征;對原有節(jié)點和新增節(jié)點進行分類,實現(xiàn)個性化推薦。同理,在電力設(shè)備健康管理知識圖譜中也可實現(xiàn)對故障的分類和個性化運維方案推薦。通過設(shè)備運維日志、巡檢手冊、行業(yè)標(biāo)準(zhǔn)等電力文本語料所構(gòu)建的電力設(shè)備健康管理知識圖譜,涵蓋了電力設(shè)備歷史故障信息以及應(yīng)急處理方案、運檢方案等,為電力設(shè)備個性化運維提供了數(shù)據(jù)上的支撐。近年來,隨著圖神經(jīng)網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)、深度學(xué)習(xí)在知識圖譜實體分類、關(guān)系預(yù)測等任務(wù)中的應(yīng)用,也為研究者提供了對于非歐氏空間數(shù)據(jù)處理的思路,為智能運維方案推薦提供了模型及算法上的保障。

        4.2 多學(xué)科交叉融合研究的新范式

        電力設(shè)備健康管理知識圖譜的構(gòu)建是多學(xué)科融合的典型場景,不僅需要利用計算機技術(shù)從復(fù)雜的電力文本、語料中挖掘?qū)嶓w、關(guān)系、本體等構(gòu)建知識圖譜所需的關(guān)鍵成分,更需要電力系統(tǒng)良好的先驗知識作為支撐。優(yōu)質(zhì)的數(shù)據(jù)和使用方法決定了圖譜質(zhì)量的下限,而對電力設(shè)備的深入理解則決定了知識圖譜質(zhì)量的上限。對本體層和數(shù)據(jù)層定義的不一致最終也會導(dǎo)致所構(gòu)建的知識圖譜有本源差別。所以,對計算機知識和電力系統(tǒng)知識的充分了解可使得構(gòu)建的知識圖譜具有良好的魯棒性。

        電力設(shè)備健康管理需要加強故障診斷方法、狀態(tài)評估方法、故障機理、圖譜構(gòu)建方法、推理算法等的研究。完備的故障機理模型能夠有效刻畫現(xiàn)實物理模型,從設(shè)備機理出發(fā),研究新型傳感器獲得能表征設(shè)備運行狀態(tài)的關(guān)鍵數(shù)據(jù),為故障診斷方法、評估方法提供理論上的支撐,這就需要電力系統(tǒng)從業(yè)人員加深對電力設(shè)備全生命周期的理解。為應(yīng)對電力數(shù)據(jù)分布不均的問題,使用小樣本學(xué)習(xí)、生成對抗網(wǎng)絡(luò)等方法在現(xiàn)有數(shù)據(jù)上學(xué)習(xí)獲得特征或者直接進行數(shù)據(jù)擴充,為知識圖譜的構(gòu)建提供方法上的保障也是研究的重點。

        因此,在構(gòu)建電力設(shè)備健康管理知識圖譜的過程中,不同學(xué)科之間相互獨立,卻又互相聯(lián)系,電力學(xué)科和計算機學(xué)科表現(xiàn)最為明顯,而針對特定電力設(shè)備的一些部件,如變壓器絕緣紙、GIS 絕緣氣體等,甚至還需要材料學(xué)的介入。在能源電力系統(tǒng)轉(zhuǎn)型的背景下,需要各個學(xué)科深入研究各領(lǐng)域中存在的難點和痛點問題,最終形成多學(xué)科交叉融合研究的新范式。

        4.3 電力人工智能的可解釋性

        當(dāng)前人工智能分為符號主義、連接主義、行為主義三大流派。符號主義的代表是知識圖譜和專家系統(tǒng),連接主義的代表是深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò),行為主義的代表是強化學(xué)習(xí)和機器人。符號主義擁有良好的解釋性,而連接主義預(yù)測精度高但缺乏可解釋性,行為主義不需要標(biāo)注樣本,可在復(fù)雜的環(huán)境中自行學(xué)習(xí)樣本特征。在智能電網(wǎng)階段,基于連接主義的人工智能方法在電力設(shè)備故障診斷、狀態(tài)評估中獲得了重要的應(yīng)用,卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)在各類電力設(shè)備故障診斷、故障預(yù)測、故障樣本生成任務(wù)中取得了優(yōu)異的表現(xiàn),為健康管理工作提供了良好的算法模型支持。端到端的深度學(xué)習(xí)故障診斷和狀態(tài)評估算法,接受大樣本作為訓(xùn)練輸入,所獲得的模型本質(zhì)上是神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù),而預(yù)測的過程則是參數(shù)計算的過程,計算和預(yù)測的過程不是透明的,過程缺乏可解釋性。深度學(xué)習(xí)模型實質(zhì)為黑箱模型,學(xué)習(xí)器對輸入輸出的映射往往不具可解釋性,因而對電力系統(tǒng)生產(chǎn)實踐的指導(dǎo)效果有限[69]。而根據(jù)深度學(xué)習(xí)模型得到的結(jié)果在參與電力設(shè)備健康管理輔助決策時通常是缺乏證據(jù)支撐的,且不能給出合理的解釋[70],導(dǎo)致電力系統(tǒng)從業(yè)人員對機器產(chǎn)生的結(jié)果無法全部相信,還需借助專家經(jīng)驗。因此,需要加強對電力人工智能可解釋性的研究,增強其可信度和可解釋性。

        知識圖譜技術(shù)的出現(xiàn)打破了上述僵局,知識圖譜的可解釋性在于它是一種語義網(wǎng)絡(luò)結(jié)構(gòu),包含了豐富的實體、關(guān)系、屬性、概念等信息,更符合人類邏輯思維,這便使得解釋成為可能。2017 年,國務(wù)院印發(fā)了關(guān)于新一代人工智能發(fā)展規(guī)劃的通知,將關(guān)聯(lián)理解與知識挖掘、知識圖譜構(gòu)建與學(xué)習(xí)、知識演化與推理等技術(shù)作為新一代人工智能關(guān)鍵共性技術(shù)體系的重點突破領(lǐng)域。而知識圖譜所帶來的解釋性可分為2 個方面:1)在所構(gòu)建的知識圖譜中應(yīng)用知識推理技術(shù),可獲得故障原因并按需生成可解釋的運維方案;2)與深度學(xué)習(xí)相融合,將深度學(xué)習(xí)診斷的結(jié)果轉(zhuǎn)化為知識圖譜可以理解的三元組進行推理,理解數(shù)據(jù)驅(qū)動方法的黑箱模型。

        因此,雖然針對知識圖譜本身的研究正在逐步展開,但是對于知識圖譜與深度學(xué)習(xí)融合的可解釋性研究目前尚處在探索階段。這也是“人工智能2.0”時代最大的瓶頸問題——可解釋性,這是因為現(xiàn)有人工智能過于依賴訓(xùn)練數(shù)據(jù),缺乏深層次數(shù)據(jù)語義挖掘,導(dǎo)致可解釋性差。未來的弱人工智能、可解釋性和可理解性人工智能、強人工智能等在理論研究方面仍將任重道遠[71]。這同樣是今后研究中需要通過知識圖譜增強電力人工智能可解釋性的重點之一。

        5 結(jié)語

        由于知識圖譜技術(shù)具有良好的結(jié)構(gòu)化知識表示方式和推理能力,近幾年得到快速發(fā)展,并開始逐漸被引入電力系統(tǒng)調(diào)度、電網(wǎng)故障診斷、電力問答等領(lǐng)域,而在電力設(shè)備健康管理中還鮮有研究。在對電力設(shè)備進行狀態(tài)評估、故障診斷、故障預(yù)測時,可在歷史運維日志數(shù)據(jù)的基礎(chǔ)上,構(gòu)建電力設(shè)備健康管理知識圖譜,可有效進行知識管理,并進一步采用數(shù)據(jù)+知識聯(lián)合驅(qū)動的方法形成上層應(yīng)用,可對數(shù)據(jù)驅(qū)動的黑箱模型進行解釋,為輔助決策提供證據(jù)支撐,有助于理解電力設(shè)備故障機理,達到精準(zhǔn)運維的目標(biāo)。而在“電網(wǎng)一張圖”、數(shù)字化轉(zhuǎn)型等背景下,知識圖譜的出現(xiàn)更是為“電力設(shè)備一張圖”提供了良好的支撐。

        隨著知識圖譜在電力設(shè)備健康管理工作中研究的深入,相信在未來會形成以知識為主體的“電力設(shè)備健康管理大腦”,賦予設(shè)備自我感知、自我認知的能力,更好地與業(yè)務(wù)場景相融合,最終提升電力設(shè)備健康管理的水平。

        支撐數(shù)據(jù)和附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。

        猜你喜歡
        電力設(shè)備圖譜運維
        繪一張成長圖譜
        加強電力設(shè)備運維云平臺安全性管理
        運維技術(shù)研發(fā)決策中ITSS運維成熟度模型應(yīng)用初探
        風(fēng)電運維困局
        能源(2018年8期)2018-09-21 07:57:24
        雜亂無章的光伏運維 百億市場如何成長
        能源(2017年11期)2017-12-13 08:12:25
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        電力設(shè)備運維管理及安全運行探析
        主動對接你思維的知識圖譜
        基于ITIL的運維管理創(chuàng)新實踐淺析
        基于壓縮感知的電力設(shè)備視頻圖像去噪方法研究
        日本亚洲精品一区二区三| 官网A级毛片| 亚洲一区视频中文字幕| 国产一区二区三区久久悠悠色av| 国自产精品手机在线观看视频| 人妻无码中文人妻有码| 国产在线白浆一区二区三区在线| 在线观看在线观看一区二区三区| 台湾佬中文娱乐网22| 4444亚洲人成无码网在线观看| 国产高清白浆| 日本一级片一区二区三区| 欧美激情在线播放| 亚洲不卡中文字幕无码| 亚洲国产AⅤ精品一区二区久| 内射爆草少妇精品视频| 男女猛烈xx00免费视频试看| 久久精品国产精品亚洲毛片| 免费福利视频二区三区| 国产视频一区二区三区在线免费| 亚洲av无码一区二区三区观看| 日本午夜国产精彩| 久久99国产精品久久99密桃| 亚洲色偷偷偷综合网| 国产肉丝袜在线观看| 校花高潮一区日韩| 精品人妻69一区二区三区蜜桃| 肉体裸交137日本大胆摄影| 欧美精品在线一区| 国产性感主播一区二区| 新婚人妻不戴套国产精品| 野花社区www高清视频| 国产精品电影久久久久电影网| 被灌醉的日本人妻中文字幕| 久久超碰97人人做人人爱| 亚洲av美女在线播放啊| 美女射精视频在线观看| 国产大片黄在线观看| 日本丶国产丶欧美色综合| 国产一区二区三区蜜桃av| 女优av一区二区三区|