亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識圖譜的二次設(shè)備測試自動配置方法

        2022-06-16 07:20:48葉遠(yuǎn)波李端超王志華王駿東
        電力系統(tǒng)保護(hù)與控制 2022年12期
        關(guān)鍵詞:文本設(shè)備信息

        葉遠(yuǎn)波,李端超,謝 民,王志華,王駿東

        基于知識圖譜的二次設(shè)備測試自動配置方法

        葉遠(yuǎn)波1,李端超1,謝 民1,王志華2,王駿東2

        (1.國網(wǎng)安徽省電力有限公司,安徽 合肥 230022;2.武漢凱默電氣有限公司,湖北 武漢 430223)

        隨著智能變電站的發(fā)展,二次設(shè)備更新?lián)Q代頻繁且智能化程度不斷提升,以往采用手動測試配置的方法已難以滿足工作需求。提出一種基于知識圖譜的二次設(shè)備自動配置方法。首先,模擬常規(guī)測試核心流程,構(gòu)建基于測試任務(wù)的信息點(diǎn)、基于設(shè)備廠家的信息點(diǎn)檢索路徑以及基于測試配置信息類型的命名實(shí)體知識三類知識圖譜。然后,根據(jù)測試設(shè)備及測試功能,利用所構(gòu)建的知識圖譜檢索需配置信息點(diǎn),確定設(shè)備廠家并基于子圖匹配信息路徑。采用改進(jìn)的BERT模型計(jì)算配置信息點(diǎn)與描述文本之間的相似性,從而完成映射配置。此外,還加入了端口地址配置數(shù)據(jù)字符串校驗(yàn)。實(shí)驗(yàn)仿真結(jié)果表明,基于知識圖譜的二次設(shè)備測試自動配置方法合理有效,并具有極高的準(zhǔn)確性。

        二次設(shè)備測試;知識圖譜;BERT模型;文本向量;路徑推理

        0 引言

        隨著智能變電站快速推進(jìn),變電站二次設(shè)備呈現(xiàn)出種類數(shù)量急劇增加、自動化程度明顯提升、安全要求不斷加強(qiáng)的特點(diǎn)[1-5],為變電站二次設(shè)備測試的發(fā)展帶來了機(jī)遇與挑戰(zhàn)。智能電子設(shè)備IED(Intelligent Electronic Devices, IED)基于統(tǒng)一的數(shù)字化標(biāo)準(zhǔn)規(guī)約IEC61850實(shí)現(xiàn)通信[6]。同樣,二次設(shè)備測試也基于IEC61850規(guī)約解析IED文件實(shí)現(xiàn)測試配置[7]。

        目前在變電站二次設(shè)備測試時(shí),檢測人員需要根據(jù)應(yīng)用功能種類與測試策略配置對應(yīng)事件、信號、數(shù)據(jù)等信息點(diǎn),基于不同被測裝置及應(yīng)用業(yè)務(wù)的測試方案故障參數(shù)已經(jīng)預(yù)制完成,通過模擬故障設(shè)置測試參數(shù)并監(jiān)測保護(hù)裝置動作情況,從而驗(yàn)證保護(hù)效果及裝置參數(shù)設(shè)置準(zhǔn)確與否[8-9]。

        信息點(diǎn)配置是整個檢測過程的關(guān)鍵環(huán)節(jié),即在導(dǎo)入全站系統(tǒng)配置SCD(Substation Configuration Description)文件后,根據(jù)出廠配置信息文件(ICD文件),基于IED輸出端口地址配置數(shù)據(jù)及接口文本描述等信息特征,實(shí)現(xiàn)待檢測智能電子設(shè)備IED的模擬數(shù)據(jù)集與實(shí)例信息虛鏈接一一映射,但因?yàn)镮CD虛端子的dU或dAI描述沒有統(tǒng)一規(guī)范,所以大多采用手動配置的方法。變電站設(shè)備繁多,人工配置測試導(dǎo)致效率低下、配置耗時(shí)耗力、測試周期長、人員經(jīng)驗(yàn)及工作狀態(tài)差異明顯,易出現(xiàn)缺項(xiàng)漏項(xiàng),出錯后糾錯的工作量也很大。

        針對這一問題,已有相關(guān)學(xué)者對于信息自動配置方案進(jìn)行了探討。文獻(xiàn)[10]通過子模版匹配SCD文件的方式實(shí)現(xiàn)繼電保護(hù)測試配置的實(shí)例化,為二次設(shè)備測試提供了新思路,但是該方案的可擴(kuò)展性及泛化性有待提升。文獻(xiàn)[11]提出基于SCD文件的專家系統(tǒng)完成檢修二次信息的匹配,實(shí)現(xiàn)智能變電站測試中安措票的配置,但是分類較為簡單且耗時(shí)較長。文獻(xiàn)[9]及文獻(xiàn)[12]均提出了基于利用自然語言處理技術(shù)實(shí)現(xiàn)二次設(shè)備自配置,文獻(xiàn)[6]采用TextCNN對智能錄波器配置文件進(jìn)行文本分類實(shí)現(xiàn)端口地址映射,這種方法對于長本文效果較好,但對于短文本具有局限性,且未考慮其他端口地址數(shù)據(jù);文獻(xiàn)[12]利用詞向量表示技術(shù)計(jì)算虛端子語義相似度實(shí)現(xiàn)鏈接匹配,能夠得到較好的匹配效果,但采用分詞表示的方法在詞向量表示上未考慮文本的全局語義信息,仍有提升空間。通過以上討論可以發(fā)現(xiàn),二次設(shè)備自動配置方案主要基于兩種思路:一是利用模板等先驗(yàn)知識進(jìn)行匹配,準(zhǔn)確性高但泛化性低;二是利用配置信息相似性進(jìn)行分類或相似度計(jì)算,適應(yīng)性強(qiáng)但均為單設(shè)備配置。

        知識圖譜作為一種模擬人類思維方式的多源異構(gòu)實(shí)體及關(guān)系表征大數(shù)據(jù)技術(shù)[13],可解釋性及數(shù)據(jù)存儲結(jié)構(gòu)性能優(yōu)越[14-15],已在數(shù)據(jù)檢索、推薦系統(tǒng)、知識推理等方面得到廣泛運(yùn)用[16],同時(shí)在電力領(lǐng)域的數(shù)據(jù)運(yùn)維、電力文本表征及電網(wǎng)動態(tài)輔助決策等方面做出了初步研究探索[17-20]。大量投運(yùn)變電站的SCD可作為知識數(shù)據(jù)蒸餾樣本基礎(chǔ),且知識圖譜技術(shù)能夠很好地表征IED文件中的文本、字符等多源異構(gòu)數(shù)據(jù)。因此,本文提出基于知識圖譜的二次設(shè)備測試自動配置方法,將先驗(yàn)知識匹配與配置信息相似性計(jì)算兩種配置方式的優(yōu)勢相結(jié)合,利用知識圖譜多跳路徑匹配進(jìn)行配置信息查詢及抓取,并采用改進(jìn)BERT模型計(jì)算配置信息相似度,從而實(shí)現(xiàn)準(zhǔn)確高效的多設(shè)備多任務(wù)二次設(shè)備測試自動配置。

        1 二次設(shè)備測試配置文件信息解析

        智能變電站二次設(shè)備測試配置需根據(jù)測試任務(wù)映射對應(yīng)數(shù)據(jù)集參數(shù)信息點(diǎn),不同測試任務(wù)的信息需求具有差異性,在確認(rèn)目標(biāo)信息需求的基礎(chǔ)上,通過IED輸出端口地址配置數(shù)據(jù)與文本描述信息映射對應(yīng)信息點(diǎn),即可實(shí)現(xiàn)測試信息配置。SCD文件解析示意圖如圖1所示,配置所需端口地址配置數(shù)據(jù)與文本描述信息均存儲于SCD文件中,該文件描述了智能變電站中各IED的數(shù)據(jù)模型、配置信息及相互間邏輯鏈接關(guān)系,所有裝置在SCD文件中均表現(xiàn)為一級IED節(jié)點(diǎn)及其節(jié)點(diǎn)內(nèi)嵌套的各層子節(jié)點(diǎn)信息,遵循IEC61850規(guī)約[21],IED結(jié)構(gòu)主要包含訪問點(diǎn)、邏輯設(shè)備、邏輯節(jié)點(diǎn)、數(shù)據(jù)屬性、數(shù)據(jù)信息等。IED之間通過虛端子鏈接,主要包含采樣值(SV)與通用對象變電站事件(GOOSE)信息,解析配置文件即明確IED的SV與GOOSE的信息關(guān)系,由于SCD數(shù)據(jù)嵌套復(fù)雜性及SV與GOOSE信息關(guān)系的隱晦性,故通過匹配端口地址配置數(shù)據(jù)與文本描述完成信息關(guān)系映射與信息配置。

        圖1SCD文件解析示意圖

        Fig. 1Schematic diagram of SCD file parsing

        本文采用元素樹方式遍歷SCD文件的嵌套數(shù)據(jù),以各設(shè)備IED節(jié)點(diǎn)為初始節(jié)點(diǎn),按照IED層次結(jié)構(gòu)深度優(yōu)先為原則訪問其各層子節(jié)點(diǎn)的屬性及元素,然后通過字典列表的形式存儲端口地址配置數(shù)據(jù)、文本描述及對應(yīng)嵌套路徑,如此既獲得了匹配需要的關(guān)鍵信息,又保留了信息獲取路徑,為構(gòu)建二次設(shè)備測試自動配置知識圖譜奠定數(shù)據(jù)基礎(chǔ)。

        2 知識圖譜構(gòu)建

        智能變電站二次設(shè)備測試配置需要依次明晰三個內(nèi)容,首先是確定完成某種任務(wù)功能測試所需要配置的全部信息點(diǎn),隨后是根據(jù)不同設(shè)備廠家的IED數(shù)據(jù)格式清楚對應(yīng)信息的層次路徑及描述特征,最終基于信息特征判斷配置信息點(diǎn)的映射關(guān)系正確性。基于以上配置邏輯與流程,本文設(shè)計(jì)的二次設(shè)備測試自動配置知識圖譜數(shù)據(jù)模型及架構(gòu)共包含三類,如圖2所示,分別是基于測試任務(wù)的信息點(diǎn)知識圖譜、基于設(shè)備廠家的信息點(diǎn)檢索路徑知識圖譜、基于測試配置信息類型的實(shí)體命名知識圖譜。接下來針對不同部分知識圖譜構(gòu)建進(jìn)行介紹。

        圖2二次設(shè)備測試自動配置知識圖譜數(shù)據(jù)模型及架構(gòu)

        Fig. 2Data model and architecture of knowledge graph for automatic configuration of secondary equipment test

        2.1 測試任務(wù)信息點(diǎn)

        智能變電站中需要測試的二次設(shè)備包括繼電保護(hù)裝置、合并單元、智能終端、智能錄波器等多種設(shè)備,不同二次設(shè)備相對應(yīng)的測試內(nèi)容截然不同,且同種設(shè)備在不同狀態(tài)下的測試內(nèi)容也具有一定的差異性。例如繼電保護(hù)裝置測試具有變壓器、線路、母線等多種位置場景,測試內(nèi)容包含定值設(shè)置、采樣精度、動作信息、開入開出量等,所需配置的信息點(diǎn)包含SV輸入、GOOSE輸入及輸出端口地址配置數(shù)據(jù)、保護(hù)功能壓板、保護(hù)動作元件、保護(hù)動作相別及保護(hù)動作時(shí)間等。

        針對該部分內(nèi)容,在二次設(shè)備測試規(guī)定文件及廠家測試配置信息中已做出了對應(yīng)說明。本文采用模板匹配的方式對文件進(jìn)行抽取、匹配、融合并進(jìn)行人工校驗(yàn),構(gòu)建的二次設(shè)備繼電保護(hù)測試的部分信息點(diǎn)知識圖譜數(shù)據(jù)示例如圖3所示。

        圖3 部分信息點(diǎn)知識圖譜數(shù)據(jù)示例

        2.2 設(shè)備廠家信息點(diǎn)檢索路徑

        二次設(shè)備測試信息配置工作具有重復(fù)性及經(jīng)驗(yàn)性,對應(yīng)信息點(diǎn)在SCD文件中的位置在一定程度上相對統(tǒng)一,故而可通過尋找相似信息路徑的方式來配置信息。

        本文以2.1節(jié)圖譜中的信息點(diǎn)為核心及出發(fā)點(diǎn),在解析的字典中以深度優(yōu)先的檢索方式進(jìn)行匹配,查找到對應(yīng)信息則保存由IED節(jié)點(diǎn)至該信息點(diǎn)的檢索路徑,對同類信息的路徑進(jìn)行統(tǒng)計(jì)、篩查,保留路徑相似度較高的路徑作為檢索路徑。

        但這種方法也存在一定的漏洞,例如二次設(shè)備廠家主要有南瑞、許繼、四方等,各廠家間IED層次嵌套具有一定區(qū)別,不同版本設(shè)備信息表征方式同樣可能具有差異性,且存在設(shè)備配置端口地址配置數(shù)據(jù)與描述信息規(guī)范性不足的問題。

        針對以上問題提出兩種解決思路:一是對不同廠家設(shè)備構(gòu)建不同的信息點(diǎn)檢索路徑以解決廠家不同的問題;二是信息點(diǎn)檢索采用多路徑檢索,因?yàn)橥ㄟ^觀察解析保存的字典信息發(fā)現(xiàn),一般前幾層的嵌套信息路徑基本統(tǒng)一,在邏輯節(jié)點(diǎn)后的從屬層信息路徑及內(nèi)容才會出現(xiàn)差異,多為版本差異造成,因此通過保留多個相似度較高路徑作為備選路徑。

        2.3 測試配置信息命名實(shí)體

        當(dāng)完成信息點(diǎn)確認(rèn)及廠家信息點(diǎn)路徑檢索后,便到達(dá)二次設(shè)備配置的最終環(huán)節(jié),即確認(rèn)最終的測試點(diǎn)信息點(diǎn)與數(shù)據(jù)集的映射關(guān)系,也是整個配置環(huán)節(jié)中最關(guān)鍵的步驟。端口地址配置數(shù)據(jù)與文本描述信息雖然在格式上存在較大區(qū)別,但同一廠家設(shè)備信息邏輯上具有強(qiáng)關(guān)聯(lián)性,相同實(shí)體命名及表述基本統(tǒng)一,因此挖掘其實(shí)體命名規(guī)律對于信息自動配置具有重要作用。

        基于處理SCD文件獲得的字典列表數(shù)據(jù),抽取廠家、端口地址配置數(shù)據(jù)及文本描述三類信息,鏈接實(shí)體以{廠家,端口地址配置數(shù)據(jù),文本描述}形成三元組,初始抽取結(jié)果存在大量冗余數(shù)據(jù),一類是完全重復(fù)的數(shù)據(jù),另一類是由于區(qū)分同類數(shù)據(jù)不同實(shí)體而給端口地址配置數(shù)據(jù)增加的無實(shí)意編號。

        本文將三元組中端口地址配置數(shù)據(jù)信息中的數(shù)字量信息刪除,僅保留字母字符串量信息。然后以廠家與文本描述的融合信息構(gòu)建索引,統(tǒng)計(jì)每類索引中端口地址配置數(shù)據(jù)的種類及個數(shù),按照統(tǒng)計(jì)結(jié)果將三元組進(jìn)行轉(zhuǎn)化,僅保留同類索引中相同端口地址配置數(shù)據(jù)的一個三元組。此外,將相同三元組的統(tǒng)計(jì)個數(shù)以屬性值性質(zhì)嵌入,從而實(shí)現(xiàn)將大量冗余實(shí)體消歧并融合,最終形成廠家、文本描述、端口地址配置數(shù)據(jù)表述的簡化子圖,基于測試配置信息類型的部分命名實(shí)體知識圖譜數(shù)據(jù)示例如圖4所示。

        圖4 部分命名實(shí)體知識圖譜數(shù)據(jù)示例

        3 基于知識圖譜的配置自動推理方法

        3.1 基于改進(jìn)BERT模型的文本相似度匹配算法

        短文本相似性不是直接計(jì)算兩個原始文本,需將源文本轉(zhuǎn)換為計(jì)算機(jī)可以理解和處理的數(shù)據(jù),而計(jì)算機(jī)更善于處理向量模式數(shù)據(jù),所以一般將文本聚焦于向量空間中進(jìn)行度量,常見的模型有詞袋模型和詞嵌入。詞袋模型通常與詞頻-逆文本頻率聯(lián)合使用,常見的有向量空間模型、淺語義分析、隱含狄利克雷分布等,詞袋模型較為簡單但具有一定的限制性,沒有考慮詞序、稀疏性、復(fù)雜性問題,對于處理本文較短的電力描述信息難以挖掘足夠的語義信息。詞嵌入常見的如Word2Vec、TextCNN、BERT模型等[22],在泛化性及語義信息理解上有了極大的提升。本文選取目前應(yīng)用最為廣泛的BERT模型為基礎(chǔ)模型,考慮文本較短的情況,故而采用基于字向量的BERT模型對文本進(jìn)行分布式嵌入。BERT模型基礎(chǔ)結(jié)構(gòu)如圖5所示。

        圖5 BERT模型結(jié)構(gòu)

        將初始向量采用注意力機(jī)制求解,采用Softmax函數(shù)歸一化為概率分布,如式(4)所示。

        考慮基于字向量的文本嵌入模型對于電力領(lǐng)域詞匯特征提取有一定的局限性,缺乏一定的先驗(yàn)知識與背景信息,對于專有詞匯的表征可能會出現(xiàn)一定偏差。因此本文提出在字向量基礎(chǔ)上融合二次測試專有詞匯的詞嵌入向量,從而豐富描述短文本的特征表征信息。

        基于獲得的文本向量,采用應(yīng)用最為廣泛的余弦相似度度量文本相似度,如式(10)。

        求得的距離與相似度成反比,距離越小則相似度越大,與給定配置信息點(diǎn)距離最小的短文本描述即為所要匹配映射的配置信息描述。最終改進(jìn)BERT模型處理流程如圖6所示。

        圖6 改進(jìn)BERT模型處理流程

        3.2 多圖分級推理的信息配置模型

        二次設(shè)備測試配置本質(zhì)上是一項(xiàng)信息檢索匹配任務(wù),任務(wù)具有很強(qiáng)的程式性與邏輯性,模型需要協(xié)調(diào)信息配置順序,強(qiáng)調(diào)配置結(jié)果準(zhǔn)確率,同時(shí)兼顧配置效率,在考慮以上因素的基礎(chǔ)上本文提出多圖分級推理的信息配置模型來實(shí)現(xiàn)二次設(shè)備測試的自動配置,具體流程如圖7所示。

        圖7 配置具體流程圖

        圖8 檢索路徑匹配子圖模板構(gòu)造

        基于編輯距離計(jì)算字符串相似度公式為

        4 算例結(jié)果與分析

        4.1 實(shí)驗(yàn)數(shù)據(jù)

        為了驗(yàn)證本文所提模型及方法在二次設(shè)備測試配置任務(wù)中的有效性,本文選取許繼、南瑞、平高三個廠家的設(shè)備進(jìn)行測試,重點(diǎn)研究保護(hù)、測控、智能終端及合并單元典型測試任務(wù)[25],抽取各廠家已配置成功的測試設(shè)備映射關(guān)系IED數(shù)據(jù)5 000條作為配置樣本。樣本按廠家隨機(jī)分成5份:選擇其中4份作為訓(xùn)練集,構(gòu)建知識圖譜并訓(xùn)練文本向量;1份作為測試集,且測試集不分廠家隨機(jī)打亂,利用測試集衡量算法及模型效果。部分?jǐn)?shù)據(jù)樣本如表1所示,可以看出文本描述與配置信息點(diǎn)相似度很大,但在描述上也具有一定區(qū)別。端口地址配置數(shù)據(jù)大部分字符串具有一定解釋性,例如“PIGO”表示跳閘,“PROT”表示保護(hù),但同樣兩個閉鎖重合閘配置信息點(diǎn)端口地址配置數(shù)據(jù)卻完全不同,是因?yàn)閺S家命名區(qū)別,且存在例如“Amp1”“Ind90”等釋義難以確定字符串,但其在描述上具有高度相似性,這也是本文選擇主要以文本匹配信息點(diǎn)的原因之一。

        表1 部分樣本示例

        4.2 評價(jià)指標(biāo)

        本文測試數(shù)據(jù)均為配置完成數(shù)據(jù),因此檢索結(jié)果具有唯一性,即通過最終基于本文所提方法的配置數(shù)據(jù)判斷檢索結(jié)果。匹配成功則為正確,匹配失敗則為錯誤,匹配失敗則繼續(xù)匹配,至多匹配5次。將一個信息點(diǎn)匹配作為一次匹配任務(wù),通過建立準(zhǔn)確度(ACC)和平均倒數(shù)排名(MRR)作為匹配結(jié)果的評價(jià)指標(biāo)[26],以評估任務(wù)路徑匹配與文本相似度匹配效果,如式(15)、式(16)所示。

        4.3 實(shí)驗(yàn)環(huán)境及參數(shù)

        本次實(shí)驗(yàn)環(huán)境為Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10 GHz 八核,NVIDIA Corporation GP102 [GeForce GTX 1080 Ti],Ubuntu 16.04 操作系統(tǒng),采用python語言編程,改進(jìn)BERT模型基于TensorFlow深度學(xué)習(xí)框架構(gòu)建。模型中各參數(shù)設(shè)置如表2所示。

        表2 模型重要參數(shù)設(shè)置

        4.4 實(shí)驗(yàn)設(shè)置及結(jié)果分析

        4.4.1路徑檢索方法驗(yàn)證

        本文提出的二次設(shè)備測試配置方法首先要尋找到所要匹配的配置信息在IED文件中的嵌套位置,即檢索位置路徑。通過在1圖譜中匹配配置信息點(diǎn)可極大減少依靠經(jīng)驗(yàn)的重復(fù)性工作,實(shí)驗(yàn)中發(fā)現(xiàn)構(gòu)建每類任務(wù)的配置信息點(diǎn)雖然具有一定的工作量,但是構(gòu)建完成后可一直使用,能夠提升配置準(zhǔn)確率,減少操作失誤,單次檢索時(shí)間小于0.001 s。此外,基于2圖譜關(guān)系抽取,可自動確定待測試設(shè)備廠家,實(shí)現(xiàn)對設(shè)備廠家快速分類并為后續(xù)子圖匹配及信息匹配奠定基礎(chǔ)。以上兩項(xiàng)任務(wù)在實(shí)驗(yàn)中均未發(fā)生匹配錯誤的情況,驗(yàn)證了其邏輯合理并處理高效。

        基于圖譜2的子圖匹配方式與關(guān)系型數(shù)據(jù)庫兩種方式檢索路徑的時(shí)間復(fù)雜度如表3所示,可以看出子圖匹配的方式能夠極大地減少時(shí)間支出,且檢索邏輯清晰明了,相比較而言通過關(guān)系型數(shù)據(jù)庫查找相對復(fù)雜一些,對于配置人員來說難度極大。

        表3 不同數(shù)據(jù)庫檢索路徑時(shí)間復(fù)雜度對比

        為了驗(yàn)證路徑檢索結(jié)果性能,本文通過設(shè)置單次任務(wù)1~4條最相似路徑分別在測試集進(jìn)行路徑匹配,抓取路徑下所有待匹配文本描述與端口地址配置數(shù)據(jù),所獲得數(shù)據(jù)中含有映射正確的待匹配信息點(diǎn)數(shù)據(jù)則為正確,計(jì)算指標(biāo)結(jié)果如表4所示。

        表4 不同數(shù)量相似路徑下檢索結(jié)果對比

        從表4中可以看出,基于路徑檢索獲取待匹配信息完全能夠滿足任務(wù)需求,只匹配最相似路徑便可獲得95%以上的準(zhǔn)確率,并且在匹配兩條最相似路徑時(shí)準(zhǔn)確率又得到了0.32%的提升。通過觀察結(jié)果發(fā)現(xiàn),設(shè)備版本變化帶來的IED文件嵌套格式變化波動不大,隨著后續(xù)匹配路徑的數(shù)量增加,準(zhǔn)確率上升趨勢減緩,這也說明了信息匹配路徑具有極大相似性,同時(shí)驗(yàn)證了本文所提路徑檢索方法有效。

        4.4.2改進(jìn)BERT模型性能評估

        為了評估本文提出的基于字向量并融入關(guān)鍵詞向量的改進(jìn)BERT文本嵌入式表示模型,選取VSM、Word2Vec以及考慮細(xì)粒度、多頭注意力機(jī)制及關(guān)鍵詞的BERT模型進(jìn)行比較,待匹配文本數(shù)據(jù)基于路徑檢索正確情況下所獲得的數(shù)據(jù),結(jié)果對比如表5所示。

        表5 不同文本匹配模型結(jié)果對比

        從上述各方法匹配的結(jié)果來看,采用融合多頭注意力機(jī)制、字粒度、關(guān)鍵詞的BERT模型取得了最高的準(zhǔn)確率及平均倒數(shù)排名,實(shí)驗(yàn)1采用傳統(tǒng)向量空間模型VSM,準(zhǔn)確率僅達(dá)到82.2%,而實(shí)驗(yàn)2~6準(zhǔn)確率均達(dá)到了90%以上,原因在于VSM對于數(shù)據(jù)依賴性較強(qiáng),過于機(jī)械化,而實(shí)驗(yàn)2~6屬于深度學(xué)習(xí)模型,生成的表示向量具有一定的語義特征,更能夠反映真實(shí)文本含義。同時(shí),在相同的BERT模型下,實(shí)驗(yàn)5相較于實(shí)驗(yàn)4在指標(biāo)上分別獲得了1.1%準(zhǔn)確率提升和1.2%的平均倒數(shù)排名提升,說明針對二次設(shè)備測試配置短文本采用字粒度能夠獲得更好的詞義表示向量。此外,本文融合基于關(guān)鍵詞的詞粒度BERT模型語義表征向量在評估結(jié)果中取得了最優(yōu)效果,相對于未考慮關(guān)鍵詞的實(shí)驗(yàn)5提升了2.5%的準(zhǔn)確率以及2.2%的平均倒數(shù)排名,兩項(xiàng)指標(biāo)均達(dá)到了98%以上,甚至前5平均倒數(shù)排名達(dá)到了98.9%的極優(yōu)性能,說明考慮領(lǐng)域關(guān)鍵詞相當(dāng)于對深度學(xué)習(xí)BERT模型增加了一部分先驗(yàn)知識,起到對描述文本向量表征的補(bǔ)充作用。

        4.4.3自動配置方法評價(jià)

        本文所提出的二次設(shè)備測試自動配置方法主要由兩個關(guān)鍵環(huán)節(jié)組成。一是圖譜匹配獲取信息點(diǎn)路徑抓取待匹配輸出端口地址配置數(shù)據(jù)及接口文本描述數(shù)據(jù);二是在抓取的數(shù)據(jù)中基于改進(jìn)BERT進(jìn)行相似度計(jì)算得到匹配數(shù)據(jù)并校驗(yàn)。下面將各環(huán)節(jié)結(jié)合為整體進(jìn)行評估,考慮不同的最相似路徑抓取數(shù)量、文本相似度匹配模型及是否加入字符串校驗(yàn)因素,以最終匹配準(zhǔn)確率及用時(shí)作為評價(jià)指標(biāo),實(shí)驗(yàn)設(shè)置10輪,每輪實(shí)驗(yàn)設(shè)置配置100個測試任務(wù),耗時(shí)為每輪任務(wù)平均耗時(shí),實(shí)驗(yàn)結(jié)果如表6所示。

        表6 不同文本匹配模型結(jié)果對比

        觀察表6可發(fā)現(xiàn),16個實(shí)驗(yàn)設(shè)置互為對照,從實(shí)驗(yàn)結(jié)果可以對路徑抓取、模型改進(jìn)、校驗(yàn)成效三個方面實(shí)驗(yàn)結(jié)果進(jìn)行綜合討論。首先,實(shí)驗(yàn)1~4、實(shí)驗(yàn)5~8、實(shí)驗(yàn)9~12以及實(shí)驗(yàn)13~16四組實(shí)驗(yàn)在模型及是否校驗(yàn)統(tǒng)一的情況下,抓取路徑數(shù)量與耗時(shí)成正比增加,不難理解,抓取數(shù)量增加則意味著所要進(jìn)行的相似度計(jì)算規(guī)模也相應(yīng)擴(kuò)大,從而造成時(shí)間成本的增加。實(shí)驗(yàn)4比實(shí)驗(yàn)1耗時(shí)增加了近4倍,雖然犧牲了時(shí)間但換取了準(zhǔn)確率的提升,當(dāng)抓取數(shù)量從1升至2時(shí),四組對比實(shí)驗(yàn)準(zhǔn)確率均上升了3%左右。在抓取數(shù)量從2升至3及從3升至4時(shí),準(zhǔn)確率提升較小,甚至出現(xiàn)了準(zhǔn)確率下降的情況。依據(jù)配置錯誤實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),抓取路徑增多直接帶來待匹配數(shù)據(jù)量成倍增加,由此加大了匹配難度,帶來相似度計(jì)算性能下降,又因?yàn)榘姹咀兓瘞砺窂阶兓那闆r較少發(fā)生,出現(xiàn)三種或四種路徑的情況較少,所以出現(xiàn)了路徑數(shù)量為2時(shí)準(zhǔn)確率提升較大,后續(xù)增加路徑數(shù)量提升較少的情況。

        實(shí)驗(yàn)1~4與實(shí)驗(yàn)5~8互為對照,同樣實(shí)驗(yàn)9~12與實(shí)驗(yàn)13~16互為對照,這兩組對照的變量為模型,通過觀察實(shí)驗(yàn)結(jié)果不難發(fā)現(xiàn),改進(jìn)BERT模型比基礎(chǔ)BERT模型在準(zhǔn)確率上有較大提升,兩組8個實(shí)驗(yàn)對比準(zhǔn)確率平均提升了4.7%,再一次說明了本文所提改進(jìn)模型的有效性,同時(shí),改進(jìn)模型帶來的時(shí)間成本增加在2 s左右,在可接受范圍內(nèi),在實(shí)際應(yīng)用時(shí),可根據(jù)任務(wù)環(huán)境選擇模型。

        實(shí)驗(yàn)1~8與實(shí)驗(yàn)9~16在是否進(jìn)行字符串校驗(yàn)的變量因素上形成互為對照,由于增加了編輯距離計(jì)算過程,所以造成了一定的時(shí)間成本增加,每輪平均耗時(shí)增加4.9 s。但從準(zhǔn)確率上來說,增加字符串校驗(yàn)對于準(zhǔn)確率的提升具有一定積極作用,平均提升1.3%的準(zhǔn)確率。

        通過對上述對比試驗(yàn)討論,證明了路徑檢索方法、改進(jìn)BERT模型及字符串校驗(yàn)在二次設(shè)備測試配置中具有顯著作用。此外,從整體上看,實(shí)驗(yàn)16準(zhǔn)確率達(dá)到了98.3%,再次直觀驗(yàn)證了本文所提二次設(shè)備自動配置方法切實(shí)有效。

        5 結(jié)論

        本文考慮到二次設(shè)備測試人工配置效率低且易出錯的問題,提出了一種基于知識圖譜的二次設(shè)備自動配置方法,結(jié)論如下:

        1) 通過構(gòu)建二次設(shè)備測試知識圖譜,將IED文件與測試任務(wù)、測試設(shè)備、配置信息點(diǎn)、信息路徑建立知識關(guān)聯(lián),在此基礎(chǔ)上實(shí)現(xiàn)了自動抓取待匹配信息點(diǎn)的端口地址配置數(shù)據(jù)及文本描述,從而為信息映射匹配奠定了基礎(chǔ)。實(shí)驗(yàn)證明,路徑檢索準(zhǔn)確率至少可達(dá)到95%以上。

        2) 以BERT模型為基礎(chǔ),在字向量BERT模型基礎(chǔ)上融合二次測試專有詞匯的詞嵌入向量,有效增加了文本相似度識別過程中的先驗(yàn)知識,準(zhǔn)確率平均提升了4.7%,最高可達(dá)到96.7%。增加了端口地址配置數(shù)據(jù)字符串校驗(yàn)環(huán)節(jié)以解決文本描述無法確定映射數(shù)據(jù)的情況,進(jìn)一步將準(zhǔn)確率提升約1.3%,有效地實(shí)現(xiàn)信息點(diǎn)與文本描述的映射匹配。

        3) 通過設(shè)置多變量對照實(shí)驗(yàn),配置準(zhǔn)確率最高達(dá)到98.3%。并對路徑抓取、模型改進(jìn)、校驗(yàn)成效進(jìn)行綜合評估,實(shí)驗(yàn)發(fā)現(xiàn),增加校驗(yàn)環(huán)節(jié)及采用改進(jìn)BERT模型對于準(zhǔn)確率提升均有較大作用,且耗時(shí)上不會有較大影響。增加最相似路徑抓取數(shù)量對于提升待匹配數(shù)據(jù)中配置映射準(zhǔn)確率有一定效果,但在整個配置環(huán)節(jié)中準(zhǔn)確率并非隨著路徑數(shù)量增加而線性增加,因?yàn)槁窂綌?shù)量增加帶來的待匹配描述文本數(shù)量成倍增加,由此帶來的耗時(shí)增加及可能的相似度計(jì)算準(zhǔn)確率下降仍需納入工作考量。

        [1] HE Yuqing, CHEN Yuehui, YANG Zhiqiang, et al. A review on the influence of intelligent power consumption technologies on the utilization rate of distribution network equipment[J]. Protection and Control of Modern Power Systems, 2018, 3(2): 183-193.

        [2] 張巧霞, 王廣民, 李江林, 等. 變電站遠(yuǎn)程運(yùn)維平臺設(shè)計(jì)與實(shí)現(xiàn)[J]. 電力系統(tǒng)保護(hù)與控制, 2019, 47(10): 164-172.

        ZHANG Qiaoxia, WANG Guangmin, LI Jianglin, et al. Design and implementation of substation remote operation and maintenance platform[J]. Power System Protection and Control, 2019, 47(10): 164-172.

        [3] 李寶潭, 趙丹, 李寶偉, 等. 智能變電站在線防誤系統(tǒng)關(guān)鍵技術(shù)的研究[J]. 智慧電力, 2020, 48(6): 73-78, 111.

        LI Baotan, ZHAO Dan, LI Baowei, et al. Key technologies of online error prevention system in smart substation[J]. Smart Power, 2020, 48(6): 73-78, 111.

        [4] 錢平, 楊松偉, 張永, 等. 面向智能變電站信息流可靠性分析方法研究[J]. 電測與儀表, 2021, 58(10): 106-111.

        QIAN Ping, YANG Songwei, ZHANG Yong, et al. Research on reliability analysis method of information flow in intelligent substation[J]. Electrical Measurement & Instrumentation, 2021, 58(10): 106-111.

        [5] 范衛(wèi)東, 董金星, 馮曉偉, 等. 智能變電站二次操作校核方法研究[J]. 電測與儀表, 2020, 57(13): 40-46, 54.

        FAN Weidong, DONG Jinxing, FENG Xiaowei, et al. Research on checking method of secondary operation in smart substation[J]. Electrical Measurement & Instrumentation, 2020, 57(13): 40-46, 54.

        [6] 吳在軍, 胡敏強(qiáng). 基于IEC 61850標(biāo)準(zhǔn)的變電站自動化系統(tǒng)研究[J]. 電網(wǎng)技術(shù), 2003, 27(10): 61-65.

        WU Zaijun, HU Minqiang. Research on a substation automation system based on IEC61850[J]. Power System Technology, 2003, 27(10): 61-65.

        [7] 陳德輝, 須雷, 趙希才. 智能變電站自動化與保護(hù)核心 IEC 標(biāo)準(zhǔn)的進(jìn)展與分析[J]. 電力系統(tǒng)自動化, 2019, 43(21): 229-239.

        CHEN Dehui, XU Lei, ZHAO Xicai. Progress and analysis of intelligent substation automation and protection core IEC standards[J]. Automation of Electric Power Systems, 2019, 43(21): 229-239.

        [8] 諸源勝. 智能變電站二次設(shè)備一體化測試系統(tǒng)的研制及應(yīng)用[D]. 廣州: 華南理工大學(xué), 2020.

        CHU Yuansheng. Development and application of integrated test system for secondary equipment of the intelligent substation[D]. Guangzhou: South China University of Technology, 2020.

        [9] 陳旭, 張弛, 劉千寬, 等. 基于深度語義學(xué)習(xí)的智能錄波器自配置方法[J]. 電力系統(tǒng)保護(hù)與控制, 2021, 49(2): 179-187.

        CHEN Xu, ZHANG Chi, LIU Qiankuan, et al. Automatic configuration method of intelligent recorder based on deep semantic learning[J]. Power System Protection and Control, 2021, 49(2): 179-187.

        [10] 張曉莉, 劉慧海, 李俊慶, 等. 智能變電站繼電保護(hù)自動測試平臺[J]. 電力系統(tǒng)自動化, 2015, 39(18): 91-96.

        ZHANG Xiaoli, LIU Huihai, LI Junqing, et al. Automatic test platform in smart substation for relay protection[J]. Automation of Electric Power Systems, 2015, 39(18): 91-96.

        [11] FAN Wen, LIAO Yuan. Wide area measurements based fault detection and location method for transmission lines[J]. Protection and Control of Modern Power Systems, 2019, 4(1): 53-64.

        [12] 范衛(wèi)東, 馮曉偉, 董金星, 等. 基于歷史數(shù)據(jù)語義相似度的智能變電站虛端子自動連接[J]. 電力系統(tǒng)保護(hù)與控制, 2020, 48(17): 179-186.

        FAN Weidong, FENG Xiaowei, DONG Jinxing, et al. Automatic matching method of a virtual terminal in intelligent substation based on semantic similarity of historical data[J]. Power System Protection and Control, 2020, 48(17): 179-186.

        [13] SINGHAL A. Introducing the knowledge graph: things, not strings[J]. Official Google Blog, 2012.

        [14] WANG Xiang, WANG Dingxian, XU Canran, et al. Explainable reasoning over knowledge graphs for recommendation[C] // Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence, AAAI, 2019, Honolulu, USA: 5329-5336.

        [15] JI Shaoxiong, PAN Shirui, CAMBRIA E, et al. A survey on knowledge graphs: representation, acquisition and applications[J]. arXiv preprint arXiv: 2002.00388, 2020.

        [16] 饒子昀, 張毅, 劉俊濤, 等. 應(yīng)用知識圖譜的推薦方法與系統(tǒng)[J]. 自動化學(xué)報(bào), 2021, 9(3): 2061-2077.

        RAO Ziyun, ZHANG Yi, LIU Juntao, et al. Recommendation methods and systems using knowledge graph[J]. Acta Automatica Sinica, 2021, 9(3): 2061-2077.

        [17] DAI Renchang, LIU Guangyi, WANG Zhiwei, et al. A novel graph-based energy management system[J]. IEEE Transactions on Smart Grid, 2019, 11(3): 1845-1853.

        [18] 劉廣一, 王繼業(yè), 李洋, 等. “電網(wǎng)一張圖”時(shí)空信息管理系統(tǒng)[J]. 電力信息與通信技術(shù), 2020, 18(1): 7-17.

        LIU Guangyi, WANG Jiye, LI Yang, et al. “One graph of power grid” spatio-temporal information management system[J]. Electric Power Information and Communication Technology, 2020, 18(1): 7-17.

        [19] 喬驥, 王新迎, 閔睿, 等. 面向電網(wǎng)調(diào)度故障處理的知識圖譜框架與關(guān)鍵技術(shù)初探[J]. 中國電機(jī)工程學(xué)報(bào), 2020, 40(18): 5837-5848.

        QIAO Ji, WANG Xinying, MIN Rui, et al. Framework and key technologies of knowledge-graph-based fault handling system in power grid[J]. Proceedings of the CSEE, 2020, 40(18): 5837-5848.

        [20] 余建明, 王小海, 張?jiān)? 等. 面向智能調(diào)控領(lǐng)域的知識圖譜構(gòu)建與應(yīng)用[J]. 電力系統(tǒng)保護(hù)與控制, 2020, 48(3): 29-35.

        YU Jianming, WANG Xiaohai, ZHANG Yue, et al. Construction and application of knowledge graph for intelligent dispatching and control[J]. Power System Protection and Control, 2020, 48(3): 29-35.

        [21] APOSTOLOV A. Efficient maintenance testing in digital substations based on IEC 61850 edition 2[J]. Protectionand Control of Modern Power Systems, 2017, 2(4): 407-420.

        [22] GUTIéRREZ L, KEITH B. A systematic literature review on word embeddings[C] // International Conference on Software Process Improvement, Springer, Cham, 2018: 132-141.

        [23] DEVLIN J, CHANG M W, LEE K, et al. Bert: pre-training of deep bidirectional transformers for language understanding[J]. arXiv preprint arXiv: 1810.04805, 2018.

        [24] LI Yujian, LIU Bo. A normalized Levenshtein distance metric[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(6): 1091-1095.

        [25] 陳桂芳, 董秀成, 鄭永康, 等. 基于長短期記憶網(wǎng)絡(luò)的繼電保護(hù)測試故障診斷研究[J/OL]. 電力系統(tǒng)保護(hù)與制: 1-9[2021-12-20]. https://doi.org/10.19783/j.cnki.pspc. 210624.

        CHEN Guifang, DONG Xiucheng, ZHENG Yongkang, et al. Fault diagnosis of a relay protection test based on a long short-term memory network[J]. Power System Protection and Control: 1-9[2021-12-20]. https://doi.org/10.19783/j. cnki.pspc.210624.

        [26] YU Y, LI Y, SHEN J, et al. STEAM: Self-supervised taxonomy expansion with mini-paths[C] // Proceedings of the 26th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 2020: 1026-1035.

        Automatic configuration method of secondary equipment test based on a knowledge graph

        YE Yuanbo1, LI Duanchao1, XIE Min1, WANG Zhihua2, WANG Jundong2

        (1. State Grid Anhui Electric Power Co., Ltd., Hefei 230022, China; 2. Wuhan Kemov Electric Co., Ltd., Wuhan 430223, China)

        With the development of smart substations, the replacement of secondary equipment is frequent and intelligence is increasingly improved. The former manual test configuration method finds it difficult to meet the work needs.An automatic configuration method for secondary equipment based on a knowledge graph is proposed. First, the core process of conventional testing is simulated to build a knowledge graph based on three types of data, test task information points, information point retrieval paths of equipment manufacturers, and named entity knowledge of test configuration information types. Then, from the test equipment and testing capabilities, the information points needed to be configured are retrieved by the constructed knowledge graph, the device manufacturer is determined and the information path is matched based on the subgraph. The improved BERT model is used to calculate the similarity between the configuration information points and the description text to complete the mapping configuration. In addition, a string verification of port address configuration data is added. The simulation results show that the method based on the knowledge graph is reasonable and effective and has high accuracy.

        secondary equipment test; knowledge graph; BERT model; text vector; path reasoning

        10.19783/j.cnki.pspc.211193

        2021-08-30;

        2021-12-21

        葉遠(yuǎn)波(1973—),男,碩士,教授級高工,研究方向?yàn)殡娏ο到y(tǒng)繼電保護(hù);E-mail: 13905608638@139.com

        王駿東(1996—),男,通信作者,碩士研究生,研究方向?yàn)殡娏χR圖譜。E-mail: 1825893405@qq.com

        This work is supported by the Science and Technology of State Grid Corporation of China (No. 5212002000AR).

        國家電網(wǎng)公司科技項(xiàng)目資助(5212002000AR)

        (編輯 魏小麗)

        猜你喜歡
        文本設(shè)備信息
        諧響應(yīng)分析在設(shè)備減振中的應(yīng)用
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        基于MPU6050簡單控制設(shè)備
        電子制作(2018年11期)2018-08-04 03:26:08
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        500kV輸變電設(shè)備運(yùn)行維護(hù)探討
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        原來他們都是可穿戴設(shè)備
        如何快速走進(jìn)文本
        語文知識(2014年1期)2014-02-28 21:59:13
        久久99精品久久久久久琪琪| 亚洲国产日韩av一区二区| 午夜视频手机在线免费观看| 国产内射爽爽大片| 国产又爽又粗又猛的视频| 欧美日韩亚洲色图| 亚洲中文有码一区二区| 久久精品日本不卡91| 狠狠色狠狠色综合| 国产一区二区精品在线观看 | 亚洲最新中文字幕一区| 青青草小视频在线观看| 免费网站看av片| 久99久热只有精品国产男同| 日韩精品一区二区三区四区五区六 | 在线视频你懂的国产福利| 日韩av在线不卡观看| 亚洲av网站在线观看一页| 99精品国产一区二区三区| √最新版天堂资源在线| 午夜一区二区在线视频| 亚洲成在人线视av| 丁香花在线影院观看在线播放| 一区二区视频观看在线| 日本av一区二区在线| 国产亚洲一区二区在线观看| 精品亚洲aⅴ在线观看| 午夜天堂精品一区二区| 国产日产韩国av在线| 少妇下蹲露大唇无遮挡| 亚洲AV肉丝网站一区二区无码| 操国产丝袜露脸在线播放| 久久久久人妻一区二区三区| 丰满人妻妇伦又伦精品国产 | 亚洲av色香蕉一区二区三区蜜桃 | 亚洲国产精品一区二区成人片国内| 久久无码人妻精品一区二区三区| 欧美手机在线视频| av在线免费观看大全| 免费人成视频xvideos入口| 无码不卡一区二区三区在线观看 |