黃晨貴 羅一 王志文 韋鳳梅
摘要:隨著變電站無人值守及電網(wǎng)規(guī)模的逐步擴(kuò)大,對變電站監(jiān)控信息的接入質(zhì)量、規(guī)范性提出更高的要求。為提高存量監(jiān)控信息的規(guī)范性,本文通過研究基于線性相關(guān)序列的Markov算法,對長序詞條進(jìn)行分段預(yù)處理,建立監(jiān)控信息標(biāo)準(zhǔn)庫、監(jiān)控信息比對知識庫,實(shí)現(xiàn)監(jiān)控信息與標(biāo)準(zhǔn)信息的自動校核。通過監(jiān)控信息校核能夠準(zhǔn)確的、快速的對比出監(jiān)控信息與標(biāo)準(zhǔn)信號的差異情況。對在運(yùn)站點(diǎn)表進(jìn)行標(biāo)準(zhǔn)性校核,為監(jiān)控信息表管理提供有效技術(shù)支持。
Abstract: With the unattended substation and the gradual expansion of the scale of the power grid, higher requirements are put forward for the access quality and standardization of substation supervision information. In order to improve the standardization of inventory supervision information, this paper uses the Markov algorithm based on linear correlation sequence to preprocess the long-order entries in segments, establish a supervision information standard library and a supervision information comparison knowledge base, and realize supervision information and standard information automatic verification. Through the supervision information check, the difference between the supervision information and the standard signal can be accurately and quickly compared to perform standard checks on the station tables in operation and provide effective technical support for the management of supervision information.
關(guān)鍵詞:線性相關(guān)序列;Markov算法;文本處理;監(jiān)控信息;校核
Key words: linear correlation sequence;markov algorithm;text processing;supervision information;check
中圖分類號:TP301.6;O211.62? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)31-0215-03
0? 引言
隨著智能電網(wǎng)的逐步推進(jìn)以及調(diào)控一體化的全面實(shí)施,電網(wǎng)監(jiān)控?cái)?shù)據(jù)的及時(shí)性、準(zhǔn)確性的要求日益凸顯,電網(wǎng)監(jiān)控人員所面臨的壓力也逐日增加。變電站監(jiān)控信息表作為調(diào)控一體化運(yùn)行的基礎(chǔ)數(shù)據(jù),對電網(wǎng)設(shè)備健康運(yùn)行狀態(tài)監(jiān)控具有重要作用[1]。變電站監(jiān)控信息的規(guī)范程度直接影響著監(jiān)控工作的效率甚至是電網(wǎng)的安全穩(wěn)定運(yùn)行。對于存量變電站監(jiān)控信息的標(biāo)準(zhǔn)化梳理、處置,是減輕監(jiān)控人員工作強(qiáng)度,提高工作效率的重要保障。變電站監(jiān)控信息的標(biāo)準(zhǔn)化這項(xiàng)基礎(chǔ)工作對于調(diào)度、監(jiān)控人員日常的監(jiān)控信息分析、電網(wǎng)故障判斷起著舉足輕重的作用,有利于對電網(wǎng)的運(yùn)行狀態(tài)進(jìn)行有效的監(jiān)控和評估。
1? 監(jiān)控信息預(yù)處理方法
變電站的遙信、遙測、遙控、遙調(diào)等信息都是以文本弄的方式進(jìn)行存儲的,且傳統(tǒng)的監(jiān)控信息編制都以純手工的方式實(shí)現(xiàn),各站監(jiān)控信息點(diǎn)表差異較大。由此導(dǎo)致了雖然已發(fā)布相關(guān)規(guī)范,但存量監(jiān)控信息不規(guī)范情況仍較為普遍。
基于上述問題,為了避免文本數(shù)據(jù)中因?yàn)椴灰?guī)范的寫法造成的分析錯誤,在進(jìn)行信息處理抽取前,需要根據(jù)規(guī)則對文本內(nèi)容進(jìn)行標(biāo)準(zhǔn)化處理,使得同一類數(shù)據(jù)有相對統(tǒng)一的寫法。非結(jié)構(gòu)化的監(jiān)控信息在結(jié)構(gòu)化分析過程中,采用自然語言處理技術(shù)進(jìn)行分析[2]-[3]。具體方法如下:
1.1 設(shè)備類型信息處置
同一個(gè)設(shè)備類型,可能有不同的名稱描述,需要在分析之前對相關(guān)信息進(jìn)行標(biāo)準(zhǔn)化處置,方便后續(xù)對設(shè)備的定位與辨識。表1為主要設(shè)備的類型名稱規(guī)范表。
1.2 序號類信息處置
對于變壓器、電容器、電抗器、站用變等,有“1#變壓器、#1變壓器、1號變壓器、變壓器1”等多種不同的寫法,需要進(jìn)行規(guī)范化處置。在處置的過程中,注意信息之間的分割。比如針對1#電容器間隔,對應(yīng)的開關(guān)編號為231,有些不規(guī)范的文本描述中,會把開關(guān)編號、電容器序號混寫在一起,寫成“2311#電容器”;在分析的過程中,需要根據(jù)變電站信息查找包含的電容器列表,根據(jù)拓?fù)渑袛嚯娙萜靼拈_關(guān)編號信息,根據(jù)電容器、開關(guān)編號的組合,將文本分割為231、1#電容器這樣的信息組合。
1.3 數(shù)字類信息處置
針對數(shù)字(比如XX三線中的“三”),可能有漢字、阿拉伯?dāng)?shù)字、羅馬數(shù)字、不規(guī)范的羅馬數(shù)字(比如Ⅲ可能會用英文字母組合III代替),需要對多種寫法的數(shù)字進(jìn)行統(tǒng)一。在此過程中,處理的目標(biāo)信息是單獨(dú)的數(shù)字,注意不要對設(shè)備編號、保護(hù)型號等信息中的數(shù)字信息造成干擾。
另外,還需要對全角半角等各類信息進(jìn)行規(guī)范化處置。
2? 隱馬爾科夫模型研究
隱馬爾科夫模型(Hidden Markov Model,HMM)[4]:先由隱藏的馬爾科夫鏈隨機(jī)生成的不可觀測的隨機(jī)狀態(tài)序列,再由產(chǎn)生的狀態(tài)生成一個(gè)可觀測的隨機(jī)序列的過程。其中,把由隱馬爾科夫鏈隨機(jī)生成的狀態(tài)序列,稱為狀態(tài)序列(State Sequence);把每個(gè)狀態(tài)生成觀測組成的隨機(jī)序列稱為觀測序列(Observation Sequence)。因此,HMM 就是定義了觀測序列 x 和狀態(tài)序列 y 的聯(lián)合概率 p(x,y)。由于狀態(tài)序列是一個(gè)馬爾科夫鏈,并且狀態(tài)序列不可見,因此稱該過程為隱馬爾科夫過程。
3? 基于線性相關(guān)序列的Markov算法實(shí)現(xiàn)監(jiān)控信息知識庫的構(gòu)建
變電站監(jiān)控信息表是一種按電網(wǎng)調(diào)度規(guī)則,電網(wǎng)設(shè)備信息等組成的具有規(guī)律性的中文詞條。但由于不同的編制人員的對監(jiān)控信息規(guī)范理解的差異性,導(dǎo)致監(jiān)控信息的標(biāo)準(zhǔn)化程度因站而議,各站信息差距較大,人工辨識的難度、工作量都非常大。
通過研究變電站一、二次設(shè)備的信號命名規(guī)則,根據(jù)典型監(jiān)控信息的組成原理進(jìn)行深入探究[5],最終將通過預(yù)處理的監(jiān)控信息分為電壓等級、間隔、設(shè)備類型、設(shè)備編號、信號描述等部分,對應(yīng)本體監(jiān)控信號的標(biāo)注為:V(電壓等級)、S(間隔)、D(設(shè)備類型)、N(設(shè)備編號)、I(信號描述)。
對于監(jiān)控信息的描述不完備的情況,需基于具體的信號描述進(jìn)行補(bǔ)充,實(shí)現(xiàn)數(shù)據(jù)的完整性評估及填充工作。
下面以“2051水車Ⅱ線RCS-923A保護(hù)跳閘”信號為例展開說明:
①電壓等級:無,通過開關(guān)編號命名規(guī)范補(bǔ)充電壓等級為220kV;
②間隔:2051/水車Ⅱ線;
③設(shè)備類型:無,通過“RCS-923A”補(bǔ)充設(shè)備類型為線路保護(hù);
④設(shè)備編號:RCS-923A;
⑤信息描述:保護(hù)跳閘。
詳細(xì)的拆分及標(biāo)注情況示例如表2所示。
中文長詞條中缺少對分詞的明顯分隔符,通常需要依靠人為分?jǐn)鄬﹂L詞條進(jìn)行分界點(diǎn)判別。因此如何對監(jiān)控信息的分詞間斷點(diǎn)判別成為了監(jiān)控信息文本處理的關(guān)鍵?;诰€性相關(guān)序列的Markov算法可以有效對該類長詞條中文信號進(jìn)行分詞[6]。
首先通過對電網(wǎng)規(guī)程的深入分析與解讀,構(gòu)建一套經(jīng)典電網(wǎng)詞庫,包含電網(wǎng)變電站的電壓等級、間隔、設(shè)備、常見告警等信息,提取變電站遙信、遙測、遙控監(jiān)控信號表中的經(jīng)典詞,與空間向量建立映射關(guān)系,假設(shè)監(jiān)控信息點(diǎn)表中含有x個(gè)經(jīng)典詞庫收錄短詞,將它們按順序編號為1, 2, …, x。x維空間向量可采用下面的公式表達(dá):
W=[w1, …, wk, …, wx]
通過對監(jiān)控信號的分詞,實(shí)現(xiàn)監(jiān)控信息文本的向量化,以此構(gòu)建空間向量模型。對于監(jiān)控信息的文字信息處理,采用語義框架槽填充的方法實(shí)現(xiàn)對監(jiān)控信息的挖掘;運(yùn)用Space Vector探索了監(jiān)控信息中文文本的挖掘方法。
標(biāo)準(zhǔn)信息的詞條分?jǐn)喾绞酵O(jiān)控信息,不再贅述。
通過上述方法完成監(jiān)控信息、標(biāo)準(zhǔn)信息的詞條分?jǐn)?,完成監(jiān)控信息標(biāo)準(zhǔn)庫、監(jiān)控信息校核知識庫,為標(biāo)準(zhǔn)化校核提供數(shù)據(jù)支撐。
4? 監(jiān)控信息與標(biāo)準(zhǔn)信息的校核
基于監(jiān)控信息及標(biāo)準(zhǔn)信息的長序詞條分?jǐn)嗉夹g(shù),構(gòu)造監(jiān)控信息知識庫。隨著測試樣本的增加,基于監(jiān)控信息知識庫將不斷更新完善,并通過“最優(yōu)可信度占位”理論的監(jiān)控信息的匹配算法,實(shí)現(xiàn)監(jiān)控信息與標(biāo)準(zhǔn)信息的自動校核與匹配,整體方案路線見圖1。相似度在70%以上的信息可實(shí)現(xiàn)自動校核,準(zhǔn)確性可達(dá)到92~95%。
5? 結(jié)束語
在電網(wǎng)調(diào)控一體化模式下,集中監(jiān)控變電站數(shù)量及監(jiān)控?cái)?shù)據(jù)數(shù)量龐大,因信息錯漏和相關(guān)管理不到位導(dǎo)致的安全風(fēng)險(xiǎn)始終存在。本文通過基于線性相關(guān)序列的Markov算法實(shí)現(xiàn)監(jiān)控信息的詞條分?jǐn)?,完成監(jiān)控信息知識庫的構(gòu)建,進(jìn)而實(shí)現(xiàn)對監(jiān)控信息標(biāo)準(zhǔn)化的自動校核,將存量的監(jiān)控信息與標(biāo)準(zhǔn)信息實(shí)現(xiàn)精準(zhǔn)匹配,發(fā)掘存量信息存在的問題,提高監(jiān)控信息管理的效率和信息表質(zhì)量,為后續(xù)監(jiān)控信息智能化分析奠定堅(jiān)實(shí)的基礎(chǔ),保障監(jiān)控運(yùn)行安全。
參考文獻(xiàn):
[1]吳曉燕.一體化監(jiān)控信號管理在電力系統(tǒng)監(jiān)控中的應(yīng)用[J]. 科技資訊,2014,32:70.
[2]張春曉,陸建峰,夏士兵,饒莉莉,蔡丹,冉光瑩.基于專家系統(tǒng)的變電站監(jiān)控信號智能處理系統(tǒng)[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(S2):140-144.
[3]張琳.提升無人值守變電站監(jiān)控質(zhì)量探析[J].科技視界,2015,04:328.
[4]解宇涵.基于深度學(xué)習(xí)的中文分詞模型應(yīng)用研究[D].重慶:重慶大學(xué),2017.
[5]林英,陸穎銓.變電站集中監(jiān)控信號優(yōu)化方案探究[J].中國新技術(shù)新產(chǎn)品,2014,16:40-41.
[6]李英,錢建國,方響,等.基于大數(shù)據(jù)背景的集中監(jiān)控輔助決策系統(tǒng)研究[J].浙江電力,2019,38(10):34-39.DOI:10.19585/j.zjdl.201910006.