陶士昌,徐天品,劉琪,翟毅,曹衛(wèi)華,孫榮西
(1.南瑞集團(tuán)公司(國(guó)網(wǎng)電力科學(xué)研究院),江蘇 南京 210061;2.國(guó)電南瑞科技股份有限公司,江蘇 南京 211106)
隨著我國(guó)特高壓電網(wǎng)建設(shè)的全面提速、新能源的快速發(fā)展和電力市場(chǎng)化改革的深入推進(jìn),電網(wǎng)一體化運(yùn)行的特征愈發(fā)明顯,對(duì)電網(wǎng)實(shí)施集中分析決策、多專業(yè)間業(yè)務(wù)協(xié)作和跨調(diào)度機(jī)構(gòu)工作協(xié)同等需求更加迫切。
近年來(lái),快速發(fā)展的云計(jì)算技術(shù)具備超大規(guī)模、虛擬化、高可靠性、通用性、高可擴(kuò)展性、按需服務(wù)等特點(diǎn)。基于云計(jì)算技術(shù),文[3]提出了調(diào)控云總體規(guī)劃,設(shè)計(jì)了調(diào)控云總體架構(gòu),提出了調(diào)控云建設(shè)需要突破的關(guān)鍵技術(shù),展望了調(diào)控云的應(yīng)用前景。調(diào)控云能夠?qū)崿F(xiàn)電力調(diào)度信息的全局規(guī)劃和統(tǒng)一設(shè)計(jì),提升大電網(wǎng)運(yùn)行安全水平和調(diào)控管理的精益化水平。
目前,模型數(shù)據(jù)上云的方法主要有兩種:一種是以Ⅰ區(qū)為源三區(qū)完善參數(shù),即在Ⅰ區(qū)建立模型數(shù)據(jù)中心匯集全省D5000 模型數(shù)據(jù),同步到Ⅲ區(qū),通過(guò)Ⅲ區(qū)OMS(Operation Management System)系統(tǒng)的新設(shè)備啟動(dòng)流程結(jié)合O-P 將缺少的參數(shù)維護(hù)完整;另一種以三區(qū)為源,即調(diào)控云就是模型數(shù)據(jù)的源頭,在調(diào)控云維護(hù)完整后,同步給其他系統(tǒng)共享該類模型。本文采用的是第一種方法。此根據(jù)方法,傳統(tǒng)的獲取方式是進(jìn)行手工錄入模型數(shù)據(jù)或者通過(guò)模型拼接導(dǎo)入模型數(shù)據(jù)。對(duì)于手工錄入模型數(shù)據(jù),后續(xù)云端數(shù)據(jù)與EMS(Energy Management System)系統(tǒng)的映射關(guān)系也需要人工維護(hù),效率低下,難以大規(guī)模應(yīng)用。對(duì)于模型文件拼接導(dǎo)入方式,容易存在數(shù)據(jù)不準(zhǔn)確、不規(guī)范等問(wèn)題,而且模型數(shù)據(jù)變化后不宜實(shí)時(shí)同步,導(dǎo)入效率低。本文提出的模型數(shù)據(jù)治理系統(tǒng)通過(guò)分析電網(wǎng)調(diào)控系統(tǒng)以及OMS系統(tǒng)與調(diào)控云結(jié)構(gòu)化設(shè)計(jì)的差異,通過(guò)模糊匹配關(guān)鍵技術(shù),建立調(diào)控系統(tǒng)、OMS 系統(tǒng)與調(diào)控云模型表域的映射關(guān)系,通過(guò)此映射關(guān)系,可將OMS 系統(tǒng)中的數(shù)據(jù)補(bǔ)充到調(diào)控系統(tǒng),再通過(guò)可配置的轉(zhuǎn)換規(guī)則和可視化的轉(zhuǎn)換流程實(shí)現(xiàn)電網(wǎng)模型數(shù)據(jù)的治理上云。下面各章節(jié)具體介紹了該系統(tǒng)的實(shí)現(xiàn)方式,包括模糊匹配、模型數(shù)據(jù)治理規(guī)則、數(shù)據(jù)治理總體流程三個(gè)方面,并在第4 小節(jié)中介紹了本系統(tǒng)的實(shí)際應(yīng)用情況。
采用人工方式建立數(shù)據(jù)關(guān)聯(lián),工作量巨大,針對(duì)此問(wèn)題,本文引入了模糊匹配的關(guān)鍵技術(shù)。該技術(shù)包括IK Analyzer分詞工具與相似度比較函數(shù)兩部分。
IK Analyzer 是一個(gè)開(kāi)源的,基于Java 語(yǔ)言開(kāi)發(fā)的輕量級(jí)的中文分詞工具包,具有如下特點(diǎn):
(1)支持細(xì)粒度和智能分詞兩種切分模式:采用了特有的“正向迭代最細(xì)粒度切分算法”;
(2)高速處理能力:Core2 i7 3.4G 雙核,4G 內(nèi)存,window 7 64 位,Sun JDK 1.6_29 64 位普通PC 環(huán)境測(cè)試,達(dá)到160 萬(wàn)字/秒(3000KB/S);
(3)智能分詞模式支持分詞排歧義處理和數(shù)量詞合并輸出;
(4)優(yōu)化的詞典存儲(chǔ),更小的內(nèi)存占用,支持用戶詞典擴(kuò)展定義。
分詞后是相似度匹配流程,本文采用“余弦相似度法”,公式如下。
模糊匹配流程如下:
(1)抽取同一設(shè)備不同系統(tǒng)中的表數(shù)據(jù);
(2)IK Analyzer 分詞;
(3)計(jì)算詞頻,組成詞頻向量;
(4)相似度匹配,記錄映射關(guān)系表。
模型數(shù)據(jù)治理規(guī)則約定數(shù)據(jù)源端與云端數(shù)據(jù)的對(duì)應(yīng)關(guān)系,即調(diào)控系統(tǒng)(D5000)、OMS 系統(tǒng)與調(diào)控云結(jié)構(gòu)化設(shè)計(jì)的對(duì)應(yīng)關(guān)系,其中,OMS 系統(tǒng)起到模型補(bǔ)充作用。
D5000、OMS 與調(diào)控云屬性的映射關(guān)系以調(diào)控云中的變電站表為例,如表1 所示,可以總結(jié)為以下四種情況:
(1)D5000 與OMS 共有,如“變電站名稱”與“所屬調(diào)度機(jī)構(gòu)”等;
(2)D5000 獨(dú)有,如“所屬電網(wǎng)”與“擁有者”;
(3)OMS 獨(dú)有,如“資產(chǎn)單位”與“投運(yùn)日期”等;
(4)D5000 與OMS 均沒(méi)有,如“資產(chǎn)歸屬性質(zhì)”與“海拔”等。
治理順序規(guī)則:從上至下,先電網(wǎng),再設(shè)備容器,最后設(shè)備對(duì)象,這樣可以避免數(shù)據(jù)庫(kù)表中外鍵約束依賴造成數(shù)據(jù)入庫(kù)失敗問(wèn)題。
數(shù)據(jù)治理范圍規(guī)則以去冗余原則,只提取調(diào)控云需要的數(shù)據(jù)。調(diào)控系統(tǒng)模型共性范圍一般包括以下三點(diǎn):
(1)模型記錄的所屬應(yīng)用同時(shí)含SCADA、PAS;
(2)模型記錄的電壓等級(jí)為“10kV、20kV、35kV、110kV、220kV、500kV”;
(3)模型對(duì)象的運(yùn)行狀態(tài)為“正常投運(yùn)”。
表1 變電站屬性映射關(guān)系
數(shù)據(jù)治理系統(tǒng)可以同時(shí)對(duì)存量數(shù)據(jù)和增量數(shù)據(jù)進(jìn)行處理。存量數(shù)據(jù),即調(diào)控云系統(tǒng)上線前,源端D5000 系統(tǒng)及OMS 系統(tǒng)現(xiàn)有的模型數(shù)據(jù)。
存量數(shù)據(jù)治理上調(diào)控云的整體思路是:
(1)以D5000 系統(tǒng)的模型數(shù)據(jù)為基準(zhǔn),先將D5000 系統(tǒng)的數(shù)據(jù)治理上調(diào)控云,再將OMS 中的部分模型參數(shù)補(bǔ)充到調(diào)控云。
(2)對(duì)于部分設(shè)備類型(比如電流互感器和電壓互感器),D5000 系統(tǒng)沒(méi)有建模但是OMS 有的,則從OMS 將數(shù)據(jù)治理上調(diào)控云。
增量數(shù)據(jù)處理是在某一時(shí)間節(jié)點(diǎn)存量數(shù)據(jù)治理完成后,由于設(shè)備新投、變更、退役,導(dǎo)致源端(D5000 系統(tǒng)、OMS)發(fā)生數(shù)據(jù)新增、刪除或參數(shù)改變后,將數(shù)據(jù)治理后同步到調(diào)控云,保證源端與云端數(shù)據(jù)一致的過(guò)程。增量數(shù)據(jù)處理會(huì)實(shí)時(shí)觸發(fā)將變更消息推送入臨時(shí)庫(kù)中,后面的流程與存量數(shù)據(jù)治理相同。
數(shù)據(jù)治理系統(tǒng)的總體流程如圖1 所示:
(1)建立D5000 系統(tǒng)、OMS 兩系統(tǒng)與電網(wǎng)模型云平臺(tái)通用數(shù)據(jù)對(duì)象標(biāo)準(zhǔn)結(jié)構(gòu)間表、字段屬性映射關(guān)系,將兩系統(tǒng)中存量數(shù)據(jù)抽取至待治理臨時(shí)庫(kù)中。同時(shí),增、刪、改發(fā)生時(shí),將增量數(shù)據(jù)推送到臨時(shí)庫(kù)中。
圖1 數(shù)據(jù)治理流程示意圖
(2)按照規(guī)則進(jìn)行數(shù)據(jù)治理,按照ID 編碼規(guī)則,生成調(diào)控云電網(wǎng)模型數(shù)據(jù)云平臺(tái)中設(shè)備所屬的唯一ID;通過(guò)電壓等級(jí)、所屬?gòu)S站(調(diào)管關(guān)系)、設(shè)備名稱字段的模糊匹配,建立D5000 系統(tǒng)、調(diào)控云與OMS 設(shè)備對(duì)象的關(guān)聯(lián)關(guān)系。
(3)治理的結(jié)果會(huì)進(jìn)行發(fā)布,目前導(dǎo)出成Excel 格式的文檔,用戶可以根據(jù)該文檔檢查數(shù)據(jù)的完整性、參數(shù)的正確性。
(4)修改完成后,重新進(jìn)入治理流程,如此循環(huán),直到所有數(shù)據(jù)均完成治理。
目前本文介紹的調(diào)控云模型數(shù)據(jù)治理系統(tǒng)在多個(gè)省調(diào)的調(diào)控云系統(tǒng)投入應(yīng)用。下文以某省調(diào)調(diào)控云模型數(shù)據(jù)治理的實(shí)際流程為例詳細(xì)介紹通過(guò)模型數(shù)據(jù)治理系統(tǒng)模型數(shù)據(jù)上云的應(yīng)用情況。
圖2 模型數(shù)據(jù)治理案例
該省調(diào)在一區(qū),通過(guò)以D5000 系統(tǒng)為平臺(tái)的模型中心匯集了全省包含10kV 以上的全電網(wǎng)模型。通過(guò)一三區(qū)數(shù)據(jù)鏡像將模型數(shù)據(jù)復(fù)制到三區(qū)模型中心鏡像庫(kù),建立模型中心、OMS 兩系統(tǒng)與電網(wǎng)模型云平臺(tái)通用數(shù)據(jù)對(duì)象標(biāo)準(zhǔn)結(jié)構(gòu)間表、字段屬性映射關(guān)系,將兩系統(tǒng)中數(shù)據(jù)抽取至待治理臨時(shí)庫(kù)中。后續(xù)按上文中的轉(zhuǎn)換規(guī)則對(duì)臨時(shí)庫(kù)中的數(shù)據(jù)進(jìn)行轉(zhuǎn)換治理上云,如圖2 所示。
表2 是以兩個(gè)規(guī)模相當(dāng)?shù)?20kV 新建廠站為例,采用的模型數(shù)據(jù)治理系統(tǒng)前后的對(duì)比。從表中數(shù)據(jù)可以看出,本系統(tǒng)的數(shù)據(jù)治理效率相比于模型文件導(dǎo)入和手工錄入有明顯提升,而且正確率也有保證。另外,如果考慮到以后常態(tài)化運(yùn)行過(guò)程中的增量數(shù)據(jù)治理,本系統(tǒng)的優(yōu)勢(shì)會(huì)更加明顯。
表2 模型治理方式與手工錄入對(duì)比
本文提出的電網(wǎng)模型數(shù)據(jù)治理上云的系統(tǒng),通過(guò)梳理源端調(diào)控系統(tǒng)、OMS 系統(tǒng)與調(diào)控云結(jié)構(gòu)化設(shè)計(jì)的差異,通過(guò)設(shè)計(jì)一套可靈活配置的模型映射規(guī)則及數(shù)據(jù)轉(zhuǎn)換規(guī)則,同時(shí)引入模糊匹配的關(guān)鍵技術(shù),實(shí)現(xiàn)了電網(wǎng)模型自動(dòng)上云。文中針對(duì)存量數(shù)據(jù)和增量數(shù)據(jù)模型分別給出了處理方案,保證了在調(diào)控云的初期建設(shè)中模型數(shù)據(jù)的正確性、一致性,并且解決了后期常態(tài)運(yùn)行過(guò)程中數(shù)據(jù)的增、刪、改后數(shù)據(jù)同步問(wèn)題。通過(guò)在某省調(diào)的實(shí)際應(yīng)用,相比傳統(tǒng)的手工錄入和模型文件導(dǎo)入,此方案有效提高了數(shù)據(jù)上云的效率,并且符合泛在電力物聯(lián)網(wǎng)“數(shù)據(jù)一個(gè)源、電網(wǎng)一張圖”的理念,為調(diào)控云的后期建設(shè)提供了思路和方法。