呂順利 楊濟海 鄧 偉施 健 陸 濤
(1.南瑞集團公司(國網電力科學研究院) 南京 210003)(2.國網江西省電力公司 南昌 330077)
2015年12月23日的烏克蘭電網停電事故獲得廣泛關注,同時也將電力系統(tǒng)的信息通信安全問題擺在了人們面前,成為建設與完善電力系統(tǒng)乃至未來的全球能源互聯(lián)網不可回避的重要挑戰(zhàn)[1]。電力通信網作為基礎承載實體網絡,不僅為各類電力信息系統(tǒng)提供通道支撐,同時還直接負責電網繼電保護、安穩(wěn)控制、調度自動化等重要業(yè)務的實時、可靠傳輸,為電網生產安全控制提供通信基礎[2]。
隨著電力通信網絡規(guī)模的不斷擴大,網絡層次的逐漸增多,網絡結構的日趨復雜,對電力通信網及其承載重要業(yè)務的安全運行提出了新的挑戰(zhàn)。研究發(fā)現(xiàn),國內電力通信網業(yè)務風險評估體系和方法很不完備,存在如下問題:
1)指標零碎,缺乏有效的數據分析能力。電力通信網業(yè)務的風險評估涉及電力通信網光纜層、傳輸層、業(yè)務層等各層級的多源異構信息,導致評估多而雜,尚未形成系統(tǒng)的體系,不同網省公司有各自的手段和指標,信息不能有效共享,未形成電力系統(tǒng)統(tǒng)一、高效的風險評估體系和方法;
2)風險評估準確性較低,事前預警能力較差。目前風險評估指標的選擇大多通過專家咨詢法和層次分析法來確定,使得評估結果在很大程度上受到專家權威和個人偏好等主觀因素影響,降低了評估的客觀性,導致隱患和風險未能及時發(fā)現(xiàn),事前預警能力較差。
為解決上述問題,本文提出一種融合Apriori關聯(lián)規(guī)則分析和層次分析法(AHP)的風險評估方法Apriori-AHP:針對當前現(xiàn)狀,基于多源異構的海量數據構建初始指標集,采用改進的Apriori算法確定多種因素與目標的關聯(lián)度,實現(xiàn)指標篩選;采用AHP算法完成對各因素的權重測算,從而建立統(tǒng)一、高效的評估體系和方法,加權求得綜合風險評估指標,降低了單純依賴層次分析法的主觀因素影響,提高了評估的準確性和有效性。
電力信息通信作為能源與信息通信技術的交叉與融合點[3],在保障電網正常運行中發(fā)揮著巨大的作用,也承擔著重要的責任。電力通信網是電力系統(tǒng)安全、穩(wěn)定運行的重要支柱,而電力通信網承載的繼電保護、安穩(wěn)控制等電力業(yè)務的可靠性直接關系著電力系統(tǒng)的穩(wěn)定可靠運行[4~6]。本文將電力通信網業(yè)務風險評估作為研究對象,電力通信網絡模型如圖1所示。
由圖中可以看出,從模型層次上分析,電力通信網絡可分為光纜層、傳輸層、業(yè)務層。其中光纜層涉及敷設方式、光纜類型、途經地域的環(huán)境和氣象條件、是否包含三跨等因素;傳輸層涉及設備廠家、設備類型、設備型號、家族缺陷、傳輸拓撲結構、時隙占用情況、保護方式等因素;業(yè)務層涉及業(yè)務承載情況、業(yè)務開通方式、歷史故障和檢修情況、運維人員管理水平等因素。
圖1 電力通信網絡分層模型
電力通信網業(yè)務風險評估是利用電力通信網的層級結構及其承載業(yè)務的運行特點和相關理論技術,特別是大數據分析挖掘相關的算法,對電力通信網業(yè)務可靠性是否達到一定安全要求所做出的價值判斷,目的是提前發(fā)現(xiàn)系統(tǒng)存在的隱患,指導電力通信網的主動預警與智能檢修,提高電力業(yè)務運行的安全性和穩(wěn)定性。
電力通信網承載業(yè)務受不同層級諸多因素影響,且各因素影響程度也不相同,導致風險評估的輸入和輸出之間呈現(xiàn)復雜的非線性關系,難以建立用一個合理、精確的數學解析式。
本文首先構建電力通信網業(yè)務風險評估模型的初始指標集,設為{x1,x2,…,xn},那么風險評估的數學模型為
式(1)中,y為風險評估函數。電力通信網業(yè)務風險評估的建模,就是要找到一個最適合的風險評估函數y,該函數能很好地反應電力通信網業(yè)務風險評估系統(tǒng)的輸入和輸出之間復雜的非線性關系。風險評估函數y為連續(xù)值,取值范圍經過歸一化后為0~1,其中風險閾值是根據生產廠家推薦的性能參數值及歷史運行數據計算出的,根據實際計算得到的值同風險閾值對比,判斷電力通信網及其承載業(yè)務所處的健康狀態(tài),并采取適當的檢修策略。
影響通信網絡可靠性的因素眾多,且很復雜,如果不加以分析、簡化,即使是經驗豐富的專家處理起來也很困難,為便于評價,引入層次分析法將影響通信網絡的各因素條理化、層次化,把對某個狀態(tài)影響程度相近或聯(lián)系比較緊密的因素放在一起,形成一層,建立起多層次關系結構模型;但是單純依靠專家經驗選擇基礎指標,存在一定的局限性,為了降低人為選擇指標的主觀性和隨意性,使篩選的指標更加合理,故引入Apriori關聯(lián)規(guī)則算法,先基于Apriori分析篩選出關聯(lián)指標,然后再應用AHP算法完成權重測算,從而建立統(tǒng)一、高效的評估體系和方法,可大大提高模型的準確性和有效性?;谏鲜隹紤],本文提出一種融合關聯(lián)規(guī)則分析和層次分析法的電力通信網業(yè)務風險評估方法Apriori-AHP算法。
結合當前現(xiàn)狀,建立電力通信網業(yè)務風險評估模型的第一步是構建初始指標集。電力通信網業(yè)務可靠運行評價,涉及不同層級的海量原始數據,包括資源臺賬數據、設備運行狀態(tài)、歷史故障、性能數據、運行維護數據和專業(yè)管理數據等,結合實際情況及各網省公司多年的指標分析經驗,梳理得到圖2所示的初始指標集,其中文檔、日志、視頻、圖片等半/非結構化數據,需通過聚類、分詞、特征提取、機器學習等處理手段,先行轉化為結構化數據。
圖2所示初始指標集,基于多源異構的海量原始數據得到,但由于這些指標雜而多、較為零碎,需要經過指標篩選和權重測算兩個關鍵步驟,建立統(tǒng)一高效的評估模型,才能得到最終準確可靠的綜合風險評估結果。
圖2 電力通信網業(yè)務風險評估初始指標集
Apriori算法[7~8]是布爾關聯(lián)規(guī)則挖掘頻繁項集算法。采取逐層搜索的迭代方法生成所有的頻繁項集。
針對構建的電力通信網業(yè)務風險評估初始指標集,本文提出一種改進的Apriori關聯(lián)分析,實現(xiàn)對電力通信網業(yè)務有影響的強關聯(lián)指標的篩選,主要的步驟為:
1)依據支持度找出所有頻繁項集(頻度),找出初始指標集的所有頻繁項集;
2)依據置信度產生關聯(lián)規(guī)則(強度),找出對電力通信網業(yè)務可靠性有影響的強關聯(lián)指標。
步驟1算法實現(xiàn):
首先,通過掃描所有初始指標集,累計每個項的計數,并收集滿足最小支持度的項,找出頻繁1-項集的集合,即集合L1;然后,L1用于找頻繁2-項集的集合L2,L2用于找L3,如此下去,直到不能再找到頻繁k-項集,找每個需要一次初始指標集全掃描,該步驟依據支持度找出初始指標集的所有頻繁項集。
步驟2算法實現(xiàn):
依據置信度,找出對電力通信網業(yè)務可靠性有影響的強關聯(lián)指標。
為提高關聯(lián)規(guī)則分析的效率,本文對Apriori算法做了如下改進:
1)通過構建支持度計算支撐數組來簡化支持度的計算,減少讀取數據庫的次數;
2)通過構建鄰接字典鏈表,動態(tài)發(fā)現(xiàn)滿足支持度要求的二項頻繁集。
3)通過分支篩選優(yōu)化策略,動態(tài)刪除無效分支,快速生成二項頻繁集。
通過Apriori算法,篩選出對評估結果有重要影響的指標,用于確定AHP的基礎指標。通過Aprio?ri指標篩選,可降低單純依賴人工選擇的主觀性和隨意性,提高其選擇的合理性。
AHP算法[9~10]本質上是一種決策思維方式,它把復雜的問題分解為各個組成因素,將這些因素按支配關系分組形成有序的遞階層次結構,通過兩兩比較方式確定層次中諸因素的相對重要性,然后綜合人們的判斷以決定諸因素相對重要性的順序。
一個復雜的問題可分解為它的目標,約束準則和方案等因素,按照不同屬性把這些因素分組形成互不相交的層次,上一層的因素對相鄰下一層的全部或部分因素起著支配作用,形成按層次自上而下的逐層支配關系,而每一層都要通過兩兩比較,導出它們包含因素的相對重要性排序權重,具有這種性質的層次稱為遞階層次結構。
AHP權重測度是通過兩兩比較判斷給出的。比較的依據是標度,用整數1~9及其倒數來表示,也叫比例標度,如表1所示。在同一準則下對元素進行兩兩比較,并不要求對被比較元素的屬性有專門知識,標度結果進一步組成判斷矩陣,一般不具有一致性。比例標度法便于在判斷不一致或相互矛盾的情況下對被比較元素進行標度。
表1 AHP測度方法
單一準則下的排序問題實質上是由一組元素兩兩比較得到重要性測度組成的判斷矩陣A(aij)n*n,其具有正值、互反性和基本一致性,并且和排序測度W之間具有AW=nW的關系:
從矩陣代數Perron-Frobineus理論可知,正矩陣的實特征根所對應的歸一化特征向量是唯一的,而最大的特征根λmax可通過求解:
得到。因此,單一準則下的排序問題化為對上式的求解。特征根法是解決從比較測度求出排序全值的一種方法。
算法實現(xiàn):首先基于Apriori篩選得到的對電力通信網業(yè)務可靠性有影響的強關聯(lián)指標,確定AHP的層次模型及基礎指標;然后對底層的各指標進行兩兩比較判斷,構造判斷矩陣A(aij)n*n;通過對判斷矩陣的計算,進行層次單排序和一致性校驗;最后進行層次總排序,得到各因素的權重,建立電力通信網業(yè)務風險評估模型后,即可對待評價的電力通信網業(yè)務風險進行評估,輸出評價結果。
Apriori-AHP風險評估流程含兩個步驟,步驟一基于Apriori完成指標篩選;步驟二基于AHP完成權重測算,生成最優(yōu)風險評估模型,并對待評價對象進行評估,輸出評估結果。
步驟一包括:
1)搜集數據,并依據業(yè)務專家、經驗積累及實際要求,建立電力通信網業(yè)務風險評估的初始指標集;
2)基于Apriori關聯(lián)規(guī)則分析,篩選出對電力通信網業(yè)務有影響的關鍵指標。
步驟二包括:
1)根據Apriori篩選得到對電力通信網業(yè)務有影響的關聯(lián)指標,從而確定AHP的層次模型及基礎指標;
2)對底層的各指標進行兩兩比較判斷,構造判斷矩陣;
3)通過對判斷矩陣的計算,進行層次單排序和一致性校驗;
4)進行層次總排序,得到各因素的權重,建立電力通信網業(yè)務風險評估模型
5)采用建立的評估模型對待評價電力通信網絡業(yè)務進行評估,輸出評價結果,使得運維人員能夠及時發(fā)現(xiàn)存在的隱患和風險,并對潛在故障類型和影響范圍做進一步分析,指導主動預警和智能檢修。
Apriori-AHP的風險評估流程如圖3所示。
圖3 Apriori-AHP風險評估流程
為了驗證Apriori-AHP風險評估方法的性能,在RStudio 0.99平臺下進行仿真實驗。實驗數據來自某省電力公司的電力通信網絡風險評估數據庫,該庫包含了近五年電力通信網業(yè)務風險評估及實際運行情況記錄,從中選取900條記錄作為模型的訓練及測試驗證數據,其中600條數據作為訓練樣本集,剩余300條數據作為測試樣本集。
基于原始數據構建初始的指標體系,采用改進Apriori算法對初始風險評估指標集進行關聯(lián)規(guī)則分析,過程如圖3步驟一所示,分析得到敷設方式,環(huán)境溫度,傳輸拓撲,保護方式,歷史故障,設備運行狀態(tài)、光纜衰耗等強關聯(lián)的基礎指標,對數據進行處理得到新的數據集,并確定AHP的層次模型及基礎指標;通過AHP完成權重評價及測算,得到最終的電力通信網業(yè)務風險評估模型。
利用測試集進行驗證,模型輸出同實際值對比如圖4所示,兩者相關系數為0.9028,評價精度達到89.93%,其中評價精度用來衡量預測值與實際值的擬合程度,計算公式為(|預測值-實際值|/實際值)*100%,評價結果的精度相當高。結果表明,融合了關聯(lián)規(guī)則分析和層次分析法的Apriori-AHP評估方法是準確、可行的。
圖4 Apriori-AHP模型輸出與實際值相關性
傳統(tǒng)的電力通信網業(yè)務風險評估指標多而雜,尚未形成系統(tǒng)的體系,不同網省公司有各自的手段和指標,基礎指標選擇的隨意性較大;而Aprio?ri-AHP方法則建立了統(tǒng)一、高效的評估體系和方法,為了進一步評價Apriori-AHP模型的優(yōu)劣,選擇傳統(tǒng)層次分析法進行對比實驗,采用評價精度和相關系數作為模型的衡量標準,對比結果如表2所示。
表2 兩種算法的對比
AHP模型輸出與實際值相關性見圖5。
對圖4、圖5和表2的仿真結果進行對比和分析,可以得到如下結論:
Apriori-AHP的評價精度更高,采用關聯(lián)規(guī)則分析篩選出對評估結果有重要影響的指標,然后采用AHP完成權重測算形成最終模型進行風險評估,充分結合兩者的優(yōu)勢,提高了評估的精度和準確性,是一種有效、可行的電力通信網業(yè)務風險評估方法。
圖5 AHP模型輸出與實際值相關性
根據該省電力公司歷年運維故障記錄統(tǒng)計分析,63.7%~80.5%的電力通信網業(yè)務故障可提前預警。基于Apriori-AHP分析風險評估方法在該省電力公司實際應用一年以來,25項在運電力通信網業(yè)務的隱患被及時發(fā)現(xiàn),未能及時預警的5個故障,是由于系統(tǒng)外臨時施工挖斷光纜等突發(fā)的人為破壞導致,實際預警率達到了83.33%。為對比分析,借助傳統(tǒng)層次分析法也同步開展了風險評估,實際情況如表3所示。
從表中可看出,采用Apriori-AHP方法后,實際的預警效果得到明顯提升,避免了電力通信網業(yè)務潛在的隱患和風險,極大降低了故障造成的損失及運維人力成本,提高了電力業(yè)務運行的安全性及穩(wěn)定性。
表3 算法實際效果對比
為解決“海量數據”和“有限知識”之間的矛盾,提高電力通信網業(yè)務風險評估的準確性和有效性,提出一種基于Apriori-AHP分析的風險評估方法。
仿真結果和實際應用效果均表明,相較于傳統(tǒng)的層次分析方法,Apriori-AHP有效提高了風險評估的準確性和有效性,使運維人員能及時發(fā)現(xiàn)存在的隱患和風險,提高了電力重要業(yè)務運行的安全性和穩(wěn)定性。成果具有顯著的經濟效益、社會效益和管理效益,對電網安全穩(wěn)定運行及管理具有重大意義。
[1] 郭慶來.由烏克蘭停電事件看信息能源系統(tǒng)綜合安全評估[J].電力系統(tǒng)自動化,2016,40(5):145-147.GUO Qinglai.Comprehensive Security Assessment for a Cyber Physical Energy System:a Lesson from Ukraine's Blackout[J].Automation of Electric Power Sys-tems,2016,40(5):145-147.
[2]趙子巖,劉建明.基于業(yè)務風險均衡度的電力通信網可靠性評估算法[J].電網技術,2011,35(10):209-213.ZHAO Ziyan,LIU Jianming.A New Service Risk Bal?anc-ing Based Method to Evaluate Reliability of Electric Power Communication Network [J].Power System Tech-nology,2011,35(10):209-213.
[3]趙俊華,文福拴,薛禹勝,等.電力CPS的架構及其實現(xiàn)技術與挑戰(zhàn)[J].電力系統(tǒng)自動化,2010(16):1-7.ZHAO Junhua,WEN Fushuan,XUE Yusheng,et al.Cy?ber Physical Power Systems:Architecture,Implementation Techniques and Challenges[J].Automation of Electric Power Systems,2010(16):1-7.
[4]曾瑛.電力通信網可靠性分析評估方法研究[J].電力系統(tǒng)通信,2011,32(8):13-16.ZENG Ying.Power Communication Network Reliability Analysis and Evaluation Methods[J].Telecommunications for Electric Power System,2011,32(8):13-16.
[5]繆巍巍,何迎利,朱斌.基于IP網絡的電力遠動傳輸通道監(jiān)測方法[J].電力系統(tǒng)自動化,2003,27(24):59-62.MIAO Weiwei,HE Yingli,ZHU Bin.An IP-based Method for Supervising the Electric Power Telecontrol Transm Is?sion Channel[J].Automation of Electric Power Systems,2003,27(24):59-62.
[6]閆生超,張?zhí)毂?,張春?基于組合規(guī)則的電力通信網故障分析方法[J].電力系統(tǒng)通信,2011,32(3):34-38.YAN Shengchao,ZHANG Tianbing,ZHANG Chunping.Analysis on The Fault of Power Communication Network Based on Combined Rules[J].Telecommunications for Electric Power System,2011,32(3):34-38.
[7]Agrawal R,Imielinski T,Swami A.Mining asaz~ation rules between sets of items in large databases[J].ACM SIGMOD Record,1993,22(2):207-216.
[8]Agrawal R,Imielinski T,Swami A.Databasemining:a peaorriiRrlce perspective[J].Knowledge and Data Engi?neering,IEEE Transactions,1993,5(6):914-925.
[9]馮瑩瑩,于干,周紅志.層次分析法和神經網絡相融合的教學質量評價[J].計算機工程與應用,2013,49(17):235-245.FENG Yingying,YU Gan,ZHOU Hongzhi.Teaching quali?ty evaluation model based on neural network and analytic hi-erarchy process[J].Computer Engineering and Appli?ca-tions,2013,49(17):235-238.
[10]DunhamM H.數據挖掘教程[M].郭崇慧,田鳳占,靳曉明譯.北京:清華大學出版社,2005:79-88.DunhamM H.Data Mining Tutorial[M].GUO Chonghui,TAN Zhanfeng,JIN Xiaoming translation.Beijing:Tsing?hua University Press,2005:79-88.