朱繼忠 駱騰燕 吳皖莉 李盛林 董瀚江
綜合能源系統(tǒng)運行可靠性評估評述Ⅱ:數據驅動法與模型-數據混合驅動法
朱繼忠 駱騰燕 吳皖莉 李盛林 董瀚江
(華南理工大學電力學院 廣州 510641)
對綜合能源系統(tǒng)進行運行可靠性評估,不僅能實現系統(tǒng)運行狀態(tài)的實時感知,而且能對系統(tǒng)的短期運行風險進行合理預測。利用數據驅動的人工智能技術解決能源領域問題是當下的研究熱點。該文首先基于數據驅動法對考慮時變性與供需不確定性的綜合能源系統(tǒng)設備運行可靠性建模方法進行闡述和總結,并歸納出在設備運行可靠性建模方面現有研究存在的不足;其次,詳細總結數據驅動及模型-數據混合驅動兩種運行可靠性評估方法的原理、研究現狀和目前研究存在的局限性;最后,針對現有研究存在的問題,對綜合能源系統(tǒng)運行可靠性評估研究進行總結與展望并提出人工智能背景下模型-數據混合驅動的運行可靠性建模及評估總體思路。
綜合能源系統(tǒng) 運行可靠性建模 運行可靠性評估 數據驅動 模型-數據混合驅動
在本系列論文中,上篇《綜合能源系統(tǒng)運行可靠性評估評述I:模型驅動法》主要對模型驅動的綜合能源系統(tǒng)(Integrated Energy Systems, IES)運行可靠性建模及評估進行了詳細綜述,并對現有研究所存問題做歸納總結。本文為下篇,主要對數據驅動及模型-數據混合驅動的IES運行可靠性評估的研究現狀和現存問題進行綜述,并對IES運行可靠性分析建模與評估方法中的現存關鍵科學問題進行總結與展望。在此基礎上,提出人工智能背景下模型-數據混合驅動的IES運行可靠性建模與評估新思路。
數據驅動的IES設備運行可靠性建模方法主要有專家系統(tǒng)法、人工神經網絡法、模糊模型法及貝葉斯網絡法,其研究現狀總結見表1。
表1 數據驅動的設備運行可靠性建模方法研究現狀
1.1.1 專家系統(tǒng)法
專家系統(tǒng)法是應用較早的人工智能方法,依靠領域專家的知識和經驗進行推理和判斷,來模擬專家的決策過程,從而指導運行可靠性建模方面的問題[1]。專家系統(tǒng)由知識庫和推理機共同構成[13]。
專家系統(tǒng)法具有較強的故障信息處理能力和決策能力,可解釋性強。但專家系統(tǒng)要頻繁對規(guī)則庫進行維護,并帶有很強的主觀判斷,且知識庫在線建立與維護困難,容易造成故障診斷定位不及時,運行可靠性評估效率低,結果不準確。因此,現有研究將專家系統(tǒng)法與其他建模方法結合使用[1-2]來彌補模型短板。
1.1.2 人工神經網絡法
人工神經網絡法是一種仿生學算法,具有較強的自學習能力和非線性擬合能力,能夠通過歷史數據來建立學習模型,并學習重現這些數據中的隱含信息,實現快速故障診斷,并具有較好的容錯性[14-15]。目前基于人工神經網絡的建模主要有分塊訓練法[3]和結合診斷法[4,16]兩種。但人工神經網絡法存在模型不明確,可解釋性低等問題。當系統(tǒng)的拓撲結構發(fā)生變化時,需要進行神經網絡的重新訓練,模型的可移植性較差。且隨著網絡層數的增加,基于人工神經網絡法的可靠性建模計算變得更加耗時,甚至在某些情況下出現難以收斂的問題。
1.1.3 模糊模型法
模糊模型法主要考慮設備運行的模糊性,對設備運行不確定性[5-6]及可再生能源接入[7]導致的不確定性進行建模。常用的模糊模型法有粗糙集法和模糊Petri網法兩種。粗糙集法善于從不完整和不確定的知識中挖掘規(guī)律,容錯能力較強,但故障信息分析的準確率并不高?,F有研究主要針對粗糙集法的信息冗余問題和診斷精度問題進行突破。模糊Petri網法是在Petri網法基礎上衍生出的可靠性建模方法[16]。Petri網是一種加權有向圖,能以圖形的方式解釋系統(tǒng)的動態(tài)行為,對故障信息中隱含的邏輯關系進行推理分析[17]。模糊Petri網法充分考慮了設備運行的不確定性,但是并不能實現時序信息的合理利用,并且建模過程繁雜,計算難度大,容錯性不高?,F有研究主要在時序信息的充分利用[18]和模型容錯性的提高[19]方面進行改進。
以粗糙集法和模糊Petri網法為代表的模糊模型法能夠對設備運行過程中的不確定因素進行建模,并善于利用模糊集合和模糊邏輯進行推理,但在關鍵信息缺失時,模型精度并不高,且推理規(guī)則的建立易受主觀影響。利用模糊模型法與其他方法結合來提高模糊模型法對樣本信息的處理能力,增強模型的可解釋性,對設備運行可靠性建模的發(fā)展具有重要意義。
1.1.4 貝葉斯網絡法
貝葉斯網絡是對不確定信息進行推理計算的一種數學模型。利用貝葉斯網絡建立設備運行可靠性模型的精確度較高,但是由于需要各設備的故障先驗概率,并且推理計算過程需要較多樣本,可能會導致評估效率降低?,F有研究主要考慮貝葉斯法與其他建模方法相結合進行設備可靠性建模,如粗糙集-貝葉斯網絡法[20],混合貝葉斯動態(tài)離散化算法[9]和基于信息融合思想的可靠性評估方法[10]等。
對現有研究中模型驅動及數據驅動的設備運行可靠性建模方面存在的問題進行分析,總結如下:
1)考慮設備時變特性及供需不確定性的建模尚不充分。設備運行受內部影響如設備壽命、運行時間和外部影響如極端天氣、運行條件等共同作用而呈現出時變特性,現有研究對設備時變特性進行建模主要通過馬爾可夫多狀態(tài)的故障修復模型來實現,但隨著影響設備正常運行的因素增加,兩狀態(tài)模型并不能清晰地描述設備故障原因。多狀態(tài)模型認為設備各故障因素是相互獨立的,忽略了其內在關聯性,不符合運行實際情況,這就使得馬爾可夫多狀態(tài)模型在描述設備運行可靠性時存在局限性。IES中包含電負荷、氣負荷、冷熱負荷等多種負荷類型,是一個多維度、多時間尺度的綜合系統(tǒng),且隨著可再生能源在IES中的大量消納,系統(tǒng)運行不確定性因素大大增加,考慮可再生能源固有的隨機性與波動性和接入IES對系統(tǒng)運行帶來的不確定性問題尚未在建模環(huán)節(jié)得到完全解決?,F有研究僅通過以粗糙集法和模糊Petri網法為代表的模糊模型法對設備運行不確定性進行建模,其推理過程易受主觀意識的干擾,且可解釋性較弱,并不能完全符合設備運行層面的建模要求。
2)對耦合設備的運行可靠性建模方法尚不完善。IES是典型的多能耦合系統(tǒng),系統(tǒng)中的耦合設備如果發(fā)生故障將會導致系統(tǒng)級聯故障,甚至可能使耦合系統(tǒng)中兩個或多個子系統(tǒng)相互分離[21]。相較于傳統(tǒng)的單一能源供能系統(tǒng),IES運行可靠性的改變主要由系統(tǒng)間的耦合關系引起,系統(tǒng)間可靠性的相互影響由耦合設備進行傳遞[22]。為了更準確地評估IES的運行可靠性,提升系統(tǒng)運行安全性,必須充分研究系統(tǒng)間的耦合關系,并對典型耦合設備如P2G裝置、CHP機組、CCHP機組等進行準確建模,以反映設備的耦合特性及在能量轉換過程中的可靠性?,F有對耦合設備建模的方法基本基于模型驅動來實現,無法反映耦合設備運行過程中面臨的運行條件的改變?yōu)樵O備帶來的不確定性問題,以及能量轉換過程中的損耗問題對設備運行可靠性的影響,且如CCHP此類由幾種設備集成的設備單元,研究內部設備在運行階段的協調配合問題與設備重要程度問題也對運行可靠性評估具有重要的指導意義,但在現有工作中并未得到充分研究。
3)數據驅動的設備建模方法尚未充分發(fā)展。隨著IES的運行規(guī)模擴大化、運行結構復雜化、運行狀態(tài)多樣化,設備的運行數據大量增加,數據驅動的人工智能技術在面對多維時變數據信息時具有較強的處理能力和較快的計算效率,在設備運行狀態(tài)判斷與信息感知方面也具有較好的精度,更能準確地捕捉設備的故障信息及運行數據的改變?,F有的基于傳統(tǒng)人工智能算法的數據驅動建模方法已經有了一定的研究基礎,但如上文分析,算法存在的缺陷可能會導致建模結果并不準確。目前,利用更為先進的機器學習算法如深度學習、強化學習等對IES中設備特別是耦合設備運行狀態(tài)進行建模分析研究成果較少,其可用性有待進一步深入研究。
隨著IES的自動化程度日益提高,系統(tǒng)規(guī)模和量測、決策單元數量都大大增加,其內部耦合機理日漸復雜,內部因素如獨立設備與耦合設備的時變特性、運行方式的不斷增加及外部環(huán)境如可再生能源消納及用戶用能行為等帶來的運行不確定性問題都直接或間接地影響著IES的運行可靠性?,F今,IES的運行可靠性評估問題已經由單一的電力系統(tǒng)可靠性評估問題轉換為研究多能耦合系統(tǒng)多維度、多時間尺度下的綜合問題,對影響系統(tǒng)運行的各方面因素、系統(tǒng)實時運行狀態(tài)的捕捉及運行數據在線處理能力提出了更高的要求。
以機器學習為代表的數據驅動的人工智能技術,在應對數據特征不明顯、具有關聯性的多維異構數據時,具有良好的非線性擬合能力和強大的在線決策能力[23],有望解決模型驅動方法在處理運行可靠性評估問題中面臨的瓶頸。利用機器學習方法進行能源領域的規(guī)劃、預測、評估、優(yōu)化等問題是當下的研究熱點。人工智能技術在能源領域的應用,將實現智能傳感與物理狀態(tài)相結合、數據驅動與仿真模型相結合、輔助決策與運行控制相結合[13],從而提高系統(tǒng)處理高維非線性問題的在線計算與決策能力,為系統(tǒng)的安全穩(wěn)定運行提供保障。
IES在生產、傳輸、交易、消費過程中涉及海量的設備及系統(tǒng),這些設備和系統(tǒng)的運行數據庫構成了能源大數據的基礎[24]。在模型驅動的運行可靠性評估方法難以處理海量高維非線性數據、計算效率低、精度差的背景下,數據驅動的人工智能方法在大數據背景下為IES的運行可靠性分析提供了新的思路。目前,利用數據驅動的方法,充分利用能源大數據,對多能量流系統(tǒng)的運行可靠性建模及評估已經取得了初步研究成果[21]。數據驅動方法的核心問題在于從能源大數據中進行訓練和自學習,對具體的數學模型依賴程度較低,具有應對高維、時變、非線性問題的強優(yōu)化處理能力和強大的學習能力[25],能夠突破模型驅動的技術瓶頸。研究數據驅動的IES運行可靠性評估方法,符合未來的發(fā)展趨勢,有望解決在人工智能大數據時代的IES運行可靠性評估難題,實現IES的故障診斷與定位、實時狀態(tài)感知和在線評估。因此,數據驅動的人工智能技術是電網發(fā)展的必然選擇,也是綜合能源轉型發(fā)展的重要戰(zhàn)略支撐[25]。參照文獻[25-27],數據驅動的運行可靠性評估思路如圖1所示。
圖1 數據驅動的運行可靠性評估
如圖1所示,數據驅動的運行可靠性評估方法通常采用“離線訓練-在線評估”的工作模式。在離線訓練環(huán)節(jié),數據驅動模型能夠基于系統(tǒng)的歷史運行數據進行學習,挖掘數據集更深層次的內在關系,并將學習后的模型應用于在線評估環(huán)節(jié),以提高評估結果的準確性;在線評估環(huán)節(jié)能夠將大量的在線計算任務轉移到離線訓練過程中[25],并通過運行狀態(tài)的在線評估及運行可靠性指標體系的計算結果指導離線訓練環(huán)節(jié)的模型更新,這使得評估的實時響應能力變強,效率變高。
目前,數據驅動的IES運行可靠性評估主要依靠機器學習(Machine Learning, ML)來實現。ML是一種算法范疇,是人工智能技術的核心研究方向。ML的目的是根據給定的訓練樣本求取系統(tǒng)輸入、輸出之間依賴關系的估計,使它能夠盡可能準確地預測未知的輸出[23]。并且,ML能夠根據歷史數據和經驗,依靠自身強大的自學習能力不斷改進算法性能。根據學習功能的不同,文獻[13]將ML分為四類:傳統(tǒng)ML、深度學習(Deep Learning, DL)、強化學習(Reinforcement Learning, RL)和遷移學習(Transfer Learning, TL)。其中,傳統(tǒng)ML算法根據學習數據有無標簽,主要分為有監(jiān)督學習、無監(jiān)督學習和半監(jiān)督學習三類[25]。典型的監(jiān)督學習算法有決策樹(Decision Tree, DT)、支持向量機(Support Vector Machine, SVM)、K臨近算法和最小二乘法等;典型的無監(jiān)督學習算法有K均值聚類(K-Means Clustering, KMS)、主成分分析(Principal Component Analysis, PCA)等;典型的半監(jiān)督學習算法有轉導支持向量機(Transudative Support Vector Machine, TSVM)等。
傳統(tǒng)ML在運行可靠性評估問題上已經有了一定應用。在運行可靠性故障信息獲取方面,文獻[28]提出一種基于K最鄰近模型和糾錯輸出編碼的電路快速診斷方法。文獻[29]提出基于模糊C均值聚類和改進SVM的結合方法來提高故障診斷的準確率。在能流計算問題上,文獻[30]利用偏最小二乘法與最小二乘法相結合對歷史數據進行回歸,提出基于數據驅動的電-熱互聯IES系統(tǒng)潮流線性化方法,改善了傳統(tǒng)方法的數值穩(wěn)定性問題。傳統(tǒng)ML算法實現過程相對簡單,但對較長時間序列的處理能力較弱,且處理特征性不明顯、關聯性較強的高維數據時收斂能力不理想,一般應用其改進算法或多種算法結合使用來保障評估準確性。
DL是底層信號到高層語言映射關系的一種多層次模型,具有良好的非線性擬合能力和很強的泛化性能,且具有較強的自學習與挖掘能力,適用于IES中的大量時間序列,因此能夠進行IES的運行可靠性評估工作。典型的DL算法有卷積神經網絡、深度置信網絡、堆疊自編碼器、長短期記憶網絡、受限玻耳茲曼機和生成式對抗網絡。文獻[31]對DL在電力系統(tǒng)故障診斷與運行穩(wěn)定性評估中的應用進行了總結與展望。文獻[32]為了解決可再生能源并網所帶來的不確定性,提出了一種基于DL的系統(tǒng)在線穩(wěn)定性評估方法。文獻[33]提出一種深度自編碼網絡模型來進行風電機組的實時故障檢測。文獻[34]基于深度置信網絡對變壓器進行故障診斷。文獻[35]基于卷積神經網絡進行系統(tǒng)的在線穩(wěn)定評估。文獻[36]提出一種基于卷積神經網絡的配電主設備分布式狀態(tài)傳感器可靠性評估方法。文獻[37]考慮到多饋直流及動態(tài)負荷的影響,采用卷積神經網絡對電壓穩(wěn)定性進行快速評估。文獻[38]提出一種利用長短期記憶網絡結合SVM進行輸電線路故障檢測的方法。綜上所述,DL在IES特別是電力系統(tǒng)運行可靠性評估中的實時故障診斷、在線狀態(tài)感知等環(huán)節(jié)應用廣泛。但DL受限于反饋機制,且對數據的推理理解能力有限[25],限制了DL算法更深層次的應用。
RL又稱為再勵學習或評價學習,其本質是智能體根據環(huán)境來指定決策以使累計獎賞最大化[23]。RL有較強的自學習能力和在線學習能力,同時在線決策能力強,適用于對IES進行實時評估。典型的RL算法有Q學習和SARSA(state action reward state action)法等。文獻[39]提出一種基于復雜電網分區(qū)的分布式改進Q學習算法來計算系統(tǒng)的最優(yōu)潮流。文獻[40]基于Q學習算法研究系統(tǒng)在虛假數據注入攻擊下的運行安全性。文獻[41]設計了一種基于Q學習的系統(tǒng)穩(wěn)定器來抑制風電接入帶來的低頻振蕩對運行可靠性的影響。
但是,RL算法在進行大規(guī)模計算和控制決策時,容易出現“維數災”現象,且模型更新需要大量信息交互,使得計算成本較高且學習效率降低[13]。為了克服RL自身的缺陷,有研究將RL與DL結合使用,提出深度強化學習算法(Deep Reinforcement Learning, DRL),能獲得較好的計算結果。文獻[42]采用卷積神經網絡和DRL的混合模型對輸電線路進行運行故障檢測。文獻[43]提出一種基于連續(xù)動作的DRL模型來計算考慮可再生能源出力實時不確定性的系統(tǒng)最優(yōu)能流問題。
TL強調在不同但相似的數據域進行知識遷移,并允許在訓練和測試中使用不同的數據域,從而提高算法效率[23]。文獻[44]利用TL實現了歷史數據潛力的充分挖掘,并結合少量獲得的新數據進行系統(tǒng)的在線穩(wěn)定評估。文獻[45]利用TL實現了使用一個經過訓練的模型來處理多個故障的方法,大大提高了算法效率。文獻[46]提出一種DL與TL的系統(tǒng)可靠性混合分析方法,利用卷積神經網絡來訓練樣本采集數據計算可靠性指標,能減少樣本的收集時間,并結合TL進一步提高算法效率。TL計算效率較高但收斂性較差,適用于小樣本學習和個性化學習,并適合與其他算法配合來加快計算收斂。
目前,數據驅動的方法在IES運行可靠性評估中的在線故障診斷、最優(yōu)能流計算、運行狀態(tài)判斷等環(huán)節(jié)的應用正處于起步階段,對解決能源領域的技術瓶頸仍面臨諸多挑戰(zhàn),現有研究存在的不足總結為如下三點:
1)研究對象多為電力系統(tǒng),利用數據驅動方法對IES尤其是耦合環(huán)節(jié)的運行可靠性研究較少。相較于電力系統(tǒng),IES運行可靠性的改變在很大程度上取決于供能子系統(tǒng)的耦合與不同能源的相互轉換。現有數據驅動的研究鮮有對IES中的耦合設備及耦合環(huán)節(jié)進行運行可靠性分析,故數據驅動的方法還尚未解決IES運行可靠性評估的核心問題。
2)缺乏數學理論及具體模型的支持,可解釋性弱。數據驅動模型實質為黑箱模型,導致現有的通用運行模型及專家經驗還無法在人工智能模型中體現[23]。數據驅動方法在應用于能源領域問題時過于依賴訓練數據,缺乏深層次的數據語義挖掘[25],對于IES運行可靠性問題中物理本質與計算過程的映射,難以給出合理具體的數學描述,這也限制了數據驅動方法在高風險等特殊運行場景中的應用。
3)數據集質量問題。數據驅動模型在系統(tǒng)運行與分析中的可靠性和準確性密切依賴于數據集質量。IES運行過程中會生成海量運行數據,且需計及內外部影響因素的時變特性,數據集本身的收集工作就有較大難度,依賴IES中的設備狀態(tài)檢測系統(tǒng)、能量管理系統(tǒng)、地理信息系統(tǒng)及氣象信息系統(tǒng)等能源信息化平臺的進一步完善[23]。且IES運行場景多樣,單一場景內的運行數據可能不足且時變性較強,系統(tǒng)處于穩(wěn)定運行和遭受小擾動的場景數據居多,故障運行和遭受大擾動的場景數據較少[47],導致其正負樣本不均衡問題嚴重。另外,IES復雜的運行環(huán)境導致其數據異?,F象時有發(fā)生,相應的包括數據清洗在內的數據預處理技術和數據集質量評價標準尚不完善,可能會造成部分數據集的可用性無法保障。
上文詳細綜述了模型驅動的IES運行可靠性評估與數據驅動的IES運行可靠性評估,兩種方法各自的優(yōu)缺點對比見表2。
表2 模型驅動方法與數據驅動方法的優(yōu)缺點對比