機器學習和數(shù)據(jù)驅動算法在智慧發(fā)電系統(tǒng)中的應用
——一種不確定性處理的視角

2021-03-17 02:54:06孫立FengqiYou

工程 2021年9期

孫立, Fengqi You *

a Key Laboratory of Energy Thermal Conversion and Control of Ministry of Education, S chool of Energy and the Environment, S outheast University, Nanjing 210096, China b Robert Frederick S mith S chool of Chemical and Biomolecular Engineering, Cornell University, Ithaca, NY 14853, US A

1.引言

幾十年來，火力發(fā)電是造成環(huán)境污染和碳排放的主要因素之一[1]。據(jù)報道，2018 年發(fā)電行業(yè)的碳排放占碳排放增長的近三分之二，其中燃煤發(fā)電所占比重最大（約占總排放量的30%）[2]?？紤]到日益嚴重的氣候變化問題，世界主要國家被迫確定“將全球平均氣溫的上升幅度控制在工業(yè)化前水平以上低于2 ℃之內(nèi)”[3]的目標。為了實現(xiàn)這一目標，需要對發(fā)電行業(yè)進行改革，具體包括優(yōu)化目前流行的火力發(fā)電的效率，擴大可持續(xù)能源（包括水電、太陽能和風能）的比例。

控制和優(yōu)化發(fā)電系統(tǒng)對于其高效和安全運行至關重要[4]。由于發(fā)電系統(tǒng)中各部分存在多時間尺度的特征，發(fā)電系統(tǒng)通常采用分層控制框架[5-6]，以完成各層的主要任務，如圖1所示。在最低的測量過程層，必須保證重要變量測量和監(jiān)控的可見性。根據(jù)這些變量，將調節(jié)控制器放置在現(xiàn)場，以使每個單回路（如溫度、壓力和水位）控制在上級監(jiān)控層指定的工作點上?；诖?，本文將調節(jié)控制水平的性能稱為“機動性”，它描述了目標回路在需要時如何快速和穩(wěn)定地行動。監(jiān)控層采用先進的控制算法，在滿足操作約束的同時，通過考慮多變量耦合，最大限度地提高許多交互回路的靈活性[8]。在最高級別的經(jīng)濟規(guī)劃中，制定和優(yōu)化總體效率或利潤指標，為較低層次的動態(tài)控制提供穩(wěn)態(tài)工作點[9]。除了自下而上的控制水平外，故障檢測和診斷（FDD）對于安全運行和維持更長的發(fā)電廠壽命至關重要[10]。圖1 中的層次結構可用于管理完整的發(fā)電系統(tǒng)（如燃料電池單元）或子系統(tǒng)（如燃煤發(fā)電廠的鍋爐燃燒爐）。

一般圖1中的每個層級都有一個精確的模型，這對于實現(xiàn)多個目標至關重要。監(jiān)控層的內(nèi)部變量通常由狀態(tài)觀測器或基于狀態(tài)空間（SS）模型的卡爾曼濾波器實現(xiàn)，如電池芯溫度估計[11]。用于調節(jié)層的則是廣泛使用的比例-積分-微分（PID）控制器——通常需要一個參數(shù)整定的過程模型[12]。就靈活性層級而言，模型預測控制（MPC）占監(jiān)控算法的最大份額。MPC采用基于模型的輸出預測，將多變量約束優(yōu)化問題轉化為一個滾動時域二次優(yōu)化框架。參考文獻[13]展示了在太陽能聯(lián)合循環(huán)電廠中的MPC 的典型應用。對于經(jīng)濟規(guī)劃層，動態(tài)規(guī)劃是一種非常流行的算法，用于調度不同電源之間的能量流需求，通常以每小時運行成本來計算，如復雜第三代發(fā)電廠的能量成本優(yōu)化[14]或混合發(fā)電廠的運行成本優(yōu)化[15]。故障檢測通常使用的是先驗模型，就像最近在燃料電池空氣供給系統(tǒng)中的應用[16]一樣。近年來一個重要的發(fā)展趨勢是基于經(jīng)濟模型預測控制（EMPC）框架，將經(jīng)濟性規(guī)劃與監(jiān)控水平結合形成集成EMPC。該框架能夠根據(jù)系統(tǒng)模型和各種約束條件直接制定經(jīng)濟指標，同時實現(xiàn)經(jīng)濟優(yōu)化和動態(tài)運行。已有研究[17-18]表明，可以利用EMPC 減少鍋爐-汽輪機機組的節(jié)流損失以及提高建筑物熱電聯(lián)產(chǎn)系統(tǒng)的舒適性。

傳統(tǒng)的基于模型的方法雖然有效，但其終將無法處理規(guī)模不斷增長且具有各種不確定性的能源系統(tǒng)。本文總結了圖1中每個層級上通常遇到的幾種典型不確定性。這些不確定性將在下一節(jié)中逐一討論。21 世紀是機器學習（ML）和數(shù)據(jù)科學[19]蓬勃發(fā)展的時代；機器學習和數(shù)據(jù)科學的發(fā)展可能是解決可擴展性和不確定性方面困難的關鍵。在這個大數(shù)據(jù)時代，許多學科，如粒子物理學[20]、材料學[21]和過程系統(tǒng)工程[22]，已經(jīng)逐漸產(chǎn)生了研究方法從基于模型的分析到機器學習和基于數(shù)據(jù)驅動（DD）研究的巨大轉變。機器學習和基于數(shù)據(jù)驅動的研究技術徹底改變了現(xiàn)代能源系統(tǒng)的監(jiān)測、控制和優(yōu)化的方法，包括傳統(tǒng)化石燃料發(fā)電廠和可再生能源系統(tǒng)。常見的機器學習算法包括無監(jiān)督學習、監(jiān)督學習和強化學習（RL）[23]，每一種算法都被應用于不同層次的能源系統(tǒng)，以解決不同的問題。數(shù)據(jù)驅動技術通常使用實時或歷史數(shù)據(jù)直接控制過程，包括迭代反饋調節(jié)（IFT）[24]、迭代學習控制（ILC）和自抗擾控制（ADRC）[25-26]。數(shù)據(jù)驅動方法通常比機器學習方法具有更大的適用范圍和更快的運行速度，它能滿足監(jiān)管控制層級的高實時性要求，應用廣泛。

本文并不試圖對所有能源系統(tǒng)應用中的每種方法進行全面的討論，相反，本文旨在展示如何適當運用機器學習和基于數(shù)據(jù)驅動的方法，以提高發(fā)電系統(tǒng)的可見性、機動性、靈活性、經(jīng)濟性和安全性（簡稱“五性”），來應對各個層級所出現(xiàn)的不確定性挑戰(zhàn)。根據(jù)圖1，“五性”可定義如下：

?可見性——可測量變量的測量和傳輸以及內(nèi)部不可測量變量的估計。

?機動性——底層調節(jié)控制響應的快速性和準確性，主要是在單回路過程中。

?靈活性——多變量協(xié)調在監(jiān)督控制水平上可以達到的程度。

?經(jīng)濟性——整個系統(tǒng)或重要子系統(tǒng)的經(jīng)濟成本或效益。

圖1.發(fā)電系統(tǒng)或子系統(tǒng)的分層結構，用于監(jiān)測、控制、優(yōu)化和故障檢測。

?安全性——系統(tǒng)的FDD，防止對發(fā)電系統(tǒng)造成危險。

在智慧發(fā)電中，可見性層級是其他層級的基礎，因為它涉及感知用于控制、優(yōu)化和診斷的內(nèi)部參數(shù)。強大的機動性級別是實現(xiàn)靈活性和經(jīng)濟性的有力保證，而安全級別是保護整個系統(tǒng)安全的基本保障。

本文全面回顧了機器學習和數(shù)據(jù)驅動方法在電力行業(yè)的應用：從傳統(tǒng)火力發(fā)電到新興的可再生能源領域；從確定性場景到不確定性場景；從整個運行管理框架的底層到頂層。

本文選擇不確定性處理視角的原因如下：

?不確定性廣泛存在于發(fā)電系統(tǒng)的各個層面。正如Roger Brockett所說，“如果系統(tǒng)、控制或環(huán)境中沒有不確定性，那么反饋控制在很大程度上是不必要的?！盵27]

?不確定性的性質在不同層級上有所不同，所以需要各個層級單獨考慮。例如，應估計并抵消靈活性層級上的干擾不確定性，而經(jīng)濟性上的環(huán)境不確定性應建模為隨機過程，然后將其考慮在內(nèi)在經(jīng)濟優(yōu)化過程中。

本文側重于發(fā)電方面，將不討論電網(wǎng)方面的文獻。本文的其余部分組織如下：第2節(jié)討論了底層可見性和機動性，其中數(shù)據(jù)驅動和機器學習算法必須快速響應監(jiān)管要求；第3節(jié)回顧了基于數(shù)據(jù)驅動模型的預測控制、在能源系統(tǒng)規(guī)劃層面的監(jiān)管靈活性以及各種無監(jiān)管和RL 方法，計算時間從數(shù)分鐘到數(shù)小時不等；第4節(jié)對發(fā)電系統(tǒng)的數(shù)據(jù)驅動的FDD 方法進行了回顧，并與基于模型的方法進行了比較；第5節(jié)總結了調查結果，并闡述了智慧發(fā)電的未來研究方向。

2.可見性和機動性

可見性要求涉及變量測量、定量過程表征和隱藏變量軟測量。測量信號中不可避免的隨機噪聲是在這一層級上的主要的不確定性。機動性是基于過程識別和可見性層級的測量或估計信號實現(xiàn)的，主要目標是抑制不確定性干擾。

2.1.動態(tài)特性

系統(tǒng)辨識是一種用于動態(tài)系統(tǒng)的經(jīng)典數(shù)據(jù)驅動的方法。由于物理建模的困難，它通常被視為一個黑箱。自20 世紀60 年代以來，該學科受到了廣泛關注并取得了巨大成功，甚至早于機器學習的興盛[28]。通過將某些激勵作為控制輸入，用于辨識發(fā)電過程輸入/輸出數(shù)據(jù)背后的基本結構和參數(shù)?；诮?jīng)典階躍響應的傳遞函數(shù)識別是發(fā)電廠中最常用的方法。階躍響應識別在能源系統(tǒng)中的應用包括再熱器中的水位控制[29]、燃料電池的溫度控制[30]和多變量流化床燃燒室控制[31]。已有研究表明，經(jīng)典的階躍響應方法無法辨識存在測量噪聲的高階過程[32]。為了緩解這一問題，參考文獻[33]針對換熱器（能源系統(tǒng)中常見的高階設備）開發(fā)了一種混合時域和頻域的辨識方法。

傳感器噪聲是現(xiàn)代系統(tǒng)辨識方法需要解決的核心問題。加性高斯白噪聲（AWGN）主要來源于熱噪聲，是發(fā)電系統(tǒng)中最常見的傳感器噪聲。目前已經(jīng)開發(fā)出多種成熟的數(shù)據(jù)驅動的方法來解決能源系統(tǒng)中的AWGN，最常用的方法是使用最小標準，如平方誤差[34]。對于單輸入單輸出系統(tǒng)（SISO），參考文獻[35]給出了一個示例，其中使用自適應遞歸最小二乘法（ARL）實時識別燃料電池混合系統(tǒng)模型的回歸參數(shù)，即具有AWGN 的線性差分方程或具有額外輸入的自回歸（ARX）模型。該ARX 模型基于遞歸最小二乘法（RLS）識別方法，是幾乎所有發(fā)電行業(yè)最常用的抵消AWGN 的方法之一，包括風力發(fā)電行業(yè)[36]、太陽能發(fā)電行業(yè)[37-38]、火力發(fā)電行業(yè)[39]和儲能系統(tǒng)行業(yè)[40-41]。而對于非高斯有色噪聲，參考文獻[42]中的電池參數(shù)識別研究引入了一種輔助變量方法，該方法改進了最小二乘識別方法，優(yōu)于傳統(tǒng)RLS。

當涉及SS 模型描述的多狀態(tài)系統(tǒng)時，噪聲問題變得更加棘手。對于具有未知參數(shù)（即灰盒）的SS物理模型，Cramer-Rao 界分析用于電池[43]和混合儲能系統(tǒng)[44]的參數(shù)識別，以處理電池電壓測量中的AWGN。為了避免理論解中的分析困難，啟發(fā)式優(yōu)化方法被廣泛用于識別能源系統(tǒng)，如燃料電池[45]、太陽能電池[46]和水輪機[47]的SS模型參數(shù)。對于沒有任何物理機制和SS模型的黑箱系統(tǒng)，通常采用子空間識別（SID）。此類系統(tǒng)的示例包括燃料電池[48]、電廠再熱器[49]和流化床燃燒器[50]。

上述系統(tǒng)識別方法通常需要特定類型的輸入激勵信號，并且主要作用于線性系統(tǒng)。隨著機器學習方法的發(fā)展，這一慣例發(fā)生了變化，機器學習方法能夠識別基于大量數(shù)據(jù)記錄的復雜非線性系統(tǒng)。淺層神經(jīng)網(wǎng)絡（NN）是能源系統(tǒng)中最常用的方法之一，如燃料電池的動態(tài)建模[51-52]、鍋爐-渦輪機組[53-54]和太陽能發(fā)電[55]。為了降低結構風險，支持向量機（SVM）也廣泛用于能源系統(tǒng)識別[56,58]。在過去10 年中，隨著深度學習的重新興起，長短期記憶網(wǎng)絡（LSTM）變得越來越普遍，因為它能更好地處理發(fā)電系統(tǒng)的時間序列數(shù)據(jù)[59]。

2.2.軟測量

由于能源系統(tǒng)中的一些關鍵變量可能無法直接測量，軟測量技術，包括基于模型的狀態(tài)估計[60]和數(shù)據(jù)驅動的相關[61]算法，可以有效地觀測系統(tǒng)內(nèi)部的情況，并為控制層提供反饋信號。基于模型的狀態(tài)估計通常存在隨機噪聲的不確定性和傳感器的不精確性等問題。一些數(shù)據(jù)驅動的方法已被用來彌補這一不足，如基于狀態(tài)增強和反饋校正的電池芯溫度估計[11]。

基于數(shù)據(jù)驅動代數(shù)相關的軟測量方法旨在通過測量次要變量來估計不可測量變量（也稱為主要變量）[62]。雖然在系統(tǒng)運行時無法直接測量，但主要變量可以脫機測量和（或）間歇性訪問，每個樣本的成本很高。所以，軟測量的基本任務是根據(jù)有限的觀測數(shù)據(jù)，確定主要變量和次要變量之間的關系。為此，可以使用回歸或曲線擬合。例如，學習證據(jù)回歸模型，將其作為軟傳感器來監(jiān)測磨煤機中的粉末濃度[63]；訓練偏最小二乘（PLS）回歸來預測1000 MW級發(fā)電廠中NOx的排放[64]。

2.3.監(jiān)管控制

為了實現(xiàn)強大的靈活性，許多反饋控制器被部署在調節(jié)控制層級。該層級接收來自可見性層級的信號和來自上層的參考命令。其主要目標是減輕不可測量和不確定性干擾的影響[65]。對每個回路進行建模和設計單獨的反饋控制器既十分耗時又很昂貴。因此，數(shù)據(jù)驅動的控制方法在工業(yè)調節(jié)控制中起著核心作用[26]。本文回顧了PID 控制、自抗擾控制和ILC在一些典型擾動中的應用。

PID控制仍然是發(fā)電系統(tǒng)中的主要控制器，因為它易于使用，在要求快速反應的環(huán)境中，計算時間可以忽略不計[12]。PID 控制使用比例、積分和實時誤差數(shù)據(jù)推導的組合，而不是物理模型，來調整執(zhí)行器并在最佳條件下保持設備運行。困難通常在于調整控制器參數(shù)。工程師有時采用機器學習技術來提高性能，如神經(jīng)網(wǎng)絡增強PID控制在火力發(fā)電廠[66]、燃料電池[67]、太陽能發(fā)電廠[68]和風力渦輪機[69]中的應用。此外，模糊邏輯在風力渦輪機[70]、燃料電池[71]、太陽能發(fā)電[72]和聯(lián)合循環(huán)發(fā)電廠[73]中非常流行，用于在線調整PID參數(shù)。為了能充分利用歷史數(shù)據(jù)的潛力，還對IFT 進行了研究，以調整鍋爐-汽輪機機組的PID 參數(shù)[74]。IFT 是一種有趣的方法，通過學習以前任務的性能來迭代地提高控制性能。

由于PID控制在處理非線性和模型不確定性方面的局限性，自抗擾控制正在成為一種突破性的數(shù)據(jù)驅動控制技術。與PID控制相同，自抗擾控制器的設計不需要物理模型[75]。與PID控制相比，自抗擾控制的主要優(yōu)點在于它具有兩個自由度，在設定點跟蹤和干擾抑制方面都能產(chǎn)生令人滿意的性能。自抗擾控制的數(shù)據(jù)驅動補償機制如圖2所示。首先設計一個擴展狀態(tài)觀測器來估計未知動態(tài)和外部干擾，然后通過分析輸入和輸出數(shù)據(jù)直接補償控制輸入中的未知動態(tài)和外部干擾。增強型設備，即圖2中的灰色塊，可以作為串級積分器過程進行近似補償，從而可以容易地設計外環(huán)控制器。參考文獻[29]表明，自抗擾控制器具有抗積分飽和能力，適用于1000 MW 級發(fā)電廠的再熱器。通過鍋爐爐膛控制中的實驗應用，討論了自抗擾控制器的整定[76]。通過引入串級自抗擾控制結構，電廠過熱溫度的波動顯著降低[77]。最近，自抗擾控制器還被引入風力渦輪機[78]、光伏發(fā)電[79]和燃料電池[80-81]的監(jiān)管控制中。

ILC 專門用于解決周期性干擾[82]，盡管在發(fā)電系統(tǒng)中的應用相對有限，但仍然得到了控制界的廣泛關注。通過學習前面序列中相應的時間步，ILC在每個時間步逐步修改控制動作。發(fā)電系統(tǒng)中典型的周期性擾動和探索性ILC 應用包括燃料電池陽極凈化過程[83]和風力渦輪機峰值負荷[84]。

3.靈活性和經(jīng)濟性

靈活性是指監(jiān)控級別協(xié)調多個回路之間操作的能力，構成了盈利能力的基礎。為了尋求最大利潤和最小成本，盈利水平計算中間層過程變量的最佳條件。因此，更大的靈活性使高度互動的能源系統(tǒng)能更容易、更安全地在選定的幾個操作條件下得到維護，并具有最大的經(jīng)濟效益。

圖2.自抗擾控制器數(shù)據(jù)驅動干擾補償結構。kp：比例增益；e：反饋誤差；b0：過程增益；ESO：擴展狀態(tài)觀測器。

3.1.靈活性

系統(tǒng)靈活性的監(jiān)控層級主要負責兩個基本監(jiān)管回路的協(xié)調。更靈活的多變量控制器設計策略使系統(tǒng)在任何干擾后能快速地轉換回經(jīng)濟性最優(yōu)的狀態(tài)。

多變量模型仍然很重要，目前在監(jiān)控應用（包括發(fā)電應用）中發(fā)揮著基本作用。由于發(fā)電過程中嚴格的安全要求，純數(shù)據(jù)驅動控制的研究和應用受到一定限制。沒有模型，通常很難保證多變量控制系統(tǒng)的穩(wěn)定性。然而，基于模型的控制的主要挑戰(zhàn)是在條件轉換、設備老化和環(huán)境變化期間的模型不確定性。為此，機器學習和數(shù)據(jù)驅動技術可以提高系統(tǒng)對模型不確定性的魯棒性。

對于計算資源有限的傳統(tǒng)監(jiān)控應用，通常使用模糊邏輯調整參數(shù)以提高性能。通過識別電廠主蒸汽壓力的一組線性模型，使用模糊邏輯在線調整解耦PID 控制器的參數(shù)，以適應磨煤機的不確定條件[85]。同樣，為光伏/燃料電池發(fā)電廠開發(fā)了基于平滑度的智能模糊邏輯控制器，以實現(xiàn)對電力系統(tǒng)的快速穩(wěn)定響應[86]。開發(fā)了一種混合經(jīng)典和模糊控制方法，用于控制電廠鍋爐的蒸汽溫度和水位[87]。模型信息可用于增強多變量自抗擾控制器的數(shù)據(jù)驅動控制性能，如水箱中的多變量控制應用[88]和火力發(fā)電廠的直接能量平衡控制[89]。

鑒于工業(yè)計算能力的快速發(fā)展，上述監(jiān)控方法有些過時，這使得先進的、算力需求較大的控制算法（如MPC）得以應用。當缺少物理模型時，通常使用SID 方法為MPC開發(fā)數(shù)據(jù)驅動模型。參考文獻[90]中提出了模糊聚類與SID組合的方法，以便在MPC框架下制定和處理鍋爐-汽輪機機組的多變量耦合和運行約束。對于沒有完全在線測量所有輸出變量的燃料電池系統(tǒng)，SID 方法直接嵌入MPC，以實現(xiàn)完全數(shù)據(jù)驅動控制[91]。最近，數(shù)據(jù)驅動增強型MPC被用于燃煤發(fā)電廠的污染控制[92]和碳捕獲控制[93]。除了數(shù)據(jù)驅動方法外，機器學習方法還與MPC相結合。神經(jīng)網(wǎng)絡用于訓練MPC 模型，并在動態(tài)能量管理系統(tǒng)中取得了成功[94]。此外，最小二乘支持向量機（LSSVM）和偏最小二乘支持向量機分別用于識別燃料電池系統(tǒng)，在此基礎上部署MPC，以實現(xiàn)對工作溫度有約束的快速功率跟蹤[95]。參考文獻[96]中針對核電廠過熱蒸汽供應系統(tǒng)提出了一種基于多層感知的MPC?；跈C器學習的MPC的主要缺點是通常無法保證閉環(huán)穩(wěn)定性。

3.2.經(jīng)濟性

經(jīng)濟性規(guī)劃是發(fā)電系統(tǒng)規(guī)劃的最高水平。它的時間步長通常為小時或天，因此有足夠的時間計算較低級別的經(jīng)濟參考。傳統(tǒng)上，數(shù)據(jù)挖掘的方法用于根據(jù)歷史數(shù)據(jù)計算最經(jīng)濟的操作。例如，在最近的無監(jiān)督學習應用中，首先通過主成分分析（PCA）減小電廠脫硫系統(tǒng)的歷史數(shù)據(jù)的量，然后使用模糊C-均值聚類方法得出具有相似操作條件的多個組。因此，運行系統(tǒng)的經(jīng)濟參考可確定為類似組的最低脫硫成本點[97]。換言之，主成分分析和聚類相結合的方法旨在通過將當前工況與其所屬組中類似的運行工況進行比較來尋找最佳點。然而，這種方法只能搜索數(shù)據(jù)庫的現(xiàn)有條件，不能保證最優(yōu)性。這是一種不同于鍋爐燃燒優(yōu)化的方法[98]?；谧钚《酥С窒蛄繖C，對鍋爐燃燒效率和污染物排放量進行了大量的回歸分析。然后采用遺傳算法優(yōu)化條件設置，平衡燃燒效率和污染排放。

當涉及可再生能源發(fā)電系統(tǒng)時，由于不確定環(huán)境變量的存在，如風和陽光的周期，以及各種負荷的波動，使得經(jīng)濟規(guī)劃更加困難。為此，對每個不確定變量的合理預測對于下一步的盈利能力決策至關重要。這可能是發(fā)電領域最活躍的研究領域，有大量文獻研究了各種機器學習算法。以風電預測為例，各種人工神經(jīng)網(wǎng)絡（ANN）結構，包括前饋、時間序列、遞歸和深度神經(jīng)網(wǎng)絡，已被用于將不同的天氣變量映射到一系列不同時間尺度（如每日、每周和每月）的確定性風電預測值[99-100]。風力發(fā)電的統(tǒng)計特性通過貝葉斯方法進行評估，如稀疏貝葉斯學習[101]、貝葉斯非參數(shù)方法[102]和馬爾可夫鏈蒙特卡羅（MCMC）方法[103]，以得出一定范圍內(nèi)的概率分布。最近，開發(fā)了一個兩層式機器學習模型，以產(chǎn)生確定性和概率性的風電預測，其中天氣變量（溫度、濕度、壓力和風向）通過深度特征選擇塊進行預處理[104]。如文獻[105-106]所述，最先進的太陽能和負荷預測方法與風能的預測方法相似。

隨著間歇性可再生能源和不確定負荷的預測，優(yōu)化混合發(fā)電和儲能系統(tǒng)的經(jīng)濟規(guī)劃成為可能。RL 似乎是一個很有前途的數(shù)據(jù)驅動解決方案，因為它即使沒有模型也能處理具有不確定性的優(yōu)化問題。RL 繼承自馬爾可夫決策過程（MDP）框架，由環(huán)境中的一組代理狀態(tài)、每個代理的一組可能操作以及控制動態(tài)轉換、偏好和觀察的規(guī)則來描述[107]。通過與宿主環(huán)境交互（即接收觀察和獎勵），RL代理選擇適當?shù)牟僮饕宰畲蠡剟?。為了克服傳統(tǒng)優(yōu)化方法的分析挑戰(zhàn)[108-109]，無論是否有物理/仿真模型[110]，RL將極端尋求或經(jīng)濟規(guī)劃轉化為發(fā)電系統(tǒng)的純數(shù)據(jù)學習問題。一個直觀的單代理Q-學習示例來自風能轉換系統(tǒng)（WECS）的最大功率點跟蹤（MPPT）控制，其中RL代理是風力渦輪機，過渡狀態(tài)是轉子速度和電功率輸出，動作是速度調整命令，獎勵定義為電功率輸出的增量[111]。針對多電源分布式發(fā)電，提出了一種以燃料電池、柴油發(fā)電機、電池、海水淡化裝置和電解槽等可調節(jié)裝置的累積期望折扣回饋最大，來減少系統(tǒng)的油耗裝置為主體的多智能體模糊學習方法。通過這些可調元件之間的RL協(xié)調行動，可最大化減少耗能，以確保系統(tǒng)可靠性并最大限度地減少化石燃料消耗[112]。深度強化學習（DRL）被引入[113]，利用神經(jīng)網(wǎng)絡強大的逼近能力來解決復雜的能源網(wǎng)絡問題。關于RL和DRL在發(fā)電系統(tǒng)中應用的進一步示例，可在最近的調查[114]中查閱。

4.安全性——故障檢測和診斷

通常，智慧發(fā)電中用于FDD 的方法分為兩類：基于模型的方法和基于實例的方法?；谀Ｐ偷姆椒▽で笤O備的輸入、狀態(tài)和輸出之間的定量關系，受潛在設備不確定性的影響。計算目標輸出和模型預測之間的殘差，如果累計殘差大于規(guī)定閾值，則檢測并隔離故障。以某制粉系統(tǒng)為例，利用SS方程建立了基于觀測器的FDD模型，用于監(jiān)測漏煤、堵磨等故障。實驗結果表明，基于觀測器的FDD 方法在標稱情況下表現(xiàn)良好[115-116]。然而，未知干擾或不確定性可能導致基于觀測器的FDD 模型表現(xiàn)不夠好。為防止此類故障，一種數(shù)據(jù)驅動FDD 方法被開發(fā)出來[117]。這種方法基于可測過程數(shù)據(jù)構建魯棒的殘差生成器以檢測故障，如應用在存在未知干擾和測量噪聲的情況下的風機故障檢測與診斷中。此外，數(shù)據(jù)驅動的FDD 方法可能不需要來自工廠的先驗信息。在參考文獻[118]中可以找到風力渦輪機故障檢測的應用，其中比較了神經(jīng)網(wǎng)絡和其他回歸方法。

數(shù)據(jù)驅動基于實例的方法還將具有不同故障類型的歷史樣本視為位于由輸入、輸出和（或）狀態(tài)組成的混合特征空間中的模式。然后將新的觀測結果與歷史模式進行比較，以確定是否存在斷層；如果是，則檢測到的故障將被分配到已知的最相似的故障類型。數(shù)據(jù)驅動的方法是基于案例的方法解決分類問題，而基于模型的方法是解決回歸問題。換句話說，任何分類算法都可以重新調整用途并部署為FDD 模型。類似地，燃料電池FDD 基于分類算法進行[119]。參考文獻[120]對支持向量機和自適應神經(jīng)模糊推理系統(tǒng)（ANFIS）分類器進行了研究，以識別汽輪機機組的故障狀態(tài)。對于基于能源系統(tǒng)分類算法的其他FDD模型，感興趣的讀者可查閱參考文獻[121]及其中的文獻。

普遍存在的不確定性阻礙了FDD 在發(fā)電系統(tǒng)中的應用。閾值通常由用戶確定。事實上，幾乎所有的FDD 模型都對用戶給定的閾值敏感：一個小的閾值會導致許多錯誤警報。目前還沒有一種通用且被廣泛接受的方法用于處理不精確性和不確定性，或者在FDD 中預設用戶給定的閾值。除上述兩個問題外，發(fā)電廠的安全協(xié)議使得獲取故障樣本（即訓練樣本）的成本過高。因此，必須根據(jù)正常操作數(shù)據(jù)執(zhí)行FDD。

由于存在不確定性導致的困難，傳統(tǒng)的數(shù)據(jù)驅動基于實例的方法通常難以通過將新觀測值與歷史運行數(shù)據(jù)進行比較來識別潛在故障。為了緩解這一困難，證據(jù)的Demp‐ster-Shafer（DS）理論[122,125]擴展了概率理論，并通過將所有故障類型/類別的功率集作為識別框架，提供了解釋不精確性和不確定性的一般框架。理論上，假設有一個包含c個正常態(tài)（或故障）的集合Ω={ω1,ω2,...,ω3}，概率論定義了概率分布p:Ω →[0,1]，DS重新定義這個分布為質量函數(shù)m:2Ω→[0,1]。顯然質量方程不僅可以描述概率或觀測值屬于某個正常情況({ωq})的可信度[定義為m({ωq})]，也可以描述屬于某一個瞬時態(tài)的可信度[定義為{ωq,ωq+1}]。特別地，如果一個觀測值具有較大的未知度m(Ω)，比如m(Ω)→1，則其將被視作一個新的正常情況（包括從現(xiàn)有正常情況惡化的新情況）或未知故障?？偟膩碚f，比起概率論或模糊集理論，DS為FDD提供了一個更強大的工具來處理數(shù)據(jù)中的不精確性和不確定性。因此，在DS 框架中實施基于數(shù)據(jù)驅動案例的方法可以對FDD 作出更有意義的解釋，包括檢測正常態(tài)、瞬時態(tài)、新的正常態(tài)、惡化案例（來自正常案例）和未知故障案例，如圖3 所示。DS 理論在發(fā)電系統(tǒng)中發(fā)現(xiàn)了若干FDD應用。例如，參考文獻[126]中提出了一種基于DS理論和分類回歸樹的多傳感器融合和決策方法，用于在緊急情況下對保護發(fā)電系統(tǒng)的高壓斷路器（HVCB）進行診斷。通過借鑒參考文獻[127-128]的基本思想，基于證據(jù)k-最近鄰（EKNN）分類規(guī)則建立FDD模型，對火力發(fā)電廠的兩個實際設備單元進行監(jiān)測和預警[129]。

5.總結

機器學習和數(shù)據(jù)驅動控制方法已被證明是各級智慧發(fā)電系統(tǒng)運行中基于傳統(tǒng)模型方法的比較有希望的替代方法，尤其是對于不確定性的情況。本文闡述了各層級的目標和主要的不確定性，并回顧了機器學習和數(shù)據(jù)驅動方法如何幫助提高可見性、機動性、靈活性、經(jīng)濟性和安全性。對于受隨機噪聲不確定性影響的動態(tài)建模，數(shù)據(jù)驅動系統(tǒng)辨識方法在推導傳遞函數(shù)和SS 形式的代數(shù)模型方面起著重要作用。此外，當大數(shù)據(jù)可用時，基于機器學習的回歸方法在描述非線性多變量能源系統(tǒng)方面更為有效。除了動態(tài)表征外，數(shù)據(jù)驅動的軟測量還可以顯著增強內(nèi)部能量系統(tǒng)的可見性。基于可見度信息，調節(jié)控制水平可以通過對特定類型的不確定性干擾使用合適的數(shù)據(jù)驅動控制方法來提高設備的機動性。基于模型的第一定律方法對于監(jiān)控多變量控制水平仍然至關重要，但可以將數(shù)據(jù)驅動方法嵌入MPC 框架中，以增強發(fā)電系統(tǒng)對模型不確定性的靈活性。經(jīng)濟性規(guī)劃嚴重依賴機器學習方法來適應受各種不確定性影響的大規(guī)模能源系統(tǒng)優(yōu)化問題。為了在未知故障情況下提高系統(tǒng)安全性，數(shù)據(jù)驅動的DS理論只有在正常運行數(shù)據(jù)可用時，在發(fā)電系統(tǒng)故障診斷中顯示出巨大的潛力。目前，EMPC仍然嚴重依賴于過程模型，并且關于將機器學習算法實現(xiàn)為監(jiān)督和規(guī)劃級別組合的研究很少。此外，與機器學習和數(shù)據(jù)科學的蓬勃發(fā)展相比，最新的機器學習算法（如深度學習）與當前智慧發(fā)電系統(tǒng)中的應用存在很大差距。阻礙EMPC進一步應用的主要困難是在線優(yōu)化所需的巨大計算時間。EMPC的高效計算是未來研究的一個重要課題。這個被低估但令人興奮的話題仍處于發(fā)展的初級階段。機器學習和數(shù)據(jù)驅動方法在提高電力系統(tǒng)效率方面具有巨大潛力，是電力系統(tǒng)實現(xiàn)可持續(xù)發(fā)展的未來。

圖3.DS理論框架下的數(shù)據(jù)驅動的故障檢測和診斷。

致謝

感謝蘇志剛博士、Ralph Wang和Shreya Vaidyafor對本文的貢獻和反饋。

Compliance with ethics guidelines

Li Sun and Fengqi You declare that they have no con‐flict of interest or financial conflicts to disclose.

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

機器學習和數(shù)據(jù)驅動算法在智慧發(fā)電系統(tǒng)中的應用——一種不確定性處理的視角