李亦言,胡榮興,宋立冬,賈乾罡,陸 寧
(1.北卡羅來納州立大學電子與計算機工程系,羅利市 27695,美國;2.上海交通大學電子信息與電氣工程學院,上海市 200240)
能源轉型是解決環(huán)境問題、實現經濟社會可持續(xù)發(fā)展的必由之路。美國政府宣布將在2050年之前實現100%的清潔能源供應與零排放[1-2]。中國提出了在2030年前實現“碳達峰”、2060年前實現“碳中和”的雙碳戰(zhàn)略目標。擺脫對傳統化石燃料的依賴,以風能、太陽能等可再生能源為主導,實現清潔、可持續(xù)的能源供用模式已經成為各國的共識。
在能源轉型背景下,電力系統作為整個能源鏈中的樞紐以及能源變革的核心環(huán)節(jié),其面臨的挑戰(zhàn)日趨嚴峻。一方面,風電、光伏等新能源占比快速提升。根據預測,到2060年中國風電、光伏裝機容量在電源結構中的比重將達到60%,系統的弱慣量、強隨機性、電力電子化特征愈發(fā)顯著。另一方面,電動汽車、可控負荷、儲能等分布式發(fā)電資源也將廣泛接入電網,系統的運行方式更加靈活,控制的復雜度也隨之大幅提升。
機器學習技術是應對以上挑戰(zhàn)的強大工具。機器學習是計算科學的一個分支,旨在讓計算機通過對已有經驗的學習不斷地自我提升,并最終實現對人類智慧的模擬[3-4]。機器學習技術的研究興起于20世紀50年代,貝葉斯分類器、邏輯回歸、感知器模型等經典的機器學習模型被首次提出,解釋大腦神經元工作原理的赫布理論(Hebbian theory)則對后續(xù)神經網絡模型的發(fā)展起到了啟蒙作用。此后,機器學習技術依次經歷了70年代的寒冬、80年代的再次興起,并在90年代以支持向量機為代表走向成熟和應用[5]。2012年,Hinton等人采用深度卷積神經網絡在圖像分類問題上取得了巨大成功[6],標志著機器學習技術開始進入深度學習時代,生成對抗網絡[7]、強化學習(RL)[8]、長短期記憶網絡[9]等模型在數據生成、自然語言處理(natural language processing)、實時決策等多個領域取得了顯著的成就。按照學習方式的不同,機器學習技術可分為無監(jiān)督學習、半監(jiān)督學習、監(jiān)督學習以及強化學習四大類,其在電力系統中的應用已經得到廣泛的關注。應用場景可分為態(tài)勢感知、決策支持兩大類,包括但不限于電源與負荷預測、系統建模、狀態(tài)監(jiān)測、故障檢修、系統優(yōu)化運行等多個方面[10-11]。雖然已經有大量的研究論文發(fā)表,但機器學習技術在電力系統中的實踐項目仍舊較為有限,工程實踐與理論研究之間存在一定的脫節(jié)。這主要是因為機器學習技術的“黑箱”特點,使得其在可解釋性、魯棒性等方面弱于傳統物理建模的方式,與電力系統運行中極高的可靠性要求存在一定矛盾。
本文以工程應用為切入點,從源、網、荷3個方面梳理了北美地區(qū)機器學習技術在智能配用電領域的典型工程實踐,旨在介紹機器學習技術在配用電領域的實際應用情況,思考機器學習技術的適用性,并為下一階段的研究提供借鑒。
在電源側,當前工程實踐的關注重點在于利用機器學習技術提升對于風電、光伏、儲能等分布式電源的態(tài)勢感知能力,包括狀態(tài)監(jiān)測、預測等,降低間歇性電源出力的不確定性。所采用的機器學習算法以分類、回歸等監(jiān)督學習算法為主。
2014年,美國IBM公司得到美國能源部的資助,開展名為Watt-Sun的光伏預測項目,旨在大幅提升光伏預測的準確率[12]。
1)Watt-Sun預測方法
相比于傳統預測方法,該項目在預測方法上具有以下2個亮點:一是多種數據來源的綜合利用與挖掘,包含歷史出力數據、歷史天氣數據、實時量測天氣數據、各類光伏電站傳感器數據,以及衛(wèi)星云圖、全天空成像儀等圖像數據,通過機器學習技術,構建了多源異構數據與光伏出力之間的復雜映射關系,提升了數據的利用效率與預測精度;二是項目涵蓋了多種已有的光伏預測模型,并建立了基于深度學習技術的模型選擇系統,以決定在何種情況下應更加信賴哪個預測模型?;谠撃P瓦x擇系統,不同的預測場景可以得到更加適配的預測模型,有助于提升整體的預測精度。
2)Watt-Sun應用效果
該項目成果在加州電力系統運營商(CAISO)以及佛蒙特州、加利福尼亞州、亞利桑那州等多個公用事業(yè)公司共計數十個裝設有全天空成像儀的光伏電站得到應用。經過一年的試運行,該系統在未來24 h時間尺度的短期光伏預測方面相較于原有預測模型實現了35%的精度提升。
3)光伏預測技術分析評價
光伏出力直接受到云層的影響,而云層復雜的生消、運動規(guī)律,是導致光伏短期出力波動與預測困難的主要原因。該項目引入衛(wèi)星云圖、全天空成像儀等圖像數據以及各類傳感器的實時量測數據,采用機器學習技術從中提取有效信息,提升了對云層運行狀態(tài)的感知能力,從而提升了短期光伏出力的預測精度。對這類多源異構數據的挖掘也是當前光伏預測領域的研究熱點之一[13]。因為不存在一個通用的預測模型能夠解決所有光伏預測問題,項目儲備了多個備選預測模型,并通過深度學習技術為不同預測場景匹配最優(yōu)的預測模型。相比于傳統的專家系統,基于機器學習的模型選擇系統具有更強的適應性、可擴展性。這種根據問題的不同定制化地選擇解決方案的機器學習技術隸屬于“元學習(meta learning)[14]”或“自動化機器學習(AutoML)[15]”,在配用電領域具有廣泛的應用前景。
Turbit公司基于機器學習技術,在2020年開發(fā)了風電機組的實時監(jiān)測與控制系統,實現精準的故障診斷與發(fā)電效率的提升[16]。
1)風機狀態(tài)監(jiān)測方法
項目采用監(jiān)督式學習技術,輸入為數據采集與監(jiān)控(SCADA)系統量測數據以及溫度、風速、湍流強度等天氣數據,輸出為經過標記的故障信息。訓練后的深度神經網絡模型可根據實時的量測信息有效辨識出微小的故障,并推薦相應的檢修措施。此外,項目構建了機器學習與風電機組控制算法之間的閉環(huán),將機器學習算法的分析/預測結果作為控制算法的輸入,以提升控制效果。例如當風電場的一側檢測到陣風時,可根據風向、風速信息快速調節(jié)受影響區(qū)域的風電機組姿態(tài),以最大化利用風能。
2)風機狀態(tài)監(jiān)測應用效果
該技術成功應用于科羅拉多州的Cedar Creek風電場,發(fā)電效率相比應用前提升了5%。
3)項目難點分析
該項目的挑戰(zhàn)之一是大規(guī)模量測數據的實時分析與處理。對于每個風電機組而言,SCADA將產生輸出功率、葉片角度、齒輪組加速度等500余個量測值。對于這些量測結果,傳統行業(yè)慣例是每10 min進行數據上傳。然而為實現實時的監(jiān)測與控制,需要將數據上傳頻率提升至秒級,并要求機器學習算法在幾秒內完成分析與計算,這將大幅提升數據處理的難度。Turbit公司采用開源的數據庫系統postgreSQL進行數據管理,并配合Swarm64 DA數據加速器實現數據的壓縮、并行處理、接口縮減等,實現秒級以內的處理速度。這種高效的數據管理架構可為同類型項目提供借鑒。
特斯拉公司融合機器學習、優(yōu)化算法等技術在2020年開發(fā)了電池儲能管理軟件平臺Autobidder[17],可 在 市 場 環(huán) 境 下 根 據 不 同 用 戶 的 需求以及風險偏好優(yōu)化電池組運行,以最大化用戶利益。
1)Autobidder技術特點
在Autobidder中,機器學習技術的應用場景主要包括市場價格、負荷、發(fā)電能力等關鍵信息的預測,為電池組的優(yōu)化調度與智能投標提供支撐。此外,該平臺對于不同的用戶偏好和應用環(huán)境(例如不同的市場環(huán)境)具有自適應性,并且可以不斷根據新的運行數據對算法進行持續(xù)優(yōu)化。為保證算法執(zhí)行的時效性與可靠性,平臺架設在特斯拉公司的云服務器上,并通過各類應用程序與市場運行人員、系統維護人員以及用戶進行交互。
2)Autobidder應用效果
該系統目前在全球范圍內超過1.2 GW的電池組上成功運行,其中最大的單體項目為南澳大利亞的Hornsdale儲能項目,規(guī)模達到150 MW。該項目在投運不到2年的時間內,通過提供應急調頻等服務創(chuàng)造了約5 000萬美元的收益,同時提升了電網的運行穩(wěn)定性。
3)Autobidder優(yōu)勢分析
分布式儲能資源是重要的系統調節(jié)資源,在其開發(fā)利用過程中應尊重用戶的個性化用能需求,保證用戶的利益。Autobidder項目的一大亮點在于可以適應不同類型用戶的用能偏好,并在此基礎上自動化地為用戶選擇最優(yōu)的電池組盈利方案,綜合考慮能量市場、輔助服務市場、系統調節(jié)服務、雙邊合同、針對可再生能源的調節(jié)服務等多種盈利場景。特斯拉公司的云計算架構為Autobidder的實現提供了硬件支撐。
電池的壽命(即有效的充放電循環(huán)次數)是電池的核心指標之一。標準的電池壽命測試方法是對電池進行持續(xù)的充放電,直至電池衰竭。該過程往往會持續(xù)幾個月甚至一年時間,導致很高的時間成本。針對該問題,美國麻省理工學院、斯坦福大學以及豐田研究中心在2019年聯合開展了基于機器學習的電池壽命快速預測項目,旨在通過學習電池早期的充放電特征,實現對電池壽命的準確分類與預測[18]。
1)電池壽命快速預測方法
項目研究人員建立了124個商業(yè)電池組的充放電測試數據庫。由于產品質量、充放電策略的差異,這些電池的壽命在150至2 300次循環(huán)之間不等(壽命定義為電池容量損耗達到20%所需要的充放電循環(huán)次數)。針對以上原始數據,研究人員建立了描述充放電過程的特征集,并采用基于彈性網絡的線性模型開展預測工作。
2)電池壽命預測精度
研究人員將124個電池組數據劃分為訓練集(41個)、驗證集(43個)、測試集(40個)3個部分。測試集上的結果表明,僅基于電池前5次充放電數據,模型即可實現對電池壽命長/短的有效分類,分類精度達到95.1%;基于前100次充放電數據,可實現對電池壽命的預測,平均預測誤差9.1%,大幅減少了電池壽命的測試時間。
3)經典預測模型價值分析
該項目中所采用的預測模型為簡單的線性模型,其主要原因有2個:一是電池早期充放電數據較為有限,建立預測模型本質上屬于小樣本機器學習問題,采用過于復雜的預測模型容易導致過擬合;更重要的是,線性模型具有較好的可解釋性,可根據擬合結果反推影響電池壽命的關鍵因素,從而有助于理解電池的充放電機理。例如在該項目中,研究人員基于擬合結果發(fā)現最優(yōu)的電池壽命預測特征是第10次放電循環(huán)和第100次放電循環(huán)之間的電壓差。僅基于該單一特征即可實現85%以上的預測精度,且該特征與電池壽命末期的容量快速衰減特性高度相關。在配用電領域的工程實踐中,與物理機理的分析相結合,這類簡單、經典的機器學習模型仍然具有較高實用價值。
無人機巡檢技術已在光伏電站廣泛應用。對于無人機采集到的圖像信息,目前仍主要由人工進行分析和處理。光伏電站的無人機自動巡檢技術[19]在自動巡航收集光伏板圖像信息的基礎上實現對故障的自動識別,進一步降低了人工成本。
1)無人機自動巡檢核心算法
該項技術的核心算法為基于快速區(qū)域卷積神經網 絡(fast region-based convolutional network,Fast R-CNN)的目標檢測算法。采集了300個標記了缺陷信息的光伏板圖像,通過圖像旋轉實現樣本的擴充并在Xeon處理器上對模型進行訓練,訓練過程耗時約6 h。
2)無人機自動巡檢應用效果
訓練完成后,每秒鐘可辨識188張圖片,辨識光伏板是否存在缺陷的成功率達到96.3%,效果如圖1所示[19]。基于該方法,可將單臺無人機的最大巡檢能力由每周1次提升至每周3次。
圖1 光伏板缺陷辨識結果Fig.1 Defect identification results for photovoltaic panel
3)無人機自動巡檢技術分析評價
該項目是圖像識別技術在電力領域的早期成功實踐。由于不涉及電力系統的具體模型,其算法的跨領域通用性較強,可直接移植計算機視覺領域的最新算法。最終效果主要取決于算法的有效性以及硬件平臺的計算能力。此外,由于故障辨識本質上是監(jiān)督學習,而故障樣本往往數量有限,且故障數據集的標記將耗費較高人力成本。因此,可考慮采用數據增強(data augmentation)方法實現訓練樣本的擴充。
斯坦福大學在2018年開展了Deep-solar光伏數據庫項目,通過對衛(wèi)星地圖的圖像識別,辨識出其中的光伏區(qū)域,從而以極低的成本實現對大范圍光伏安裝情況的快速統計[20]。
1)Deep-solar核心算法
項目的技術核心為谷歌深度卷積網絡Inception V3[21-22],主 要 分 為 圖 像 識 別 和 圖 像 分割2個部分:先辨識出目標圖像中是否包含光伏系統,一旦判定為真,則繼續(xù)進行圖像的分割,從中提取出光伏區(qū)域,從而實現對其面積(可折算為容量)的統計。
2)Deep-solar應用效果
項目示例效果詳見附錄A圖A1[20],其對于光伏系統的辨識準確率可達到90%。基于該數據庫,研究人員可結合經濟社會信息得到更多結論。例如研究人員發(fā)現日均輻照度大于4.5(kW·h)/m2是觸發(fā)光伏安裝的“閾值”;此外,在人口密度為1 000人/平方英里(1平方英里約等于2.59 km2),家庭年均收入約15萬美元的地區(qū)光伏安裝密度達到峰值。
3)基于衛(wèi)星地圖的智能配用電研究
分布式光伏近年來增長迅速,但由于其單個體量小、數量龐大、布局分散,對其裝機容量、安裝位置等靜態(tài)信息的統計工作難度較大。而基于Deepsolar所得到的光伏數據庫具有很強的實時性,其更新頻率可與衛(wèi)星地圖的更新頻率一致,對于分析光伏的分布情況、裝機密度等信息具有直接幫助,同時也可為電力系統的規(guī)劃運行提供參考。此外,衛(wèi)星地圖由于包含了豐富的靜態(tài)信息,受到了電力系統研究人員的更多關注?;谛l(wèi)星地圖與機器學習結合的配電網規(guī)劃、模型辨識已有相應的研究成果[23]。
美國能源部下屬的太陽能技術辦公室(solar energy technology office,SETO)發(fā)布了2020年獲得資助的研究項目,其中包含10個人工智能技術在太陽能領域的應用,資助總額為730萬美元,代表了該方向上美國最新的研究趨勢[24],具體如表1所示。其中采用的核心技術方法均為人工智能與機器學習技術。
表1 2020年人工智能在太陽能領域資助項目Table 1 Funded projects of artificial intelligence in the field of solar energy,2020
通過以上獲得資助的項目內容可以看出,當前人工智能在光伏領域的應用關注的核心在于解決光伏出力強波動性與弱量測之間的矛盾及其帶來的含光伏系統運行困難問題。為解決該問題,一方面項目充分利用已有的多源異質數據,包括但不限于天氣數據、出力數據、傳感器量測數據、圖像數據等;另一方面,項目積極運用前沿的人工智能技術,例如圖神經網絡、遷移學習、變分遞歸網絡等,對這些數據進行深入挖掘,并最終提升對含光伏系統的實時感知與預測能力。此外還可以看到,表后光伏及其帶來的凈負荷分析預測問題成為研究的重點,光熱電站的相關運行問題也逐漸受到關注。
目前配電網的運行方式日趨靈活,運行狀態(tài)可能在短時間內發(fā)生顯著變化,需要更加精準、快速的態(tài)勢感知以及決策支持技術以保障其運行的安全性與經濟性。機器學習技術一方面可助力解決配電網的弱量測問題,提升對系統運行的狀態(tài)感知、故障診斷能力;另一方面基于強化學習可實現更加快速、自適應的運行決策。
提前預知配電系統中可能發(fā)生故障的設備并對其進行維護或更換,可有效減少故障所帶來的損失。美國紐約地區(qū)的地下供電系統是世界上最大、最古老的地下供電系統之一,對其進行檢修與維護難度較大。2005年起,當地公用事業(yè)公司Con Edison與哥倫比亞大學開展合作,嘗試利用機器學習技術對系統運行數據進行實時分析,按照故障風險的大小對配電設施進行排序,并對高故障風險的設備進行重點檢修[25-28]。
1)設備故障風險排序算法
項目主要包含2個部分:饋線故障排序和電纜井故障排序。饋線故障排序所使用的數據源包括靜態(tài)數據(如饋線的年齡、拓撲結構等)和動態(tài)數據(如負荷序列等)共計150余個屬性,并將歷史故障數據作為標簽。項目采用的機器學習算法為馬丁格爾增強(Martingale boosting,MB)算法[29],可不斷迭代篩選出對故障率影響最為顯著的屬性,具有較好的可解釋性。電纜井故障排序所使用的原始數據為自1970年起的電纜井故障記錄票(trouble ticket)。由于歷史時間長,故障記錄票的質量參差不齊,長度從幾行到幾百行不等,且包含大量的非常規(guī)縮寫、單詞拼寫錯誤、格式變化等,成為該項目的難點之一。為此,研究人員首先通過數據清洗與關鍵詞檢索,提取出嚴重的故障事件(爆炸、起火等)及其對應的特征信息。此后,采用延伸知識發(fā)現(extended knowledge discovery,EKD)算法進行監(jiān)督學習,實現對每個電纜井的風險打分,并按照打分結果排序。
2)故障預測效果
饋線故障預測方面,Con Edison公司利用項目算法對轄區(qū)內941個饋線進行了排序。以2005年7月為例,該月共計發(fā)生184起饋線故障,算法的排序成功指數達到0.8(1表示完全成功),且排名后500的饋線無一發(fā)生故障,表明了該方法的有效性。電纜井故障預測方面,2007年Con Edison公司共計擁有超過5萬個電纜井,全年共計發(fā)生44起嚴重事故。該算法風險評分最高的2%的電纜井發(fā)生故障的數量占總故障的11%,表明其具備一定的預測能力。此外,通過特征分析發(fā)現,電纜井中電纜的數量和故障記錄票中提及的電纜井次數這2個特征對故障的發(fā)生具有最強的預測能力。
3)故障排序技術分析評價
該項目開展時間較早,所采用的機器學習算法為經典的排序算法,具有一定的預知能力,且結果具有一定的可解釋性,是早期的成功實踐之一。對于故障記錄票的處理,現階段可考慮采用自然語言處理技術進行自動化的關鍵詞提取與故障分類。
許多公用事業(yè)公司具有悠久的歷史,網架結構龐大,在系統建設初期還沒有地理信息系統(GIS)、計算機輔助設計(CAD)等軟件,甚至還沒有計算機。這就導致系統的網架數據源自許多不同的歷史層次,包括初級的手繪紙質材料、文件掃描件、以及現代的系統建模工具。在這些異質網架數據融合的過程中,很容易出現各種錯誤,例如量測不準確、網架結構重疊、數據缺失、設備更新等。若通過現場調研的方式修正網架數據將帶來很高的成本。為此,2017年美國通用電氣公司開展Mix Core Platform項目的研究,旨在通過機器學習技術恢復準確的中低壓配電網結構[30]。
1)系統拓撲辨識方法
項目通過機器學習技術,從GIS、SCADA、數據庫管理系統(DMS)、停電管理系統(OMS)、智能庫房管理系統(WMS)等多種不同的數據源中進行特征提取與關系型建模,建立了配電網設備的語義數據模型(semantic data model)。在此基礎上,采用迭代遍歷算法推斷出設備之間的拓撲連接關系,并最終輸出配電網拓撲模型如圖2所示[30]。其中,不同顏色曲線代表不同相的網絡拓撲。對于每一個連接關系的推斷,系統可同時給出推斷的置信度水平。
圖2 Mix Core Platform示意圖Fig.2 Schematic diagram of Mix Core Platform
2)系統拓撲辨識效果
該項目成果已經在歐洲、北美等多個地區(qū)得到應用。其中代表性的應用案例是將1 149個智能表計成功匹配到32個饋線上,匹配成功率超過90%。這32個饋線也成功與其所屬的變電站匹配,匹配成功率為100%,且推斷的置信度均在90%以上。在這個過程中,系統識別出了原始數據中未標注的地下電纜與節(jié)點,修正了部分智能表計與變壓器之間的連接關系。
3)拓撲辨識技術特點分析
系統拓撲模型辨識是典型的“數據驅動-物理模型”相結合的應用場景,要求機器學習的推斷結果可解釋、可驗證。在這個過程中,語義模型是一種值得關注的數據管理與建模工具,用于描述復雜系統中各個組件的屬性及其相互之間的連接關系。
BluWave-AI是致力于采用人工智能技術解決清潔能源問題的公司,在2018年與Sustainable Power Systems聯合研制了高比例清潔能源接入下的微電網運行控制模塊[31]。該模塊采用人工智能技術實現系統運行狀態(tài)的實時分析以及負荷、新能源的預測,從而支撐微電網的自主運行(類似于電動汽車的自動駕駛)。該項目的亮點之一是采用“云-邊”的系統架構,機器學習算法集中在云平臺上運行,而智能表計、恒溫控制器、各類物聯網傳感器可進行數據的采集、上傳以及實現部分本地計算功能。
Emera公司與Sandia國家實驗室于2020年聯合發(fā)布了微電網智能控制系統BlockEnergy[32],整個系統的部署架構如圖3所示。
圖3 BlockEnergy系統部署架構Fig.3 Deployment architecture of BlockEnergy system
1)BlockEnergy技術特點
系統除了包含傳統的微電網運行控制功能之外,還可實現區(qū)域內各個用戶之間的能源拍賣交易,并可與電力公司完美對接。而且當中央控制單元發(fā)生故障后,其控制功能可以自動轉移至區(qū)內用戶的控制子模塊上,使得系統具有更強的韌性。在該系統中,機器學習技術主要用于提供用戶側負荷、分布式光伏等數據的預測,從而為求解優(yōu)化問題提供支撐。
2)BlockEnergy應用效果
該產品在美國最大的空軍基地之一Kirtland開展了測試,測試系統包含250 kW的負荷、100 kW的屋頂光伏與220 kW·h的儲能。測試結果表明,系統在發(fā)生故障、突然失去電網供電、所有用戶同時開啟大功率電器的情境下,仍然能夠保持平穩(wěn)運行。
2020年,科羅拉多公用事業(yè)公司Holy Cross Energy與NREL合作,開展自治微電網項目的研究[33]。
1)自治微電網核心算法
在該項目中,為了應對優(yōu)化問題規(guī)模增長導致的求解時間過長的問題,研究人員設計了交替方向乘子法(ADMM)與強化學習相結合的分布式優(yōu)化問題求解架構ADMM-RL,其亮點在于對每個子優(yōu)化問題采用強化學習進行決策。由于訓練完成的強化學習智能體(agent)可以實現快速的決策,大幅減少了優(yōu)化問題的整體求解時間,可實現秒級以內的實時優(yōu)化控制。
2)自治微電網應用效果
項目成果應用于科羅拉多州附近一個包含27個家庭的微電網,每戶家庭安裝了8 kW的屋頂光伏以及磷酸鐵鋰電池儲能系統。結果表明系統可保持長期穩(wěn)定運行,且在冬季主網斷電、光伏板覆雪的極端情形下仍可維持供電約2 h。此外,微電網內用戶的電費相較于本州普通居民降低了85%。
以上工程實踐表明,人工智能助力的微電網運行控制技術已經開始進入商業(yè)化、產品化階段。由于微電網可脫網運行,對于停電事故具有更強的韌性。在微電網的優(yōu)化運行中,機器學習技術的作用主要體現在2個方面:①態(tài)勢感知,例如負荷、光伏等數據的分析與預測;②計算提速,當微電網內設備數量過多時,可采用強化學習等人工智能技術代替?zhèn)鹘y的優(yōu)化問題完成部分決策任務,從而避免維數災,提升計算效率,滿足實時控制的時間要求。
加州是山火高風險地區(qū),而電力設備故障是導致山火發(fā)生的重要因素。2018年的加州大火即是由輸電線路設施老化所導致[34]。南加州電力公司下轄的區(qū)域內有27%的區(qū)域是山火高風險地區(qū)。為避免山火帶來的損失,公司開展了無人機運檢與山火預防項目[35]。
項目通過無人機巡線拍攝電力設備圖像,并利用計算機視覺技術自動識別設施中的早期損壞特征與火災風險,以便檢修人員及時維修與更換。進一步地,公司基于所拍攝的線路周邊植被圖像,辨識出具有造成短路風險的植被信息并對其進行及時處置,可有效降低相應的短路風險與火災風險。一旦發(fā)現起火點,公司將開展火勢傳播規(guī)律的仿真工作,以更好地遏制山火的蔓延。應用結果表明,該技術可將單個設備的平均檢修時間由80 min減少至52 min。
系統發(fā)生嚴重故障后的修復過程,關鍵在于合理地分配人力、物力等檢修資源。該項工作需要考慮諸多因素,例如修復時間要求、成本、設備損壞程度、可用檢修資源約束等。此外,隨著檢修過程的開展,這些因素也在發(fā)生動態(tài)變化。目前的檢修決策仍然主要依靠專家對故障數據的實時分析,該過程往往要持續(xù)1 h以上。而當同時發(fā)生多個故障時,問題的決策將更加復雜。為此,PG&E公司利用機器學習技術加速故障修復過程[36]。
1)故障快速恢復方法
項目分為預測、決策、呈現3個階段。在預測階段,機器學習引擎讀入颶風等災害預報數據、GIS數據、系統量測數據,預測其所造成的故障類型及所需要的檢修資源;決策階段,系統基于隨機優(yōu)化模型生成最優(yōu)恢復策略;呈現階段,系統提取故障狀態(tài)、可用檢修資源等關鍵信息集中呈獻給運行人員。在該項目中,故障事件被建模為多元高斯分布,檢修資源的動態(tài)變化則由馬爾可夫過程描述。機器學習技術主要用于基于歷史數據實現對高斯分布以及狀態(tài)轉移矩陣中參數的估計。
2)故障快速恢復測試效果
該系統在2014至2017年的歷史故障數據集上進行了測試,將系統生成的檢修方案與實際執(zhí)行的檢修方案進行對比,并由專家對方案進行評估。結果表明系統可在5 min內生成有效的檢修方案,相比于原來平均1 h的人工決策時間顯著提升了工作效率。
3)故障恢復與機器學習技術
不合理的檢修方案將導致故障持續(xù)時間的延長以及檢修資源的浪費。因此,為避免高昂的試錯成本,目前在故障恢復領域機器學習技術主要用于為運行人員提供決策支持,而非替代運行人員直接進行決策。
由于智能表計的普及,電力用戶側具有大數據的特征,為機器學習技術的應用提供了良好的環(huán)境[37]。機器學習技術主要用于負荷變化規(guī)律的分析與挖掘(建模、預測、模式識別等),為進一步開展負荷管理提供支撐,最終實現用電能效與供電質量的提升。
為應對多樣化的配電網運行要求,PG&E公司在2018年開展了全系統負荷預測項目的研究[38]。
1)全系統負荷預測方法
項目的技術亮點主要包含2個方面。一是對于數據缺失區(qū)域的處理。相較于主網,配電網具有“弱量測”的特征。對于配電網中缺乏高級量測體系(AMI)、SCADA等量測數據的區(qū)域,項目基于遷移學習[39]的思想,在與數據缺失區(qū)域特征相似的量測區(qū)域內完成模型的訓練,并適當調整后應用于數據缺失區(qū)域的預測。二是預測模型的混合技術(blending)。項目采用自上而下和自下而上2種預測模型,并對二者結果進行加權得到最終結果。其中的權重由決策樹模型確定,將綜合考慮數據的可用性等特征。此外,項目可以對預測結果給出置信度,對于可能出現的大預測誤差進行預警。
2)全系統負荷預測效果
項目成果在其管轄范圍內的317個節(jié)點(區(qū)域)進行測試。結果表明該項目可實現配電網內任何負荷聚合級別的預測,并具有85%的成功率標識出誤差大于50%的極端情景。
3)復雜預測場景應對方法分析
配電網日益靈活的運行方式,要求適配同樣具有靈活性的負荷預測系統,以實現不同區(qū)域、負荷聚合水平、負荷類型、時間尺度的預測任務。在該過程中,遷移學習可有效解決部分預測任務數據缺失的問題,并提升模型的訓練速度。此外,包含多種預測模型的集成學習(ensemble learning)可以綜合不同模型的優(yōu)點,提升預測系統對于不同任務的應對能力。
數據中心的冷卻將消耗大量的電能。2016年,Google公司DeepMind團隊建立了基于深度學習的數據中心能耗優(yōu)化模型,以提升能源利用效率[40]。
1)數據中心建模方法
數據輸入包括現場上千個傳感器所收集到的溫度、功耗、空氣泵速率、空調系統溫度設定等數據。系統采用一個深度神經網絡模型進行運行決策,以最小化數據中心能效系數(PUE)為目標,PUE越接近1表明數據中心能效越高。另外,系統包含2個深度網絡,對未來1 h的溫度、壓力等指標進行預測,以保證決策滿足系統的運行約束。
2)模型應用效果
該模型在實際應用后,可穩(wěn)定地實現40%左右的冷卻負荷減少以及15%左右的能效系數下降,如圖4所示[40]。
圖4 控制算法開啟前后PUE對比Fig.4 Comparison of power usage effectiveness before and after applying control algorithm
3)機器學習用于負荷建模的適用性分析
冷卻系統的運行優(yōu)化難度較高,主要包括以下3個原因:①設備與環(huán)境之間的熱交換過程復雜、非線性,物理建模方法難以對其進行完全描述;②系統具有較強的熱慣性,難以適應快速的內部、外部環(huán)境變化;③不同的數據中心具有不同的架構和環(huán)境特點,導致針對每個數據中心需要進行個性化的建模和維護,工作量較大。而這種復雜非線性、動態(tài)、個性化的建模任務,正是機器學習技術的優(yōu)勢所在??刹捎蒙窠浘W絡模型替代物理模型,并不斷采用最新的量測結果對模型進行動態(tài)更新。
用戶的反饋(如用戶的評論留言等)是提升公司服務和產品質量的重要信息。這些反饋可能包含語音、文字評論等多種形式,并來自不同的語言,對其進行翻譯、整理和理解將耗費大量的人力資源。針對 該 問 題,ABB與IBM合 作,采 用IBM的Watson Discovery引擎對用戶反饋進行自動化整理和分析[41]。
1)客戶反饋信息處理方法
引擎首先采用自然語言處理將不同的語言評論統一翻譯成英文。然后,采用自然語言理解(natural language understanding)從中提取出關鍵詞、概念、實體對象、類別、關系等信息,判斷用戶的情緒和語氣,并構建相應的結構化數據庫。最后,針對用戶的負面反饋,可通過該數據庫自動查詢生產環(huán)節(jié)中可能導致問題的原因,并提供給工作人員進行進一步的分析和改進。
2)項目應用價值
相比于其他直接作用于電力生產環(huán)節(jié)的項目,該項目從用戶體驗觸發(fā),通過分析用戶的負面反饋反向查找生產環(huán)節(jié)中的不足,對于配電網運行人員提升供電質量與服務水平具有參考意義。
竊電是發(fā)展中國家所普遍面臨的問題。以牙買加為例,2014年有27%的電能損耗是由于竊電等非技術原因所導致。這部分電能損失成本將部分由公用事業(yè)公司承擔,并最終分攤到用戶身上。為解決該問題,牙買加公用事業(yè)公司JPS每年花費上千萬美元處理竊電問題,但始終無法徹底解決。這是因為其檢測方式主要依賴于人工分析,而竊電手段正變得越來越復雜并難以識別。
1)竊電監(jiān)測方法
JPS與世界銀行下屬的能源管理援助計劃(energy sector management assistance program,ESMAP)合作,采用機器學習技術實現自動竊電監(jiān)測[42]。項目基于用戶的歷史用電數據、竊電行為審查記錄以及所提取的判別特征,采用隨機森林模型為每個用戶賬戶進行風險打分,并對高竊電風險用戶進行重點檢查。
2)竊電監(jiān)測效果
該項目執(zhí)行的第1個月內,檢測出竊電行為的成功率提升了一倍。項目代碼已在Github向社會公開[43]。
在需求響應期間能否實現穩(wěn)定的負荷削減是衡量需求響應質量的關鍵,也是需求響應作為產品參與電力市場的前提。對于居民空調負荷而言,傳統的需求響應控制方式包括2種。一種方式是周期性地開斷空調設備來實現負荷的削減。對于某些用戶而言,這種方式會明顯損害用戶的舒適度,這是因為不同用戶的房屋大小、隔熱能力各不相同。同樣斷開0.5 h空調設備,對于部分房屋熱容小的用戶將導致其室內溫度嚴重越限。另一種方式是直接調節(jié)用戶的空調溫度設定值,并使其保持在一定舒適范圍內。該方法雖然可以保證用戶的舒適性,但卻無法保證負荷削減的穩(wěn)定性,往往在需求響應初期能實現較好的負荷削減,而在后期由于室內溫度越限,空調重新啟動導致負荷反彈。
1)空調用戶個性化建模方法
為解決該問題,得州電力可靠性委員會(ERCOT)市場成員采用機器學習技術,通過每個用戶的空調使用數據,學習用戶的房屋熱力學模型以及用戶的用能偏好[44]。在此基礎上開展隨機優(yōu)化,以最小化負荷削減量波動為目標實現對空調負荷集群的優(yōu)化控制。
2)需求響應執(zhí)行效果
基于300多個家庭的測試結果顯示,相比于傳統固定用戶空調溫度設定的需求響應方式,該方法可降低20%的需求響應控制時間以及25%的用戶需求響應退出率。
3)用戶個性化建模價值分析
該項目中,機器學習技術的作用是實現對用戶用能偏好以及房屋熱力學模型的個性化估計,從而避免了傳統“一刀切”的控制方式,對每個用戶進行個性化調節(jié),最大程度發(fā)揮需求響應潛力。例如對于部分房屋熱容較大、溫度不敏感的用戶,可適當降低對其空調設備的控制時間,在不影響需求響應效果的同時提升了用戶用能的自由度與舒適度。
機器學習是一門以計算機為載體、數據驅動的學科,其學習過程本質上是一個由果索因的過程,即從紛繁復雜的數據中提取一般性的規(guī)律,從而加深對研究對象的理解,并進一步反作用于研究對象。在電力系統中,機器學習技術發(fā)揮作用的機理主要體現在以下2個方面。
1)描述復雜規(guī)律。電力系統是高度復雜、非線性的系統,其部分運行機理至今尚未得到完全理解,更加難以建立完備的解析化模型進行描述(如3.2節(jié)的數據中心建模)。此外,系統產生的海量量測數據也已經超出人類的理解能力(如1.2節(jié)的風電機組量測數據)。機器學習技術可以從數據中提取復雜的映射規(guī)律,從而幫助運行人員掌握系統的運行狀態(tài),理解系統的運行機理。
2)提升工作效率。一是機器學習模型以計算機算力為支撐,自動化程度高,可以進行大規(guī)模部署以替代重復性的人力勞動(如1.5節(jié)的光伏電站自動巡檢);二是適應能力強,可利用最新的量測數據實現自我更新(如1.1節(jié)中光伏預測模型的迭代更新),相比于物理模型維護更加便捷;三是訓練完成的機器學習模型在應用過程中,只需簡單的數值計算即可得到輸出結果,相比于優(yōu)化等模型具有更高的計算效率,更加適合實時在線應用(如2.3節(jié)中基于強化學習的微電網運行決策)。
對系統復雜規(guī)律的理解與描述屬于電力系統態(tài)勢感知的范疇;而在理解系統的基礎上進一步實現系統的高效優(yōu)化控制,則屬于決策支持的范疇。為此,對第1至3章的工程實踐按照態(tài)勢感知、決策支持歸納為兩大類共計5個應用場景,如表2所示。
表2 工程實踐案例匯總Table 2 Summary of engineering practice cases
電力系統態(tài)勢感知即在特定的時間和空間下,對電力系統中各元素或對象的察覺、理解,以及對未來狀態(tài)的預測[45]。基于機器學習的系統狀態(tài)監(jiān)測、預測均可以歸類于該范疇。在態(tài)勢感知方面,機器學習實踐經驗總結如下。
1)預測、監(jiān)測是典型的基于數據驅動的應用,其本質是從大量量測數據中提取出一般性的規(guī)律,與電力系統物理模型結合程度較低。因此,其算法的跨領域通用性較強,可直接借鑒于信號處理、計算機視覺、時間序列分析、模式識別等領域的技術與算法,并較為容易地在工程中得到應用。這也是該領域論文發(fā)表數量多、軟件迭代更新速度快的主要原因。
2)預測、監(jiān)測的數據驅動特征使得其對系統量測數據的規(guī)模、質量有著較高要求,而這與當前配電網有限量測的狀態(tài)存在一定矛盾,單一數據源往往無法完全反映出系統的運行狀態(tài)。因此,在工程應用中應充分挖掘多源異質數據,從不同視角共同提升預測、監(jiān)測工作的精度。
3)提升數據管理與模型訓練的效率是發(fā)揮機器學習優(yōu)勢的關鍵。為了滿足部分預測、監(jiān)測工作的實時性要求,在工程應用中一方面應注重提升海量量測數據的傳輸、處理效率,譬如可采用專業(yè)的數據庫軟件開展數據的壓縮、并行處理等工作;另一方面應加速機器學習模型的訓練過程,如開展遷移學習、元學習等技術以及云計算架構的應用,以提升模型的訓練速度。
4)隨著量測網絡的逐步建立以及機器學習技術的普及,系統遭受網絡信息攻擊(cyber attack)的風險也隨之增大。一旦系統中被注入虛假、錯誤數據,將造成機器學習感知結果的偏差,進而帶來系統運行的風險。因此,在工程實踐中應注重信息安全問題,提升對于異常數據的甄別能力。
電力系統運行的核心問題之一是優(yōu)化決策問題,系統的建模、控制、資產管理均隸屬于該范疇。根據機器學習技術與優(yōu)化問題的結合方式不同,可將其分為4類:邊界參數改進、優(yōu)化參數選擇、混合模型、替代模型[46]。在該領域,機器學習實踐經驗總結如下。
1)在開展面向用戶的建模工作時,應注重模型的個性化。這是因為不同的用戶具有不同的負荷構成與用能偏好。傳統的需求響應等負荷管理方式往往采用“一刀切”的辦法,例如對參與響應的用戶統一開斷空調、熱水器等設備。這種方式簡單有效,但勢必會影響用戶的用能體驗,在越來越注重用戶體驗的今天難以可持續(xù)發(fā)展。隨著量測數據與控制手段的不斷豐富,開展更加個性化、精細化的用戶用能管理成為可能,在考慮每位用戶自身偏好的前提下實現社會效益的最大化[47]。但同時應注意到,模型精度與個性化程度的提升也增加了用戶隱私暴露的風險。如何在挖掘用戶數據的同時最大程度保護用戶隱私,實現二者之間的平衡,是該領域工程實踐中所要面對的問題。
2)在替代傳統物理模型時,機器學習模型需要進行更多的實地測試以驗證其魯棒性。這是因為機器學習建模對于數據具有高度依賴性。當采集的訓練樣本不均衡、不全面時,容易造成機器學習建模結果出現偏差,導致其在部分場景下失效。因此,對機器學習建模結果進行多場景下的實地測試,明確模型的“有效邊界”,或根據應用場景的不同適配不同的機器學習模型,將有助于提升機器學習建模的精度。
3)在系統運行過程中,機器學習技術主要為運行提供決策支撐(如2.1節(jié)中設備的故障預警、2.5節(jié)中提供故障恢復備選方案等),直接進行決策的情形較少。這主要是因為機器學習技術的“黑箱”特征,使得其結果存在解釋困難而導致的“信任”問題,與電力系統高可靠性的運行要求相矛盾。隨著目前神經網絡架構的復雜化,該問題愈發(fā)凸顯。也正是由于該原因,在近幾年的工程實踐中一些經典的機器學習技術(例如決策樹、回歸分析等)仍舊應用廣泛。這是因為這些技術的成熟度、穩(wěn)定性、可解釋性較高,相比于“黑箱”性質顯著的深度網絡而言,對于運行人員更加友好,而這也是工程實踐與理論研究的重要差異之一。因此,在工程實踐中不應盲目追求模型的復雜化,應綜合考慮實際問題的復雜度、數據的可用性等因素,合理地選擇機器學習模型。此外,研究可解釋的機器學習(interpretable machine learning)技術是工程應用領域中的重要方向。
4)用于進行實時決策的強化學習目前工程應用案例較少。除了上述提到的可解釋性問題外,強化學習技術通過與環(huán)境不斷交互學習知識,在電力系統中可能帶來較大的試錯成本。此外,強化學習的模型訓練耗時長、調參難度大、模型的泛化能力較弱等問題,均一定程度上制約了其在電力系統中的工程應用。現階段強化學習技術主要應用于電網末端容錯率較高的場景,如配電網電壓控制、2.3節(jié)中微電網的運行決策等,即使出現錯誤的決策也不會造成顯著的經濟損失。但同時應注意到,相較于傳統物理模型,強化學習模型對于環(huán)境變化的適應能力更強,在配用電領域仍具有深入研究的價值。
5)電力系統多數情況下運行在穩(wěn)定狀態(tài),故障狀態(tài)較少,相應的故障樣本數據也相對較少。而這些少數故障樣本往往更加具有研究價值。反觀機器學習技術,通常需要大量的樣本數據進行訓練以學習其中規(guī)律,導致其處理故障狀態(tài)這些少數“離群點”存在挑戰(zhàn)。因此,研究小樣本、不平衡樣本下的機器學習技術(例如few-shot learning[48])、數據增強技術具有重要意義。
6)除了預測技術之外,機器學習技術在配用電規(guī)劃領域的理論研究和工程應用均相對較少。其中部分原因是規(guī)劃問題的實時性要求較低,規(guī)劃人員具有充足的時間開展詳盡的仿真分析以及優(yōu)化模型的求解等工作,對機器學習技術依賴度較低。此外,規(guī)劃問題要求結果具有強可解釋性,這也與機器學習“黑箱”的特征存在一定沖突。但目前已有少量研究開始著眼于通過機器學習技術生成可行的饋線拓撲結構[49],以提升規(guī)劃工作的效率。這為規(guī)劃領域的研究提供了新的思路。
如上文所述,在北美配用電領域機器學習技術已經有諸多工程實踐項目,項目執(zhí)行主體涵蓋政府研究機構、公用事業(yè)公司、高校、企業(yè)等。然而,現階段北美地區(qū)該領域的機器學習項目資源共享性較差,通過一個項目得到的模型、數據、經驗很難被其他項目有效利用[50],這導致了如下問題。
1)缺乏指導:新項目開展時,難以充分整合利用領域內已有的工程實踐經驗,在技術路線上容易走彎路。
2)重復勞動:新項目開展時,往往需要從零開始進行數據搜集、模型訓練等工作,造成資源的浪費。
3)橫向對比困難:每個實踐項目基于自己獨有的測試數據集與應用場景進行技術驗證,難以橫向對比技術的先進性與有效性。
導致以上問題的本質原因是機器學習技術自身“開源、共享”的特征與電力領域強調“保密、專用”之間的矛盾。為解決該問題,可考慮由權威政府機構牽頭,聯合各類研究機構以及相關電力企業(yè)組建機器學習的資源共享平臺。具體可包括如下方法。
1)數據資料集中管理:對成員單位的工程實踐項目進行統一的跟蹤管理,整合項目的數據、模型、實踐經驗等各類成果。
2)數據資料分級共享:按照保密程度對數據、模型進行安全分級,根據成員單位的權限分級共享。
3)數據匿名化:對真實數據進行匿名化處理,增強數據的可共享性。
4)建立智囊團:組建專家團隊,對成員單位新開展的項目進行技術路線指導。
合理的共享機制有助于提升資源優(yōu)化配置效率,促進整個領域的快速發(fā)展。
供電能力、可靠性以及電能質量是中國配電網工程實踐中所關注的核心問題[51],其中部分問題可由機器學習技術助力解決,梳理如表3所示。
表3 中國配電網工程實踐問題及機器學習解決方案Table 3 Problems of distribution network engineering practice in China and machine learning solutions
綜上,機器學習技術作為一種強大的工具,在智能配用電領域有著廣闊的下沉空間。但同時應注意到,目前的人工智能機器學習技術仍處于“弱人工智能”階段,具有諸多局限性。文獻[52]指出,現階段合適的應用場景應滿足5個條件:①真實樣本充足易獲取;②具備一定的容錯性;③目標任務單一;④邊界確定的封閉環(huán)境;⑤任務靜態(tài),信息完備且確定。就配用電領域來看,許多應用場景尚無法完全滿足以上條件,尤其是在容錯性方面。
因此,為促進中國機器學習技術在配用電領域的良性發(fā)展,避免一擁而上的過熱現象造成資源的浪費,建議在工程實踐中關注以下幾個方面:一是從實際需求出發(fā),將機器學習技術與配用電領域的物理模型、專家經驗深度融合,最終形成“物理+數據”雙輪驅動的良性發(fā)展局面,避免陷入一味追求機器學習算法先進性的舍本逐末誤區(qū);二是如4.4節(jié)中提到,由權威政府機構牽頭,建立配用電領域機器學習數據、模型、實踐經驗的分級共享機制,打破數據壁壘,促進整個行業(yè)的快速發(fā)展;三是因地制宜循序漸進,對于農村等偏遠地區(qū),仍舊以改造基礎設施提升供電質量為核心任務,而對于量測體系發(fā)達、資源充足的中心城區(qū),可率先開展機器學習技術試點,并從提高自動化水平、態(tài)勢感知等較為基礎的應用場景切入,逐步過渡到決策支持甚至直接參與決策的高級應用場景;四是注重人才的培養(yǎng)與跨領域的交叉合作,確保能夠在掌握配用電領域痛點問題的同時,保持對機器學習領域最新進展的動態(tài)跟進,實現“問題”與“方法”的最優(yōu)匹配。
本文聚焦機器學習技術在智能配用電領域的應用,從源、網、荷3個方面概述了北美地區(qū)的典型工程實踐項目,從應用場景、技術路線等角度為國內相關研究與實踐工作提供借鑒。在“雙碳”目標的驅動下,未來中國新能源發(fā)電比重將穩(wěn)步提升,儲能、電動汽車、可控負荷等分布式電源也將廣泛參與配電網運行。在這個過程中,配用電領域的大數據特征將愈發(fā)顯著,系統運行的復雜性、控制的實時性、建模的精細化程度都將不斷提升,機器學習技術也將逐漸發(fā)揮更大的作用。
附錄見本刊網絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網絡全文。