呂 睿,薛禹勝,郁 琛,黃天罡,謝云云
(1. 南京理工大學自動化學院,江蘇省南京市 210094;2. 南瑞集團有限公司(國網(wǎng)電力科學研究院有限公司),江蘇省南京市 211106;3. 智能電網(wǎng)保護和運行控制國家重點實驗室,江蘇省南京市 211106)
電力系統(tǒng)規(guī)劃、運行調度、安全控制、市場運營與能源轉型等問題,不僅涉及發(fā)電、輸電、配電等物理環(huán)節(jié),還可能與電價建?;蛐袨榻S嘘P[1-3],它們都需要算法支持[4]。不論是離散型的定性分析還是連續(xù)型的定量分析,除了要在計算精度和速度之間折中外,還需要了解其分析結果的精度及強壯性,這就需要建立合理的誤差評估指標。恰當?shù)恼`差評估不僅可用以評估算法的準確性,而且也可幫助算法選取最優(yōu)參數(shù)值。
通常,誤差以數(shù)學模型的仿真結果與現(xiàn)場實測的結果之差來反映,并且可根據(jù)誤差評估指標的敏感性分析來估計誤差來源或評估模型的適用性與強壯性。有別于純數(shù)學的觀點,在工程問題中,誤差絕對值相同,但誤差符號不同的結果,往往有不同的物理含義及經(jīng)濟影響。這就要求在算法誤差評估指標中給予反映,而在不必區(qū)分誤差符號的場合,只須將權值設為相同即可。
對于風電功率的預測[5-6],正誤差反映風電水平被高估的情況,而負誤差則對應于風電水平被低估的情況。正誤差導致正常運行計劃中的其他一次能源的發(fā)電水平偏低,一方面,降低了正常運行下的供電充裕性;另一方面,與風電不確定性正相關的靈活發(fā)電備用需求卻會被高估,從而增加了備用成本。這2 種影響雖然在宏觀上有一定的對消趨勢,但由于因果關系不同,優(yōu)化的整體效果將會下降。反之,風電功率預測的負誤差則以相反的規(guī)律來降低運行的可靠性及經(jīng)濟性。
然而,負荷預測[7]的正誤差會使發(fā)電計劃和備用計劃同時趨于保守,不再存在兩者對消的趨勢,故與風電功率預測誤差對符號敏感性的關系存在定性的不同。這樣的情況廣泛出現(xiàn)在風速預測[8-10]、狀態(tài)估計[11]等許多領域中。因此,誤差評估指標應該能反映相關樣本算例的誤差符號的影響。不失一般性,下面以電力系統(tǒng)暫態(tài)功角穩(wěn)定分析問題為例來討論。
電力系統(tǒng)暫態(tài)功角穩(wěn)定分析離不開合適的數(shù)學模型和數(shù)值積分技術,一般的分析方法在獲得足夠時長的時間響應曲線后,憑經(jīng)驗定性地判斷具體算例是否穩(wěn)定。需要時,可以通過反復試探來獲得參數(shù)的臨界值(例如臨界故障清除時間),并取為標準值來評估其他算法的誤差。集成擴展等面積準則(integrating extended equal area criterion,IEEAC)是目前唯一可以從上述受擾軌跡中直接提取軌跡穩(wěn)定裕度的量化分析方法,可以揭示電力系統(tǒng)動態(tài)過程中的各種涌現(xiàn)現(xiàn)象,包括分岔與混沌,并被廣泛應用于國內(nèi)外電力工程。此外,可以通過靈敏度分析技術直接獲得參數(shù)的臨界值,故計算量很?。?2],可被用做在線分析工具。IEEAC 的誤差來自2 個部分:1)積分求取受擾軌跡時產(chǎn)生的誤差;2)積分軌跡中提取穩(wěn)定裕度的誤差。由于后一部分是嚴格的初等代數(shù)運算,并且其映射步長采用了與數(shù)值積分相同的步長,因此,IEEAC 的總誤差與它所依據(jù)的數(shù)值積分技術處于同一水平[12]。
為了應對系統(tǒng)規(guī)模和模型復雜性的增加對計算量的新挑戰(zhàn),文獻[13]在先前關于分類器(case filtering,CF)大量研究[14-18]的基礎上進一步將定性多檔分類、準定量分析與IEEAC 相結合,構成7 分類輸出的分類器(7-output CF,CF-7)。它先采用2 分類輸出的分類器(2-output CF,CF-2)將大量待分析的算例粗篩為“肯定穩(wěn)定”與“可能不穩(wěn)定”2 個子集;再將前一子集內(nèi)的算例,細分為{高度穩(wěn)定,中度穩(wěn)定,低度穩(wěn)定};將后一子集細分為{輕度失穩(wěn),中度失穩(wěn),嚴重失穩(wěn),不能確定}。這樣,精確而費時的IEEAC 定量算法就可以只被用于評估那些被分到“不能確定”子集的算例,而其他的大量算例則直接被多輸出分類器分到穩(wěn)定裕度的各個離散區(qū)間,從而顯著提高了效率和強壯性。
當然,其前提是要確保在風險性誤分類率(將實際穩(wěn)定性等級較低的算例劃分到穩(wěn)定性等級較高子集的占比)為零值的同時,盡量減少降效性誤分類率(將實際穩(wěn)定性等級較高的算例劃分到穩(wěn)定性等級較低子集的占比),從而使更多的算例能夠采用較大的積分步長和映射步長,進一步減少計算量[18]。為此,除了要更好地協(xié)調數(shù)據(jù)驅動技術的快速性與因果分析技術的強壯性,還要通過優(yōu)化分類器的各個分類閾值,來適度容忍降效性誤分類率,以保證風險性誤分類率為零值。這就要求在設定分類閾值時,要區(qū)別對待算例近似算法對應的正負誤差值。
電力系統(tǒng)分析算法的研究采用了各種誤差評估指標,包括平均誤差(mean error,ME);基于絕對誤差概念的平均絕對誤差(mean absolute error,MAE)[19]、平 均 絕 對 百 分 比 誤 差(mean absolute percentage error,MAPE)[20]、最 大 絕 對 誤 差(maximum absolute error)[21]、均 方 根 誤 差(root mean square error,RMSE)[22-23];基于相對誤差概念的平均相對誤差(mean relative error,MRE)[22]、最大相對誤差(maximum relative error)[24]、均方百分比 誤 差(mean square percent error,MSPE)[25]和MRE 的 衍 生 指 標[26];基 于 偏 差 概 念 的 方 差(variance)[21]、標準差(standard deviation)[27];歸一化指 標,如 NMAE(normalized MAE)、NRMSE(normalized RMSE)[6]。此外,統(tǒng)計學中的眾數(shù)、中位數(shù)、偏度、峰度也被用來反映算法誤差的個別特征。
但是對于許多具體問題,這些指標和特征都不能正確反映誤差符號在物理內(nèi)涵上的不同,也不能反映誤差影響的非線性。即使同時采用其中的多個指標[28],也不可能避開誤差評估指標中的上述本質缺陷。
為了能在考慮安全約束的控制優(yōu)化問題中,協(xié)同處理安全性及經(jīng)濟性,文獻[29]提出了風險代價的概念,從而將安全約束條件轉換為與目標函數(shù)中建設費用、運行費用并列的風險費用。風險代價被定義為2 項內(nèi)容之乘積,其一是隨機事件發(fā)生的概率,其二是為保持系統(tǒng)可靠運行而付出的控制代價。以全部隨機事件對應的風險代價之和來評估各候選方案的安全成本,并加入選優(yōu)的目標函數(shù),解決了如何處置小概率高風險事件的難題。
風險代價中關于控制代價的一項反映了事件的具體影響,包括定性的后果及定量的后果,而對于誤差評估問題,則對應為誤差的符號及大小。這就為誤差評估指標提供了全新的設計思路,不但能區(qū)分誤差后果的符號敏感性和強非線性,并且能合理處置小概率大誤差算例的影響。根據(jù)此概念,文獻[5]考慮了誤差符號及非線性的影響,設計了用于評估風電預測誤差的指標,并協(xié)同處理了風電預測誤差對系統(tǒng)可靠性及經(jīng)濟性的影響。
本文歸納了誤差評估指標應滿足的要求;回顧了傳統(tǒng)的誤差評估指標的局限,基于上述風險觀點設計了電力系統(tǒng)算法的誤差風險指標(error risk index,ERI),并通過分析該指標的特性及計算方法表明其可行性。最后,針對暫態(tài)功角穩(wěn)定分析中算例篩選分類器的閾值優(yōu)化問題,通過實例比較了按照不同的誤差指標來優(yōu)化CF-7 分類閾值的效果,驗證了誤差風險指標的合理性。
在算法精度的比較與提高中,誤差評估指標起著重要作用。基于文獻[12]對定量型指標提出的基本要求,電力系統(tǒng)算法誤差的評估指標應滿足的條件包括:1)唯一性,即對于確定的誤差情形有且僅有1 個指標值;2)充要性,即嚴格反映誤差的符號,零值對應于與標準值相同;3)單調性,即指標值應與客觀的誤差水平的變化方向保持一致,可按指標值對算法精度排序;4)可觀性,即指標評估體系能反映算法的任何改變對精度的影響;5)可控性,即按照指標值的靈敏度分析可以指導算法精度的提高;6)連續(xù)性和光滑性(或可微性),即誤差評估指標隨參數(shù)連續(xù)光滑地變化;7)可反映誤差絕對值對實際電力工程影響的非線性;8)反映誤差符號對實際電力工程的不同影響;9)可將上述影響直接反映為機會成本或風險成本;10)不但適用于電力系統(tǒng)的靜態(tài)分析,也適用于電力系統(tǒng)的動態(tài)分析及演化過程分析。
大多數(shù)傳統(tǒng)指標能滿足唯一性、充要性、單調性、可觀可控性、連續(xù)光滑性等基本要求,但卻難以反映工程實際對誤差影響的非線性、符號敏感性,因此也無法全面反映工程算法的性能。文獻[28]以MAE 和RMSE 作為長期監(jiān)測系統(tǒng)整體誤差的指標;以誤差的頻度直方圖來估計不同誤差水平下預測結果的可信度,并以其對零點的集中程度作為性能評估的依據(jù)之一;根據(jù)影響因子分布來判斷主要誤差源;提出相關系數(shù)來評估實測序列與預測序列的相似度;以功率波動幅度及變化率的概率分布來評估峰/谷值的預報質量。雖然采用多個指標,但并未提出合理的綜合方法,因此,很可能兼具各種指標的缺陷。如果不能將誤差轉換為風險成本,在電力系統(tǒng)優(yōu)化算法,特別是帶有不等式約束的分析或控制問題中,都存在較大的局限性。
1.2.1 物理內(nèi)涵的扭曲
將所有樣本的誤差原始值求和后再取均值,會因為正負誤差的對消而扭曲了實際的誤差水平。文獻[30]先將各個預測樣本分類為偏冒進和偏保守2 個子集,再分別求取其ME,以克服均值方式的缺陷。由于未能用統(tǒng)一的指標來反映全部樣本的預測質量,故難以得到實際應用。絕大多數(shù)誤差評估指標都采用了另外一條技術路線,即對樣本誤差采取絕對值或平方化的方式(見附錄A 表A1)。
這些指標在避免正負誤差對消的同時,卻掩蓋了誤差符號對許多工程問題的物理與經(jīng)濟影響的不同。文獻[5]闡明了風電預測算法的誤差符號及非線性對電力系統(tǒng)可靠性及經(jīng)濟性的影響。預測誤差為正(預測值大于實測值)使常規(guī)機組發(fā)電容量安排偏少,從而與風電預測值正相關的備用靈活發(fā)電容量則要求偏多。這2 種影響雖然有相互補償?shù)囊幻?但由于考慮的措施及不確定性均不相同,并不能相互抵消,從而影響優(yōu)化結果。預測誤差為負時的情況則相反,但同樣會影響優(yōu)化結果偏離實際的最優(yōu)值。
1.2.2 誤差指標值與其實際影響的非線性
在實際工程中,誤差與其實際影響之間的關系既可能相當接近線性,也可能含極強的非線性。例如在緊急控制決策算法中,若誤差引起過控,則通常僅需考慮過控的成本,此時,誤差(過控量)與后果(過控代價)可能接近線性。但若誤差導致欠控,甚至造成大停電,就需要考慮誤差與后果之間的強非線性。
文獻[31]以2011 年日本地震、海嘯等自然災害引發(fā)大停電、進而導致核泄漏的事件為例,分析了小概率高風險事件對電力系統(tǒng)可靠性及經(jīng)濟性影響的嚴重性。其中,基礎設施的缺陷、管理的失誤、緊急處置的延誤等因素共同引發(fā)了骨牌效應,造成了巨大災難[32]。該文指出,安全評估應遵循風險觀點,例如將風險定義為事件發(fā)生的概率與發(fā)生后損失值的乘積。在事件發(fā)生前,可以通過風險概念來量化評估對不同樣本的關注度。
類似的,算法誤差分布特性的經(jīng)濟影響,也由誤差的概率及其經(jīng)濟代價兩者共同決定。即使誤差發(fā)生的概率很小,但若該算例誤差的代價非常高;或者雖然誤差發(fā)生的代價很低,但其發(fā)生的概率很大,這2 種情況都可能是高風險者。反過來說,既不應該單憑誤差樣本概率的大小,也不應該單憑誤差樣本的代價大小,作為對算例關注度排序的依據(jù)。總之,對不同樣本的關注程度,應該依據(jù)其風險值,無須考慮的只是低風險的算例,而非誤差小者。
但是,傳統(tǒng)指標都不能反映上述復雜關系,故無法準確反映由于算法誤差而潛在的風險,從而誤導了相關決策。
誤差通常被定義為待評估的值與真值之差:
式 中:em、y?m、ym分 別 為 樣 本m的 誤 差、估 計 值 和 真值;m為樣本號。
對于算法而言,y?m為待評估算法給出的計算結果,如風電預測算法所求得的功率預測值、暫態(tài)穩(wěn)定分析方法所得穩(wěn)定性結論等;ym則取盡量接近實際的值,如實際的風電功率值、實際的暫態(tài)功角穩(wěn)定裕度等,或被公認為精度最高的算法之一的計算值[33]。
2.2.1 單個樣本的誤差風險指標
基于風險觀點,將樣本m的誤差風險指標定義為:
文獻[5]指出,對風電功率預測算法的誤差進行評估時,必須區(qū)分誤差的符號,否則就會誤導預防控制(如備用容量)及緊急控制(如切機及切負荷)的配置,影響電力系統(tǒng)的可靠性及經(jīng)濟性。為此,在計算誤差的代價時,對于正誤差的算例,取為應對風電波動而額外安排的備用容量(設按功率缺額的x配置)成本A;對負誤差的算例,則取為棄風損失B。因此,代價cm可表示為:
文獻[5]按式(3)計算樣本集整體的預測誤差風險值R,對不同的預測模型進行了評估,并分析了當A、B取不同比例時各模型預測質量的變化情況。
3.2.1 誤差評估準備
在暫態(tài)穩(wěn)定分析的多輸出分類器中,根據(jù)算例樣本穩(wěn)定性的量測值(輸出分檔結果)與真值(實際裕度區(qū)間)的關系,存在“正確分類”“風險性誤分類”和“降效性誤分類”3 類;而未被識別為該3 類的樣本則為“不能確定類”。
3.2.2 分類器的總誤差風險指標
理論上分類器樣本全集Ω中每個樣本對應的代價cm都需單獨計算,而概率pm均為樣本總數(shù)N的倒數(shù),故由式(3)求得總風險值為:
對于同一Ψij中的各樣本的代價可視為相等,并選一個典型值cij近似替代,以提升整體計算效率。為此,需要給出6×7 個對應的cij值,并將式(7)改寫為:
式 中:nij、pij、cij分 別 為 子 集Ψij的 樣 本 數(shù)、概 率 和代價。
進一步,可將6×7 個分類子集Ψij中具有相同風險定性特性的Ψij合并,得到8 個評估子集。上標表示{實際定性特性,分類定性特性}序列,其中,S 代表穩(wěn)定,U 代表失穩(wěn)。例如,將分類風險非常小的那些Ψi=j合并為同一評估子集Ωi=j;將必須以增加計算量的代價,調用精確的IEEAC 算法,獲取正確結果的那些Ψj=7合并為同一評估子集Ωj=7。具體分類結果參見表1。
表1 CF-7 的分類結果Table 1 Filtering results of CF-7
3.2.3 不同分類樣本集的代價
將樣本分類為不同的評估子集后,不但從風險的觀點反映了降效性及風險性2 類誤分類在工程應用中的不同內(nèi)涵,并且計及了誤差大小對工程影響中的非線性。當然也可以直接按分類子集Ψij來提高分類總風險的計算精度,但一般并無必要。下面針對表1 中的不同評估子集分別討論。
1)正確分類的樣本集Ωi=j,對應的代價ci=j為零值,不再進行風險分析。
2)風險性誤分類的樣本集Ωi>j,又分為以下3 個子集:
(1)實際情況與其分類均為穩(wěn)定,但分類偏樂觀的樣本子集ΩSSi>j。這些樣本的分類過于樂觀,但由于對實際指定的故障并不需要控制措施,故其風險代價cSSi>j為零值。但系統(tǒng)在防范相繼故障等更嚴重的故障上可能存在潛在風險,故可以適當指定其主動防御代價。
(2)實際情況與其分類均為失穩(wěn),但分類偏樂觀的樣本子集ΩUUi>j。若按分類結果安排這些樣本的控制量,就只能依靠額外的校正控制量來維持系統(tǒng)穩(wěn)定,故欠控風險代價cUUi>j較大。
(3)實際失穩(wěn)、卻被分類為穩(wěn)定的樣本子集ΩUSi>j。此類樣本不被配置預防控制措施和緊急控制,故障一旦發(fā)生,只能依靠校正控制來應對,系統(tǒng)甚至由于這類控制的時效低下而失穩(wěn)。因此,對應的風險代價cUSi>j最大。
3)降效性誤分類的樣本集Ωi (1)實際情況與其分類均為穩(wěn)定、但分類偏悲觀的樣本子集ΩSSi (2)實際情況與其分類均為失穩(wěn)、但分類偏悲觀的樣本子集ΩUUi (3)實際穩(wěn)定、卻被分類為失穩(wěn)的樣本子集ΩSUi 4)未能明確分類的樣本集Ωj=7。這些樣本將通過詳細分析獲知精確的裕度,代價為零值,但會影響分類器的效率。 3.2.4 誤差風險指標的求取及其矩陣化表達 根據(jù)上述討論計算出各樣本子集的代價cij,即可由式(8)求得CF-7 的風險值為: 以杜絕風險性誤分類為前提,構建CF-7。比較按誤差風險指標值最小原則優(yōu)化閾值前、后的總風險值。優(yōu)化的初值按文獻[13]的方法設定。 取IEEE 10 機39 節(jié)點系統(tǒng)為測試系統(tǒng),模型及工況均采用該系統(tǒng)的原始數(shù)據(jù)[34]。算例分類器的訓練集分別取各線路/母線三相瞬時短路或三相永久短路,故障清除時間τ在0.10~0.50 s 內(nèi)隨機產(chǎn)生。另選隨機生成的136 個算例作為測試集(見附錄B 表B1)。仿真軟件為EEAC 商品軟件Fastest Ver 3.0.11。 根據(jù)3.2.3 節(jié)設置代價cij的取值,這里對各誤差情形均做出一定的簡化:針對Ωi 基于專家系統(tǒng)獲取CF-7 閾值的方法見文獻[13],具體的規(guī)則與閾值見附錄C 表C1 和表C2;分類結果見附錄C 表C3,統(tǒng)計出的誤差概率矩陣P為: 由式(9)可求得初始的總風險值R為74.308 4。根據(jù)各分類的rij中數(shù)值較大者(rSS21=73.529 0 和rUS43=0.735 3)調整閾值,經(jīng)過1 次尋優(yōu)后,R降低到0.066 2,滿足了收斂要求(這里設定為1.0)。更多的有關信息見附錄D 表D1、表D2 及表D3。 表2 比較了閾值優(yōu)化前后的性能,仿真硬件為搭載英特爾i5-2400 處理器(3.10 GHz)的臺式微型計算機,內(nèi)存為8 GB,操作系統(tǒng)為64 位Windows 10。優(yōu)化前的分類結果見附錄D 表D4。 表2 閾值優(yōu)化前后的分析性能比較Table 2 Comparison of analysis performance before and after threshold optimization 由于以杜絕風險性誤分類為前提,且因果型特征量的引入又大大提高了分類的強壯性,從而確保不會發(fā)生高風險代價的誤分類,使閾值優(yōu)化前后的風險值都很小。一方面,誤差風險指標指導下的閾值調整,進一步地降低了整體風險;另一方面,由于優(yōu)化前少量屬于Ωi 本文分析了傳統(tǒng)誤差指標的局限性,即單純從概率的視角來評估算法的誤差,而沒有同時計及誤差在該特定領域問題中的內(nèi)涵。后者包括誤差所對應的損失函數(shù)的非線性,以及對誤差符號的敏感性。按傳統(tǒng)誤差指標來優(yōu)化算法的結果是將小概率高風險事件排斥在評估算例集之外,而難以在優(yōu)化中協(xié)調好經(jīng)濟性與可靠性。本文提出了基于誤差風險概念的誤差風險指標,同時計及了誤差的概率分布,以及誤差的非線性與誤差的符號對經(jīng)濟性的影響,并通過將可靠性映射為機會成本,從而可以統(tǒng)一處理誤差對可靠性及經(jīng)濟性的影響。誤差風險指標很好地滿足了各項要求,并有效克服了傳統(tǒng)指標的局限性;對于需要考慮誤差影響的非線性或符號敏感性的場合,具有更好的實用性。此外,按機會成本的概念,可以很好地協(xié)調決策的經(jīng)濟性與系統(tǒng)的可靠性。通過對電力系統(tǒng)同步穩(wěn)定性的仿真分析,驗證了按誤差風險指標來評估算法精度的有效性及普適性。下一步將結合新型電力系統(tǒng)的充裕性,來驗證誤差風險評估的實用性。 附錄見本刊網(wǎng)絡版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡全文。4 誤差風險指標的應用實例
4.1 測試系統(tǒng)及算例
4.2 閾值優(yōu)化結果對比
5 結語