李 艷, 徐衛(wèi)立, 裴順強, 范曉青, 趙良水, 李長春
(1.中國氣象局公共氣象服務(wù)中心,北京100081; 2.智慧長江與水電科學湖北省重點實驗室,湖北 宜昌443133; 3.中國氣象局辦公室,北京100081; 4.長江生態(tài)環(huán)保集團有限公司,重慶401120)
氣候變化加劇帶來極端高溫事件頻發(fā),特別是一些超大型城市夏季持續(xù)高溫,城市電網(wǎng)負荷不斷突破歷史極值,不僅給電網(wǎng)運行帶來巨大壓力,還可能造成輸變電設(shè)備因超載運行發(fā)生故障。電網(wǎng)負荷變化受多種因子影響,關(guān)系也比較復(fù)雜,其中氣象要素與電力負荷的關(guān)系極為密切[1-5]。張自銀等[6]研究指出,北京市夏季日最低氣溫與逐日最大電力負荷的關(guān)系最為密切,同時夏季溫度和濕度的綜合效應(yīng)比單個溫度因子對電力負荷波動的貢獻率更高。準確的電網(wǎng)負荷預(yù)測有助于電網(wǎng)及相關(guān)輸供電單位提前采取有效的發(fā)電計劃和調(diào)度措施,對于保障電網(wǎng)和城市的安全運行非常重要,同時也能減少能源浪費,給電力市場帶來巨大的經(jīng)濟效益。
前人針對氣象條件與電力負荷的關(guān)系及其預(yù)測做了大量研究[7-14]。胡江林等[15]從華中電網(wǎng)電力負荷資料中分離出隨氣象因子變化的氣象負荷,重點分析了氣象負荷隨氣溫變化的規(guī)律。李琛等[16]研究指出,北京市夏季日最大電力負荷與悶熱指數(shù)及平均氣溫的相關(guān)性最好,同時氣象因子對夏季電力負荷的影響存在“多日累積效應(yīng)”,持續(xù)2天的悶熱將導致電力負荷急劇增加。成丹等[17]基于積溫效應(yīng)開展了華中電網(wǎng)電力負荷預(yù)測,結(jié)果表明持續(xù)3天以上的炎熱天氣過程對華中電網(wǎng)電力負荷增長影響顯著,其中湖北的電力負荷增量最大。此外,近年來在電力、供水及其他相關(guān)領(lǐng)域采用機器學習等多種方法開展預(yù)測的研究也越來越多[18-27],其中支持向量機回歸模型具有較好的泛化預(yù)測及自適應(yīng)能力,非常適用于存在非線性、多變量、不確定性的電力負荷預(yù)測,能有效地提高負荷預(yù)測精度。
雖然許多學者針對電網(wǎng)和市場需求開展了日最大電力負荷預(yù)測的工作[28-29],但由于區(qū)域間氣候條件、經(jīng)濟結(jié)構(gòu)和發(fā)展水平不同,電網(wǎng)電力負荷與氣象因子的關(guān)系不盡相同。因此本研究以上海這個對電力安全運行能力要求極高的超大型城市為對象,針對用電高峰的夏季,基于多種影響因子采用逐步回歸和支持向量回歸(SVR)模型兩種方法來構(gòu)建日最大電力負荷關(guān)系模型,以期為準確預(yù)測上海市夏季日最大電力負荷提供技術(shù)參考。
本研究所用電力負荷資料為上海2013-2017年逐日96點統(tǒng)調(diào)負荷數(shù)據(jù),有效數(shù)據(jù)共1826天,氣象資料為上海各區(qū)縣的日平均氣溫、日最高氣溫、日最低氣溫、日平均相對濕度、日最小相對濕度、日降水量等氣象要素。上海地區(qū)電網(wǎng)所轄區(qū)域為浦東、市區(qū)(虹口、靜安、黃浦、長寧、楊浦)、市北(寶山)、市南(徐家匯)、嘉定、青浦、松江、金山、奉賢、崇明和長興,這些地區(qū)氣候條件相似,但用電負荷差異顯著。據(jù)電力調(diào)度部門統(tǒng)計,近年來浦東用電負荷最大,占上海統(tǒng)調(diào)負荷的20%以上,崇明和長興用電負荷最少,僅占1%左右,其余區(qū)縣所占比例為5%~15%。為更加科學合理地計算上海電網(wǎng)區(qū)域氣象條件對電力負荷的影響,根據(jù)各區(qū)縣用電負荷所占比例,取各區(qū)縣氣象要素的加權(quán)平均值代表上海市電網(wǎng)的氣象條件。本研究把2013-2016年的數(shù)據(jù)用于模型的構(gòu)建,2017年的數(shù)據(jù)用于模型的驗證。
前人研究表明,夏季持續(xù)高溫過程中,同等氣溫條件下,電力負荷會隨著持續(xù)時間增加而出現(xiàn)較大程度的增長,稱為炎熱累積效應(yīng),是電力負荷預(yù)測建模中非常重要的自變量。炎熱累積效應(yīng)指數(shù)不僅與超過臨界值的日數(shù)有關(guān),還與超過臨界值的大小有關(guān)。由于炎熱累積效應(yīng)指數(shù)的計算結(jié)果存在很大的值跳躍,本研究在前人研究基礎(chǔ)上[30],對炎熱累積效應(yīng)指數(shù)進行了一次對數(shù)變換,使分布更加均勻,便于建模。計算方法如下:
Y=ln[n(Tm-T0)+1]
(1)
式中,Y為經(jīng)過對數(shù)變換后的炎熱累積效應(yīng)指數(shù),單位為℃·d;n為超過最高氣溫臨界值的累計日數(shù),Tm為當日最高氣溫,T0為對應(yīng)的最高氣溫臨界值。當氣溫未達到臨界值時,n為0;當氣溫超過某一臨界值日起,n從1開始逐日累加,依次循環(huán)。
為了準確分析氣象條件對用電負荷的影響,需要將氣象負荷分離出來,然后根據(jù)生產(chǎn)活動和氣象條件變化,分離分段進行分析研究。
一般來說,用電負荷由三個分量組成:
L=Lt+Lm+x
(2)
其中,L為總用電負荷;Lt為經(jīng)濟負荷,也稱為趨勢負荷,表示國民經(jīng)濟發(fā)展對用電負荷的貢獻;Lm為天氣敏感負荷,表示氣象要素對用電負荷的貢獻;x為隨機負荷,表示隨機因素對用電負荷的影響。
對于原始用電負荷數(shù)據(jù)序列L,進行以7天為周期的滑動平均,刪除以星期為周期的波動分量,得到滑動平均負荷序列TCt:
(3)
式中,k表示滑動周期,t表示天數(shù)。
國民經(jīng)濟增長速度一般比較均勻,因此經(jīng)濟負荷隨時間的變化可以用簡單的線性關(guān)系來表示。對滑動平均負荷序列TCt進行線性擬合,采用最小二乘法確定系數(shù)a和b,得到經(jīng)濟負荷Lt的線性回歸方程,從而求得經(jīng)濟負荷序列Lt:
Lt=a+bt
(4)
由于隨機負荷與其他項相比,量級小且隨機性強,影響較小,在此忽略不計。因此天氣敏感負荷Lm為原始負荷L與經(jīng)濟負荷Lt的差值:
Lm=L-Lt
(5)
由于電力部門最為關(guān)注的還是用電負荷受天氣影響部分的波動比例,因此本文開展氣象條件與用電負荷相關(guān)性研究時,采用的負荷數(shù)據(jù)均為天氣敏感負荷Lm與經(jīng)濟負荷Lt的比值,即天氣敏感負荷率lm:
(6)
1.4.1 逐步回歸方法建模
逐步回歸是一種線性回歸模型自變量選擇方法??紤]到用電負荷不僅存在累積效應(yīng),而且還存在“記憶性”,即前一天的用電負荷對于次日用電負荷影響很大,因此設(shè)計了兩種方案來進行逐步回歸建模。
方案1:僅根據(jù)氣象因子建立逐步回歸模型;分別計算各個建模因子與日最大天氣敏感負荷率的相關(guān)系數(shù)。根據(jù)前人研究,選擇日最高氣溫(x1)、日最低氣溫(x2)、日平均氣溫(x3)、日平均風速(x4)、日最大風速(x5)、日平均相對濕度(x6)、日最小相對濕度(x7)、日降雨量(x8)、炎熱累積效應(yīng)指數(shù)(x9)這9個氣象因子建模。
方案2:在方案1的基礎(chǔ)上,引入前一天用電負荷作為自變量建立逐步回歸模型。
1.4.2 SVR支持向量回歸方法建模
SVR就是在多維空間中找到一個超平面,讓一個集合的所有數(shù)據(jù)到該平面的距離最近。傳統(tǒng)回歸方法僅當回歸f(x)完全等于y時才認為預(yù)測正確,而支持向量回歸則認為只要f(x)與y偏離程度不太大,即可以認為預(yù)測正確,不用計算損失。具體就是設(shè)置閾值α,只計算|f(x)-y|>α的數(shù)據(jù)點的損失,如圖1所示,陰影部分的數(shù)據(jù)點可以認為模型已準確預(yù)測,只需計算陰影外數(shù)據(jù)點的損失。
圖1 SVR模型示例圖
SVR模型有以下幾個參數(shù)。
(1)kernel:核函數(shù),可選為rbf、linear、poly、sigmoid。
(2)C:懲罰因子,C越大表明越重視離群點。C值大時對誤差分類的懲罰增大,C值小時對誤差分類的懲罰減小。當C越大,趨近無窮的時候,表示不允許分類誤差的存在,margin越小,容易出現(xiàn)過擬合;當C趨于0時,表示不再關(guān)注分類是否正確,只要求margin越大,容易出現(xiàn)欠擬合。
(3)Gamma:是rbf、poly和sigmoid的核系數(shù)。隨著Gamma的增大,存在對于測試集分類效果差、而對訓練分類效果好的情況,并且容易泛化誤差出現(xiàn)過擬合。
本研究選擇的參數(shù)組合為kernel=‘linear’,C=1,Gamma=1。
考慮到原數(shù)據(jù)集中特征數(shù)量太少,不利于模型挖掘內(nèi)在聯(lián)系從而進行預(yù)測。因此,對于每個原始天氣變量,將其前一天的值和過去一周平均值作為兩個新的特征加入數(shù)據(jù)集,體現(xiàn)天氣條件對于負荷影響的滯后性和累積性。同時,在日期信息中,將一周中的第幾天也作為一個特征,體現(xiàn)一周中負荷的變化。此外,日期類型作為特征,用來體現(xiàn)工作日、雙休日、節(jié)假日之間負荷水平的差異。擴展后的數(shù)據(jù)集共有29個特征值(表略)。
氣溫對用電負荷的影響最為直接。把上海2013-2017年工作日的日最大天氣敏感負荷率與最高氣溫進行分段擬合(圖 2)。由圖 2可知,氣溫與用電負荷之間的關(guān)系是非線性的,呈明顯的二次曲線關(guān)系,當最高氣溫小于16 ℃時,隨著氣溫的逐步升高,負荷水平逐步降低;當最高氣溫為17-23 ℃時,氣溫處于人體感受的舒適區(qū)間內(nèi),負荷變化較為平穩(wěn);而最高氣溫高于24 ℃時,隨著氣溫逐步升高,負荷水平逐步上升,且夏季的空調(diào)降溫負荷明顯高于冬季取暖負荷。
圖2 上海2013-2017年工作日最大天氣敏感負荷率與日最高氣溫擬合圖
2.2.1 炎熱累積效應(yīng)臨界值的確定
在電力部門,日最大用電負荷對日最高氣溫比較敏感。為了確定上海夏季炎熱累積效應(yīng)的氣溫臨界點,采用日最高氣溫變化跟蹤日最大天氣敏感負荷率的變化。表1為上海日最高氣溫升高1 ℃對應(yīng)的日最大天氣敏感負荷率平均值(K)及日最高氣溫升高1 ℃時K的增加值(M)。
由表 1可知,從27 ℃開始,隨著日最高氣溫的升高,日最大天氣敏感負荷率不斷升高,在最高氣溫達到33-34 ℃時,K值達到了33.0%,意味著空調(diào)負荷所占比重很大,同時M為9.6%,需引起重視,可以認為是初始氣溫敏感點;在溫度達到35-36 ℃時,K值達到了43.0%,M為6.1%,可以認為是強氣溫敏感點;在氣溫達到37-38 ℃時,K值和M值分別為49.8%和7.7%,說明氣溫再升高1 ℃,天氣敏感負荷率的平均值達50%以上,此時,可能由于制冷設(shè)備長時間大量運轉(zhuǎn)出現(xiàn)一些開關(guān)跳閘、被燒等電力事故,電力部門需警惕重視。由此可以確定上海夏季炎熱累積效應(yīng)的臨界值為33 ℃。
表1 上海2013-2017年日最高氣溫升高1 ℃時的日最大天氣敏感負荷率平均值(K)及其增加值(M)
2.2.2 天氣敏感負荷率與炎熱累積效應(yīng)指數(shù)的擬合
確定炎熱累積效應(yīng)對應(yīng)的氣溫臨界值后,根據(jù)公式(1)計算得到夏季炎熱累積效應(yīng)指數(shù),與日最大天氣敏感負荷率進行擬合分析,結(jié)果如圖3所示。根據(jù)散點圖的分布形態(tài),選擇線性回歸擬合。從圖3可以看出,上海2013-2017年夏季工作日和雙休日炎熱累積效應(yīng)指數(shù)與日最大天氣敏感負荷率存在顯著的正相關(guān),兩者之間的R2分別為0.81和0.71。
圖3 上海2013-2017年夏季工作日(a)和雙休日(b)天氣敏感負荷率與炎熱累積效應(yīng)指數(shù)擬合圖
2.3.1 逐步回歸模型
分別計算各個建模因子與日最大天氣敏感負荷率的相關(guān)系數(shù)(見表2),回歸建模時剔除了部分相關(guān)性較差的因子(見表3)。方案1的回歸模型中入選因子為x1、x2、x3、x8、x9,可以解釋91%的方差。方案2的回歸模型中入選因子為x1、x3、x6、x9、x10、x12,可以解釋97%的方差,且前一天日最大天氣敏感負荷率和前一天日平均天氣敏感負荷率的回歸系數(shù)占據(jù)的比重最大。
表2 上海2013-2017年夏季工作日和雙休日日最大天氣敏感負荷率與各建模因子的相關(guān)系數(shù)
表3 上海2017年夏季日最大電力負荷逐步回歸預(yù)測模型
通過2013-2016年的數(shù)據(jù)建立了逐步回歸模型,利用2017年數(shù)據(jù)對回歸模型進行了驗證,結(jié)果如圖4所示。由圖4可看出,方案1和方案2都能較好地模擬出負荷變化趨勢,且模擬值與實際值偏差較小,工作日方案1和方案2的均方根誤差(RMSE)分別為7.4%和6.3%,平均相對誤差分別為4.5%和3.8%(見表4)。在6月和7月中旬回歸模擬的結(jié)果與實際的天氣敏感負荷率很接近,但當夏季出現(xiàn)極端負荷時,模擬值較實測值偏低,到了8月下旬以后模擬效果有所提升,此外回歸方程很好地模擬了8月中旬負荷迅速下降的趨勢。和工作日相比,雙休日擬合的效果略差一些,這主要是由于雙休日存在明顯的假日效應(yīng)。
圖4 上海2017年夏季工作日逐步回歸模型的模擬值與實測值對比
2.3.2 SVR支持向量回歸模型
由于SVR支持向量回歸中已經(jīng)將日期類型作為其中的特征變量,因此不用再區(qū)分工作日和雙休日。采用2013-2016年的數(shù)據(jù)建立SVR支持向量回歸模型,利用2017年的數(shù)據(jù)進行驗證,模擬結(jié)果如圖5所示。由圖5可看出,模擬值與實測值變化趨勢有很好的一致性,RMSE為4.5%(見表4),平均相對誤差為3.3%,尤其是對于夏季極端負荷的模擬表現(xiàn)出很高的吻合度。
圖5 上海2017年夏季SVR支持向量回歸模型的模擬值與實測值對比
分析SVR模型模擬的相對誤差與最高氣溫的關(guān)系發(fā)現(xiàn)(圖6),2017年7月11日-28日上海連續(xù)18天遭遇35 ℃以上的高溫天氣,用電負荷穩(wěn)定在高位運行,SVR模擬的平均相對誤差為1.9%,這也表明SVR支持向量回歸模型可以很好地模擬上海夏季的極端負荷。但當氣溫低于30 ℃時,SVR模型模擬的用電負荷值往往較實際值偏高,尤其是當天氣由炎熱轉(zhuǎn)為涼爽時,模擬值偏高較多。
圖6 上海2017年夏季工作日SVR支持向量回歸模型的模擬相對誤差與最高氣溫分布
2.3.3 兩種回歸預(yù)測模型的比較
不同模型的模擬誤差見表4。由表4可知:SVR支持向量回歸模型平均相對誤差為3.3%,而逐步回歸模型方案1和方案2的平均相對誤差分別為4.5%和3.8%,總體來說SVR支持向量回歸模型為最優(yōu)。從相對誤差小于2%和5%的日數(shù)占比來看,SVR的模擬效果最好,分別達38.2%和74.8%;逐步回歸模型方案2的模擬效果次之,分別為25.8%和67.4%;逐步回歸模型方案1的模擬效果相對最差,分別為22.5%和59.6%。從不同模型的最大相對誤差可以看出:逐步回歸模型方案2和SVR支持向量回歸模型最大相對誤差非常接近,分別為9.3%和9.4%;逐步回歸模型方案1的最大相對誤差達13.4%。
表4 上海2017年夏季不同的日最大電力負荷預(yù)測模型誤差對比 %
逐月不同模型模擬的相對誤差見表5。由表5可知:6月和9月兩種逐步回歸模型的模擬效果均優(yōu)于SVR支持向量回歸模型的模擬結(jié)果,SVR模型對于上海6月和9月負荷的模擬值較實測值偏高;但7月和8月的逐步回歸模型模擬效果均明顯差于SVR模型結(jié)果,表明SVR模型能很好地模擬上海夏季高溫天氣條件下的極端負荷,尤其是7月模擬的相對誤差僅為1.8%。
表5 上海2017年夏季不同的日最大電力負荷預(yù)測模型逐月相對誤差對比 %
利用逐步回歸和SVR支持向量回歸兩種方法分別構(gòu)建上海市夏季逐日最大電力負荷預(yù)測模型,預(yù)測結(jié)果表明:加入前一天用電負荷數(shù)據(jù)作為自變量的逐步回歸模型方案2較方案1(僅以氣象要素作為自變量)的模擬效果有所提升,復(fù)相關(guān)系數(shù)由0.91上升到0.97,方案1和方案2的平均相對誤差分別為4.5%和3.8%。SVR支持向量回歸模型總體誤差為3.3%,為三種模型中最優(yōu)。
在模型分月預(yù)測效果分析中,6月和9月逐步回歸模型的模擬效果較好,尤其是加入前一天用電負荷作為自變量的逐步回歸模型方案2,模擬效果最優(yōu)。7、8月SVR支持向量回歸模型模擬效果最好,7月模擬的平均相對誤差僅為1.8%,表明SVR回歸模型能很好地模擬上海夏季的極端負荷。
采用SVR方法對上海夏季日最大電力負荷進行模擬時,模型對夏季極端負荷的預(yù)測模擬很好,但對6月和9月過渡時期的負荷模擬往往較實際負荷略偏高,今后有待進一步對模型算法進行調(diào)試和改進。建議今后在實際負荷預(yù)測業(yè)務(wù)中可以考慮采用兩種模型的組合方式開展預(yù)測工作。
從兩類模型的結(jié)果可以看出,機器學習SVR算法的效果好于逐步回歸模型的效果,這是由多方面原因造成的。隨著各地經(jīng)濟轉(zhuǎn)型,高能耗的產(chǎn)業(yè)在逐漸減少,但數(shù)據(jù)中心等用電大戶又在逐漸興建,經(jīng)濟負荷并不是簡單的線性增長;而且隨著人們生活和消費習慣的改變,如電動車出行等因素的影響,這些行為一方面會引起用電負荷影響因子的增多,同時其對用電負荷的間接影響也在增大,即天氣和用電負荷的關(guān)系趨于復(fù)雜,這可從SVR等機器學習算法能得到更好的效果中看到。