杜維柱,張曉華,盧毅,王書淵,沈彥伶
(國網(wǎng)冀北電力科學(xué)研究院,北京 100045)
電網(wǎng)短期臨近氣象預(yù)警是對災(zāi)害性強對流天氣進行及時、精準(zhǔn)的預(yù)警,提前預(yù)測其發(fā)展趨勢,從而及時采取預(yù)防措施來減小電力設(shè)施的損失[1-2],這也是近年來新的研究熱點。目前,常見的預(yù)警方法是通過數(shù)值模式預(yù)報等方式進行粗略地統(tǒng)計與測算。典型的TITAN 算法是基于三維雷達數(shù)據(jù)對災(zāi)害性天氣進行識別、跟蹤與預(yù)警,其為氣象預(yù)警研究奠定了良好的基礎(chǔ)[3]。但由于雷達收集數(shù)據(jù)及本身技術(shù)水平的限制,數(shù)據(jù)采集無法大范圍開展。隨著氣象衛(wèi)星的發(fā)展與數(shù)據(jù)分辨率的提高,利用衛(wèi)星數(shù)據(jù)進行短期臨近預(yù)警的研究成為了可能[4-6]。文獻[7-8]利用前沿的人工智能算法對數(shù)據(jù)進行分類統(tǒng)計,并采用特征識別技術(shù)量化衛(wèi)星數(shù)據(jù),故可有效對強對流天氣進行實時預(yù)測。文獻[9]提出CI 預(yù)警方法,通過采集衛(wèi)星通道的數(shù)據(jù)指標(biāo)提出相應(yīng)的閾值,并通過閾值確定CI,進而解決了衛(wèi)星數(shù)據(jù)零散的問題。與此同時,基于遙感數(shù)據(jù)與機器學(xué)習(xí)(Machine Learning,ML)的分析方法不斷出現(xiàn),其能根據(jù)采集到的數(shù)據(jù)特征進行實時訓(xùn)練,并可達到對強對流天氣的短時臨近預(yù)警[10]。該文根據(jù)氣象觀測信息,對收集到的各類數(shù)據(jù)進行預(yù)處理及三性分析,將數(shù)據(jù)轉(zhuǎn)換為網(wǎng)格數(shù)據(jù),然后通過所設(shè)計的氣象模型實現(xiàn)預(yù)警。
根據(jù)氣象站觀測到的風(fēng)速、風(fēng)向、溫度和濕度等信息,捕捉地區(qū)的各種天氣數(shù)據(jù)。但環(huán)境的限制,導(dǎo)致觀測到的數(shù)據(jù)受設(shè)備儀器的影響,使得其收集的數(shù)據(jù)質(zhì)量也參差不齊。因此,這些數(shù)據(jù)必須經(jīng)過嚴(yán)格的質(zhì)量控制與管理,并對其進行預(yù)處理及三性分析。其中,數(shù)據(jù)的質(zhì)量控制流程如圖1 所示。
圖1 數(shù)據(jù)質(zhì)量控制流程
采用機器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)方法,首先需要對采集到的數(shù)據(jù)進行預(yù)處理[11-12]。由于衛(wèi)星接收站的原始數(shù)據(jù)與經(jīng)緯度呈現(xiàn)非線性分布,故數(shù)據(jù)的分辨率與衛(wèi)星云圖的距離呈正相關(guān)。因此,需將上述數(shù)據(jù)轉(zhuǎn)換為經(jīng)緯度網(wǎng)格的數(shù)據(jù)。通常衛(wèi)星每隔15 min對天氣狀況進行一次加密觀測,而該文方法僅需采集到每隔30 min 的加密數(shù)據(jù)即可滿足需求。同時考慮到強對流天氣易出現(xiàn)的時段,文中選擇的加密數(shù)據(jù)觀測時間如表1 所示。
表1 衛(wèi)星數(shù)據(jù)加密觀測時間
最新的天氣雷達信息由計算機控制[13],所采集到的信息是完全基于極坐標(biāo)系的。由于使用笛卡爾坐標(biāo)系的數(shù)據(jù)較為便捷,故該文在使用過程中所采用的數(shù)據(jù)均需轉(zhuǎn)換為笛卡爾坐標(biāo)系。此外,還需將采集到的雷達數(shù)據(jù)進行濾波處理。但上述數(shù)據(jù)并非完全正確,可能仍存在一定誤差,因此需要將誤差控制在合理范圍內(nèi)。
針對數(shù)值特征,基于雷達反射樣本標(biāo)簽,將比樣本數(shù)值大的數(shù)據(jù)記錄為正數(shù)據(jù);反之,記錄為負(fù)數(shù)據(jù)。處理步驟的主要目的是利用差分法(Difference Methods,DM)將數(shù)據(jù)的增量信息記錄下來,對于t時刻的信息δ采用的計算公式為:
由于數(shù)值樣本種類較多且標(biāo)準(zhǔn)未統(tǒng)一,故需通過歸一化處理上述數(shù)據(jù)。采用梯度下降法(Gradient Descent)預(yù)測數(shù)據(jù)趨勢,其對參數(shù)λ的歸一化處理應(yīng)用方式如下:
應(yīng)用機器學(xué)習(xí)算法對電網(wǎng)短期臨近預(yù)警的核心,是通過卷積及池化操作實現(xiàn)對數(shù)據(jù)的識別與預(yù)測。而其精度的高低與分類器的選擇信息相關(guān),分類器實質(zhì)上是一種數(shù)學(xué)意義上的回歸方法,可精確感知模型的概率。
假設(shè)獲得的氣象數(shù)據(jù)為x1、x2、…、xn,則其對應(yīng)的輸出數(shù)據(jù)分別為y1、y2、…、yn,通過卷積與池化操作,能夠得到y(tǒng)i與xi之間的函數(shù)關(guān)系為:
式中,f的取值范圍為[0,1],則yi的似然函數(shù)可表示為:
兩邊取對數(shù),可得:
通過求解β0,β1,…,βn的估計值,即可得到函數(shù)的極大值。
根據(jù)氣象模型設(shè)計預(yù)警流程圖,整個流程采用VC++6.0 平臺來完成雷達數(shù)據(jù)的輸入與處理,并利用小波融合算法提高紅外數(shù)據(jù)的準(zhǔn)確度。通過設(shè)計評價指標(biāo)對整個流程進行初始評價,該流程如圖2所示。
圖2 氣象預(yù)警流程圖
在預(yù)警CI 部分,采用指標(biāo)提取法對各個圖像像素進行統(tǒng)計。通過對采集到的數(shù)據(jù)進行分析,并調(diào)整指標(biāo)閾值,從而提高預(yù)警的精度。
隨著氣象檢測分辨率的增強,對強對流天氣臨近預(yù)警的精度提出了更高的要求[14-15]。但由于對流演變是一個非線性的動力過程,且該過程缺乏對流體運動的觀測,同時對時間與空間的要求也較高,故無法完全準(zhǔn)確地預(yù)報天氣狀況。
通過紅外算法將模擬信息反映為數(shù)值信息,并與溫度、濕度、濃度等信息相融合,進而從多種信息來源增加信息庫。所得到的電網(wǎng)短期臨近預(yù)警算法流程如圖3 所示。
在上述算法流程中,大量的實驗數(shù)據(jù)表明,當(dāng)小波分解到第三級時效果最佳。而在融合規(guī)則中,采用紅外云圖低頻信息可提高紅外采集數(shù)據(jù)的真實性。而針對高頻信息則采用區(qū)域求和與局部比較的方式進行選擇,最終便可得到所需的融合信息。
圖3 算法流程圖
經(jīng)過小波融合算法處理之后,紅外數(shù)據(jù)的準(zhǔn)確率得以提升,從而能夠基于高清詳細(xì)數(shù)據(jù)解決數(shù)值預(yù)報技術(shù)所存在的短時預(yù)報問題。
采用計分統(tǒng)計方法設(shè)計電網(wǎng)短期臨近預(yù)警算法時,需首先選取分類指標(biāo)及閾值。分類指標(biāo)需根據(jù)各個衛(wèi)星數(shù)據(jù)間的相互關(guān)系依次確定??梢罁?jù)紅外數(shù)值與其波段的檢測反映輻射信息,并利用溫度、濕度和云端粒子尺度等參數(shù)為短時預(yù)警提供參考。但并非所有數(shù)據(jù)均可為臨近預(yù)警算法提供有效的數(shù)據(jù),因此當(dāng)紅外波段數(shù)據(jù)的變化幅度較大時,可設(shè)置其價值數(shù)值為零。若將多個數(shù)值預(yù)報信息綜合起來進行預(yù)警分析,能夠提高短期臨近預(yù)警的準(zhǔn)確率。經(jīng)過大量測試,可得到八個分類指標(biāo)的三通道信息,具體如表2 所示。
表2 評判指標(biāo)定義與權(quán)重
根據(jù)評判指標(biāo)可知,在不同時刻的相同位置,通過比較相鄰時刻的天氣數(shù)值信息,可得到云團的運動矢量,用于解決像素在時間序列的追蹤問題。采用交叉算法可解決上述問題,其原理是將采集到的云團活動區(qū)域分為若干個小區(qū)域,根據(jù)相鄰兩個時刻的關(guān)系確定像素的對應(yīng)關(guān)系,其原理如圖4 所示。
假設(shè)t1、t2時刻對應(yīng)的子區(qū)域分別為A、B,二者均由同一云團區(qū)域劃分而來。將A與B做相關(guān)系數(shù)計算,可得到二者間的運動矢量,其中相關(guān)系數(shù)ζ可表示為:
式中,N為總數(shù)據(jù)量,t1、t2時刻的反照率分別用M1、M2表示。交叉相關(guān)算法即將圖像劃分為m個子區(qū)域,其計算量與圖像信息的大小存在直接關(guān)系。根據(jù)文獻[16]中總結(jié)的經(jīng)驗值可知,當(dāng)子區(qū)域選擇5×5 矩陣時可達到較為理想的識別效果,同時其計算精度也有顯著提高。
該文主要對某地區(qū)電網(wǎng)臨近氣象的歷史數(shù)據(jù)進行收集與整理分析,涉及的氣象時間分別為2020 年6 月13 日、8 月6 日及7 月28 日。應(yīng)用該文所述方法對該地區(qū)的臨近氣象進行預(yù)警與分析,此次強對流天氣發(fā)生的時間通常為午后至傍晚時段。根據(jù)地面氣象站風(fēng)速記錄,此次強對流天氣下,該地區(qū)共有20個地面觀測記錄到陣風(fēng)風(fēng)速超過10 級,其中有五個觀測站風(fēng)力等級達到了12級,風(fēng)速分別為42.1、51.6、39.1、34.8、37.8 m/s。此外,6 月13 日的多個氣象監(jiān)測站打破了6 月的歷史極大風(fēng)速記錄。當(dāng)日的風(fēng)速變化如圖5 所示,其是一次典型的強對流活動天氣。
圖5 2020年6月13日風(fēng)速變化
根據(jù)國家氣象站6 月13 日08 時的探空資料分析可知,8 時左右對流有效位能(Convective Available Potential Energy,CAPE)為477.8 J/kg。且在對流活動發(fā)生前,隨著溫度的升高,對流的有效位能也會進一步增加,導(dǎo)致前期積累能量持續(xù)增多。850 hPa 與500 hPa 溫差為34.7 ℃,抬升凝結(jié)溫度13.6 ℃,凝結(jié)壓強則為862.7 hPa,整體環(huán)境參數(shù)有利于對流進一步積累能量。對流活動發(fā)生后,能量可得到大量釋放,此時對流有效位能較低,整體的大氣溫濕環(huán)境趨于穩(wěn)定。但分別從500、700、850 hPa 的氣象信息來看,西北一帶850 hPa 與500 hPa 的溫度差大于30 ℃,大范圍地區(qū)內(nèi)大氣上冷下暖的結(jié)構(gòu)較為明顯,利于出現(xiàn)不穩(wěn)定的層結(jié)。
進一步對2020 年6 月13 日該地區(qū)的短期強對流天氣設(shè)置三種情形進行模擬分析。情形一為東北部發(fā)生強對流天氣,情形二為西南部發(fā)生強對流天氣,情形三則為兩地交界處發(fā)生強對流天氣?;谠撐乃龇椒?,對上述三種強對流天氣進行預(yù)警,并分析由于小波融合過程中產(chǎn)生的誤差,其結(jié)果如表3所示。
表3 三種情形預(yù)警結(jié)果及誤差
為檢測該文所述方法的有效性及精度,采用不同的損失函數(shù)(Loss Function)在各場景下測試預(yù)警模型的效果。表4 為四種方法的檢測精度對比。從表中可以看出,該方法可有效檢測極端天氣,且其預(yù)測精確率可達96.88%。
表4 不同方法下的預(yù)測精度對比
針對電網(wǎng)短期臨近預(yù)警問題,該文基于機器學(xué)習(xí)與數(shù)值預(yù)報技術(shù)開展了面向電網(wǎng)的短期臨近氣象預(yù)警模型設(shè)計。在將多類信息進行預(yù)處理及三性分析的基礎(chǔ)上,根據(jù)氣象分析技術(shù)設(shè)計了一套強對流天氣預(yù)警模型。通過小波融合算法映射云團間像素點的聯(lián)系,并分析時間關(guān)聯(lián)度,解決了短時預(yù)警問題。實際算例結(jié)果表明,該文所提方法可以有效預(yù)警極端天氣,且其預(yù)測精準(zhǔn)率達到了預(yù)期水平。在下一步的工作中,將對模型進行改進,并解決預(yù)警過程中數(shù)據(jù)不穩(wěn)定的情況,同時消除不利因素的影響。