郭艷萍,高 云,呂丙東,彭 煒
(山西大同大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)工程學(xué)院,山西 大同 037009)
強(qiáng)對流引發(fā)的災(zāi)害性天氣[1]具有變化速度快、破壞性強(qiáng)的特點(diǎn),其巨大的殺傷性對國民的生命財產(chǎn)安全造成嚴(yán)重威脅,災(zāi)害性天氣預(yù)報技術(shù)逐漸成為氣象領(lǐng)域的重要研究課題,雷達(dá)回波外推技術(shù)[2]應(yīng)運(yùn)而生。作為臨近天氣預(yù)報的主要手段,外推技術(shù)以多普勒天氣雷達(dá)探測到的當(dāng)前回波數(shù)據(jù)為參考依據(jù),明確回波強(qiáng)度分布與回波體的運(yùn)動方向與速度,經(jīng)線性或非線性外推回波體,獲取天氣變化過程的回波數(shù)據(jù)。
當(dāng)前較為主流的雷達(dá)回波外推技術(shù)主要是變分回波跟蹤算法[3]。該算法通過添加兩個的約束條件,利用變分技術(shù)迭代計(jì)算雷達(dá)回波運(yùn)動矢量場,實(shí)現(xiàn)強(qiáng)對流天氣的臨近預(yù)報。對比傳統(tǒng)交叉相關(guān)法,此算法在命中率、臨界成功指數(shù)以及虛警率方面具有突出優(yōu)勢,外推預(yù)報效果優(yōu)勢顯著。
當(dāng)雷達(dá)回波穩(wěn)定性較為理想時,雷達(dá)回波外推技術(shù)具備精準(zhǔn)跟蹤回波運(yùn)動變化的能力,一旦災(zāi)害性天氣的危險程度呈急劇上升或衰減趨勢,外推預(yù)報誤差將隨時間推移直線增加,嚴(yán)重影響制定抗災(zāi)決策的合理性。因此,預(yù)報數(shù)據(jù)誤差識別是一個具有重大意義與價值的研究方向。利用預(yù)報與實(shí)際回波的相關(guān)系數(shù),定量反映誤差相關(guān)性,為后續(xù)識別奠定理論基礎(chǔ);融合平均絕對誤差與探測概率,直觀分析預(yù)報數(shù)據(jù)誤差情況;應(yīng)用有監(jiān)督?jīng)Q策樹理念,賦予誤差識別描述性。
劃分某個時刻的多普勒天氣雷達(dá)回波圖,得到多個小空間區(qū)域,假定光流在小空間Ω中處于恒定狀態(tài),其短時內(nèi)連續(xù)幀的回波圖像運(yùn)動呈線性,因此光流目標(biāo)函數(shù)式如下所示
(1)
式中,zt(x,y)表示t時刻像素點(diǎn)(x,y)的雷達(dá)回波強(qiáng)度;?z(x,y)與W(x,y)分別是該像素點(diǎn)的回波強(qiáng)度矢量微分值與窗口權(quán)值函數(shù),其中,后者與此像素點(diǎn)到中心點(diǎn)的距離呈反比;V表示像素中心點(diǎn)的光流[4]。
若等式方程組(2)成立,則解得空間Ω的光流場[5],如式(3)所示
(2)
(3)
其中,T表示矩陣轉(zhuǎn)置因子;α、β各是空間Ω的回波強(qiáng)度矢量微分值集矩陣與t時刻回波強(qiáng)度集逆矩陣;W′指代窗口權(quán)值函數(shù)集的對角矩陣[6];{(x1,y1),(x2,y2),…,(xn,yn)}表示小空間Ω內(nèi)n個像素點(diǎn)的集合。
同理,解得各空間光流場。經(jīng)過整合所有空間的光流場,得到整個回波的光流場。
氣象數(shù)據(jù)種類多樣。當(dāng)待預(yù)報對象是降水系統(tǒng)或風(fēng)場時,則連續(xù)幀的回波圖像運(yùn)動在短時內(nèi)為非線性,若利用以往的線性外推技術(shù)來預(yù)報數(shù)據(jù),就會導(dǎo)致預(yù)報與實(shí)際的回波位置之間存在顯著誤差。
求算研究區(qū)域O在同一預(yù)報時效下預(yù)報雷達(dá)回波與實(shí)際雷達(dá)回波的相關(guān)系數(shù),定量反映出兩數(shù)據(jù)間誤差的相關(guān)性,為預(yù)報數(shù)據(jù)誤差識別奠定理論基礎(chǔ)。
假設(shè)實(shí)際與預(yù)報的雷達(dá)回波光流場分別是f、,預(yù)報初始時間與時效各為t0、τ,則采用下列計(jì)算公式,即解得預(yù)報雷達(dá)回波光流場與實(shí)際雷達(dá)回波光流場在預(yù)報時效為τ時的相關(guān)系數(shù)χ(τ)
(4)
其中,p指代雷達(dá)回波光流的當(dāng)前位置[7]。
通過下列微積分公式微分預(yù)報時效τ,獲取去相關(guān)時間L
(5)
對由所有光流位置得出的相關(guān)系數(shù)取平均值,以更好地分析預(yù)報與實(shí)際光流場數(shù)據(jù)之間的誤差。當(dāng)兩個雷達(dá)回波光流場間的相關(guān)系數(shù)χ(t)呈指數(shù)規(guī)律變化時,將去相關(guān)時間L作為指數(shù)時間常數(shù),反映所測雷達(dá)回波的可預(yù)報性[8]。
為使預(yù)報數(shù)據(jù)誤差分析更具直觀性,結(jié)合平均絕對誤差MAE與探測概率POD兩指標(biāo)[9,10]加以定性補(bǔ)充說明,各指標(biāo)計(jì)算公式分別如下所示
(6)
(7)
該式內(nèi),N為雷達(dá)回波圖像含有的總像素點(diǎn)數(shù)量;N′、N″各指代預(yù)報與實(shí)際回波像素點(diǎn)的兩種共生狀態(tài)。
關(guān)于探測概率指標(biāo),結(jié)合預(yù)報結(jié)果影響因子產(chǎn)生的預(yù)報數(shù)據(jù)誤差,逐個像素點(diǎn)比對預(yù)報回波與實(shí)際回波。若某像素點(diǎn)的回波值比預(yù)設(shè)閾值大,則判定其為有效;反之,則判定為無效。故當(dāng)預(yù)報與實(shí)際的回波像素點(diǎn)均有效時,該像素點(diǎn)的狀態(tài)為N′;當(dāng)預(yù)報回波像素點(diǎn)無效,實(shí)際像素點(diǎn)有效時,其狀態(tài)為N″。
將預(yù)報數(shù)據(jù)誤差的識別階段視為數(shù)據(jù)挖掘技術(shù)[11]的分類問題,應(yīng)用有監(jiān)督?jīng)Q策樹理念[12],建立出外推技術(shù)預(yù)報數(shù)據(jù)誤差識別模型。
由于預(yù)報結(jié)果的影響因素除氣候條件外,還包含溫濕度傳感器的距離與角度,故在預(yù)報數(shù)據(jù)特征集合中加入傳感距離與角度兩指標(biāo)數(shù)據(jù),并按照以下步驟架構(gòu)預(yù)報數(shù)據(jù)誤差識別模型:
1)合并所有預(yù)報數(shù)據(jù)特征屬性,把所得屬性集作為有監(jiān)督?jīng)Q策樹的根節(jié)點(diǎn);
2)遍歷屬性集中各屬性的所有分割模式,完成分割點(diǎn)尋優(yōu)處理。預(yù)報數(shù)據(jù)的屬性值個數(shù)不盡相同,故應(yīng)用信息增益率,評估分割點(diǎn)的尋優(yōu)純度,以防止確定分割點(diǎn)時偏向多屬性值的屬性,降低決策樹在誤差識別模型中的適用性。信息增益率的計(jì)算流程描述如下:
①已知訓(xùn)練數(shù)據(jù)集S內(nèi)m個屬性的集合是A={a1,a2,…,am},對應(yīng)k個類別標(biāo)識的集合為C={c1,c2,…,ck},屬性集劃分?jǐn)?shù)據(jù)集S為m個子集,所得子集的集合是S={s1,s2,…,sm},訓(xùn)練集S中含有|S|個數(shù)據(jù),其中,屬性集為ai(i=1,2,…,m)的訓(xùn)練數(shù)據(jù)個數(shù)是|si|,類別標(biāo)識集為cj(j=1,2,…,k)的數(shù)據(jù)個數(shù)是|cj|,當(dāng)屬性集為ai的訓(xùn)練數(shù)據(jù)里含有類別cj時,此類數(shù)據(jù)個數(shù)為|cja|;
②若類別標(biāo)識集為cj的發(fā)生概率為P(cj),屬性集為ai的發(fā)生概率為P(ai),屬性集是ai的數(shù)據(jù)集里存在類別cj的概率為P(cj|ai),則各概率的計(jì)算公式分別如下所示
(8)
(9)
(10)
其中,freq表示重采樣頻率[13]。
③采用下列公式求解各類別的信息熵
(11)
④利用下列公式計(jì)算各類別的條件熵
=infoi(S)
(12)
⑤結(jié)合類別的信息熵與條件熵,推導(dǎo)出類別與屬性的信息增益計(jì)算公式,如下所示
G(C,A)=H(C)-H(C|A)
=info(C)-info(C|A)
=info(S)-infoi(S)=gain(a)
(13)
該式內(nèi),H(C)、H(C|A)指代類別標(biāo)識與條件的信息量。
⑥經(jīng)式(14)解得屬性集合A={a1,a2,…,am}的信息熵后,通過式(15)取得用于評估分割點(diǎn)尋優(yōu)純度的信息增益率
(14)
(15)
其中,split_info(a)指代分裂信息。
3)根據(jù)得到的最優(yōu)分割點(diǎn),劃分屬性集為兩部分;
4)利用第2)~3)步循環(huán)劃分上步分類的兩個部分,待剩余數(shù)據(jù)無法分割時終止迭代運(yùn)行。
面向所建預(yù)報數(shù)據(jù)誤差識別模型,逐個結(jié)點(diǎn)統(tǒng)計(jì)錯誤分類次數(shù),將下一葉子節(jié)點(diǎn)的錯分次數(shù)作為當(dāng)前結(jié)點(diǎn)的錯分次數(shù),當(dāng)數(shù)值比識別模型預(yù)設(shè)的容錯閾值大時,用任意葉子節(jié)點(diǎn)替換該結(jié)點(diǎn)并完成標(biāo)記,以此實(shí)現(xiàn)識別模型的修剪與調(diào)整。
雷達(dá)回波外推技術(shù)常用來預(yù)測降水量,因此選取某區(qū)域近七十分鐘降雨量的實(shí)際數(shù)據(jù)與外推技術(shù)的預(yù)報數(shù)據(jù)作為研究目標(biāo),從降水強(qiáng)度、位置以及形態(tài)等角度,檢驗(yàn)本文模型對預(yù)報回波數(shù)據(jù)誤差識別的有效性與實(shí)踐性。其中,實(shí)際降雨量由西北部的地面觀測臺站測得;預(yù)報時效為10分鐘。
圖1所示為通過多普勒天氣雷達(dá)[14]得到的目標(biāo)區(qū)域?qū)嶋H降水與預(yù)報降水雷達(dá)回波圖像。
圖1 實(shí)際與預(yù)報降水的雷達(dá)回波示意圖
該實(shí)驗(yàn)環(huán)節(jié)中,采用本文模型識別雷達(dá)回波圖像中降水強(qiáng)度誤差與位置誤差,得到各預(yù)報時效下缺漏識別、錯誤識別次數(shù)以及識別時長,如圖2所示。
圖2 誤差識別效果評估示意圖
由圖2(a)可知,第一次進(jìn)行降水強(qiáng)度誤差識別時未出現(xiàn)缺漏情況,最后一次誤差識別時,缺漏與錯誤識別各自僅發(fā)生4次;從圖2(b)降水位置的兩種無效識別結(jié)果可以看出,前兩次均正確識別出了位置誤差,且僅發(fā)生一次缺漏,最后一次的缺漏與錯誤識別各是3次。較低的無效識別次數(shù)說明本文模型融合平均絕對誤差與探測概率指標(biāo),結(jié)合相關(guān)系數(shù),定量且定性地綜合分析了外推技術(shù)的預(yù)報數(shù)據(jù)誤差,故識別精度相對較高。根據(jù)以上兩組指標(biāo)數(shù)據(jù)的變化趨勢而言,無效識別次數(shù)與識別時長均隨著時間的推移而大幅上升,這不僅對長期預(yù)報的識別精度有著極大的負(fù)面影響,而且極有可能發(fā)生因識別時間過長而導(dǎo)致模型無法順利運(yùn)行的情況。今后將針對該問題展開深入分析與探討。
降水形態(tài)包含主、次軸特征長度以及覆蓋面積等屬性,將三個指標(biāo)作為實(shí)際與預(yù)報數(shù)據(jù)的誤差對比項(xiàng)。假設(shè)矩陣δ2*ν即回波圖中各像素點(diǎn)與中心的相對坐標(biāo)集合,利用灰色關(guān)聯(lián)度-主成分分析法[15],求解出協(xié)方差矩陣δδT的特征值λ1、λ2,即降水主軸特征長度與次軸特征長度;根據(jù)降水區(qū)域的雷達(dá)回波像素點(diǎn)個數(shù),確定覆蓋面積,因維度不同時各像素點(diǎn)的覆蓋面積不盡相同,故采用下列計(jì)算公式解得降水區(qū)域的覆蓋面積
(16)
該式內(nèi),dw表示像素距離,φn表示第n個像素的維度。
經(jīng)本文識別實(shí)際與預(yù)報的降雨形態(tài)指標(biāo)數(shù)據(jù)誤差,得出圖3所示的誤差識別效果評估結(jié)果。
圖3 基于降雨形態(tài)的誤差識別效果評估示意圖
從缺漏、錯誤識別結(jié)果以及所用時長可以看出,該模型應(yīng)用有監(jiān)督?jīng)Q策樹理念,將預(yù)報數(shù)據(jù)誤差的識別階段視為數(shù)據(jù)挖掘技術(shù)的分類問題,且在預(yù)報數(shù)據(jù)特征集合中加入了傳感距離與角度兩指標(biāo)數(shù)據(jù),因此,對比強(qiáng)度與位置的數(shù)據(jù)誤差識別結(jié)果,錯誤、缺漏識別次數(shù)與識別時長均有所減少,具有更理想的識別精度與實(shí)時性,但變化發(fā)展趨勢仍存在一定的消極性。
雷達(dá)回波外推技術(shù)作為氣象災(zāi)害的主要預(yù)警手段,在短時預(yù)報中得以廣泛應(yīng)用。由于當(dāng)前應(yīng)用的雷達(dá)回波外推技術(shù)正處于探索的初期階段,預(yù)報數(shù)據(jù)仍存在一定誤差,故研究一種誤差識別方法,以提升外推技術(shù)的預(yù)報精準(zhǔn)度。為綜合優(yōu)化誤差識別各項(xiàng)指標(biāo),從以下幾個角度著手改進(jìn):外推預(yù)報誤差的產(chǎn)生因素除文中所提外,還有回波自身發(fā)生形變因素,下一階段應(yīng)添加回波增強(qiáng)與減弱趨勢,完善模型的誤差識別項(xiàng);應(yīng)嘗試采用神經(jīng)網(wǎng)絡(luò)、傅里葉變換等人工智能算法,設(shè)計(jì)出高準(zhǔn)度與高穩(wěn)定性的雷達(dá)回波外推技術(shù),從根本上減小外推預(yù)報誤差。