劉學(xué)謙,劉 娟
(武漢大學(xué) 計算機(jī)學(xué)院,湖北 武漢430072)
目前對雷暴[1-3]的預(yù)測方法多集中于尋找相關(guān)氣象因素(如可沉降水蒸氣等)與雷電發(fā)生之間的關(guān)系,并利用這個關(guān)系對雷暴的發(fā)生進(jìn)行預(yù)測[4]。然而值得注意的是,在對雷電的預(yù)測活動中,雷電數(shù)據(jù)本身就是一個有價值的參考因素,因此本文試圖從云地閃發(fā)生數(shù)據(jù)入手,構(gòu)建一個對雷暴發(fā)展與移動進(jìn)行實時評估的模型,通過以實時的動態(tài)的方法對地閃數(shù)據(jù)進(jìn)行分析,為今后的雷暴預(yù)警工作增加了新的參考因素。
為了更好的研究雷電的發(fā)生原因,雷電發(fā)生密度等,一些國家陸續(xù)建立了自己的雷電監(jiān)測系統(tǒng),如美國國家雷電監(jiān)測網(wǎng)[5]。近些年,中國也發(fā)展起來了自己的雷電監(jiān)測網(wǎng)絡(luò)[6],可以實時提供云地閃發(fā)生的時間、經(jīng)緯度、雷擊電流幅值等信息。目前對這些雷電發(fā)生數(shù)據(jù)的運用多用于對各種雷電預(yù)測模型的驗證:即使用其它氣象觀測數(shù)據(jù)構(gòu)建雷電預(yù)測模型,然后用雷電的發(fā)生數(shù)據(jù)去驗證模型的合理性[7,8];對雷電監(jiān)測系統(tǒng)雷擊定位準(zhǔn)確率的討論[5];以及對其它災(zāi)害性強(qiáng)對流天氣的研究[9]。
本文所使用的數(shù)據(jù)為中國雷電監(jiān)測網(wǎng)提供的中國境內(nèi)地區(qū)云地閃發(fā)生數(shù)據(jù),數(shù)據(jù)包括了云地閃的發(fā)生時間,發(fā)生地點的經(jīng)緯度,以及放電強(qiáng)度等信息。本文所提出的方法主要使用了云地閃發(fā)生數(shù)據(jù)的時間信息和發(fā)生地點經(jīng)緯度信息。
雷電的發(fā)生具有很大的隨機(jī)性,云地閃發(fā)生的具體位置也具有不可預(yù)測性的特點,所以以區(qū)域為單位去研究一個地區(qū)受雷擊影響的程度以及可能遭遇雷擊天氣的可能性更具有實際意義。因此,本文對云地閃數(shù)據(jù)的討論也是以區(qū)域為單位的,具體方法如下:首先把一個時間段內(nèi)所發(fā)生的所有雷電的位置在地圖上進(jìn)行標(biāo)記,然后使用若干個一定大小的正方形網(wǎng)格將所有發(fā)生雷電的區(qū)域用網(wǎng)格覆蓋,如圖1所示,實心點表示表示在某個時間段內(nèi) (如十分鐘)內(nèi)在某個區(qū)域所監(jiān)測到的云地閃,之后本文使用同樣大小的正方形網(wǎng)格無重疊地覆蓋所有雷電發(fā)生區(qū)域。
圖1 網(wǎng)格覆蓋云地閃發(fā)生區(qū)域
因此對于每個時間段內(nèi)監(jiān)測到的云地閃數(shù)據(jù),都可以得到一個由小方格描繪的雷暴發(fā)生區(qū)域的分布情況。顯然,通過對每個小方格中的雷電進(jìn)行計數(shù),也可獲知該時間段內(nèi)不同區(qū)域雷暴的云地閃密度。為了對雷暴進(jìn)行識別,本文對一個時間段內(nèi)云地閃數(shù)據(jù)所形成的網(wǎng)格進(jìn)行聚類,即將所有毗連在一起的網(wǎng)格識別為同一雷暴。在聚類過程中,本文采用了廣度優(yōu)先遍歷算法,網(wǎng)格聚類的具體算法描述如下:
(1)用網(wǎng)格覆蓋所有在本時間片內(nèi)發(fā)生了雷電的區(qū)域。
(2)將所有網(wǎng)格標(biāo)簽為 “unclustered”。
(3)對所有網(wǎng)格按照雷電計數(shù)值從大到小進(jìn)行排序,形成一個網(wǎng)格列表。
(4)對列表中每一個標(biāo)簽為 “unclustered”且雷電計數(shù)值最大的網(wǎng)格Ct進(jìn)行如下循環(huán)操作:
注:一個網(wǎng)格G 的 “鄰居”的定義為:所有與G 有共同頂點的網(wǎng)格。即每個網(wǎng)格最多有8個 “鄰居”網(wǎng)格。
在上述算法中,首先按照每個網(wǎng)格中發(fā)生的雷電數(shù)目從大到小對網(wǎng)格進(jìn)行排序,然后將未被聚類且含有云地閃數(shù)目最多的網(wǎng)格作為一個雷暴的中心點網(wǎng)格,由于這里雷暴的中心點是基于密度產(chǎn)生的,所以也即雷暴的密度中心點。
本文對云地閃監(jiān)測數(shù)據(jù)采用這種先繪制網(wǎng)格再對網(wǎng)格進(jìn)行聚類的處理方法實際上是利用了層次聚類的思想,這比直接對云地閃進(jìn)行聚類的方法 (如文獻(xiàn) [10])節(jié)省了大量的計算時間[11]。需要注意的是,在本文的算法中,一些靠近雷暴但是與雷暴聚類沒有毗連的離散網(wǎng)格沒有被識別為該雷暴的一部分,這樣做首先是為了減少計算代價,顯然,識別網(wǎng)格是否毗連的實現(xiàn)更為簡便,其次這樣的離散網(wǎng)格并不影響本研究的主要目的:對雷暴進(jìn)行識別和追蹤。因為雷暴中心區(qū)域的云地閃發(fā)生密度相對較大,而雷暴邊緣區(qū)域云地閃的發(fā)生密度則相對較小,這樣本文基于云地閃所畫出的網(wǎng)格在雷暴中心區(qū)域一般會毗連較為緊密,而雷暴邊緣區(qū)域的網(wǎng)格則相對離散,所以這些離散的網(wǎng)格對本文識別雷暴中心以及評估雷暴的發(fā)生強(qiáng)度的影響相對較小。
對一個時間段內(nèi)發(fā)生的云地閃數(shù)據(jù)使用上述聚類算法后可以得到若干被識別的聚類,在本節(jié)中將要討論如何對這些雷暴進(jìn)行追蹤。文獻(xiàn) [12]描述了一種基于面積和云間距離的云的追蹤方法,該文獻(xiàn)的方法是基于如下假設(shè):同一朵云在兩個時間片較短的兩幅云圖中的面積和位置不應(yīng)有過大的變化。在本文論述的問題中,某個聚類所覆蓋面積的大小是基于該時間片內(nèi)云地閃的地理分布的,而雷暴天氣是一種發(fā)展相對較快的氣象現(xiàn)象,不同時間的云地閃的發(fā)生區(qū)域和發(fā)生密度可能會發(fā)生較大變化,因此所提出的方法在本文討論的問題中并不完全適用。為了解決這一問題,在這里本文提出了一種數(shù)據(jù)重疊的方法,具體做法如下:例如當(dāng)讓時間段的長度為10分鐘且讓兩個相鄰的時間段有50%的重疊時,本文可以得到如下形式的相鄰時間段:第 一 個 時 間 段 為 從 “2012-06-07 17:00:00”到“2012-06-07 17:10:00”,第二個時間段為從 “2012-06-07 17:15:00”到 “2012-06-07 17:25:00”,這樣兩個時間段中時間重疊部分的云地閃數(shù)據(jù)是相同的,即數(shù)據(jù)重疊。使用第2部分所討論的網(wǎng)格聚類算法對這兩個時間段內(nèi)的云地閃數(shù)據(jù)進(jìn)行聚類,由于網(wǎng)格的分布是由一個時間片中的云地閃發(fā)生位置決定的,若前后兩個時間段有一部分時間重疊,那么在這段重疊的時間內(nèi)發(fā)生的云地閃便成為了在這兩個相鄰時間片上繪制網(wǎng)格的共同依據(jù),所以同一個雷暴在兩個相鄰時間片上的網(wǎng)格必然有一部分是相同的,這也就為雷電發(fā)生區(qū)域的追蹤提供了依據(jù)。因此可以推定在兩個相鄰時間段上,具有共同網(wǎng)格數(shù)最多的兩個聚類應(yīng)該是同一雷暴。
圖2 (a)和圖2 (b)描繪了同一雷暴在兩個相鄰時間片上的云地閃發(fā)生情況以及根據(jù)云地閃位置所繪制出的網(wǎng)格。圖3將圖2 (a)和圖2 (b)兩幅圖描繪在了同一坐標(biāo)系上,本文可以看出由于圖2 (a)和圖2 (b)所在的時間片有重疊,所以一些云地閃同時出現(xiàn)了對該雷暴的兩次聚類之中,即圖3 中的菱形實心點所表示的云地閃。這樣,對云地閃的兩次網(wǎng)格聚類便有了相同的網(wǎng)格,所以可以以此為依據(jù)推斷它們是同一雷暴。
圖2 同一雷暴在相鄰時間片上的云地閃與網(wǎng)格分布
綜上所述,本文提出了如下的雷暴追蹤算法:
(1)對兩個相鄰的時間片的云地閃數(shù)據(jù)進(jìn)行聚類,得到聚類集合Set0和Set1。
(2)對Set0中聚類按網(wǎng)格數(shù)從多到少進(jìn)行排序。
(3)對Set0中所有聚類進(jìn)行如下循環(huán):{
圖3 雷暴追蹤
從Set0中取出一個未被比較過且網(wǎng)格數(shù)最多的聚類ClusterMax 與Set1中所有未被匹配的聚類進(jìn)行對比,選出Set1中與ClusterMax 具有最多重疊網(wǎng)格數(shù)的聚類Cluster-Match,將ClusterMatch 的類別號改為與ClusterMatch 相同 (即認(rèn)為ClusterMatch與ClusterMatch 是同一類);
將ClusterMatch標(biāo)記為已匹配。}
(4)Set1中剩余的未被匹配的聚類則認(rèn)為是新生聚類。
由于發(fā)生強(qiáng)度大且覆蓋面積廣的雷暴應(yīng)該是我們首先關(guān)注的,所以在上述算法中,本文是先對Set0中的類別從大到小的排序后才進(jìn)行匹配,這實際上是給予網(wǎng)格數(shù)較多(即雷暴發(fā)生區(qū)域面積較大)的聚類以優(yōu)先匹配權(quán),讓雷電區(qū)域面積較大的聚類去匹配與其重疊區(qū)域最多的聚類,這也防止了在相鄰時間片上一個面積很小的聚類匹配上一個面積很大的聚類的情況。同時本述算法的一個設(shè)定是:認(rèn)為一個雷暴只與下一個時間片中與其重疊區(qū)域最多的雷暴進(jìn)行匹配,對于與其有重疊區(qū)域,但重疊區(qū)域相對較小的雷暴則認(rèn)為是新生雷暴聚類。
為了完成對云地閃數(shù)據(jù)的網(wǎng)格聚類,本文首先需要對網(wǎng)格做出一些設(shè)定。在同一時間片內(nèi),若網(wǎng)格越大,則覆蓋某一雷暴發(fā)生區(qū)域所使用的網(wǎng)格就越少,一個網(wǎng)格內(nèi)的雷電數(shù)目越多,對云地閃進(jìn)行網(wǎng)格聚類的計算量越小。反之,若網(wǎng)格越小,則對雷暴內(nèi)部不同區(qū)域中云地閃發(fā)生情況的描述越精確,對雷暴中心點的確定也相對較為精確。所以在本實驗中本文需要對網(wǎng)格的尺寸做一個折中,在這里,本文選擇了中尺度氣象學(xué)中較常用的一個尺度:邊長為0.05度的正方形網(wǎng)格 (這里的度表示經(jīng)緯度,0.05度約相當(dāng)于5公里),需要注意的是,在本實驗中對云地閃的聚類和追蹤中所使用的網(wǎng)格時相同尺寸的。同時,為了網(wǎng)格聚類的運算方便,網(wǎng)格每個頂點的經(jīng)緯度坐標(biāo)都以0.05度為最小單位。
時間片的與時間片重疊長度的選擇:由于雷暴從形成到消亡的時間相對較短,從這一點出發(fā),選擇較短的時間片更為合適,如果時間片選的過長,那么在一個時間片中雷暴已經(jīng)經(jīng)過了較長時間的發(fā)展,隨著雷暴結(jié)束時間的臨近,識別與追蹤的意義便被減小了。然而如果時間片的時間較短,一個雷暴在該時間片內(nèi)該網(wǎng)格中發(fā)生的雷電數(shù)就會很少甚至沒有,這樣就不利用對雷暴的統(tǒng)計和聚類。因此通過實驗經(jīng)驗,本文選擇了10分鐘作為時間片的長度。為了保證兩個相鄰時間片上有足夠多的相同云地閃數(shù)據(jù)并且兩個相鄰時間片應(yīng)有足夠的時間差,本文將相鄰時間片的重疊度設(shè)置為50%,即在本實驗中兩個相鄰時間片具有5分鐘的重疊時間。
本文選取了中國版圖范圍內(nèi)在2012年8月間的若干天的云地閃監(jiān)測數(shù)據(jù)作為實驗數(shù)據(jù),期間共監(jiān)測到386187次云地閃,這些云地閃數(shù)據(jù)包含了云地閃的發(fā)生時間,經(jīng)緯度等信息。然后對這些數(shù)據(jù)使用本文提出的聚類與追蹤算法,之后我們計算了被匹配成功的聚類在前后兩個相鄰時間片上中心點的平均距離,該平均距離為0.0581度 (經(jīng)緯度),該平均距離表示的是一個雷暴聚類在前后兩個時間上的平均移動距離。這個距離說明雷暴的追蹤沒有發(fā)生較大的偏差,達(dá)到了預(yù)期的效果,因為如果本文提出的聚類與追蹤算法不合理的話,被本模型識別的聚類在相鄰時間片上的位置應(yīng)該有大于合理范圍的差異。之后我們試圖通過一個簡單的預(yù)測來檢驗本文所提出模型的效用。預(yù)測方法如下:對每一個由聚類得到的雷暴,使用其前3個時間片中心點的位置去預(yù)測該雷暴在下一時刻中心點的位置。我們計算了預(yù)測得到的中心位置與實際的中心位置之間的平均距離,其結(jié)果為0.0403度。這個值小于了之前得到了平均移動距離,說明本文所提出的模型具有進(jìn)一步對雷暴進(jìn)行預(yù)測的潛質(zhì),更加完備的的預(yù)測工作將在今后的實驗中進(jìn)一步實現(xiàn)。
本文通過對云地閃數(shù)據(jù)進(jìn)行聚類以及對聚類的追蹤,達(dá)到了預(yù)期的效果,實現(xiàn)了對雷暴數(shù)據(jù)的追蹤。其創(chuàng)新點在于提出了一種利用云地閃監(jiān)測數(shù)據(jù)來監(jiān)測雷暴發(fā)展和運動趨勢的方法,并且利用數(shù)據(jù)重疊法實現(xiàn)了對雷暴的追蹤,為今后雷暴活動監(jiān)測系統(tǒng)的實施提供了參考案例。通過實驗不難發(fā)現(xiàn),本文提出的方法對于雷暴運動趨勢的預(yù)測同樣具有實際價值,為今后進(jìn)一步利用云地閃數(shù)據(jù)進(jìn)行雷暴預(yù)警打下了基礎(chǔ)。
[1]Ashley WS,Gilson CW.A reassessment of US lightning mortality [J].Bulletin of the American Meteorological Society,2009,90 (10):1501-1518.
[2]Krawchuk MA,Cumming SG,F(xiàn)lannigan MD.Predicted changes in fire weather suggest increases in lightning fire initiation and future area burned in the mixedwood boreal forest[J].Climatic Change,2009,92 (1-2):83-97.
[3]HE Jl,ZENG R,CHEN SM.Lightning protection study of transmission line,part Ⅲ:Protection measures [J].High Voltage Engineering,2009,35 (12):2903-2909.
[4]McCaul Jr EW,Goodman SJ,LaCasse KM,et al.Forecasting lightning threat using cloud-resolving model simulations[J].Weather &Forecasting,2009,24 (3):709-729.
[5]Biagi CJ,Cummins KL,Kehoe KE,et al.National lightning detection network(NLDN)performance in southern Arizona,Texas,and Oklahoma in 2003-2004 [J].Journal of Geophysical Research: Atmospheres (1984-2012 ), 2007, 112(d5):D05208.
[6]CHEN JH,Zhang Q,F(xiàn)ENG WX,et al.Lightning location system and lightning detection network of China power grid[J].High Voltage Engineering,2008,34 (3):425-431.
[7]Lynn B,Yair Y.Prediction of lightning flash density with the WRF model[J].Advances in Geosciences,2010(23):11-16.
[8]Tang X,Zhuang L,Gao Y.Support vector machine based on chaos particle swarm optimization for lightning prediction[C]//Advances in Computer Science,Intelligent System and Environment,2011:727-733.
[9]Price C,Yair Y,Mugnai A,et al.Using lightning data to better understand and predict flash floods in the mediterranean[J].Surveys in geophysics,2011,32 (6):733-751.
[10]Juntian G,ShanQiang G,Wanxing F.A lightning motion prediction technology based on spatial clustering method[C]//7th Asia-Pacific International Conference on Lightning,2011:788-793.
[11]SUN Jigui,LIU Jie,ZHAO Lianyu.Clustering algorithms research [J].Journal of Software,2008,19 (1):48-61(in Chinese).[孫吉貴,劉杰,趙連宇.聚類算法研究 [J].軟件學(xué)報,2008,19 (1):48-61.]
[12]Kober K,Tafferner A.Tracking and nowcasting of convective cells using remote sensing data from radar and satellite[J].Meteorologische Zeitschrift,2009,18 (1):75-84.