武錦興, 張?zhí)K平??, 李江波, 卞航天, 孫 卓
(1. 中國海洋大學(xué)海洋與大氣學(xué)院, 山東 青島 266100;2. 河北省氣象臺(tái), 河北 石家莊 050021; 3. 海門市亞森網(wǎng)絡(luò)有限公司, 江蘇 南通 226100)
大氣水平能見度(簡稱能見度)是反映大氣透明度的一個(gè)指標(biāo)[1]。低能見度天氣對于陸運(yùn)、航海、航空的順利進(jìn)行都會(huì)造成嚴(yán)重的影響,甚至導(dǎo)致社會(huì)生產(chǎn)及軍事活動(dòng)無法進(jìn)行[2]。低能見度事件如霧霾、霧等的產(chǎn)生是由地理環(huán)境差異、物理化學(xué)作用等共同導(dǎo)致的。這些過程往往與大氣內(nèi)部的運(yùn)動(dòng)、大氣與地面及海氣間的相互作用有關(guān)。由于這些過程都是瞬息萬變的,因此預(yù)報(bào)難度相對較大[3]。隨著改革開放及現(xiàn)代進(jìn)程的加快,近年來中國出現(xiàn)了越來越多的霧霾天氣,針對低能見度天氣的預(yù)報(bào)被社會(huì)各界廣泛關(guān)注重視。由此,對于大氣能見度研究,特別是關(guān)于大氣低能見度的相關(guān)研究工作也陸續(xù)開展起來[4-6]。
河北省東部面向渤海,西部與太行山接壤,將北京和天津緊緊環(huán)繞,是一個(gè)集多種地理環(huán)境于一身的省份。近年來,河北省東部及中部地區(qū)低能見度事件頻發(fā)[7]。因此,研發(fā)一個(gè)針對河北省地區(qū)能見度預(yù)報(bào)方法是有必要的。
人工神經(jīng)網(wǎng)絡(luò)可以通過內(nèi)部神經(jīng)元實(shí)現(xiàn)復(fù)雜的算法計(jì)算,作為統(tǒng)計(jì)模型的一種,人工神經(jīng)網(wǎng)絡(luò)對于隨時(shí)間變化的過程有強(qiáng)大的學(xué)習(xí)能力[8]。20世紀(jì)80年代以來,神經(jīng)網(wǎng)絡(luò)方法便被廣泛運(yùn)用到氣象學(xué)中的各個(gè)領(lǐng)域[9-11]。李法然等[9]利用神經(jīng)網(wǎng)絡(luò)方法,對浙江湖州地區(qū)的霧建立了計(jì)算模型并預(yù)報(bào)。李沛等[1]針對北京地區(qū)的能見度進(jìn)行了研究,利用神經(jīng)網(wǎng)絡(luò)算法建立了該地區(qū)的能見度模型。徐志鵬等[12]使用BP神經(jīng)網(wǎng)絡(luò)對青島海岸附近站點(diǎn)建立了能見度預(yù)報(bào)模型。李昕蓓等[13]分析了影響福州地區(qū)能見度的氣象要素,并采用循環(huán)神經(jīng)網(wǎng)絡(luò),對福州單站建立了能見度短臨預(yù)報(bào)模型。由上可見,神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)方法在能見度預(yù)報(bào)方面是有一定進(jìn)展和成效的。但前人研究均集中于相同地區(qū),而能見度具有很強(qiáng)的局地性,低能見度事件如霧的產(chǎn)生是物理、化學(xué)、輻射過程在不同空間和時(shí)間尺度上活動(dòng)的結(jié)果,這些過程受到局部地形條件如不規(guī)則地形、海陸邊界、海面條件影響[3]。因此沿海與內(nèi)陸地區(qū)影響能見度的主要?dú)庀笠乜赡苁遣煌?,挑選出各自適合的氣象要素作為神經(jīng)網(wǎng)絡(luò)的特征值,從而得到適合各自的能見度計(jì)算模型是有必要的。
石家莊位于河北省中部,是河北省的政治、文化、人口的中心;秦皇島位于河北東北部,面朝渤海,是河北經(jīng)濟(jì)強(qiáng)市。對兩站能見度建立計(jì)算模型對整個(gè)河北地區(qū)具有較好的地區(qū)代表意義及經(jīng)濟(jì)價(jià)值。本文采用循環(huán)神經(jīng)網(wǎng)絡(luò)方法,將石家莊站(114.39°E,38.01°N)和秦皇島站(119.51°E,39.85°N)(見圖1)作為河北省的內(nèi)陸和沿海的代表站,對比分析兩站基本氣象要素與能見度的關(guān)系,進(jìn)而建立單站能見度計(jì)算模型,并用多種評判方法檢驗(yàn)?zāi)P托Ч骄垦h(huán)神經(jīng)網(wǎng)絡(luò)在能見度預(yù)報(bào)上的可行性。
(紅色點(diǎn)代表秦皇島站,綠色點(diǎn)代表石家莊站。Red dot represents Qinhuangdao station; Green dot represents Shijiazhuang station.)
本文使用資料為河北省石家莊和秦皇島自動(dòng)氣象站2017—2018年逐小時(shí)地面觀測資料,隨機(jī)挑選其中70%的資料用于建立能見度計(jì)算模型,剩余的資料用于檢驗(yàn)。自動(dòng)氣象站測量資料包括風(fēng)速、降水量、溫度、相對濕度和逐分鐘能見度。
如圖2所示,一個(gè)典型的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)是由一個(gè)輸入Xt,一個(gè)輸出ht以及神經(jīng)網(wǎng)絡(luò)單元A所構(gòu)成。與常見的BP神經(jīng)網(wǎng)絡(luò)不同的是,循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)單元A不僅與輸入和輸出存在聯(lián)系,其自身內(nèi)部也存在一個(gè)回路。將這個(gè)自身回路展開便可展示為等號(hào)右邊的形式。循環(huán)神經(jīng)網(wǎng)絡(luò)中最初始的輸入值為X0,輸出值為h0,同時(shí)該時(shí)刻網(wǎng)絡(luò)神經(jīng)元的狀態(tài)會(huì)保存在神經(jīng)單元A中,當(dāng)下一個(gè)時(shí)刻到來后,此時(shí)網(wǎng)絡(luò)神經(jīng)元的狀態(tài)不僅僅會(huì)由于下一時(shí)刻的輸入X1產(chǎn)生變化,也會(huì)由此時(shí)刻的神經(jīng)元狀態(tài)A所決定。以此類推,直到時(shí)間序列的末尾時(shí)刻?;谶@種結(jié)構(gòu),循環(huán)神經(jīng)網(wǎng)絡(luò)可以理解并記憶隨時(shí)間變化的氣象要素,較BP神經(jīng)網(wǎng)絡(luò)將各要素當(dāng)做離散的數(shù)字,該方法在處理能見度數(shù)據(jù)時(shí)能夠提取其中更多的特征變化規(guī)律。
圖2 循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structure of RNN
參考中國氣象局制定的能見度等級(jí)劃分標(biāo)準(zhǔn)(即能見度小于1 km為低能見度,能見度大于10 km為高能見度),并考慮到神經(jīng)網(wǎng)絡(luò)模型的計(jì)算能力及氣象局的實(shí)際業(yè)務(wù)運(yùn)用,本文將能見度劃分為0~1 km,1~5 km,5~10 km三個(gè)級(jí)別,本研究主要關(guān)注1級(jí)別(0~1 km)和2級(jí)別(1~5 km)兩個(gè)級(jí)別能見度的征兆評分(Threat Score,TS)及樣本的準(zhǔn)確率。
氣象中常用TS(Threat Score)評分判斷單項(xiàng)目標(biāo)的預(yù)報(bào)準(zhǔn)確性;ACC(Accuracy)評分判斷總體目標(biāo)的預(yù)報(bào)準(zhǔn)確性,ACC又稱為準(zhǔn)確率。
(1)
(2)
式中:TP稱為命中,即實(shí)測為低能見度,預(yù)報(bào)為低能見度;FP稱為漏報(bào),即實(shí)測為低能見度,預(yù)報(bào)為高能見度;FN稱為空報(bào),即實(shí)測為高能見度,預(yù)報(bào)為低能見度。TN稱為正確否定,即實(shí)測為高能見度,預(yù)報(bào)為高能見度。
為找到與低能見度有關(guān)的基本氣象要素,本文分別統(tǒng)計(jì)了秦皇島站和石家莊站基本氣象要素在三個(gè)級(jí)別能見度區(qū)間內(nèi)的頻率分布。頻率計(jì)算方法如下:
從圖3(a)可以發(fā)現(xiàn),石家莊站相對濕度在1級(jí)能見度下的頻率呈多峰分布,秦皇島站相對濕度在各級(jí)能見度下的頻率均呈單峰分布,故相對濕度可能不適合作為兩站能見度計(jì)算因子。從圖3(b)中可知,石家莊站溫度在1級(jí)別能見度下的頻率呈單峰分布,而在2、3級(jí)別能見度下的頻率呈多峰分布,故溫度可能適合作為該站能見度計(jì)算因子。秦皇島站溫度在各級(jí)能見度下的頻率均呈多峰分布,故溫度可能不適合作為該站能見度計(jì)算因子。觀察圖3(c)可以發(fā)現(xiàn),兩站都符合風(fēng)速越大,低能見度出現(xiàn)概率越低的規(guī)律。但對于石家莊站而言,當(dāng)風(fēng)速為0 m/s時(shí),1級(jí)能見度發(fā)生的概率最大,為0.55,且風(fēng)速小于2 m/s時(shí),1級(jí)能見度發(fā)生的概率很大,因此風(fēng)速可能適合作為該站能見度計(jì)算因子。由圖3(d)可知,石家莊站3小時(shí)有效降溫在1級(jí)能見度下的頻率呈單峰分布,因此3小時(shí)有效降溫可能適合作為該站能見度計(jì)算因子。觀察圖3(e)及3(f)可知,石家莊站與秦皇島站溫度3小時(shí)變化在各級(jí)能見度下的頻率均呈單峰分布,故溫度3小時(shí)變化可能不適合作為兩站能見度計(jì)算因子。秦皇島站相對濕度3小時(shí)變化在各級(jí)能見度下的頻率均呈單峰分布,故相對濕度3小時(shí)變化可能不適合作為兩站能見度計(jì)算因子。
(黑線為1級(jí)能見度,紅線代表2級(jí),藍(lán)線代表3級(jí)。The black line is visibility of 0~1 km; The red line is visibility of 1~5 km; The blue line is visibility of 5~10 km.)
為了定量的分析各氣象要素與分級(jí)后能見度的相關(guān)性,計(jì)算出了各級(jí)能見度與各氣象要素的相關(guān)系數(shù)。表1中展示部分特征較為明顯的要素。
表1 基本氣象要素與能見度的同期相關(guān)系數(shù)(2017年1月—2018年12月)Table 1 Correlation coefficient of basic meteorological element and visibility in the same period (January 2017—December 2018)
表中使用RH、TEMP、AH、V、EC分別代表相對濕度、溫度、絕對濕度、風(fēng)速和有效降溫,其中1、2和3 h分別代表1、2、3 小時(shí)改變量。通過觀察表1可以發(fā)現(xiàn),當(dāng)能見度為1級(jí)時(shí),石家莊站的相對濕度、溫度2、3小時(shí)改變量、絕對濕度改變量以及有效降溫與能見度的相關(guān)性較強(qiáng),通過了顯著水平0.01的檢驗(yàn),且有效降溫與能見度的相關(guān)系數(shù)最大;秦皇島站相對濕度以及3、2、1小時(shí)有效降溫均通過了顯著性水平為0.01顯著性檢驗(yàn),風(fēng)速通過了顯著性水平為0.05的顯著性檢驗(yàn),相對濕度與能見度的相關(guān)系數(shù)絕對值最大。這可能是由于內(nèi)陸地區(qū)出現(xiàn)低能見度天氣主要以輻射霧為主,而沿海地區(qū)以平流霧居多。
當(dāng)考慮所有樣本時(shí),石家莊站的相對濕度、1小時(shí)有效降溫、風(fēng)速通過了顯著性檢驗(yàn),且除了相對濕度和有效降溫以及風(fēng)速外,其他要素相關(guān)系數(shù)絕對值均小于 0.1。秦皇島站各項(xiàng)要素中,風(fēng)速、相對濕度以及1、2、3小時(shí)有效降溫通過了顯著水平0.01的檢驗(yàn),其中相對濕度、有效降溫的相關(guān)系數(shù)絕對值大于 0.3。兩站相對濕度的相關(guān)系數(shù)絕對值均大于 0.2,是較為理想的計(jì)算因子。
通過第2節(jié)的統(tǒng)計(jì)分析,排除與能見度相關(guān)性較小的相對濕度改變量,隨機(jī)挑選70%的樣本數(shù)據(jù),選用不同氣象要素建立能見度計(jì)算模型。利用剩余30%數(shù)據(jù)對模型進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果如表2。
表2 檢驗(yàn)樣本的能見度計(jì)算的單因子TS評分結(jié)果(2017年1月—2018年12月)Table 2 TS score results of visibility forecast from January 2017 to December 2018
觀察表2可以發(fā)現(xiàn),對使用單一因子建立的兩站能見度模型進(jìn)行檢驗(yàn),結(jié)果都是比較穩(wěn)定的。隨著計(jì)算因子不斷增多,檢驗(yàn)結(jié)果就會(huì)變得復(fù)雜起來。選取相對濕度、有效降溫及溫度改變量這三項(xiàng)作為石家莊站能見度模型的計(jì)算因子時(shí),該站1級(jí)別能見度的TS評分以及準(zhǔn)確率是最高的。繼續(xù)增加因子反而會(huì)降低這1級(jí)別能見度的TS評分。觀察秦皇島站的結(jié)果可知,選取相對濕度、有效降溫這兩項(xiàng)作為秦皇島站能見度模型的計(jì)算因子時(shí),該站1級(jí)別能見度的TS評分最高,達(dá)到了0.3,準(zhǔn)確率達(dá)到了55%。繼續(xù)增加計(jì)算因子,反而會(huì)導(dǎo)致該站準(zhǔn)確率降低。由此可見,挑選關(guān)鍵因子建立能見度模型是必要的。
接下來分別使用相對濕度,相對濕度和有效降溫,相對濕度、有效降溫和溫度改變量,作為神經(jīng)網(wǎng)絡(luò)輸入因子,進(jìn)而得到石家莊站三種能見度計(jì)算模型并檢驗(yàn)(見圖4)。圖中橫坐標(biāo)為實(shí)際級(jí)別,即對歷史觀測的能見度進(jìn)行分級(jí)??v坐標(biāo)為預(yù)報(bào)級(jí)別,即對模型計(jì)算所得的能見度進(jìn)行分級(jí)。圖中綠色方框內(nèi)數(shù)字代表模型計(jì)算的能見度與歷史觀測的能見度級(jí)別相同的個(gè)數(shù),下方百分?jǐn)?shù)代表該樣本數(shù)占總樣本數(shù)的百分比。黃色方框內(nèi)數(shù)字代表模型計(jì)算的能見度與歷史觀測的能見度級(jí)別不同的個(gè)數(shù)。淺藍(lán)色方塊中綠色及紅色百分?jǐn)?shù)分別代表方塊所在級(jí)別正確樣本百分比和錯(cuò)誤樣本百分比。深藍(lán)色方塊內(nèi)的百分?jǐn)?shù)代表準(zhǔn)確率。
觀察圖4(a)可以發(fā)現(xiàn),當(dāng)選取相對濕度作為石家莊站能見度模型的計(jì)算因子時(shí),1 級(jí)別能見度的空報(bào)率(即第一行中黃色方塊內(nèi)的數(shù)值之和除以第一行中綠色方塊與黃色方塊中數(shù)值總和,也就是第一行淺藍(lán)色方塊中的紅色百分?jǐn)?shù))為59.6%,該模型會(huì)將屬于2級(jí)別能見度的34個(gè)樣本計(jì)算為1級(jí)別;漏報(bào)率(即第一列中黃色方塊內(nèi)的數(shù)值之和除以第一列中綠色方塊與黃色方塊內(nèi)的數(shù)值總和,即第一列淺藍(lán)色方塊中的紅色百分?jǐn)?shù))為28.1%;該模型算計(jì)1級(jí)別的TS評分為0.35。2 級(jí)別的空報(bào)率為47.7%,該模型將3級(jí)別樣本中很大一部分計(jì)算為了2級(jí)別樣本,漏報(bào)率為17.4%。相比于1級(jí)別,該模型計(jì)算得出的2級(jí)別漏報(bào)率及空報(bào)率明顯較低,準(zhǔn)確率為56.5%;圖4(b)中,當(dāng)選取相對濕度、有效降溫作為石家莊站能見度模型的計(jì)算因子時(shí),相較于上一個(gè)計(jì)算模型,該模型對1級(jí)別能見度的空報(bào)率降低為50.9%,同時(shí)漏報(bào)率下降到12.5%,對于低能見度事件預(yù)報(bào),提升效果是顯著的。2級(jí)別的空報(bào)率及漏報(bào)率略有增加,且仍將大量的3級(jí)別樣本計(jì)算為2級(jí)別事件;準(zhǔn)確率下降為54.6%;圖4(c)當(dāng)選取相對濕度、有效降溫、溫度改變量作為石家莊站能見度模型的計(jì)算因子時(shí),該模型對1級(jí)別能見度的漏報(bào)率下降為6.2%,同時(shí)其空報(bào)率也下降為46.4%,相比上面兩個(gè)模型,三項(xiàng)計(jì)算因子得到的算法模型使得2級(jí)別空報(bào)率顯著下降,同時(shí)準(zhǔn)確率顯著增大,達(dá)到了60.8%??偨Y(jié)發(fā)現(xiàn),隨著計(jì)算因子的不斷增加,石家莊站能見度計(jì)算模型對于2級(jí)別能見度預(yù)報(bào)的傾向會(huì)減小,由此提升了模型的準(zhǔn)確率。
圖4 石家莊站能見度計(jì)算結(jié)果檢驗(yàn)Fig.4 Visibility forecast result verification at Shijiazhuang Station
觀察圖5(a)可以發(fā)現(xiàn),當(dāng)選取相對濕度作為秦皇島站能見度模型計(jì)算因子時(shí),該模型對1級(jí)別能見度的空報(bào)率為66.7%,漏報(bào)率為36.2%,對1級(jí)別能見度的TS評分為0.28。對2 級(jí)別能見度的空報(bào)率為58.5%,漏報(bào)率為47.8%,將近大量3級(jí)別能見度樣本計(jì)算為2級(jí)別能見度;圖5(b)中,當(dāng)選取相對濕度、有效降溫作為秦皇島站能見度模型計(jì)算因子時(shí),該模型較僅適用相對濕度建立的能見度模型,對1級(jí)別能見度的空報(bào)率及漏報(bào)率有所降低,這反映出模型對于1級(jí)別事件計(jì)算能力提升了,同時(shí)模型對1級(jí)別能見度的TS評分達(dá)到了0.3。同時(shí)該模型對2級(jí)別能見度的空報(bào)率及漏報(bào)率顯著降低,同時(shí)準(zhǔn)確率達(dá)到了56.5%;圖5(c)當(dāng)選取相對濕度、有效降溫和溫度改變量作為秦皇島站能見度模型計(jì)算因子時(shí),得到的能見度模型對于各級(jí)別能見度預(yù)報(bào)能力下降。由此可知,挑選關(guān)鍵因子建立的能見度模型,預(yù)報(bào)效果更佳。
圖5 秦皇島站能見度計(jì)算結(jié)果檢驗(yàn)Fig.5 Visibility forecast result verification at Qinhuangdao Station
通過對石家莊站和秦皇島站兩個(gè)自動(dòng)氣象站2017年1月—2018年12月逐小時(shí)觀測資料進(jìn)行分析,分布挑選兩站能見度影響因子。隨機(jī)挑選70%的樣本數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)方法建立能見度計(jì)算模型,并利用剩余30%數(shù)據(jù)進(jìn)行檢驗(yàn),得到如下結(jié)論:
(1)大氣能見度與氣象要素的頻率分布特征在石家莊站和秦皇島站有明顯不同。當(dāng)石家莊站溫度在20 ℃、相對濕度為90%;秦皇島站溫度在7 ℃,相對濕度為98%時(shí),出現(xiàn)1級(jí)能見度概率最大。
(2)通過分析氣象要素和能見度的相關(guān)性可以發(fā)現(xiàn),兩站均顯示相對濕度和有效降溫與能見度的相關(guān)性較強(qiáng)。1級(jí)能見度時(shí),秦皇島站相對濕度與能見度的負(fù)相關(guān)系數(shù)最大,而石家莊站則是有效降溫和溫度改變量與能見度的相關(guān)性最好。這可能是由于內(nèi)陸地區(qū)出現(xiàn)低能見度天氣主要以輻射霧為主,而沿海地區(qū)以平流霧居多。
(3)通過使用循環(huán)神經(jīng)網(wǎng)絡(luò)來建立基本要素和能見度的計(jì)算模型發(fā)現(xiàn),基于單一因子建立的計(jì)算模型TS評分較低,但隨著計(jì)算因子的不斷增多,計(jì)算的效果也不一定會(huì)變得更好。秦皇島站采用相對濕度和有效降溫作為計(jì)算因子時(shí),1、2級(jí)別能見度的TS評分最高,準(zhǔn)確率達(dá)56%。石家莊站采用相對濕度、有效降溫和溫度改變量作為計(jì)算因子時(shí),1、2級(jí)別能見度的TS評分最高。
使用循環(huán)神經(jīng)網(wǎng)絡(luò)方法建立的能見度模型,對于低能見度事件的空報(bào)率較高,可能與建模時(shí)低能見度樣本較少有關(guān)。今后工作將用更多自動(dòng)氣象站資料,對不同地理環(huán)境的站點(diǎn)進(jìn)行更細(xì)致分區(qū),篩選出適合各分區(qū)的能見度影響因子,最終利用業(yè)務(wù)預(yù)報(bào)模式中的要素,由點(diǎn)及面,得到河北省格點(diǎn)能見度預(yù)報(bào)。
致謝:本文所用的觀測數(shù)據(jù)由河北省氣象局提供,作者對此表示誠摯謝意。
中國海洋大學(xué)學(xué)報(bào)(自然科學(xué)版)2022年12期