彭科曼,劉 博,陳海鳳,田 程
(1.貴州省貴陽(yáng)市氣象臺(tái),貴州 貴陽(yáng) 550001;2.天津市氣象臺(tái),天津 300074)
貴陽(yáng)遷站后霧的氣候特征及預(yù)報(bào)模型研究*
彭科曼1,劉 博2,陳海鳳1,田 程1
(1.貴州省貴陽(yáng)市氣象臺(tái),貴州 貴陽(yáng) 550001;2.天津市氣象臺(tái),天津 300074)
該文利用貴陽(yáng)基準(zhǔn)站2000—2013年的地面觀測(cè)資料,運(yùn)用線性分析、相關(guān)分析等方法對(duì)貴陽(yáng)2000年遷站后霧的氣候特征進(jìn)行分析,結(jié)果表明:貴陽(yáng)的年霧日分布不均,總體呈增長(zhǎng)趨勢(shì);霧的盛發(fā)期在冬季,占全年的36.81%;霧在06—08時(shí)生成的概率比較高;09時(shí)左右消散的概率最高,持續(xù)時(shí)間多在6 h以下。該文還采用了CIMISS數(shù)據(jù)庫(kù)2000—2015年的逐日氣象資料,運(yùn)用決策樹方法建立統(tǒng)計(jì)模型來對(duì)貴陽(yáng)霧的預(yù)報(bào)進(jìn)行初探,命中率達(dá)到76.19%,該預(yù)報(bào)結(jié)果能夠基本滿足預(yù)報(bào)需求,為預(yù)報(bào)員提供一定參考。
貴陽(yáng);霧;氣象要素;決策樹
霧是近地面層空氣中懸浮著的大量水滴或冰晶微粒而使水平能見度小于1 km的天氣現(xiàn)象,是一種常見的災(zāi)害性天氣。霧對(duì)交通的危害很大,同時(shí)還會(huì)加劇近地層的空氣污染,危害身體健康[1〗[2-6],如劉玉英等[2〗對(duì)吉林省霧的氣候特征及變化成因進(jìn)行了分析;賀皓等[3〗運(yùn)用數(shù)值預(yù)報(bào)釋用技術(shù)、統(tǒng)計(jì)學(xué)方法和診斷分析方法對(duì)陜西省的大霧進(jìn)行了研究;羅喜平等[4〗利用貴州省84個(gè)觀測(cè)站的觀測(cè)資料以及9個(gè)地州市代表站的氣溫、地溫和相對(duì)濕度資料較為全面的分析了貴州省霧的時(shí)間、空間分布特征(其中對(duì)貴陽(yáng)市霧的分析研究截止到1999年),研究表明,霧的氣候特征具有明顯的地域性差異,因此研究本地霧的氣候特征以及發(fā)生規(guī)律,具有很大的現(xiàn)實(shí)意義。由于貴陽(yáng)基準(zhǔn)站于2000年遷站,新舊兩站的海拔高度相差較大,對(duì)霧的觀測(cè)有較大差異。目前學(xué)者們對(duì)貴陽(yáng)遷站后霧的特征研究較少,并且在2014年之后,能見度觀測(cè)由人工觀測(cè)改為了能見度儀自動(dòng)觀測(cè),由于觀測(cè)方式的差異,使得能見度觀測(cè)結(jié)果存在一定的差異,因此本文主要研究貴陽(yáng)2000—2013年霧的氣候特征,并采用決策樹方法建立統(tǒng)計(jì)模型來對(duì)貴陽(yáng)霧的預(yù)報(bào)進(jìn)行初探,以期對(duì)霧的預(yù)報(bào)提供參考。
2.1 資料
本文所使用的氣象數(shù)據(jù)來自于貴陽(yáng)基準(zhǔn)站2000—2013年的地面觀測(cè)資料以及CIMISS數(shù)據(jù)庫(kù)2000—2015年的逐日氣象資料,通過數(shù)據(jù)質(zhì)量控制后處理為時(shí)間序列和氣象要素完整的逐日氣象數(shù)據(jù)。霧日的記錄以觀測(cè)資料為準(zhǔn),一天之中任一時(shí)次能見度小于1 km,均定義為一個(gè)霧日。
2.2 研究方法
2.2.1 本文主要采用了線性分析和相關(guān)分析等氣候診斷方法來研究貴陽(yáng)遷站后霧的氣候特征。
2.2.2 決策樹 本文采用決策樹方法初步嘗試了對(duì)貴陽(yáng)霧日進(jìn)行預(yù)報(bào)。
決策樹是一種統(tǒng)計(jì)學(xué)分類算法,是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)算法,代表了對(duì)象的屬性和值之間的映射關(guān)系,能夠從一組無次序、無規(guī)則的元組中推理出決策樹表示形式的分類規(guī)則[7]??梢姡捎脹Q策樹方法進(jìn)行霧日和非霧日的分類預(yù)報(bào)具有直觀、便捷的特點(diǎn),故本文選取決策樹方法嘗試對(duì)貴陽(yáng)霧日進(jìn)行預(yù)報(bào)。本研究采用C4.5算法來進(jìn)行決策樹分類[8],該方法能夠選擇具有最大增益率的屬性作為分裂屬性,對(duì)目標(biāo)類進(jìn)行最佳的分割。
3.1 霧的年際變化
圖1 2000—2013年貴陽(yáng)市霧日的年際變化Fig.1 The annual variation of foggy days in Guiyang from 2000 to 2013
經(jīng)統(tǒng)計(jì),2000—2013年貴陽(yáng)的年平均霧日為41 d。從圖1可以看出,貴陽(yáng)的年霧日分布不均,總體呈增長(zhǎng)趨勢(shì),2006年以前,增長(zhǎng)得比較迅速,在2006年達(dá)到第一個(gè)峰值,為61 d,之后略有下降;又在2012年陡增,霧日達(dá)到最多,為81 d。霧日最少年為2001年,僅有17 d。
3.2 霧的季節(jié)變化
圖2 貴陽(yáng)市2000—2013年各季節(jié)霧日數(shù)占全年 霧日總數(shù)的比例Fig.2 The proportion of each season’s foggy days to the whole year in Guiyang from 2000 to 2013
從圖2可以看出,四季中,貴陽(yáng)冬季霧最多,占全年的36.81%,春季最少,為19.79%,夏季、秋季分別為20.83%、22.57%。
冬季冷空氣頻繁,貴陽(yáng)多處于變性冷高壓控制下,近地面大氣層結(jié)較穩(wěn)定,夜間輻射降溫加劇,且多靜風(fēng)、微風(fēng),在低層水汽充足的情況下,易形成輻射霧[9],并且冬季云貴靜止鋒比較活躍,受靜止鋒的影響,貴陽(yáng)地區(qū)常常有鋒面霧出現(xiàn)。因此與春、夏、秋三個(gè)季節(jié)相比,冬季貴陽(yáng)霧日明顯偏多。
3.3 霧的月際變化
圖3 貴陽(yáng)市2000—2013年月平均霧日數(shù)Fig.3 Monthly average number of foggy days in Guiyang from 2000 to 2013
經(jīng)統(tǒng)計(jì),2000—2013年,貴陽(yáng)月均霧日數(shù)為3.4 d。從圖3可以看出,月均霧日數(shù)多于平均值的月份有:1—3月、6月、10—12月,其余各月的月均霧日數(shù)均低于平均值。貴陽(yáng)霧的盛發(fā)期出現(xiàn)在1、2、12月,均在5 d以上,4月、9月霧日較少,分別為2.0 d、1.9 d。
3.4 霧的生消和持續(xù)時(shí)間
掌握霧的生消和持續(xù)時(shí)間的氣候特征,對(duì)于規(guī)避霧天帶來的危害具有重要的意義,因此本文對(duì)貴陽(yáng)站2000—2013年霧的生成時(shí)間、消散時(shí)間和持續(xù)時(shí)間進(jìn)行了統(tǒng)計(jì),統(tǒng)計(jì)時(shí)規(guī)定,當(dāng)生成時(shí)間處于兩個(gè)整點(diǎn)之間時(shí),按第一個(gè)整點(diǎn)來統(tǒng)計(jì),當(dāng)消散時(shí)間處于兩個(gè)整點(diǎn)之間時(shí),按第二個(gè)整點(diǎn)來統(tǒng)計(jì)[2],例如,當(dāng)生成時(shí)間為09時(shí)20分,作為09時(shí)來統(tǒng)計(jì),當(dāng)消散時(shí)間為10時(shí)35分,作為11時(shí)來統(tǒng)計(jì)。從圖4可以看出,霧在06—08時(shí)生成的概率比較高,合計(jì)出現(xiàn)概率為45.0%,其中06時(shí)是全天各時(shí)次中出現(xiàn)概率最高的,為16.9%;霧的消散時(shí)間主要出現(xiàn)在08—11時(shí)以及20時(shí),合計(jì)出現(xiàn)概率為59.2%,其中09時(shí)是全天各時(shí)次中出現(xiàn)概率最高的,為20.9%。霧消散的最高概率出現(xiàn)的時(shí)段比生成的最高概率出現(xiàn)的時(shí)段要晚2~3 h。從霧的生消時(shí)間多處于早晨來看,貴陽(yáng)站的霧多以輻射霧為主,夜間氣溫下降,空氣濕度逐漸增加,早晨日出前氣溫最低,空氣濕度最大,因此有利于形成霧,日出后,隨著氣溫上升,空氣濕度減小,霧逐漸消散。從霧的持續(xù)時(shí)間來看(表1),持續(xù)時(shí)間在6 h以內(nèi)的,占總數(shù)的85.2%,其中持續(xù)時(shí)間在3 h以內(nèi)的出現(xiàn)概率最高,為61.7%。從持續(xù)時(shí)間上也可看出,貴陽(yáng)站出現(xiàn)的霧多屬于輻射霧。
圖4 貴陽(yáng)市2000—2013年霧的生消時(shí)間概率的日變化Fig.4 The diurnal variation of the probability of the time of fog formation and dispersion in Guiyang from 2000 to 2013
持續(xù)時(shí)間(h)0~34~67~12>12概率(%)61723511929
決策樹方法對(duì)于判別霧日及類似的分類氣象預(yù)報(bào)具有直觀、便捷的特點(diǎn),適于對(duì)霧日和非霧日進(jìn)行分類預(yù)報(bào)。故本文選取決策樹方法嘗試對(duì)貴陽(yáng)霧日進(jìn)行預(yù)報(bào)。
4.1 預(yù)報(bào)因子的篩選
選取不同的預(yù)報(bào)因子進(jìn)入模型,對(duì)最終的預(yù)報(bào)準(zhǔn)確率影響很大。由于各個(gè)氣象要素之間存在共線性的作用,對(duì)預(yù)報(bào)效果會(huì)有一定影響,因此綜合氣象要素與霧日的相關(guān)性分析結(jié)果,結(jié)合已有數(shù)值模式可預(yù)報(bào)的氣象要素,本文共篩選出3組預(yù)報(bào)因子對(duì)霧日和非霧日的分類判別進(jìn)行預(yù)報(bào)模型的建立,通過對(duì)3個(gè)模型預(yù)報(bào)準(zhǔn)確率的比較確定最優(yōu)模型。
第1組預(yù)報(bào)因子按照相關(guān)性大小來進(jìn)行篩選(表2),對(duì)2000—2015年逐日氣象要素和每日08時(shí)的氣象要素進(jìn)行普查,從(溫、壓、濕、風(fēng)、降水)各類氣象要素中分別選取出與日最小水平能見度相關(guān)性最大的要素作為預(yù)報(bào)因子輸入模型;第2組預(yù)報(bào)因子為日氣象要素;第3組預(yù)報(bào)因子僅包括08時(shí)氣象要素。
表2 各氣象要素與日最小水平能見度的相關(guān)性大小Tab.2 The correlation between the meteorological factors and the minimum visibility
注:**在置信度(雙測(cè))為 0.01 時(shí),相關(guān)性是顯著的
篩選的預(yù)報(bào)因子如表3所示:
表3 預(yù)報(bào)因子篩選結(jié)果Tab.3 The results of selected predictors
4.2 劃分訓(xùn)練集和驗(yàn)證集
本文選取貴陽(yáng)站進(jìn)行預(yù)報(bào)試驗(yàn),氣象數(shù)據(jù)來自于CIMISS數(shù)據(jù)庫(kù)2000—2015年的逐日氣象資料,以日最小能見度小于1 km確定為一個(gè)霧日。將確定好的霧日作為決策樹分類的目標(biāo)變量,1為有霧,0為無霧。通過對(duì)原始?xì)庀髷?shù)據(jù)中缺省數(shù)據(jù)的處理及空值的剔除,最終獲得5 738個(gè)樣本(包括霧日和非霧日)。在預(yù)報(bào)模型的建立過程中發(fā)現(xiàn),由于非霧日樣本數(shù)遠(yuǎn)多于霧日樣本數(shù),模型確定分枝節(jié)點(diǎn)時(shí),會(huì)更多的考慮非霧日的預(yù)報(bào)準(zhǔn)確率,而忽視了霧日的預(yù)報(bào)準(zhǔn)確率,因此對(duì)樣本進(jìn)行預(yù)處理,隨機(jī)抽取(按時(shí)間序列均勻分布)非霧日樣本的1/7,使其樣本數(shù)與霧日樣本數(shù)基本一致,最終確定進(jìn)行預(yù)報(bào)模型建立和檢驗(yàn)的非霧日樣本數(shù)為713個(gè),霧日樣本數(shù)為722個(gè)。將所有樣本按照時(shí)間序列排序,取其前90%時(shí)間序列(2000年—2014年4月)為訓(xùn)練集,并進(jìn)行10%交叉測(cè)試,后10%(2014年5月—2015年12月)為驗(yàn)證集。
4.3 建立決策樹模型
本文使用weka軟件,采用c4.5算法建立決策樹。步驟如下:
①數(shù)據(jù)預(yù)處理。
②通過訓(xùn)練集建立決策樹模型并在運(yùn)行過程中進(jìn)行10%數(shù)據(jù)交叉驗(yàn)證,最終挑選擬合準(zhǔn)確率最高的決策樹來確定模型。
③保存決策樹結(jié)果。
④進(jìn)行驗(yàn)證集準(zhǔn)確率測(cè)試。
將3組預(yù)報(bào)因子分別建立決策樹模型,預(yù)報(bào)結(jié)果如表4所示。
表4 3組預(yù)報(bào)因子所建立的決策樹模型預(yù)報(bào)結(jié)果對(duì)比Tab.4 The comparison of decision tree model forecast results set up by three sets of predictors
最終根據(jù)預(yù)報(bào)準(zhǔn)確率和可行性(有些預(yù)報(bào)因子無模式直接預(yù)報(bào)結(jié)果),確定最優(yōu)預(yù)報(bào)模型為第3組預(yù)報(bào)因子建立的預(yù)報(bào)模型(圖5),即采用08時(shí)氣象要素對(duì)霧日預(yù)報(bào)命中率最高,且漏報(bào)率和空?qǐng)?bào)率都最低。采用該模型對(duì)驗(yàn)證集(2014年5月—2015年12月)的105個(gè)霧日進(jìn)行預(yù)報(bào),共命中80個(gè)霧日。
圖5 最優(yōu)決策樹模型Fig.5 The optimal Decision Tree Model
該預(yù)報(bào)結(jié)果能夠基本滿足預(yù)報(bào)需求,但準(zhǔn)確率仍有提升空間,今后會(huì)嘗試添加新的預(yù)報(bào)因子來對(duì)霧進(jìn)行預(yù)報(bào),如EC細(xì)網(wǎng)格預(yù)報(bào)的850 hPa溫度、10 m風(fēng)速等,以期能達(dá)到更好的預(yù)報(bào)效果,為提高貴陽(yáng)霧日預(yù)報(bào)的準(zhǔn)確率提供參考。
①貴陽(yáng)的年霧日分布不均,總體呈增長(zhǎng)趨勢(shì);霧的盛發(fā)期出現(xiàn)在1月、2月和12月;4月、9月的霧日較少;四季中,貴陽(yáng)冬季霧最多,占全年的36.81%。霧在06—08時(shí)生成的概率比較高;09時(shí)左右消散的概率最高,持續(xù)時(shí)間多在6h以下。
②本文運(yùn)用決策樹方法,結(jié)合相關(guān)分析方法通過多次比對(duì)預(yù)報(bào)因子進(jìn)行決策樹預(yù)報(bào)試驗(yàn),選取了與霧日的預(yù)報(bào)相關(guān)性最高的一組預(yù)報(bào)因子,嘗試對(duì)貴陽(yáng)霧日進(jìn)行預(yù)報(bào),最終建立的預(yù)報(bào)模型預(yù)報(bào)命中率達(dá)到76.19%。該預(yù)報(bào)結(jié)果能夠滿足預(yù)報(bào)需求,為預(yù)報(bào)員提供一定參考。
[1〗 周斌斌.論霧與污染的關(guān)系[J〗.氣象,1994,20(9):19-24.
[2〗 劉玉英,李宇凡,張婷,等.吉林省霧的氣候特征及變化成因分析[J〗.地理科學(xué),2015,35(8):1 060-1 066.
[3〗 賀皓,劉子臣,徐虹,等.陜西省高等級(jí)公路大霧的預(yù)報(bào)方法研究[J〗.陜西氣象,2003(1):7-10.
[4〗 羅喜平,楊靜,周成霞.貴州省霧的氣候特征研究[J〗.北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,44(5):765-772.
[5〗 高陽(yáng)華,冉榮生.重慶市霧的區(qū)域分布及變化特征[J〗.貴州氣象,1999(6):3-5.
[6〗 周濤,周成霞.貴州霧的時(shí)空分布特征[J〗.貴州氣象,2005,29(s1):32-34.
[7〗 Tan Pang-Ning,Steinbach Michael,Kumar Vipin,數(shù)據(jù)挖掘?qū)д揫M〗:北京:人民郵電出版社,2006.
[8〗 林玲玲.基于C4.5算法的高血壓分類規(guī)則提取的研究[D〗:太原理工大學(xué),2012.
[9〗 童堯青,銀燕,許遐禎.南京地區(qū)霧的氣候特征[J〗.南京氣象學(xué)院學(xué)報(bào),2009,32(1):115-120.
Study on climatic characteristics and forecast model of fog inGuiyang after relocation
PENG Keman1, LIU Bo2, CHEN Haifeng1, TIAN Cheng1
(1.Guiyang Meteorological Observatory, Guiyang, 550001, China;2.Tianjin Meteorological Observatory, Tianjin 300074, China)
Based on the surface observation data of Guiyang station in 2000-2013, the study analyzed the climatic characteristics of fog in Guiyang after relocation using linear analysis and correlation analysis method. The results show that the annual distribution of foggy days in Guiyang is uneven, and the annual trend of foggy days is increasing. Foggy days are concentrated in winter, accounting for 36.81% of the whole year. Fog usually forms from 6:00 to 8:00 and disperses at 9:00, while the duration of fog is usually less than 6 hours. And a fog prediction model, whose accuracy reached 76.19%, was constructed by Decision Tree Method according to meteorological data from 2000 to 2015 of CIMISS. The forecast results can basically satisfy the forecast demand and provide reference for the forecaster.
Guiyang; fog; meteorological factors; decision tree method
2017-01-20
彭科曼(1991—),女,助工,主要從事天氣預(yù)報(bào)工作,E-mail:493069676@qq.com。
貴陽(yáng)市氣象局氣象科研基金項(xiàng)目(筑氣科合201405號(hào))。
1003-6598(2017)03-0051-05
P426.4
B