胡航菲
摘要 利用常規(guī)觀測資料,采用統(tǒng)計分析方法得到霧天氣時各氣象要素指標,然后基于SVM和RF方法建立安陽霧預(yù)報模型,并檢驗分析。結(jié)果表明:相對濕度越大,越易出現(xiàn)低能見度;出現(xiàn)霧時氣溫主要分布在-3~3 ℃,溫度露點差在0~3 ℃,風速大部在0~3 m/s,風向主要為偏南風、西南風,且以偏南風為主;SVM和RF 2種方法對霧分級預(yù)報效果總體一般,相對來說RF效果較好,綜合采用RF方法對霧進行分級預(yù)報。
關(guān)鍵詞 氣象要素;SVM方法;RF方法;霧
中圖分類號:P457.1 文獻標識碼:B 文章編號:2095–3305(2023)07–0148-03
大霧天氣是一種常見的災(zāi)害性天氣。大霧天氣帶來的低能見度會對城市交通、高速公路、機場等交通安全帶來很大危害,而霧一旦與氣溶膠顆粒結(jié)合形成霧霾,將會對空氣質(zhì)量、人體健康等方面產(chǎn)生嚴重的負面影響。
近年來,已有許多氣象學者對霧進行了大量研究[1-4]。黃彬等[5]對GRAPES-TYM模式海霧預(yù)報性能進行了檢驗,發(fā)現(xiàn)該模式對均壓場形勢下黃海海霧的落區(qū)預(yù)報最準確。馮濤等[6]利用統(tǒng)計方法建立了華北高速公路沿線及鄰近氣象站的霧定量統(tǒng)計預(yù)報模型,檢驗表明該方法具有一定的預(yù)報能力。楊紅子[7]分析研究了烏海市霧的環(huán)流特征和氣象要素變化,最終提煉出了預(yù)報指標—地面相對濕度≤90%,地面風速<3.0 m/s,氣溫日較差在9~16 ℃之間。但是,由于不同地區(qū)的天氣條件不同,霧的預(yù)報技術(shù)存在一定的地域差異。安陽特殊的氣候特點、地形條件及城市布局,使其在大范圍天氣形勢比較穩(wěn)定、濕度條件較好等條件下容易出現(xiàn)霧。在實際業(yè)務(wù)中,由于霧的局地性強、時空分布差異大,其預(yù)報存在較大的難度。
基于安陽市近30年常規(guī)氣象觀測資料,采用支持向量機方法(Support Vector Machine,SVM)和隨機森林方法(Random Forests,RF)分別建立霧預(yù)報模型,并對比檢驗分析,以期建立霧的有效預(yù)報方法,為安陽市霧預(yù)報預(yù)警服務(wù)工作提供參考。
1 資料與方法
1.1 資料
采用1992—2021年安陽市5個縣(市)常規(guī)觀測資料,選用其中的霧日數(shù)據(jù)和氣溫、相對濕度、露點溫度、定時10 min風速、定時10 min風向、小時降水量、能見度等。
根據(jù)地面氣象觀測規(guī)范的定義,霧是指大量微小水滴浮游空中,使水平能見度V<1.0 km的天氣現(xiàn)象。只要出現(xiàn)霧即統(tǒng)計為一個霧日。
1.2 方法
1.2.1 支持向量機方法(Support Vector Machine,SVM) SVM方法是基于統(tǒng)計學理論發(fā)展而來的,它是通過一個非線性映射p,將樣本空間映射到一個高維乃至無窮維的特征空間,使得在原來的樣本空間中非線性可分的問題轉(zhuǎn)化為在特征空間中的線性可分的問題。即升維和線性化。SVM方法在氣象預(yù)報領(lǐng)域,如溫度、暴雨、云量的預(yù)報等方面已經(jīng)取得了一定的進展。
1.2.2 隨機森林方法(Random Forests,RF) RF方法是集合了多個決策樹對樣本進行訓(xùn)練,并預(yù)測的一種分類器。隨機森林方法的基本思想是先應(yīng)用自助法重抽樣技術(shù)從原始訓(xùn)練集中有放回地重復(fù)隨機抽取k個樣本,且每個樣本的樣本容量與原始訓(xùn)練集相同;然后對k個樣本分別建立k個決策樹模型,得到k種分類結(jié)果;最后根據(jù)k種分類結(jié)果對每個記錄進行投票表決,決定其最終分類。大量理論和實踐研究證明,RF方法具有很高的預(yù)測準確率。
2 霧天氣的氣象要素特征
從形成原因來看,影響霧的氣象要素主要有氣溫、相對濕度、溫度露點差、風速等,通過分析可知,在選取的樣本時段,小時雨強主要在0.1~5.0 mm,
占比92.8%,此時能見度大部在2 km以上,占比77.3%,而本研究預(yù)報的重點是霧天氣的能見度情況,因此,暫時不考慮降水對能見度的影響。
從表1可以看出,在霧天氣時,影響能見度的主要因子是相對濕度和溫度露點差,其次是氣溫。除能見度與相對濕度呈負相關(guān)外,與其余氣象要素均呈正相關(guān)。
水汽飽和是霧形成和發(fā)展必不可少的條件之一,而飽和水汽壓與氣溫關(guān)系密切,故氣溫對霧的形成很重要。對于不同類型的霧,風的作用也不同。由圖1可知,出現(xiàn)低能見度時其水汽幾乎是近于飽和的,相對濕度越大,越容易出現(xiàn)低能見度天氣。出現(xiàn)霧時氣溫主要分布在-3~3 ℃,溫度露點差在0~3 ℃,風速大多在0~3 m/s,風向主要為偏南風和西南風,且以偏南風為主。
3 霧預(yù)報方法
在實際業(yè)務(wù)中,霧預(yù)報的重點是霧強度預(yù)報,依據(jù)其強度發(fā)布相應(yīng)級別的預(yù)警信號。霧強度預(yù)報實質(zhì)上是能見度的分級預(yù)報。本研究采用SVM和RF 2種分類算法進行建模,并對比分析,建立霧的有效預(yù)報模型。
3.1 預(yù)報模型的建立
在采用分類算法建模前,先確定分級標準。在建立霧預(yù)報模型時,能見度的分級標準以其等級進行劃分,但由于現(xiàn)有預(yù)報能力對V<200 m的情況預(yù)報效果較差,因此結(jié)合業(yè)務(wù)實際,重點研究0級(V≥10 000 m)、1級(1 000 m≤V<10 000 m)、2級(500 m≤V<1 000 m)和3級(V<500 m)的預(yù)報情況。
在建立模型時需先將訓(xùn)練樣本數(shù)據(jù)離散化處理,再進行預(yù)報因子的確定。SVM中預(yù)報因子的確定采用逐步回歸方法。RF則是將所有預(yù)報因子輸入,在模型建立時自動篩選。以林州為例,由表2可知,模型4的復(fù)相關(guān)系數(shù)最大,結(jié)果最好,因此對于林州考慮采用模型4中的4個因子作為預(yù)報因子建立模型,其余站的因子使用同樣的方法選取。
對于SVM,確定預(yù)報因子后即可輸入訓(xùn)練模型。訓(xùn)練模型以原始樣本的2/3數(shù)據(jù)作為訓(xùn)練樣本,以剩余的1/3數(shù)據(jù)樣本作檢驗,最后將1/3的數(shù)據(jù)樣本預(yù)報結(jié)果與其對應(yīng)的實況進行對比,確定模型優(yōu)劣。而RF相對簡單,將預(yù)報因子輸入建立預(yù)報模型后,使用與SVM相同的方法進行檢驗分析。
3.2 預(yù)報模型檢驗
對能見度分級預(yù)報模型的評價基于5種預(yù)報檢驗方法,分別為級別正確性評分、準確率(GR)、漏報率(PO)、空報率(FAR)和預(yù)報偏差(BS)。級別正確性評分中預(yù)報級別與實況級別完全正確100分,相差一級50分,相差兩級及以上0分。
式(1)~(4),NA為預(yù)報正確樣本數(shù),NB為空報樣本數(shù),NC為漏報樣本數(shù)。
3.3 結(jié)果分析
對SVM和RF方法建立的霧分級預(yù)報模型進行對比檢驗分析,2種方法對能見度分級的總體預(yù)報效果一般,相對來說RF較好。對于5個站點,2種方法均是以林州的預(yù)報效果最好,對安陽、滑縣預(yù)報效果較差。RF和SVM對各縣能見度分級的總體預(yù)報準確率分別為73.4%~75.6%和63.5%~75.1%,能見度級別正確性評分分別為86~87和81~87分。比較而言,RF對SVM方法中預(yù)報準確率較低的站點預(yù)報效果改善較明顯,如安陽站(表3)。
表4是5個站點霧分級預(yù)報的結(jié)果檢驗,0級時RF的預(yù)報準確率明顯高于SVM,RF和SVM對霧的分級預(yù)報準確率分別為56.5%~76.5%和35%~71%。
(1)1級時,2種方法的預(yù)報準確率均高于0級時,SVM的預(yù)報準確率高于RF,對于站點預(yù)報效果的好壞與0級時呈相反情況,1級時對林州預(yù)報效果最差,對安陽和滑縣預(yù)報效果較好。SVM和RF的預(yù)報準確率分別為81%~95%和76.3%~84.2%。
(2)2級時,2種方法對霧分級預(yù)報效果都不理想,幾乎均在10%以下,其中RF的預(yù)報效果稍好,SVM對除林州外的其他站點預(yù)報準確率均為0。
(3)3級時,2種方法對其預(yù)報效果都不太理想,但是其預(yù)報準確率高于2級時,對于安陽、林州、內(nèi)黃,RF預(yù)報效果優(yōu)于SVM,RF和SVM的預(yù)報準確率分別為19.4%~47.2%和1.0%~43.0%;對于湯陰和滑縣SVM預(yù)報效果優(yōu)于RF,SVM和RF的預(yù)報準確率分別為44.0%~60.0%和24.8%~46.4%。
結(jié)合空報率、漏報率和預(yù)報偏差來看,除2級外RF預(yù)報效果均高于SVM。因此,綜合采用RF方法進行能見度分級預(yù)報。且2級和3級的低能見度預(yù)報效果明顯低于0級和1級。一方面,是分級造成的,在進行等級劃分時,0級和1級的數(shù)據(jù)量占總樣本的90%以上,低能見度的樣本量太少,采用RF或SVM時無法充分學習該等級的分類特征,效果較差。另一方面,在建立模型時,僅僅考慮了相對濕度、氣溫、溫度露點差、風速等氣象要素,尚未分析探空數(shù)據(jù)、天氣類型等,這對能見度具有一定的影響。
4 結(jié)論
(1)在霧天氣時,影響能見度的主要因子是相對濕度和溫度露點差,其次是氣溫。在出現(xiàn)霧時,氣溫主要分布在-3~3 ℃,溫度露點差在0~3 ℃,風速大多在0~3 m/s,風向主要為偏南風和西南風,且以偏南風為主。
(2)SVM和RF 2種方法對霧分級的預(yù)報效果總體一般,相對來說RF效果較好。綜合采用RF方法對霧進行分級預(yù)報。
(3)目前,對于低能見度的預(yù)報準確率較低。這可能主要受限于采用的預(yù)報因子數(shù)量、要素預(yù)報的準確率和統(tǒng)計資料的數(shù)量。隨著探空技術(shù)的不斷增強、新資料的挖掘應(yīng)用以及EC細網(wǎng)格預(yù)報產(chǎn)品的進一步豐富,將會進一步提高預(yù)報準確率。
參考文獻
[1] 趙德法.霧對農(nóng)業(yè)生產(chǎn)的影響及相關(guān)措施[J].農(nóng)業(yè)與技術(shù),2017,37(1):144-145.
[2] 王鶴婷,劉小雪,周濤.2019年1月12日:14日雄安新區(qū)大霧過程分析[J].農(nóng)業(yè)災(zāi)害研究,2022,12(8):79-81.
[3] 張慶奎,項陽,王瑩,等.安徽阜陽市大霧天氣的潛勢預(yù)報方法[J].干旱氣象, 2015,33(6):1045-1049.
[4] 劉熙明,胡非,鄒海波,等.北京地區(qū)一次典型大霧天氣過程的邊界層特征分析[J].高原氣象,2010,29(5):1174-1182.
[5] 黃彬,高榮珍,時曉曚.GRAPES-TYM模式對我國東部近海海霧預(yù)報性能評估[J].氣象科技,2022,50(06):783-792.
[6] 馮濤,李迅,丁德平,張德山,等.華北地區(qū)高速公路沿線霧預(yù)報[J].氣象科技, 2011,39(6):719-722.
[7] 楊紅子.烏海市霧預(yù)報指標分析[J].內(nèi)蒙古氣象,2020(3):20-23.
Study on Anyang Fog Forecast Based on SVM and RF Methods
Hu Hang-fei (1.Anyang National Climate Observatory, Anyang, Henan 455000)
Abstract Using conventional observation data and statistical analysis methods to obtain various meteorological element indicators during foggy weather, an Anyang fog prediction model was established based on SVM and RF methods, and the analysis was tested. The results show that the higher the relative humidity, the easier it was for low visibility to occur; When fog occurs, the temperature was mainly distributed at -3 to? 3 ℃, the temperature dew point difference was 0 to 3 ℃, and the wind speed was mostly 0 to 3 m/s. The wind direction was mainly southerly, southwesterly, and mainly southerly. The overall effect of SVM and RF methods on fog classification and prediction was generally average, while the effect of RF was relatively good. RF methods were comprehensively used for fog classification and prediction.
Key words Meteorological elements; SVM method; RF method; Fog