鄧小花,魏立新,黃煥卿,張潤宇(國家海洋環(huán)境預(yù)報(bào)中心,北京100081)
?
運(yùn)用支持向量機(jī)方法對數(shù)值模擬結(jié)果的初步釋用
鄧小花,魏立新,黃煥卿,張潤宇
(國家海洋環(huán)境預(yù)報(bào)中心,北京100081)
摘要:基于獲得的海水浴場逐日兩次觀測資料及同期NCEP數(shù)值模擬結(jié)果(提取各種相關(guān)變量),通過求取兩者之間的相互關(guān)系,并采用最優(yōu)子集方法確定了對各預(yù)報(bào)要素具有重要意義的影響因子。針對海水浴場的氣溫、降水及能見度等要素的預(yù)報(bào),應(yīng)用支持向量機(jī)方法建立了相應(yīng)的預(yù)測模型,最終獲得不同海水浴場在不同預(yù)報(bào)時(shí)效、不同預(yù)報(bào)要素的數(shù)值產(chǎn)品釋用結(jié)果。經(jīng)過對比分析,各預(yù)報(bào)要素釋用后的結(jié)果較釋用前在預(yù)報(bào)準(zhǔn)確率方面有較大的提高。
關(guān)鍵詞:支持向量機(jī)方法;NCEP數(shù)值模擬結(jié)果;釋用;氣溫;降水;能見度
支持向量機(jī)(Support Vector Machines簡稱SVM)是Vapnik V N等人提出的基于統(tǒng)計(jì)學(xué)習(xí)理論的小樣本學(xué)習(xí)方法[1-2]。該方法的基本思想是把低維樣本空間的難于線性劃分解決的樣本集通過非線性映射到高維特征空間中,在高維特征空間尋求最優(yōu)劃分超平面,從而實(shí)現(xiàn)樣本空間的非線性分類。在短期的氣候預(yù)測業(yè)務(wù)或短期天氣預(yù)報(bào)中,由于大氣環(huán)流變化的復(fù)雜性和非線性性,決定了大部分的預(yù)報(bào)對象及其對應(yīng)的預(yù)報(bào)因子之間為非線性相關(guān)關(guān)系。目前,國際上應(yīng)用較為廣泛的支持向量機(jī)方法則是一種較為新穎的處理非線性分類和回歸的有效方法[3-4]。
滕衛(wèi)平,俞善賢等[5]應(yīng)用SVM回歸方法在汛期旱澇預(yù)測中進(jìn)行了應(yīng)用研究,通過相關(guān)分析從前期大氣環(huán)流場、海溫場中選取了相關(guān)性較高的預(yù)測因子,建立了浙江省汛期旱澇短期氣候預(yù)測模型,效果較傳統(tǒng)的逐步回歸方法有明顯的提高。楊淑群,芮景析等[6]也利用多年的74項(xiàng)環(huán)流特征量、海溫指數(shù)、相關(guān)區(qū)域海平面氣壓等指數(shù),建立了四川盆地5片區(qū)域降水特多或特少的SVM預(yù)測模型,并進(jìn)行了降水分類預(yù)測試驗(yàn);結(jié)果顯示所建的SVM模型的Ts評分較高。李智才,馬文瑞等[7]利用Nino區(qū)海溫、南方濤動(dòng)指數(shù)、副高面積指數(shù)等預(yù)報(bào)因子,建立了陽泉地區(qū)夏季降水正、負(fù)距平的SVM非線性分類模型;預(yù)報(bào)試驗(yàn)表明,預(yù)報(bào)能力良好。熊秋芬,胡江林等[8]還專門就支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)兩種方法,分別建立了云量預(yù)報(bào)模型;所開展的交叉驗(yàn)證和實(shí)例預(yù)報(bào)的結(jié)果顯示:兩者方法相比而言,SVM的預(yù)報(bào)能力高于人工神經(jīng)網(wǎng)絡(luò)方法,且在計(jì)算速度上有后者無法比擬的優(yōu)勢。吳愛敏,郭江勇等[9]應(yīng)用SVM方法,對甘肅隴東地區(qū)冰雹天氣的主要環(huán)流形勢進(jìn)行了分析,對冰雹分類預(yù)報(bào)進(jìn)行了探討;經(jīng)檢驗(yàn),主要降雹季節(jié)各月有無冰雹分類的正確率大于80%,效果較好。另外,黃玉霞,許東蓓,蒲肅等[10]還應(yīng)用該方法,建立了甘肅省林區(qū)森林火險(xiǎn)分類推理模型;結(jié)果表明該模型具有良好的預(yù)報(bào)能力,預(yù)報(bào)效果明顯優(yōu)于傳統(tǒng)的逐步回歸方法。眾多試驗(yàn)和研究結(jié)果表明,不管是針對短期的氣象預(yù)報(bào)還是短期氣候預(yù)測,運(yùn)用該方法均能取得較為滿意的預(yù)報(bào)結(jié)果。因此,在本文中,針對日最高氣溫、降水及能見度要素的預(yù)報(bào),采用該方法來建模是可行的。
支持向量機(jī)(Support Vector Machine,簡稱為SVM)是一種處理非線性分類和回歸的有效方法。該方法中,“機(jī)”代表機(jī)器學(xué)習(xí)領(lǐng)域中的一些算法,“支持向量”則是指訓(xùn)練集中的某些訓(xùn)練點(diǎn)的輸入系數(shù);該方法也是一種有督促(有導(dǎo)師)學(xué)習(xí)方法,即已知訓(xùn)練點(diǎn)的類別,求訓(xùn)練點(diǎn)和類別之間的對應(yīng)關(guān)系,以便將訓(xùn)練集按照類別分開,或者是預(yù)測新的訓(xùn)練點(diǎn)所對應(yīng)的類別。
用線性回歸函數(shù)f(x)=w·x+b擬合數(shù)據(jù){xi,yi},i= 1,2,…,n,xi∈Rd,yi∈R的問題,根據(jù)SVM理論,若采用線性ε不敏感損失函數(shù)
并引入松弛因子ξi≥0和ξ*i≥0,則問題為在約束條件
下,最小化目標(biāo)函數(shù)
常數(shù)C>0控制對超過誤差ε的樣本的懲罰程度。采用優(yōu)化方法可以得到其對偶問題,即在約束條件
下,對Lagrange因子αi,α*i最大化目標(biāo)函數(shù)
從而獲得回歸模型:
式中,αi,α*i均不為0,對應(yīng)的樣本則是支持向量。如果用核函數(shù)K(xi?xj)替代公式(4),(5)中的內(nèi)積運(yùn)算,則可確定非線性擬和函數(shù)f(x)中的b*,取在邊界上的一點(diǎn),即可確定。有關(guān)非線性核函數(shù)的種類較多,常用的有多項(xiàng)式核函數(shù)、經(jīng)向基核函數(shù)、柯西核函數(shù)等,本文采用經(jīng)向基核函數(shù)。圖1則為支持向量機(jī)分類方法的基本思路。
圖2為本文中所建立的各預(yù)報(bào)要素的釋用模型建立流程圖,其預(yù)報(bào)對象包括日最高氣溫、降水及能見度。
圖1 支持向量機(jī)分類方法基本思路
圖2 釋用模型建立流程圖
本文選取了青島、廈門2個(gè)海水浴場作為南北海水浴場的示范區(qū),所收集到的觀測資料為2011年和2012年海水浴場開放期間所測得。其中,青島海水浴場觀測資料時(shí)間段為2011年7月1日—9月30日和2012年7月1日—9月30日,廈門海水浴場觀測資料時(shí)間段為2011年5月10日—6月12日、2011 年9月1日—10月31日及2012年5月1日—10月20日;觀測要素則包括:風(fēng)向、風(fēng)速、總云量、過去24 h降水量、過去6 h降水量、氣溫、視程等。
另外,模式預(yù)報(bào)場資料為美國NCEP逐6 h一次輸出、預(yù)報(bào)時(shí)效為120 h的模式結(jié)果,模式的空間分辨率為0.5°×0.5°。受觀測資料時(shí)間序列限制,針對不同的海水浴場建模,模式所選用的時(shí)間段與觀測資料時(shí)間段一致。所提取的模式變量主要包括:各等壓面上的位勢高度、溫度、風(fēng)要素、相對濕度、土壤濕度、云水混合比、可降水量等;提取區(qū)域?yàn)榍鄭u、廈門兩個(gè)海水浴場及其周邊地區(qū)模式預(yù)報(bào)數(shù)據(jù)。表1列舉了釋用工作中所用到的主要變量及其具體含義。
由于支持向量機(jī)分類方法在預(yù)報(bào)對象為等級(jí)預(yù)報(bào)時(shí)具有一定的優(yōu)越性,因此,在本部分工作中,日最高氣溫的預(yù)報(bào)表現(xiàn)為訂正等級(jí)預(yù)報(bào),即按照表2將模式日最高氣溫結(jié)果與實(shí)測日最高氣溫結(jié)果之間的差值進(jìn)行相應(yīng)的分類。而所建模型的預(yù)報(bào)結(jié)果-2、-1、0、1或2,則代表了不同的訂正類別。例如預(yù)報(bào)結(jié)果為正時(shí),則代表將在模式氣溫預(yù)報(bào)的基礎(chǔ)上,進(jìn)行相應(yīng)的“降溫”調(diào)整;而當(dāng)預(yù)報(bào)結(jié)果為負(fù)時(shí),則將進(jìn)行相應(yīng)的“升溫”調(diào)整。隨后的能見度預(yù)報(bào)表現(xiàn)為能見度的等級(jí)預(yù)報(bào),降水預(yù)報(bào)表現(xiàn)為降水量的等級(jí)預(yù)報(bào),具體劃分標(biāo)準(zhǔn)分別見表3、表4。
表1 變量說明
表2 預(yù)報(bào)對象的劃分標(biāo)準(zhǔn)(日最高氣溫預(yù)報(bào)模型)
表3 預(yù)報(bào)對象的劃分標(biāo)準(zhǔn)(能見度預(yù)報(bào)模型)
表4 預(yù)報(bào)對象的劃分標(biāo)準(zhǔn)(降水預(yù)報(bào)模型)
4.1氣溫預(yù)報(bào)的訂正
針對海水浴場的氣溫要素預(yù)報(bào),較為關(guān)注的為日最高氣溫預(yù)報(bào),本文以廈門海水浴場為例,因其日最高氣溫較緯度偏北的青島海水浴場更為明顯。將海水浴場逐日最高氣溫實(shí)測資料(受觀測資料限制,取其14時(shí)資料代表日最高氣溫)與對應(yīng)時(shí)刻的模式輸出氣溫結(jié)果進(jìn)行對比后發(fā)現(xiàn):針對預(yù)報(bào)時(shí)效為24 h內(nèi)的模式結(jié)果,57.3%的樣本其實(shí)測氣溫值與模擬氣溫值差值在2℃以內(nèi);32.9%的樣本兩者之間的差值在2<X≤4或-4≤X<-2之間;另外還有9.8%的樣本表明實(shí)測氣溫與模擬氣溫的絕對差值達(dá)4℃以上。同時(shí),隨著模式的預(yù)報(bào)時(shí)效的延長,實(shí)測氣溫值與模式模擬氣溫之差在2℃以內(nèi)的樣本比重進(jìn)一步下降。
為了保證所建模型的“泛化性”,在建模過程中,基于已經(jīng)歸類好的樣本(按照表2—4進(jìn)行歸類劃分),分別選取各不同等級(jí)中的2/3的樣本用于建模,其它1/3的樣本用于檢驗(yàn)。以廈門氣溫預(yù)報(bào)模型(24—48 h預(yù)報(bào)模型)為例,共收集的樣本為266個(gè),其中誤差等級(jí)為-2、-1、0、1、2的樣本數(shù)分別為6個(gè)、19個(gè)、151個(gè)、68個(gè)和22個(gè);因此在建模過程中,分別提取了其中的4個(gè)、13個(gè)、100個(gè)、45個(gè)、15個(gè)樣本構(gòu)建模型,而其它的樣本用于模型的檢驗(yàn)。后面的降水和能見度模型在選取構(gòu)建模型樣本或檢驗(yàn)樣本方面與此類似。
通過求取實(shí)測氣溫與模式各變量之間的相關(guān)性,在24—48 h預(yù)報(bào)時(shí)效的廈門浴場氣溫預(yù)報(bào)模型的建立中,相關(guān)系數(shù)達(dá)到0.37或以上的因子個(gè)數(shù)有11項(xiàng),見表5。通過眾多預(yù)報(bào)模型的預(yù)報(bào)效果的對比,最終篩選出4個(gè)模型用于最終的氣溫預(yù)報(bào)模型的集成,所建模型的準(zhǔn)確率均大于80%。預(yù)報(bào)效果見圖3。
圖3 廈門海水浴場各氣溫預(yù)報(bào)模型預(yù)報(bào)效果檢驗(yàn)(model1—modle4誤差等級(jí)預(yù)報(bào))及模式預(yù)報(bào)效果檢驗(yàn)(誤差等級(jí)分析:real)
圖3中,橫坐標(biāo)為檢驗(yàn)樣本數(shù),縱坐標(biāo)為誤差等級(jí),real代表的是檢驗(yàn)樣本中模式模擬氣溫與實(shí)測氣溫之間的誤差等級(jí)(按照表2進(jìn)行誤差等級(jí)劃分),其中藍(lán)色虛線以左樣本誤差等級(jí)為-1或-2,表明模式模擬氣溫較實(shí)測氣溫明顯偏低;紅色虛線以右樣本誤差等級(jí)為1或2,表明模式模擬氣溫較實(shí)測氣溫明顯偏高;紅色虛線和藍(lán)色虛線之間的樣本則代表模式模擬氣溫值與實(shí)測氣溫值之差在2℃以內(nèi),即誤差等級(jí)為0,其樣本比例不足60%。
圖3中的model1—model4為最終篩選的4個(gè)預(yù)報(bào)模型。從model1給出的誤差訂正等級(jí)可以看出:針對誤差等級(jí)為1或者2的樣本(超過30%),該預(yù)報(bào)模型總體上給出了較好的趨勢訂正,其中較多樣本都給出了1或者2的誤差訂正級(jí)別;同時(shí)可以看出,model2—model4對誤差等級(jí)達(dá)到2的樣本其訂正效果更為明顯。另外,針對較少誤差等級(jí)為-1 和-2的樣本,各預(yù)報(bào)模型也給出了相應(yīng)的誤差等級(jí)訂正。
上述所建立的4個(gè)預(yù)報(bào)模型將用于最終的氣溫預(yù)報(bào)模型的集成預(yù)報(bào),而集成預(yù)報(bào)結(jié)果將有助于預(yù)報(bào)效果的穩(wěn)定。其中,各預(yù)報(bào)模型所用到的具體模式變量見表5。從該表可以看出:各預(yù)報(bào)模型所應(yīng)用到的訂正因子大部分相同,其中,2 m高度層上的氣溫(含周邊區(qū)域)、925 hPa上的氣溫(含周邊區(qū)域)、10 m高度層經(jīng)向風(fēng)速、相對濕度等變量是構(gòu)建氣溫預(yù)報(bào)模型的主導(dǎo)因子。關(guān)于廈門浴場氣溫0—24 h預(yù)報(bào)模型、48—72 h預(yù)報(bào)模型所選用的變量表及對應(yīng)的預(yù)報(bào)模型效果圖略。
經(jīng)過氣溫預(yù)報(bào)模型對廈門海水浴場模式氣溫的進(jìn)一步訂正,不管是0—24 h預(yù)報(bào)時(shí)效(圖略)還是24—48 h預(yù)報(bào)時(shí)效,其釋用結(jié)果與觀測實(shí)況之間的絕對誤差≤2℃內(nèi)的百分率由原來的57%左右提升到80%以上;并且絕對誤差≥4℃的樣本也較釋用前明顯減少。
表5 廈門海水浴場氣溫預(yù)報(bào)各模型所選用的變量(24—48 h預(yù)報(bào)時(shí)效)
表6 青島海水浴場降水預(yù)報(bào)各模型所選用的變量(48—72 h預(yù)報(bào)時(shí)效)
4.2降水預(yù)報(bào)訂正
針對降水預(yù)報(bào),本文主要關(guān)注降水量等級(jí)的預(yù)報(bào),下面的預(yù)報(bào)模型以預(yù)報(bào)時(shí)效為48—72 h的青島海水浴場為例。通過求取降水量與模式各變量之間的相關(guān)性,其相關(guān)系數(shù)達(dá)到0.26以上的因子數(shù)為11個(gè),主要包括對流性降水量、云水、整層可降水量、相對濕度等變量,具體情況見表6。通過眾多預(yù)報(bào)模型的預(yù)報(bào)效果的對比,最終篩選出4個(gè)模型用于最終的降水預(yù)報(bào)模型的集成,預(yù)報(bào)效果見圖4。
圖4中,其橫坐標(biāo)為樣本數(shù),縱坐標(biāo)為24 h降水量等級(jí)。real代表的是實(shí)測降水量等級(jí)(按照表3進(jìn)行劃分),其中,33個(gè)檢驗(yàn)樣本中有9個(gè)樣本為降水樣本,在建立的各預(yù)報(bào)模型中,均能較好的對降水樣本給出較為準(zhǔn)確的晴雨預(yù)報(bào),由于夏季降水具有陣性的特征,所以對降水量的等級(jí)較難把握。
為了更好地對各降水預(yù)報(bào)模型進(jìn)行檢驗(yàn),本文還特地將NCEP模式預(yù)報(bào)的相關(guān)降水變量進(jìn)行了提取和進(jìn)一步處理,將其預(yù)報(bào)效果與所建立的模型預(yù)報(bào)效果進(jìn)行了對比??偟脕碚f,青島海水浴場降水量的預(yù)報(bào)經(jīng)過數(shù)值產(chǎn)品釋用之后,降水預(yù)報(bào)的提升效果較為明顯,可見圖5。圖中,綠色柱狀為降水釋用模型預(yù)報(bào)結(jié)果,藍(lán)色柱狀為觀測結(jié)果,紫色柱狀為NCEP模式對流性降水量,而紅色柱狀為累積過的逐6 h降水量預(yù)報(bào)結(jié)果。需要說明的是,紫色柱狀和紅色柱狀所體現(xiàn)的降水可以直接轉(zhuǎn)換為降水量預(yù)報(bào);譬如紅色柱狀第2個(gè)樣本的37 kg/m2則相當(dāng)于37 mm降水量。
根據(jù)降水觀測資料,在33個(gè)檢驗(yàn)樣本中共有9個(gè)降水樣本,NCEP模式預(yù)報(bào)ACPCP(對流性降水)變量對降水樣本的預(yù)報(bào)準(zhǔn)確次數(shù)為3次,空報(bào)0次,漏報(bào)6次;而APCP06(6 h累積降水量)對降水樣本的預(yù)報(bào)準(zhǔn)確次數(shù)也為3次,空報(bào)0次,漏報(bào)6次;經(jīng)過數(shù)值產(chǎn)品的釋用后,模型對降水樣本的預(yù)報(bào)準(zhǔn)確次數(shù)為8次,空報(bào)0次,漏報(bào)1次。與NCEP模式預(yù)報(bào)相比,釋用后的降水模型預(yù)報(bào)準(zhǔn)確率大幅提高;其效果不僅體現(xiàn)在晴雨預(yù)報(bào)方面,在降水等級(jí)方面,釋用后的降水模型預(yù)報(bào)也更加貼近觀測實(shí)況。從圖5還可以看出,檢驗(yàn)樣本中的第8、第9個(gè)樣本,觀測實(shí)況顯示為中雨和大雨降水過程,NCEP模式預(yù)報(bào)的相關(guān)變量對這兩次降水過程均出現(xiàn)了漏報(bào),而釋用后的降水模型則不僅對這兩次降水過程進(jìn)行了有效預(yù)報(bào),在降水等級(jí)上也有較好的體現(xiàn),預(yù)報(bào)的降水等級(jí)均為中雨。經(jīng)過對各預(yù)報(bào)時(shí)效的降水預(yù)報(bào)模型準(zhǔn)確率的統(tǒng)計(jì),結(jié)果表明:針對青島海水浴場,0—24 h、24—48 h、48—72 h各預(yù)報(bào)時(shí)效其預(yù)報(bào)模型綜合準(zhǔn)確率(晴雨預(yù)報(bào)TS評分)分別為:88%、89%及84%。關(guān)于該浴場降水其它預(yù)報(bào)時(shí)效所建立的預(yù)報(bào)模型所選用的變量表及對應(yīng)的預(yù)報(bào)效果圖略。
圖4 青島海水浴場各降水預(yù)報(bào)模型預(yù)報(bào)效果檢驗(yàn)(model1—modle4降水等級(jí)預(yù)報(bào))及實(shí)測降水分析(降水實(shí)況等級(jí)分析:real)
4.3能見度預(yù)報(bào)
針對廈門海水浴場能見度預(yù)報(bào)模型的建立,首先對收集到的廈門及其周邊地區(qū)的能見度實(shí)況數(shù)據(jù)進(jìn)行統(tǒng)計(jì)后發(fā)現(xiàn):大、小梅沙、汕尾、廈門、平潭、東山及南澳一帶,在每年的5—10月容易出現(xiàn)輻射霧,如圖6所示。該圖橫坐標(biāo)為日數(shù),縱坐標(biāo)為能見度值,灰色柱狀為08時(shí)能見度,藍(lán)色柱狀為14時(shí)能見度;而其中的箭頭所示為輻射霧影響時(shí)間段;即天氣晴朗少云的清晨容易出現(xiàn)10 km以下的能見度,而至下午時(shí)間段,能見度轉(zhuǎn)好,可達(dá)15 km以上。由于輻射霧的形成條件主要包括:(1)冷卻條件:地面散熱迅速,即晴朗少云的夜間或清晨;(2)水汽條件:近低層水汽充沛,濕度越大、濕層越厚,越有利于形成霧;尤其是空氣被雨和潮濕的地面增濕厚,對此類霧形成特別有利;可對應(yīng)模式中的土壤濕度項(xiàng);(3)層結(jié)條件:有逆溫層存在;(4)風(fēng)力不大:微風(fēng)。因此,后續(xù)所開展的工作即從模式中提取了相關(guān)的因子以備建模使用。
圖5 青島海水浴場降水釋用模型(預(yù)報(bào)時(shí)效為48—72 h)檢驗(yàn)效果圖
圖6 廈門海水浴場能見度實(shí)況圖(2012年4月26日—5月31日期間逐日兩次觀測)
根據(jù)輻射霧的形成條件,從模式中提取了相關(guān)的因子,譬如850 hPa溫度與925 hPa溫度之間的溫度差、925 hPa與2 m高度的溫度差、風(fēng)力、風(fēng)向、中低層的相對濕度、土壤濕度及土壤濕度的24 h變化情況等等。其中,土壤濕度及土壤濕度的24 h變化情況是一個(gè)較好的指標(biāo);在土壤濕度已經(jīng)達(dá)到一定的閾值的前提下,由于清晨時(shí)間段土壤的溫度高于近地面的氣溫,致使土壤中的水分不斷蒸發(fā)并遇冷凝結(jié),導(dǎo)致輻射霧的形成。
在具體的建模過程中,通過求取備選因子與能見度之間的相關(guān),將相關(guān)性超過一定閾值的因子提取出來,并進(jìn)行因子的最優(yōu)因子組合,進(jìn)而構(gòu)建了預(yù)測模型。
表7 廈門浴場能見度預(yù)報(bào)各模型所選用的變量(各預(yù)報(bào)時(shí)效)
圖7 廈門海水浴場各能見度預(yù)報(bào)模型預(yù)報(bào)效果(model1—modle4能見度等級(jí)預(yù)報(bào))及能見度實(shí)況分析(能見度實(shí)況等級(jí)分析:real)
在0—24 h預(yù)報(bào)時(shí)效的能見度預(yù)報(bào)模型的建立中,所設(shè)置的相關(guān)系數(shù)閾值為0.34,達(dá)到閾值的因子個(gè)數(shù)為9個(gè)。通過眾多預(yù)報(bào)模型的預(yù)報(bào)效果的對比,最終篩選出4個(gè)模型用于最終的能見度預(yù)報(bào)模型的集成。圖7中,橫坐標(biāo)為檢驗(yàn)樣本數(shù),縱坐標(biāo)為能見度等級(jí),藍(lán)色虛線是能見度為15 km的分界線(虛線以左的樣本能見度小于15 km,以右的樣本大于15 km)。圖中的real代表了檢驗(yàn)樣本中各能見度等級(jí)的實(shí)況,譬如等級(jí)3表明樣本能見度小于10 km;等級(jí)2表明樣本能見度在10—15 km之間;而等級(jí)1代表樣本能見度在15 km以上。從model1—model4的預(yù)報(bào)效果來看,各預(yù)報(bào)模型對能見度小于10 km的樣本把握較為準(zhǔn)確,而對10—15 km的能見度預(yù)報(bào)較難把握;另外,各預(yù)報(bào)模型對能見度的預(yù)報(bào)具有總體“偏差”的趨勢,即針對一些能見度在15 km以上的樣本,預(yù)報(bào)模型仍然給出了10 km以下的預(yù)報(bào)結(jié)論。
表7為廈門海水浴場能見度各預(yù)報(bào)模型在不同預(yù)報(bào)時(shí)效情況下所用到的具體變量??傮w來說,0—24 h預(yù)報(bào)時(shí)效能見度預(yù)報(bào)模型中所用到的變量包括:整層大氣可降水量、土壤濕度(含24 h土壤濕度變化情況)、850 hPa經(jīng)向風(fēng)速切變等;而24—48 h預(yù)報(bào)時(shí)效能見度預(yù)報(bào)模型中所用到的變量則包括:整層大氣可降水量、土壤濕度(含24 h土壤濕度變化情況)、氣溫、850 hPa緯向風(fēng)速切變等;48—72 h預(yù)報(bào)時(shí)效能見度預(yù)報(bào)模型中所用到的變量包括:地表抬升指數(shù)、整層大氣可降水量、土壤濕度、氣溫、850 hPa風(fēng)速切變等。從各不同預(yù)報(bào)時(shí)效能見度預(yù)報(bào)模型所選用的影響因子來看,較大一部分是較為一致的,這表明各預(yù)報(bào)模型總體上可信度較高,并且預(yù)報(bào)效果比較穩(wěn)定。關(guān)于廈門浴場24—48 h、48—72 h能見度預(yù)報(bào)模型效果圖略。
利用收集到的2011年、2012年青島、廈門海水浴場開放期間所收集的觀測資料及對應(yīng)時(shí)間段內(nèi)的NCEP模式預(yù)報(bào)資料,應(yīng)用SVM方法,分別構(gòu)建了2個(gè)海水浴場不同預(yù)報(bào)時(shí)效內(nèi)的氣溫、降水及能見度預(yù)報(bào)模型。將釋用結(jié)果與實(shí)測資料或者模式輸出結(jié)果進(jìn)行比對,主要可以得出以下結(jié)論:
(1)應(yīng)用SVM方法,分別構(gòu)建的各預(yù)報(bào)模型,無論是歷史樣本擬和的精度上(圖略)還是模型的實(shí)際預(yù)測能力,均比較滿意;
(2)與模式結(jié)果相比,各預(yù)報(bào)要素釋用后的結(jié)果較釋用前在預(yù)報(bào)準(zhǔn)確率方面有較大的提高。如經(jīng)過氣溫、降水模型的進(jìn)一步釋用訂正,預(yù)報(bào)結(jié)論與實(shí)測結(jié)果更為接近;
(3)經(jīng)過對能見度要素(模式未能進(jìn)行直接輸出的變量)的診斷,其結(jié)果總體上較為滿意,即各能見度預(yù)報(bào)模型能夠較為準(zhǔn)確地把握住能見度低于10 km的情況;但其預(yù)報(bào)能力仍具有很大的潛力及提升空間。
參考文獻(xiàn):
[1] Vapnik V N. The Nature of Statistical Learning Theory [M]. New York: Springer-Verlag, 2000.
[2] Vapnik V N. Statistical Learning Theory [M]. New York: John wiley & Sons, Inc, 1998: 375-570.
[3]陳永義,俞小鼎,高學(xué)浩,等.處理非線性分類和回歸問題的一種新方法(Ⅰ)——支持向量機(jī)方法簡介[J].應(yīng)用氣象學(xué)報(bào), 2004, 15 (3): 345-354.
[4]馮漢中,陳永義.處理非線性分類和回歸問題的一種新方法(Ⅱ)——支持向量機(jī)方法在天氣預(yù)報(bào)中的應(yīng)用[J].應(yīng)用氣象學(xué)報(bào), 2004, 15(3): 355-565.
[5]滕衛(wèi)平,俞善賢,胡波,等. SVM回歸法在汛期旱澇預(yù)測中的應(yīng)用研究[J].浙江大學(xué)學(xué)報(bào)(理學(xué)版), 2008, 35(3): 343-347, 354.
[6]楊淑群,芮景析,馮漢中.支持向量機(jī)(SVM)方法在降水分類預(yù)測中的應(yīng)用[J].西南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2006, 28(2): 252-257.
[7]李智才,馬文瑞,李素敏,等.支持向量機(jī)在短期氣候預(yù)測中的應(yīng)用[J].氣象, 2006, 32(5): 57-61.
[8]熊秋芬,胡江林,陳永義.天空云量預(yù)報(bào)及支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)方法比較研究[J].熱帶氣象學(xué)報(bào), 2007, 23(3): 255-260.
[9]吳愛敏,郭江勇,張洪芬,等.支持向量機(jī)方法在冰雹預(yù)報(bào)中的應(yīng)用[J].干旱氣象, 2005, 23(4): 41-45.
[10]黃玉霞,許東蓓,蒲肅. SVM方法在森林火險(xiǎn)預(yù)測中的應(yīng)用[J].林業(yè)科學(xué), 2007, 43(10): 77-82.
Preliminary interpretation and utilization of NCEP simulation results using the SVM
DENG Xiao-hua, WEI Li-xin, HUANG Huan-qing, ZHANG Run-yu
(National Marine Environmental Forecasting Center, Beijing 100081 China)
Abstract:Based on the correlation between the observed data and the numerical simulation results from NCEP, the main influencing factors for different forecasting objects, for instance, temperature, precipitation, visibility and so on, were obtained. Furthermore, the SVM provided an effective and feasible way to construct the corresponding forecast models. Comparing with the direct outputs of the model, the interpretation and utilization of numerical simulations showed great improvement.
Key words:SVM;numerical simulation results;interpretation;temperature;precipitation;visibility
作者簡介:鄧小花(1982-),女,工程師,碩士研究生,主要從事海洋氣象預(yù)報(bào)工作。E-mail: dengxh@nmefc.gov.cn
基金項(xiàng)目:國家海洋局海洋公益性行業(yè)科研專項(xiàng)(201005036)
收稿日期:2014-03-27
DOI:10.11737/j.issn.1003-0239.2015.02.003
中圖分類號(hào):P732
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1003-0239(2015)02-0014-10