郭鳳娟,王 曼,賈新軍
(1.克拉瑪依氣象局,新疆 克拉瑪依 834000;2.新疆興農(nóng)網(wǎng)信息中心,新疆 烏魯木齊 830002;3.洛浦縣氣象局,新疆 和田 848200)
探空氣球施放高度是高空氣象觀測(cè)業(yè)務(wù)質(zhì)量考核的一項(xiàng)重要指標(biāo),它的高低對(duì)探空質(zhì)量起著至關(guān)重要的作用。提高氣球的升空高度,意味著可收集到更多更全面的高空氣象情報(bào),從而為精細(xì)化天氣預(yù)報(bào)、氣候監(jiān)測(cè)及相關(guān)科學(xué)研究提供更加精確的高空氣象觀測(cè)資料。近年來,隨著L波段高空氣象觀測(cè)系統(tǒng)、新型雷達(dá)等新型高空氣象觀測(cè)系統(tǒng)在全國(guó)各地氣象站陸續(xù)投入使用,中國(guó)氣象局對(duì)探空氣球施放高度考核的要求也越來越高,以非GCOS探空站為例,探空平均高度考核的達(dá)標(biāo)標(biāo)準(zhǔn)已經(jīng)從最初的25 km提高到了目前的28.6 km,提高了3.6 km。因此,加強(qiáng)對(duì)提高氣球施放高度方法的研究,對(duì)于改善和提高我站探空業(yè)務(wù)質(zhì)量具有十分重要的現(xiàn)實(shí)意義。
文獻(xiàn)[1-4]列舉了所有可能影響探空高度的因素,并從定性的角度指出了選擇合適的凈舉力對(duì)提高探空高度的重要性;文獻(xiàn)[5-16]則在研究中結(jié)合實(shí)際資料,進(jìn)一步明確了根據(jù)不同的天氣和季節(jié)選擇合適的凈舉力是提高探空高度的關(guān)鍵,并根據(jù)多年的工作經(jīng)驗(yàn),大致給出了不同季節(jié)和天氣下的凈舉力取值范圍,但沒有對(duì)風(fēng)向、風(fēng)速、溫度、氣壓、濕度、降水量等常規(guī)可控氣象要素如何影響探空施放高度進(jìn)行研究。本課題通過構(gòu)建多元線性回歸數(shù)學(xué)模型,首次從定量角度研究了探空高度與凈舉力及常規(guī)可控氣象要素之間的關(guān)系,給出了不同天氣條件和季節(jié)下可使氣球探空高度達(dá)到理想高度的凈舉力合適取值區(qū)間,從而為高空氣象的觀測(cè)研究提供了堅(jiān)實(shí)的實(shí)踐基礎(chǔ)。
對(duì)2011—2016年以來的放球數(shù)據(jù)進(jìn)行了整理,分別從07時(shí)年平均探空高度、19時(shí)年平均探空高度、全年平均探空高度3個(gè)層面重點(diǎn)分析了克拉瑪依探空氣球施放平均高度的基本規(guī)律,以期對(duì)克拉瑪依近年來的探空情況有個(gè)整體了解,具體分析結(jié)果見圖1。
圖1 2011—2016年克拉瑪依國(guó)家基本氣象站年平均探空高度變化
從2011—2016年這6 a時(shí)間里的年平均探空高度變化圖來看,大致變化趨勢(shì)為:先是逐年緩慢上升,達(dá)到頂峰后,又急劇下降,觸底后又快速上升。具體來說,2011—2013年這3 a年平均探空高度逐年緩慢上升,均超過了28 600 m,在2013年年平均探空高度達(dá)到頂峰,達(dá)到29 208.5 m;從2013—2015年這3 a年平均探空高度呈逐年快速下降趨勢(shì),2015年達(dá)到最低谷,年平均探空高度僅為27 092.31 m;從2015年后,年平均探空高度又快速反彈,呈良好的上升趨勢(shì)。年平均最高探空高度最高與最低相差約2100 m,07時(shí)放球的年平均探空高度變化與年平均探空高度變化趨勢(shì)大致一致,19時(shí)的年平均探空高度與上述兩種情況的變化趨勢(shì)略有不同,2013年19時(shí)放球年平均探空高度低于2012年19時(shí)的年平均探空高度,而2013年07時(shí)的年平均探空高度達(dá)到頂峰,為29 565.52 m,明顯高于2012年07時(shí)的年平均探空高度。由此可見,2013—2015年克拉瑪依年平均放球高度呈現(xiàn)整體下降趨勢(shì),因此,加強(qiáng)相關(guān)研究非常必要且具有十分現(xiàn)實(shí)的意義。
首先篩選出所有可能影響探空高度的因素,并從中選取可控氣象要素進(jìn)行分類,其次從觀測(cè)數(shù)據(jù)中選擇樣本數(shù)據(jù),利用處理后的樣本數(shù)據(jù)進(jìn)行模型初次構(gòu)建,在此基礎(chǔ)上,對(duì)模型進(jìn)行檢驗(yàn)和優(yōu)化。另外,還可以根據(jù)選取及分類的因素,擴(kuò)大樣本數(shù)據(jù)范圍,對(duì)模型進(jìn)行進(jìn)一步的檢驗(yàn)和優(yōu)化,最終確定最優(yōu)的模型,得出主要影響因素的最佳取值范圍。構(gòu)建流程見圖2。
圖2 多元線性回歸模型構(gòu)建流程
多元線性回歸模型的基本原理是研究一個(gè)因變量與兩個(gè)或兩個(gè)以上的自變量之間相關(guān)關(guān)系。給定一個(gè)輸入向量=(x1,x2,...,xp),若期望預(yù)測(cè)輸出值 f,則線性回歸模型的一般形式可以表示為:
典型地,如果獲得n組觀測(cè)數(shù)據(jù)(xi1,xi2,...,xip;yi),其中i=1,2,...n。則上述公式可以表示為:
本課題所用樣本原始數(shù)據(jù)來源于克拉瑪依國(guó)家基本氣象站2011年1月—2017年4月750 g氣象氣球?qū)嶋H觀測(cè)資料,累計(jì)4628次放球數(shù)據(jù),剔除13時(shí)加密觀測(cè)數(shù)據(jù)、20時(shí)重放球數(shù)據(jù)、00時(shí)及01時(shí)測(cè)試數(shù)據(jù),選擇07時(shí)和19時(shí)觀測(cè)記錄共計(jì)4564條數(shù)據(jù)作為有效研究數(shù)據(jù)。選取2016年4月28日至2017年4月28日共計(jì)一年的數(shù)據(jù)作為測(cè)試樣本著重研究?jī)襞e力與常規(guī)可控氣象要素對(duì)探空高度的影響。
影響探空高度的因素很多,比如氣球本身的質(zhì)量、氣球的充灌程序、氫氣的純度、天氣狀況、凈舉力控制等,這些因素都對(duì)探空氣球的施放高度有不同程度的影響。根據(jù)長(zhǎng)期從事探空工作且經(jīng)驗(yàn)豐富專家的建議和查閱大量研究文獻(xiàn),最終選取凈舉力及天氣現(xiàn)象、風(fēng)向、風(fēng)速、溫度、氣壓、濕度、降水量等常規(guī)可控氣象要素作為本文研究的重點(diǎn)。
為方便多元線性回歸模型構(gòu)建,需將天氣現(xiàn)象用數(shù)字化表示,具體來說,數(shù)字1代表晴天,2代表小雨,3代表陣雨,4代表大雨,5代表小雪,6代表大雪,7代表10 m/s以上的風(fēng),8代表晴天同時(shí)伴有10 m/s的風(fēng),9代表小雨同時(shí)伴有10 m/s的風(fēng),10代表陣雨同時(shí)伴有10 m/s的風(fēng),11代表大雨同時(shí)伴有10 m/s的風(fēng),12代表小雪同時(shí)伴有10 m/s的風(fēng),13代表大雪同時(shí)伴有10 m/s的風(fēng),14代表霧霾天氣。
對(duì)已有的732條數(shù)據(jù)進(jìn)行清理,去除有缺失的數(shù)據(jù)12條,然后將數(shù)據(jù)分成兩類,60%數(shù)據(jù)用于模型構(gòu)建,剩余40%數(shù)據(jù)用于模型預(yù)測(cè)與驗(yàn)證,即利用432條數(shù)據(jù)構(gòu)建多元線性回歸方程,剩余288條數(shù)據(jù)用于對(duì)探空高度進(jìn)行預(yù)測(cè)分析。選擇8個(gè)影響因素作為模型自變量參數(shù),選擇IBM SPSS Statistics 19.0軟件中的“進(jìn)入法”得到如下回歸方程:
其中,x1代表凈舉力,x2代表天氣現(xiàn)象,x3代表風(fēng)向,x4代表風(fēng)速,x5代表溫度,x6代表氣壓,x7代表濕度,x8代表降水量。由上述方程可以看出,凈舉力、溫度與探空高度呈現(xiàn)正相關(guān)關(guān)系,天氣現(xiàn)象、風(fēng)向、風(fēng)速、氣壓、濕度、降水量與探空高度呈現(xiàn)負(fù)相關(guān)關(guān)系,其中天氣現(xiàn)象與降水量對(duì)探空高度影響最明顯。
3.4.1多重共線性檢驗(yàn)
多重共線性檢驗(yàn)是為了判斷自變量之間是否存在相關(guān)關(guān)系,方差膨脹因子VIF和容忍度是多重共線性檢驗(yàn)的兩個(gè)重要指標(biāo),x1、x2、x3、x4、x5、x6、x7、x8的方 差 膨 脹 因 子 分 別 是 8.874、3.267、4.818、2.346、3.787、9.124、6.372和5.118,均<10,且容忍度均>0.1,因此,可以判斷上述8個(gè)自變量之間不存在多重共線性的問題。
3.4.2模型異方差檢驗(yàn)
異方差檢驗(yàn)主要是為了解決所構(gòu)造模型是否存在自相關(guān)性的問題。數(shù)據(jù)質(zhì)量較差和模型設(shè)定不合理往往會(huì)帶來異方差問題,該問題直接導(dǎo)致回歸系數(shù)估計(jì)結(jié)果誤差較大及模型預(yù)測(cè)不準(zhǔn)確等問題。一般通過殘差圖來判斷模型的異方差的問題。對(duì)模型構(gòu)建數(shù)據(jù)進(jìn)行殘差分析,得到圖3。
圖3 回歸方程標(biāo)準(zhǔn)化殘差
由圖3可知,殘差數(shù)據(jù)大致分布在標(biāo)準(zhǔn)差數(shù)據(jù)兩側(cè),滿足隨機(jī)分布特性,因此模型本身也不存在自相關(guān)性問題。
3.4.3模型優(yōu)化
通過計(jì)算Cook距離,發(fā)現(xiàn)部分?jǐn)?shù)據(jù)偏離標(biāo)準(zhǔn)偏差較大,即存在所謂的離群點(diǎn),采用逐步回歸的方式逐一剔除這些異常的離群數(shù)據(jù),對(duì)模型進(jìn)行進(jìn)一步優(yōu)化完善,得到如下回歸方程:
經(jīng)過優(yōu)化,回歸方程的擬合優(yōu)度由0.778提高到0.881,說明該模型的預(yù)測(cè)tgr效果更佳,經(jīng)反復(fù)優(yōu)化完善,最終確定該模型為最優(yōu)擬合模型。最優(yōu)模型異方差檢驗(yàn)圖見圖4。
圖4 最優(yōu)模型異方差檢驗(yàn)效果圖
3.4.4預(yù)測(cè)效果檢驗(yàn)
利用剩余的288條數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證,即將上述兩種模型的預(yù)測(cè)結(jié)果與實(shí)際值進(jìn)行對(duì)比和驗(yàn)證,經(jīng)計(jì)算,兩種模型預(yù)測(cè)的平均相對(duì)誤差分別為±8.74%和±8.39%,預(yù)測(cè)效果較為理想(圖5)。
圖5 模型預(yù)測(cè)效果驗(yàn)證
其中,橫軸代表288條對(duì)比驗(yàn)證放球數(shù)據(jù),縱軸代表探空高度,從圖5可以看出,最優(yōu)回歸模型驗(yàn)證效果相對(duì)初始回歸模型預(yù)測(cè)效果要好。
在上述研究的基礎(chǔ)上,本文著重探究?jī)襞e力對(duì)探空高度的影響程度,因此繪制了凈舉力與探空高度關(guān)系散點(diǎn)圖(圖6)。
從圖6可以看出,一般情況下,凈舉力保持在1500~1800 g左右,能以較大概率保證探空氣球達(dá)到理想的高度;凈舉力過大或過小都很難再提高釋放球高度。
為研究天氣現(xiàn)象、凈舉力與具體天氣現(xiàn)象的關(guān)系,繪制了3D圖(圖7)。
圖6 凈舉力與探空高度關(guān)系散點(diǎn)圖
圖7 天氣現(xiàn)象、凈舉力與探空高度3D分布
由圖7可知,不同天氣現(xiàn)象下,探空高度與凈舉力的關(guān)系是不同的。因此,在日常充灌球時(shí)要根據(jù)具體的天氣選擇合適的凈舉力。依據(jù)長(zhǎng)期從事探空工作專家的建議以及上述統(tǒng)計(jì)和分析結(jié)果,得出:
(1)克拉瑪依四季不是很分明,春季和秋季很短暫,基本上可以忽略不計(jì),大致可以分為夏季和冬季兩季。由于溫度與探空高度呈現(xiàn)正相關(guān)關(guān)系,在夏季氣溫較高時(shí)可以適當(dāng)少充灌些氫,而冬季氣溫較低時(shí)需要適當(dāng)多充灌些氫氣。
(2)晴天或者10 m/s以上的有風(fēng)天氣一般保持凈舉力在1500~1750 g。
(3)遇到大雨或者大雪天氣,凈舉力要在晴天基礎(chǔ)上增加300~500 g,即達(dá)到1800~2250 g。
(4)遇到小雨、陣雨、小雪及10 m/s以下的有風(fēng)天氣,凈舉力保持在1650~1800 g即可。
(5)霧霾天氣凈舉力保持在1650~1750 g即可。
根據(jù)中國(guó)氣象局對(duì)探空高度考核指標(biāo)要求,以及目前國(guó)內(nèi)學(xué)者對(duì)探空高度影響因素的研究現(xiàn)狀,結(jié)合2011—2016年6 a平均探空高度變化,從定量的角度構(gòu)建多元線性回歸模型,并對(duì)模型進(jìn)行檢驗(yàn)優(yōu)化和驗(yàn)證實(shí)驗(yàn),確定了最優(yōu)擬合模型。主要得出以下結(jié)論:
凈舉力與探空高度在某種程度上呈現(xiàn)顯著的正相關(guān)關(guān)系;
在不同季節(jié)及天氣下選擇合適凈舉力可以適當(dāng)提高釋放球高度。
在研究過程中,未考慮天氣現(xiàn)象變化是否在放球時(shí)間的情形,比如上午下陣雨,下午19時(shí)天氣已晴等,即沒有細(xì)化到放球時(shí)間。另外,本文著重討論了探空釋放高度與凈舉力和天氣現(xiàn)象的關(guān)系、探空釋放高度與氣溫的關(guān)系以及降水量和風(fēng)速對(duì)探空釋放高度的影響,而對(duì)于氣壓、濕度、風(fēng)向?qū)μ娇蔗尫鸥叨鹊木唧w影響沒有深入討論。