安徽省氣象信息中心 季永華 劉俊娜 唐懷甌
自動(dòng)氣象站實(shí)時(shí)數(shù)據(jù)質(zhì)量控制研究與結(jié)果分析
安徽省氣象信息中心 季永華 劉俊娜 唐懷甌
根據(jù)常用質(zhì)量控制方法,氣候極值,臺(tái)站極值,內(nèi)部一致性,時(shí)間一致性,空間一致性以及自動(dòng)站報(bào)文格式檢查,對(duì)國(guó)家級(jí)自動(dòng)站實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)進(jìn)行質(zhì)量控制,并對(duì)安徽省自動(dòng)站2014年7月到2014年12月的數(shù)據(jù)資料進(jìn)行質(zhì)量統(tǒng)計(jì),得出區(qū)域站錯(cuò)誤率要高于國(guó)家站,錯(cuò)誤要素主要集中在氣溫、氣壓、降水上,并且呈現(xiàn)夏季比冬季高的特點(diǎn)。風(fēng)、濕、露點(diǎn)溫度、水汽壓錯(cuò)誤則較少。
自動(dòng)站;質(zhì)量控制;數(shù)據(jù)分析
截止2014年底, 安徽省氣象部門(mén)已建成81個(gè)國(guó)家級(jí)自動(dòng)站,近2000個(gè)區(qū)域自動(dòng)站,可提供每小時(shí)(每5分鐘)一次的實(shí)時(shí)觀測(cè)數(shù)據(jù),觀測(cè)時(shí)空密度大大提高,實(shí)現(xiàn)了觀測(cè)資料實(shí)時(shí)匯集和共享。然而由于資料質(zhì)量受到觀測(cè)儀器、觀測(cè)技術(shù)、測(cè)站位置、觀測(cè)時(shí)間、觀測(cè)方法的影響,尤其是長(zhǎng)期觀測(cè)形成的地面氣象資料,各種非氣候因素造成的影響更大,使資料質(zhì)量大打折扣。為了保證眾多臺(tái)站觀測(cè)資料在氣象預(yù)報(bào)預(yù)測(cè)和公共服務(wù)系統(tǒng)中得到準(zhǔn)確、及時(shí)的應(yīng)用,發(fā)揮自動(dòng)站的整體效益,因此加強(qiáng)自動(dòng)觀測(cè)站資料的質(zhì)量控制工作對(duì)資料的整合和氣象預(yù)報(bào)服務(wù)工作有著非常重要的意義。
依據(jù)氣象數(shù)據(jù)在天氣學(xué),氣候?qū)W原理,時(shí)間和空間上的相互聯(lián)系得出如下的常用傳統(tǒng)質(zhì)控方法,氣候極值的檢查、時(shí)間序列的檢查、空間序列的檢查[1]。用于歷史數(shù)據(jù)質(zhì)量控制的方法中有些方法在實(shí)時(shí)自動(dòng)站質(zhì)量控制同樣適用。如內(nèi)部一致性,歷史極值的判定等。但是實(shí)時(shí)信息的檢驗(yàn)和歷史質(zhì)量控制有一些不同,如對(duì)于歷史質(zhì)量控制可以知道該時(shí)刻前后時(shí)刻和空間的數(shù)據(jù),而實(shí)時(shí)數(shù)據(jù)實(shí)時(shí)性強(qiáng),只知道過(guò)去時(shí)刻和空間的數(shù)據(jù)。自動(dòng)站數(shù)據(jù)質(zhì)量控制是一個(gè)非常復(fù)雜的過(guò)程,從自動(dòng)站設(shè)備采集的數(shù)據(jù)到上傳至通信系統(tǒng)經(jīng)歷的質(zhì)量控制一般有這樣幾個(gè)過(guò)程:
(1)原始數(shù)據(jù)文件的格式檢查:包括年、月、日的檢查、區(qū)站號(hào),經(jīng)緯度,拔海高度的檢查、數(shù)據(jù)字符的檢查、數(shù)據(jù)格式的檢查、文件結(jié)束符的檢查等。不符合格式要求的數(shù)據(jù)文件做錯(cuò)誤文件處理。
(2)極值的檢查:包括氣候極限值的檢查和臺(tái)站歷史極值的檢查。
表1 要素極值
表2 氣溫月份極值
表1和表2是針對(duì)安徽地區(qū)氣候特點(diǎn)給出各要素極值參數(shù),氣溫要素隨季節(jié)變化明顯,所以按月份給出極值條件,對(duì)于氣候極限值的檢查,如果要素不在表1、表2范圍中,可以標(biāo)定為錯(cuò)誤值。歷史極值為各臺(tái)站建站以來(lái)累年各要素各月氣候極值,超過(guò)歷史極值范圍的資料為可疑資料。歷史極值的檢查包含的要素是本站氣壓、空氣溫度、相對(duì)濕度、風(fēng)速、小時(shí)降水量。
(3)內(nèi)部一致性檢查:要素間內(nèi)部一致性檢查是基于同一時(shí)刻所測(cè)得的要素間存在著不同程度的相關(guān)的事實(shí),對(duì)某些有物理特征關(guān)聯(lián)的氣象要素之間是否保持一致為依據(jù)進(jìn)行檢測(cè)。
(4)時(shí)間一致性的檢查:氣象要素的變化在時(shí)間上具有連續(xù)性。最大變化值檢查(見(jiàn)表3):各氣象要素當(dāng)前時(shí)刻與過(guò)去10分鐘的值變化,如果超過(guò)表3中懷疑極限值且小于錯(cuò)誤極限值,作為懷疑值。如大于等于表3中錯(cuò)誤極限值,作為錯(cuò)誤值。
表3 臨近時(shí)間(10分鐘時(shí)間間隔)序列最大變化值
表4 國(guó)家站和區(qū)域站疑誤率的對(duì)比
表5 溫濕風(fēng)壓降水要素疑誤數(shù)的對(duì)比
表6 各要素隨月份變化的疑誤數(shù)對(duì)比
表7 濕度、風(fēng)、水氣壓疑誤數(shù)
時(shí)間序列檢查還包含連續(xù)多個(gè)時(shí)次無(wú)變化的檢查,對(duì)于空氣溫度、草溫、地溫、相對(duì)濕度、露點(diǎn)溫度連續(xù)5個(gè)整點(diǎn)時(shí)次數(shù)據(jù)無(wú)變化算作錯(cuò)誤數(shù)據(jù)。
(5)空間序列的檢查:根據(jù)氣象要素具有的空間相關(guān)性的檢查。建立全省被檢站與拔海高度相差不超過(guò)500米的國(guó)家級(jí)地面氣象站的參證站表。選擇鄰近站的數(shù)量在5-10之間,符合條件的鄰近站比較多時(shí),首選高度相近的站,其次是緯度相近、經(jīng)度相近的站[2]。選好參考站點(diǎn),利用Madsen-Allerup方法[3],Madsen方法是北歐一些國(guó)家(丹麥)普遍采用的數(shù)據(jù)空間質(zhì)量控制方法。基本原理是基于某一空間范圍內(nèi)要素的空間分布是均一的假設(shè),利用周?chē)舾膳_(tái)站同時(shí)刻觀測(cè)值的中值和75%、25%分位值,計(jì)算統(tǒng)計(jì)量Tit=(Xit-Mt)/(Qt,75-Qt,25)式中Xit為t時(shí)刻i臺(tái)站的觀測(cè)值,Mt是t時(shí)刻i臺(tái)站N個(gè)鄰近臺(tái)站觀測(cè)值的平均值,Qt,75、Qt,25分別是鄰近臺(tái)站t時(shí)刻觀測(cè)值75%和25%分位值。判斷標(biāo)準(zhǔn)參考臨界值,氣溫、最高(最低)氣溫、0cm地溫、相對(duì)濕度、平均風(fēng)速,|Tit|>3.0。日照時(shí)數(shù),|Tit|>5.0。日降水量,適用于檢查某日絕大多數(shù)站有降水的情況,|Tit|>3.0且Xit>10.0mm。(如果多數(shù)站降水量為0,少數(shù)站降水很大時(shí),則參考站序列變化很大,中值一般為0,qt,25和qt,75均很小,則|Tit|會(huì)很大。)
依據(jù)以上的質(zhì)量控制方法對(duì)安徽省81個(gè)國(guó)家級(jí)自動(dòng)站和1343個(gè)考核區(qū)域站數(shù)據(jù)資料進(jìn)行實(shí)時(shí)的質(zhì)量檢查,對(duì)2014.7-2014.12月質(zhì)量檢查結(jié)果統(tǒng)計(jì)分析,得出如下表格,表4為安徽省國(guó)家級(jí)自動(dòng)站數(shù)據(jù)和區(qū)域自動(dòng)站數(shù)據(jù)疑誤率對(duì)比,表5為溫濕風(fēng)壓降水要素疑誤數(shù)的對(duì)比,表6降水、氣溫、氣壓要素隨月份變化的疑誤數(shù)對(duì)比,表7為濕度、風(fēng)向風(fēng)速、水氣壓的疑誤數(shù)。
從表4-表7分析得出結(jié)論:
(1)數(shù)據(jù)整體的正確率較高,在99%以上,但區(qū)域自動(dòng)站數(shù)據(jù)的錯(cuò)誤率明顯要高于國(guó)家級(jí)自動(dòng)站數(shù)據(jù)。(2)數(shù)據(jù)的錯(cuò)誤主要集中在氣溫和氣壓要素上,氣溫、降水等要素疑誤夏季偏多,而且呈現(xiàn)夏季多于冬季的特點(diǎn)。(3)其他要素的錯(cuò)誤率較低,濕度,風(fēng),露點(diǎn)溫度,水汽壓只在某些月份出現(xiàn)過(guò)幾次。
對(duì)于區(qū)域自動(dòng)站數(shù)據(jù)的錯(cuò)誤率偏高,主要原因是區(qū)域站數(shù)量多,分布廣,有些站點(diǎn)的地理環(huán)境相對(duì)惡劣,加上無(wú)人值守,遇到故障,維修時(shí)間要滯后于國(guó)家站。而夏季錯(cuò)誤率多于冬季是由于夏季極端天氣比較多,容易造成傳感器故障。另外,風(fēng)要素檢測(cè)出疑誤數(shù)偏少,風(fēng)向風(fēng)速本身隨意性較強(qiáng),在時(shí)間和空間上關(guān)聯(lián)性較弱,風(fēng)向桿卡死和風(fēng)速的突變等因素在質(zhì)控方法檢測(cè)上都帶來(lái)很大的難度,因此質(zhì)控參數(shù)還需要進(jìn)一步細(xì)化,質(zhì)量控制方法還有待進(jìn)一步的完善,保證數(shù)據(jù)檢查更加科學(xué)。
[1]劉小寧,任芝花.地面氣象資料質(zhì)量控制方法研究概述[J].氣象科技,2005,33(03).
[2]任芝花,熊安元.地面自動(dòng)站觀測(cè)資料三級(jí)質(zhì)量控制業(yè)務(wù)系統(tǒng)的研制[J].氣象,2007,33(1).
[3]岳艷霞,陳靜,郭志斌.區(qū)域自動(dòng)站雨量資料質(zhì)量控制方法及應(yīng)用[J].氣象科技,2009,37(04).
[4]中國(guó)氣象局.地面氣象觀測(cè)規(guī)范[M].北京:氣象出版社,2003.
The Research and result analysis of AWS real-time Data quality Control
Ji yonghua,Liu junna,Tang huaiou
(Anhui Meteorological Informantion Center,Hefei)
The automatic weather stations(AWS)real-time data are checked,according to normal quality control way,climatic value check, station value check,internal consistency check,time consistency check, spatial consistency check and file form check,then analysising the QC result of AWS real-time data about AnHui province 2014.7-2014.12,obtaining the error rate is higher in regional AWS than in the national AWS,error factors are mainly concentrated in the temperature,pressure,precipitation,a nd the error rate is higher in summer than in winter.The wind, humidity,dew point temperature,water vapor pressure error is less.
Automatic weather station;quality control;data analysis