王麗吉,魏爽,劉熔熔
(浙江省氣象信息網(wǎng)絡(luò)中心,杭州310017)
地面觀測(cè)因其原位探測(cè)原理,成為所有觀測(cè)手段中對(duì)真實(shí)大氣的最可靠逼近。地面觀測(cè)業(yè)務(wù)化直接關(guān)系到天氣預(yù)報(bào)的準(zhǔn)確性,同時(shí)也是極端天氣災(zāi)害、季風(fēng)變率、氣候模式改進(jìn)等相關(guān)研究工作的主要數(shù)據(jù)支撐[1],因而從早期就有較完整的歷史資料積累。然而,由于觀測(cè)手段與信息化能力的不斷發(fā)展,歷史氣象資料存在數(shù)據(jù)源多樣、存儲(chǔ)手段多樣等非均一化問題。
降水隨時(shí)間變化的過程和降水強(qiáng)度,對(duì)于研究我國降水特征,尤其是暴雨特征具有重要意義,而短時(shí)強(qiáng)降水因發(fā)生時(shí)間短、強(qiáng)度大,造成的危害更大。因此,長時(shí)間序列、高時(shí)間分辨率、高質(zhì)量的降水?dāng)?shù)據(jù)產(chǎn)品的研制需求迫切[2]。在自動(dòng)觀測(cè)業(yè)務(wù)化運(yùn)行之前臺(tái)站觀測(cè)設(shè)備為非傳感器形式,其中降水觀測(cè)使用自記式雨量計(jì),降水過程在自記紙上留下的降水曲線(即降水跡線)客觀記錄了降水隨時(shí)間變化的過程,反映了各種時(shí)段的降水強(qiáng)度,其最小時(shí)間分辨率為分鐘,是其他降水觀測(cè)資料所不可替代的[3]。而自動(dòng)觀測(cè)業(yè)務(wù)化運(yùn)行之后降水量的觀測(cè)由自動(dòng)雨量傳感器獲得,無論是數(shù)據(jù)的存儲(chǔ)、傳輸還是使用都已數(shù)字化。
早期的降水自記紙時(shí)間跨度長、觀測(cè)時(shí)間分辨率高,作為歷史降水資料十分珍貴,但卻因其是紙質(zhì)圖像檔案,無法大量快速便捷地被調(diào)用,與自動(dòng)觀測(cè)獲得的數(shù)字化數(shù)據(jù)脫節(jié),其規(guī)范保存和數(shù)字化建設(shè)意義重大。中國氣象局對(duì)紙質(zhì)歷史氣象資料的數(shù)字化工作開展多年,到2018 年為止,通過提取降水自記紙跡線信息獲得的歷史分鐘降水?dāng)?shù)據(jù)集已全部制作完成。
浙江省最早的氣象觀測(cè)資料可追溯至建國前,目前省氣象檔案館內(nèi)完好保存的地面觀測(cè)自記紙始于1948 年。自建國前至2003 年省內(nèi)自動(dòng)氣象站建設(shè)之前,氣象觀測(cè)設(shè)備一直以非傳感器形式的觀測(cè)儀器(如自記雨量計(jì)等)為主。從2003 年開始,省內(nèi)的國家地面氣象站逐漸開始使用自動(dòng)化設(shè)備,并于2005 年全部實(shí)現(xiàn)自動(dòng)化。自動(dòng)氣象站以自動(dòng)傳感器觀測(cè)為主,浙江省氣象局氣象信息網(wǎng)絡(luò)中心負(fù)責(zé)各個(gè)站點(diǎn)的數(shù)據(jù)接收,并完成數(shù)據(jù)入庫、質(zhì)量控制和業(yè)務(wù)服務(wù)。
下面分別介紹從自記雨量計(jì)的自記紙降水跡線中提取的分鐘降水量和從自動(dòng)雨量傳感器中獲得的分鐘降水量兩類分鐘降水?dāng)?shù)據(jù)。
圖1 虹吸式自記雨量計(jì)內(nèi)部結(jié)構(gòu)(左圖:實(shí)物,右圖:示意圖)
圖2 浙江省文成縣1987年6月13-14日降水自記紙掃描及跡線跟蹤圖像文件(.bmp格式文件)
地面氣象站自動(dòng)化業(yè)務(wù)開始之前,站點(diǎn)的降水量觀測(cè)以自記式的翻斗雨量計(jì)或虹吸式雨量計(jì)(見圖1)為主,當(dāng)有降水現(xiàn)象產(chǎn)生時(shí),自記儀器會(huì)在自記紙上留下降水跡線。降水跡線雖然客觀記錄了降水隨時(shí)間變化的過程,反映了各種時(shí)段的降水強(qiáng)度,但自記紙以紙張形式保存于氣象檔案館內(nèi),數(shù)據(jù)使用過程很難滿足目前實(shí)際業(yè)務(wù)和科研工作中大量快速的需求。
中國氣象局對(duì)于紙質(zhì)歷史氣象資料的數(shù)字化處理工作始于上世紀(jì)70 年代末[4],先后對(duì)全國地面站的報(bào)表以及溫、壓、濕、風(fēng)、降水自記紙進(jìn)行了圖像掃描。在圖像文件得以全面保存的基礎(chǔ)上逐步開展圖像文件數(shù)字化。浙江省到目前為止完成了所有站點(diǎn)自建站始至自動(dòng)觀測(cè)前的降水自記紙跡線信息提取,該時(shí)段的分鐘降水?dāng)?shù)據(jù)集也已制作完成。圖2 給出了浙江省文成縣1987 年6 月13-14 日降水自記紙掃描圖樣,圖中同時(shí)保留了降水跡線的跟蹤提取痕跡(紅色實(shí)現(xiàn))。下面簡要介紹跡線提取流程。
按照國家氣象信息中心制定的《降水自記紙數(shù)據(jù)提取技術(shù)規(guī)定》[5]要求,在降水自記紙跡線提取之前需完成降水自記紙圖像文件預(yù)處理,圖像文件初檢、圖像朝向和分辨率調(diào)整,并建立降水自記紙圖像文件清單。在此基礎(chǔ)上使用軟件進(jìn)行跡線的自動(dòng)跟蹤。自記紙數(shù)據(jù)提取應(yīng)以站為單位進(jìn)行,開始提取后首先進(jìn)行圖像檢查,如圖像嚴(yán)重傾斜應(yīng)重新掃描。然后進(jìn)行提取參數(shù)設(shè)置和時(shí)間分辨率設(shè)置,包括自記紙類型(虹吸、翻斗)、圖像分辨率、跟蹤方式和閾值等的設(shè)置,按照跡線的起止點(diǎn)位置及標(biāo)注時(shí)間設(shè)置時(shí)間分辨率。跡線數(shù)據(jù)提取以自動(dòng)跟蹤為主,當(dāng)跟蹤不準(zhǔn)確時(shí)需人工修正跟蹤跡線,確保與實(shí)際跡線重合。
跡線跟蹤產(chǎn)生的圖像文件格式為.bmp 格式,在跡線跟蹤過程中產(chǎn)生的相關(guān)數(shù)據(jù)記錄文件為.zjr 格式。跡線跟蹤過程實(shí)際上每分鐘降水量的記錄過程,將zjr通過特定算法轉(zhuǎn)換為.dat 文本格式的分鐘降水量文件,便于后期讀取和應(yīng)用。圖3 為分鐘降水文本文件截圖,文件名命名規(guī)則為
R01IIiiiY11Y12Y13Y14Y21Y22Y23Y24。DAT,其 中IIiii 為國家氣象站統(tǒng)一臺(tái)站號(hào),Y11Y12Y13Y14數(shù)據(jù)起始年份,Y21Y22Y23Y24為數(shù)據(jù)終止年份。
圖3 以臺(tái)站號(hào)為單位的分鐘數(shù)據(jù)降水文件
浙江省自2003 年開始在全省范圍內(nèi)逐步建設(shè)自動(dòng)氣象觀測(cè)系統(tǒng),其中降水雨量傳感器多采用雙翻斗式雨量傳感器。到2005 年為止所有國家級(jí)站點(diǎn)自動(dòng)觀測(cè)都已正式業(yè)務(wù)運(yùn)行。
自動(dòng)站觀測(cè)結(jié)果由各地方臺(tái)站以.txt 文件形式按時(shí)傳輸至省氣象局氣象信息網(wǎng)絡(luò)中心,其中分鐘數(shù)據(jù)文件每日上傳一次。每月月初將上一月所有分鐘數(shù)據(jù)文件按照固定格式制作成一份時(shí)間跨度一個(gè)月的分鐘數(shù)據(jù)文件,即J 文件。
由降水自記紙跡線提取獲得的分鐘降水?dāng)?shù)據(jù)經(jīng)過浙江省氣象信息網(wǎng)絡(luò)中心以及國家氣象信息中心兩輪質(zhì)量控制。質(zhì)量控制方法的基本思路是:從跡線中提取的分鐘降水:①將其小時(shí)累計(jì)值與小時(shí)降水量(A6文件)進(jìn)行對(duì)比或:②將其20~20 時(shí)累計(jì)值與歷史記錄的定時(shí)降水量進(jìn)行對(duì)比。由于A6 文件中的小時(shí)降水量是觀測(cè)員在自記紙換下后對(duì)紙上小時(shí)雨量的人工計(jì)算,與當(dāng)前使用軟件進(jìn)行跡線提取后獲得分鐘降水再進(jìn)行小時(shí)累加得到小時(shí)降水量相比,兩者的原始數(shù)據(jù)完全一致,因而兩者在數(shù)值上應(yīng)幾乎相等的。然而由于人工計(jì)算誤差、錯(cuò)誤以及遺漏難以避免,在實(shí)際情況中兩者存在差異。
排除正常時(shí)差影響,如提取的逐時(shí)降水量累計(jì)值與對(duì)應(yīng)時(shí)間段A6 逐時(shí)降水量累計(jì)值差異超過以下范圍:①小時(shí)累計(jì)降水量<5.0mm 時(shí)絕對(duì)誤差>0.3mm,②小時(shí)累計(jì)降水量≥5.0mm 時(shí)誤差百分率>2%,③無A6時(shí),當(dāng)提取數(shù)據(jù)20~20 時(shí)累計(jì)降水量與雨量器日降水量R 的絕對(duì)誤差超過0.5mm(R≤5mm)或者超過R×10%(R>5mm)時(shí),應(yīng)依次檢查跟蹤跡線與降水跡線是否重合,降水分辨率、起止時(shí)間設(shè)置等有無錯(cuò)誤,A6 是否有誤(A6 中數(shù)據(jù)與自記紙標(biāo)注降水量不一致時(shí)為A6 錯(cuò)誤)。當(dāng)發(fā)現(xiàn)A6 錯(cuò)誤或缺失且原因不明時(shí),需要將A6 文件中的數(shù)值予以訂正或補(bǔ)全。
對(duì)自動(dòng)觀測(cè)站分鐘數(shù)據(jù)的質(zhì)量控制即對(duì)每月制作的J 文件進(jìn)行質(zhì)量控制,其中涉及到降水?dāng)?shù)據(jù)的主要質(zhì)控算法為時(shí)間一致性和內(nèi)部一致性[6]。通過使用地面氣象測(cè)報(bào)業(yè)務(wù)軟件(Operational Software for Surface Meteorological Observation,OSSMO)完成對(duì)J 文件的自動(dòng)質(zhì)量控制,如在質(zhì)控過程中出現(xiàn)疑誤,由審核人員對(duì)J 文件進(jìn)行修正。
從降水自記紙掃描圖像中提取跡線信息獲得的歷史分鐘降水?dāng)?shù)據(jù),按照國家氣象局?jǐn)?shù)據(jù)文件格式和命名要求制作成數(shù)據(jù)集,并且經(jīng)過了省級(jí)和國家級(jí)數(shù)據(jù)質(zhì)量控制。然而這一數(shù)據(jù)集數(shù)據(jù)文件格式與2003 年后地面自動(dòng)氣象觀測(cè)站上傳至省級(jí)氣象部門的分鐘數(shù)據(jù)文件格式并不一致,由此給需要使用長序列、全時(shí)段分鐘降水?dāng)?shù)據(jù)的業(yè)務(wù)和科研工作者帶來極大不便。為了整合兩種數(shù)據(jù)源,將兩種數(shù)據(jù)的分鐘降水量以站點(diǎn)為單位、按時(shí)間順序依次錄入數(shù)據(jù)庫中,以此隱藏不同時(shí)期不同數(shù)據(jù)源的格式差異,形成統(tǒng)一表結(jié)構(gòu)的、便于查詢和使用的長序列、全時(shí)段分鐘降水?dāng)?shù)據(jù)。
圖4 給出了浙江省長興站(國家氣象站統(tǒng)一臺(tái)站號(hào)為58443)分鐘降水?dāng)?shù)據(jù)表,數(shù)據(jù)庫為SQL Server,表中字段依次包括站號(hào)、年、月、日、時(shí)、觀測(cè)時(shí)間以及逐分鐘降水量。如需獲得一定時(shí)間段和(或)一定空間分布的累積降水量只需對(duì)數(shù)據(jù)庫進(jìn)行操作即可。
圖4 采用SQL Server數(shù)據(jù)庫的分鐘降水?dāng)?shù)據(jù)表
長時(shí)間序列、高時(shí)間分辨率、高質(zhì)量降水?dāng)?shù)據(jù)集的研制對(duì)氣象業(yè)務(wù)和科研工作意義重大。地面氣象站自動(dòng)觀測(cè)業(yè)務(wù)化運(yùn)行之前,降水觀測(cè)使用自記式雨量計(jì),通過降水過程在自記紙上留下降水曲線記錄降水隨時(shí)間的變化,自記紙以紙質(zhì)歷史檔案的形式保存于省一級(jí)氣象檔案館內(nèi)。而自動(dòng)觀測(cè)業(yè)務(wù)化運(yùn)行之后降水量的觀測(cè)由自動(dòng)雨量傳感器獲得并上傳至省一級(jí)氣象部門。本文重點(diǎn)闡述了兩種數(shù)據(jù)源及其質(zhì)量控制方法的差異,并討論了通過數(shù)據(jù)庫錄入整合兩種數(shù)據(jù)源的可能性。本文主要結(jié)論如下:
(1)按照國家氣象局氣象信息中心技術(shù)規(guī)定,對(duì)降水自記紙進(jìn)行圖像掃描、跡線提取和歷史分鐘降水?dāng)?shù)據(jù)集制作,獲得地面氣象站建站始至自動(dòng)觀測(cè)前的分鐘降水?dāng)?shù)據(jù);從自動(dòng)站上傳的分鐘數(shù)據(jù)文件中獲得自動(dòng)觀測(cè)后的分鐘降水?dāng)?shù)據(jù)。
(2)計(jì)算小時(shí)累計(jì)降水量或20~20 時(shí)定時(shí)累計(jì)降水量,通過其與歷史記錄對(duì)比,完成跡線提取的歷史分鐘降水?dāng)?shù)據(jù)質(zhì)量控制;通過地面氣象測(cè)報(bào)業(yè)務(wù)軟件完成對(duì)自動(dòng)觀測(cè)分鐘降水?dāng)?shù)據(jù)質(zhì)量控制。
(3)采用SQL Server 數(shù)據(jù)庫,將兩種數(shù)據(jù)以站點(diǎn)為單位、按時(shí)間順序依次錄入,形成統(tǒng)一表結(jié)構(gòu)的長序列、全時(shí)段分鐘降水?dāng)?shù)據(jù)表。
值得指出的是,如此長時(shí)間跨度、高時(shí)間分辨的降水?dāng)?shù)據(jù)集是我國降水強(qiáng)度特征,特別是短時(shí)強(qiáng)降水特征的研究的重要數(shù)據(jù)支撐。浙江省地處長江下游入??冢瑬|臨太平洋,全年汛期時(shí)間長、降水量大,如何在降水氣候特征研究中有效使用該數(shù)據(jù)集是下一步工作的重點(diǎn)。