任建玲
摘 要隨著對(duì)氣候變化研究的重視以及極端天氣的增多,歷史氣象觀測(cè)記錄檔案的需求與作用凸顯。從20世紀(jì)70年代末至今,氣象部門投入大量人力、物力和財(cái)力,歷史氣象觀測(cè)記錄檔案的數(shù)字化取得了可喜成果。本文回顧了天津氣象觀測(cè)記錄檔案數(shù)字化的各個(gè)階段、產(chǎn)生的數(shù)字化產(chǎn)品、檔案數(shù)字化成果的應(yīng)用,并對(duì)下一步工作進(jìn)行了展望。
關(guān)鍵詞氣象 觀測(cè)記錄 檔案數(shù)字化 成果應(yīng)用
氣象觀測(cè)記錄檔案是在氣象觀測(cè)、探測(cè)中形成的,反映大氣中各種氣象要素、大氣現(xiàn)象及其變化過(guò)程的真實(shí)記錄,包括各種觀探測(cè)記錄表、簿、磁帶(盤)、縮微膠片、光盤等[1]。氣象觀測(cè)記錄檔案是氣象檔案館的館藏主體,天津市氣象檔案館收藏了大量紙質(zhì)載體的氣象記錄檔案,最早的記錄檔案始于1887年,是研究我國(guó)近代氣候及環(huán)境的不可替代的寶貴財(cái)富,也是區(qū)域氣候變化和全球變化研究的基礎(chǔ)資料。這些氣象記錄檔案主要以紙質(zhì)載體為主,其信息無(wú)法得到更為廣泛和深入的應(yīng)用,數(shù)字化是解決利用和保護(hù)最佳的方法。
歷史氣象資料數(shù)字化是指將紙質(zhì)歷史氣象資料掃描成數(shù)字圖像,通過(guò)鍵盤錄入方式將紙質(zhì)或數(shù)字圖像上的數(shù)據(jù)信息轉(zhuǎn)換為可編輯、處理的數(shù)據(jù)文件,通過(guò)光學(xué)字符識(shí)別或波形圖識(shí)別技術(shù)將數(shù)字圖像上的數(shù)據(jù)信息轉(zhuǎn)換為可編輯、處理的數(shù)據(jù)文件。對(duì)紙質(zhì)歷史氣象資料進(jìn)行數(shù)字化,既可以保護(hù)資料原件,維持其歷史憑證價(jià)值,又能突破原有載體提供利用時(shí)的局限性,提高歷史氣象資料的應(yīng)用效率[2]。
一、氣象觀測(cè)記錄檔案數(shù)字化歷程
1.數(shù)字化初始階段(1978—1990)。始于20世紀(jì)70年代末期,按照中央氣象局的統(tǒng)一部署,天津氣候資料室開(kāi)始使用紙帶穿孔方法對(duì)紙質(zhì)地面氣象觀測(cè)記錄月報(bào)表進(jìn)行信息化,用手工打鍵的方法,把手工記載的氣象資料變成電子計(jì)算機(jī)能接收識(shí)別的信息,記入紙帶、卡片、磁帶或膠片等信息載體上。參考依據(jù)就是1978年12月中央氣象局業(yè)務(wù)處下發(fā)《全國(guó)地面氣象資料信息化基本模式暫行規(guī)定》(中氣業(yè)發(fā)字〔1978〕第212號(hào)文)[3]1,之后又對(duì)這部分記載地面氣象觀測(cè)信息的紙帶資料進(jìn)行了重新整理和錄入,轉(zhuǎn)換成了A0文件歸檔保存。A0文件作為重要的數(shù)字化氣象資料,為之后的各項(xiàng)氣象事業(yè)的發(fā)展提供了可靠的基礎(chǔ)數(shù)據(jù)資源。
2.數(shù)字化持續(xù)階段(1991—2008)。截至2008年之前,數(shù)字化工作持續(xù)進(jìn)行。期間完成的主要工作有:(1)存貯介質(zhì)轉(zhuǎn)存。中國(guó)氣象局預(yù)測(cè)減災(zāi)司氣預(yù)函〔2006〕54號(hào)《關(guān)于做好2006年預(yù)測(cè)減災(zāi)業(yè)務(wù)服務(wù)專項(xiàng)能力建設(shè)工作的通知》下達(dá)了“天津市歷史信息化氣象資料存貯介質(zhì)轉(zhuǎn)存項(xiàng)目”。完成的主要任務(wù)是把2005年之前存檔的各站地面、農(nóng)業(yè)氣象、輻射信息化資料,進(jìn)行質(zhì)量檢查并分別存放在可讀寫CD-ROM光盤、磁帶、在線服務(wù)器三種介質(zhì)上。(2)降水自記紙跡線提取。降水自記紙是客觀記錄降水情況的珍貴氣象觀測(cè)資料,它記錄著每次降雨的特征,包括每分鐘的降雨強(qiáng)度、起止時(shí)間和各個(gè)時(shí)段的最大降水量,對(duì)我市開(kāi)展降水特征和天氣、氣候的研究具有非常重要的意義,同時(shí)在防災(zāi)、減災(zāi)和國(guó)民經(jīng)濟(jì)建設(shè)中發(fā)揮重要的作用。
按照中國(guó)氣象局氣預(yù)函〔2002〕83號(hào)文件《關(guān)于在全國(guó)開(kāi)展國(guó)家基本(準(zhǔn))站降水自記紙數(shù)字化處理的通知》的要求,2003—2007年期間陸續(xù)完成了“天津市降水自記紙數(shù)字化處理”項(xiàng)目。利用中國(guó)氣象局氣象檔案館和廣東省氣候中心共同研究開(kāi)發(fā)的“降水自記紙彩色圖形數(shù)字化處理系統(tǒng)”[4]737,依據(jù)中國(guó)氣象局統(tǒng)一下發(fā)的《降水曲線數(shù)據(jù)文件數(shù)據(jù)格式》《降水自記數(shù)據(jù)(降水強(qiáng)度)標(biāo)準(zhǔn)文件格式》,完成了天津市所轄范圍內(nèi)兩個(gè)國(guó)家基本站自建站2004年降水自記紙圖像掃描、跡線跟蹤處理、質(zhì)量檢查、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集制作等工作。成果包含4713個(gè)圖像文件(*.jpg);4713個(gè)數(shù)據(jù)文件(*.zjr);2個(gè)分鐘強(qiáng)度數(shù)據(jù)文件(R1文件);2個(gè)分鐘標(biāo)準(zhǔn)數(shù)據(jù)文件(R01文件);2個(gè)小時(shí)標(biāo)準(zhǔn)數(shù)據(jù)文件(R60文件);2個(gè)圖像數(shù)據(jù)集;1個(gè)降水曲線數(shù)據(jù)集;1個(gè)降水強(qiáng)度數(shù)據(jù)集。降水自記紙數(shù)字化是紙質(zhì)檔案數(shù)字化的一個(gè)大膽探索和實(shí)踐,為其他紙質(zhì)檔案數(shù)字化提供了寶貴的經(jīng)驗(yàn)和技術(shù)借鑒。(3)補(bǔ)錄A6/V0文件。從2005年開(kāi)始,開(kāi)展國(guó)家科技基礎(chǔ)性工作專項(xiàng)資金項(xiàng)目“氣象科學(xué)數(shù)據(jù)共享中心”子項(xiàng)目“省級(jí)數(shù)據(jù)資源建設(shè)與共享服務(wù)”天津?qū)n}建設(shè),通過(guò)對(duì)數(shù)字化歷史資料的格式檢查、質(zhì)量檢查、數(shù)據(jù)統(tǒng)計(jì),完成了大量數(shù)據(jù)集制作,并大大提高了數(shù)字化歷史資料(A0/A6)文件的質(zhì)量。建立的數(shù)據(jù)集清單見(jiàn)表1。依托這個(gè)項(xiàng)目,天津按照《全國(guó)地面氣象資料A6、A7文件信息基本模式暫行規(guī)定》(中國(guó)氣象局預(yù)測(cè)減災(zāi)司文件,氣預(yù)發(fā)字〔1999〕第14號(hào))[3]29、氣表-1封面、封底V文件格式(中氣測(cè)發(fā)〔2001〕18號(hào))[3]34的相關(guān)規(guī)定,對(duì)國(guó)家基本站自建站到2004年的地面氣象記錄月報(bào)表中逐時(shí)觀測(cè)項(xiàng)目進(jìn)行人工錄入處理生成A6文件1500個(gè)、封底封面V0文件1500個(gè),并通過(guò)合成軟件合并為A文件。(4)風(fēng)自記歷史資料數(shù)字化。依托2008年開(kāi)展的“天津市風(fēng)能資源數(shù)據(jù)庫(kù)建設(shè)”項(xiàng)目,按照國(guó)家級(jí)項(xiàng)目統(tǒng)一要求和本市風(fēng)能資源評(píng)價(jià)的需要,通過(guò)手工錄入和人機(jī)交互質(zhì)量控制,完成全市四個(gè)參證站(塘沽、漢沽、大港、西青)建站至2008年12月的風(fēng)向風(fēng)速逐小時(shí)歷史資料數(shù)字化工作,建立格式統(tǒng)一、數(shù)據(jù)完整和質(zhì)量可靠的AF文件1968個(gè),為我市風(fēng)能資源數(shù)據(jù)庫(kù)建設(shè)提供歷史背景資料。
3.數(shù)字化飛速發(fā)展階段(2009年至今)。2009年以來(lái),天津市氣象檔案館在中國(guó)氣象局氣象監(jiān)測(cè)與災(zāi)害預(yù)警工程、氣候變化應(yīng)對(duì)決策支撐系統(tǒng)工程、山洪地質(zhì)災(zāi)害防治氣象保障工程項(xiàng)目專項(xiàng)經(jīng)費(fèi)的持續(xù)支持下,委托數(shù)字化外包公司先后完成天津市國(guó)家級(jí)氣象臺(tái)站各類地面觀測(cè)記錄月報(bào)表、新中國(guó)成立前各類歷史氣象觀測(cè)資料、農(nóng)業(yè)氣象觀測(cè)報(bào)表、高空氣象觀測(cè)記錄表、氣壓、溫度、濕度、降水、風(fēng)向風(fēng)速自記紙的圖像掃描和數(shù)據(jù)集制作。完成情況與數(shù)據(jù)量見(jiàn)表2(見(jiàn)下頁(yè));數(shù)字化錄入文件數(shù)據(jù)集見(jiàn)表3(見(jiàn)下頁(yè))。
2009年至2018年期間,取得了豐碩的數(shù)字化建設(shè)成果,這些成果已經(jīng)在氣象業(yè)務(wù)和科研中得到應(yīng)用,取得了顯著的成效。2019年的山洪地質(zhì)災(zāi)害防治氣象保障工程已安排經(jīng)費(fèi),進(jìn)行風(fēng)自記紙跡線提取工作,目前正在進(jìn)行中。
二、數(shù)字化成果應(yīng)用
1.業(yè)務(wù)工作的支撐。歷史檔案數(shù)字化產(chǎn)品A系列文件,自20世紀(jì)70年代末誕生以來(lái),一改數(shù)據(jù)人工抄錄和統(tǒng)計(jì)的歷史,在氣象事業(yè)發(fā)展過(guò)程中長(zhǎng)期發(fā)揮著重要的支撐作用,服務(wù)氣象事業(yè)50年。數(shù)字化的檔案滿足了用戶對(duì)不同時(shí)空、分辨率數(shù)據(jù)的需求,也為預(yù)報(bào)預(yù)測(cè)、氣候監(jiān)測(cè)、氣候分析與評(píng)估、農(nóng)業(yè)氣象服務(wù)、人工影響天氣、應(yīng)急與減災(zāi)、氣象災(zāi)害與防御等提供了重要的數(shù)據(jù)保障,促進(jìn)氣象業(yè)務(wù)發(fā)展,獲得顯著的社會(huì)效益??梢载?fù)責(zé)任地說(shuō),每項(xiàng)氣象相關(guān)業(yè)務(wù)工作的開(kāi)展都離不開(kāi)歷史數(shù)據(jù)的支撐,離不開(kāi)檔案的憑證和查考作用。
2.數(shù)據(jù)產(chǎn)品的基礎(chǔ)。為了更好地提供數(shù)據(jù)服務(wù),我們制作了大量數(shù)據(jù)產(chǎn)品,數(shù)字化的檔案為各類數(shù)據(jù)集產(chǎn)品提供基礎(chǔ)數(shù)據(jù)源,數(shù)據(jù)產(chǎn)品囊括地面、高空、輻射等各類觀測(cè),種類包括氣候標(biāo)準(zhǔn)值產(chǎn)品、基礎(chǔ)數(shù)據(jù)產(chǎn)品、氣候整編產(chǎn)品、均一化產(chǎn)品、網(wǎng)格化產(chǎn)品等。
3.科研和服務(wù)的保證。數(shù)字化的檔案為科學(xué)研究和氣象服務(wù)提供必要的資料保證,支持氣象科學(xué)研究項(xiàng)目462個(gè),各級(jí)各類氣象服務(wù)不計(jì)其數(shù)。科研項(xiàng)目的資助來(lái)源包括國(guó)家科技部、中國(guó)氣象局、天津市科委、市發(fā)改委、市農(nóng)委、市財(cái)政局、市技術(shù)監(jiān)督局、市氣象局等,還有一些橫向合作的部門及高校。氣象服務(wù)遍及全社會(huì)各個(gè)角落,關(guān)系到國(guó)計(jì)民生,小到氣象災(zāi)害憑證、大到重大事項(xiàng)決策。舉個(gè)最近的應(yīng)用實(shí)例:2017年8月在天津召開(kāi)的全國(guó)第十三屆全運(yùn)會(huì),從籌備到開(kāi)幕閉幕日期的選擇,從綜合氣象條件分析到可能風(fēng)險(xiǎn)分析,從制定人工影響天氣方案到應(yīng)急方案制定,很多決策都參考了氣象統(tǒng)計(jì)數(shù)據(jù)。我們提供的氣象數(shù)據(jù)有近30年氣候背景統(tǒng)計(jì)數(shù)據(jù)、4月到9月期間逐小時(shí)降水量數(shù)據(jù)、雷達(dá)基數(shù)據(jù)資料、歷史天氣圖等數(shù)字化資料??蒲蟹矫?,氣候中心申請(qǐng)的天津市科技局項(xiàng)目“氣候變化對(duì)天津市排水規(guī)劃設(shè)計(jì)標(biāo)準(zhǔn)的影響評(píng)估”利用從降水自記紙?zhí)崛〉闹鸱昼娊邓Y料,分析了氣候變化對(duì)天津市排水設(shè)計(jì)的影響,分別利用年最大值法和年多值法進(jìn)行了分區(qū)暴雨公式編制等。
4.服務(wù)基礎(chǔ)資料專項(xiàng)。2011—2013年各省開(kāi)展的“基礎(chǔ)資料專項(xiàng)工作”,對(duì)地面、高空、輻射數(shù)字化資料存在的數(shù)據(jù)質(zhì)量問(wèn)題集中進(jìn)行質(zhì)量檢查,使其完整性、可靠性和準(zhǔn)確性進(jìn)一步提升。在質(zhì)量檢查過(guò)程中,數(shù)字化檔案起到了關(guān)鍵作用。利用最多的各類報(bào)表,使用的是掃描形成的圖像文件數(shù)據(jù)集,完全不用人工從庫(kù)房中提取原始紙質(zhì)檔案,節(jié)省了大量借閱、歸還的工作,并保護(hù)了珍貴原始觀測(cè)記錄檔案,工作效率提高70%。
三、數(shù)字化工作展望
1.新技術(shù)的應(yīng)用提高效率。目前,氣象資料數(shù)字化工作主要采用圖像掃描技術(shù)、數(shù)據(jù)錄入技術(shù)、圖形提取技術(shù)等。其中,相對(duì)有難度、耗時(shí)較長(zhǎng)的是自記紙類圖形跡線跟蹤技術(shù),其過(guò)程主要是人機(jī)結(jié)合地對(duì)自記跡線進(jìn)行跟蹤,得到跡線特征點(diǎn)的坐標(biāo)數(shù)據(jù),從而得到給定時(shí)間段內(nèi)逐分鐘降水量數(shù)據(jù),形成數(shù)據(jù)文件。相信未來(lái)會(huì)有更好的技術(shù)和手段來(lái)完成類似的工作,提高數(shù)字化效率。未來(lái)手寫文本也能很準(zhǔn)確地進(jìn)行OCR識(shí)別,也會(huì)大大提高手寫檔案的數(shù)字化效率。
2.建立更高時(shí)間分辨率要素序列。自動(dòng)氣象觀測(cè)站自2003年開(kāi)始在全國(guó)范圍內(nèi)建立,自動(dòng)觀測(cè)儀器可以采集到各種觀測(cè)要素的分鐘數(shù)據(jù),而在此之前,我們僅能提供一天四次的定時(shí)觀測(cè)數(shù)據(jù)。隨著對(duì)暴雨洪澇災(zāi)害、城市瀝澇、多年一遇極端降水事件分析等的深入研究,對(duì)更高時(shí)間分辨率降水資料的需求越來(lái)越突出。在需求的引領(lǐng)下,我們開(kāi)展了降水自記跡線提取工作,得到自動(dòng)站建立前的分鐘降水量數(shù)據(jù),滿足了科研的需要。風(fēng)的數(shù)據(jù)對(duì)風(fēng)能資源開(kāi)發(fā)、橋梁設(shè)計(jì)、高層建筑設(shè)計(jì)、大氣污染物擴(kuò)散研究等起著至關(guān)重要的作用,因此長(zhǎng)序列高時(shí)間分辨率風(fēng)向風(fēng)速觀測(cè)資料是2019年氣象科技檔案數(shù)字化的重點(diǎn)工作。以需求為引領(lǐng),是數(shù)字化工作開(kāi)展的依據(jù)。進(jìn)一步加強(qiáng)氣溫、氣壓、相對(duì)濕度等要素的數(shù)字化力度,取得高時(shí)間分辨率氣象觀測(cè)數(shù)據(jù),是今后繼續(xù)努力的目標(biāo)。
3.提升歷史氣象資料數(shù)字化產(chǎn)品在線管理和服務(wù)能力。有了大量數(shù)字化產(chǎn)品,它的開(kāi)發(fā)利用迫在眉睫。從檔案安全角度著想,我們自主研發(fā)了“歷史氣象觀測(cè)檔案數(shù)字化檢索平臺(tái)”。該系統(tǒng)在服務(wù)器虛擬化平臺(tái)上部署桌面虛擬化系統(tǒng),在閱覽室部署瘦客戶機(jī),完成歷史氣象觀測(cè)檔案數(shù)字化檢索平臺(tái)應(yīng)用的桌面虛擬化實(shí)現(xiàn)。用戶可根據(jù)檔案分類和查詢習(xí)慣,實(shí)現(xiàn)在平臺(tái)上對(duì)歷史氣象觀測(cè)檔案的分類檢索和調(diào)閱,提高了歷史檔案的檢索效率。同時(shí),系統(tǒng)的應(yīng)用減少了對(duì)紙質(zhì)檔案的翻閱,從而保護(hù)了檔案,降低了管理員工作強(qiáng)度,減少由于檔案移動(dòng)引起的工作失誤;采用桌面虛擬化技術(shù),實(shí)現(xiàn)了氣象檔案的安全訪問(wèn),防止了檔案未經(jīng)授權(quán)的訪問(wèn)事件發(fā)生。
“十三五”氣象信息系統(tǒng)發(fā)展規(guī)劃現(xiàn)代化目標(biāo)明確提出,要提高數(shù)字化氣象檔案在線管理服務(wù)率,更便捷、高效、全面地提供長(zhǎng)年代氣候背景數(shù)據(jù)產(chǎn)品。這也是我們近年來(lái)的工作目標(biāo),在中國(guó)氣象信息中心的領(lǐng)導(dǎo)下,逐步實(shí)現(xiàn)氣候資料數(shù)字化圖像在線查詢、檢索服務(wù)。