勾志竟,任建玲,王 敏
(天津市氣象信息中心 天津 300190)
隨著氣象業(yè)務(wù)服務(wù)面不斷拓寬,氣象檔案的作用也日益突出,而氣象檔案信息化只完成了由紙質(zhì)資料到信息化產(chǎn)品的部分工作,且氣象檔案內(nèi)容涉及安全保密范疇,在氣象行業(yè)內(nèi)部對(duì)如何利用檔案信息化產(chǎn)品還沒(méi)有較成熟的經(jīng)驗(yàn)。
天津市氣象檔案館從1986年成立以來(lái),經(jīng)過(guò)9個(gè)數(shù)字化項(xiàng)目的建設(shè),完成了館藏眾多種類歷史氣象觀測(cè)檔案的圖像掃描工作,形成歷史氣象觀測(cè)檔案數(shù)字化文件,涉及地面氣象觀測(cè)記錄月報(bào)表、氣壓、氣溫、濕度、日照、降水、風(fēng)向風(fēng)速等自記記錄月報(bào)表、電線積冰記錄月報(bào)表、氣象月總簿、農(nóng)業(yè)、地面氣象觀測(cè)記錄年報(bào)表、降水自記紙、降水自記紙曲線提取數(shù)據(jù)文件、風(fēng)向風(fēng)速自記紙、氣溫自記紙、濕度自記紙和建國(guó)前原始觀測(cè)記錄檔案共 17大類資料,數(shù)據(jù)量約870GB。由于沒(méi)有相應(yīng)的安全使用技術(shù),幾年來(lái)沒(méi)有有效地利用這些數(shù)字圖像資料為業(yè)務(wù)和科研人員服務(wù)。
利用虛擬化技術(shù)搭建氣象觀測(cè)檔案掃描圖像安全查閱系統(tǒng),不僅可以減少對(duì)歷史紙質(zhì)資料的翻閱,提高檢索效率,保護(hù)紙質(zhì)檔案,降低檔案管理員的工作量,減少由于檔案移動(dòng)引起的工作失誤,而且系統(tǒng)采用虛擬化技術(shù)可保證掃描圖像文件的安全,防止資料未經(jīng)授權(quán)訪問(wèn)的事件發(fā)生。同時(shí),有利于提高原始觀測(cè)記錄檔案的利用率,更好地為業(yè)務(wù)、科研和決策服務(wù),進(jìn)而提高氣象檔案信息化管理水平,推動(dòng)和促進(jìn)氣象檔案信息化建設(shè)。
歷史氣象觀測(cè)檔案數(shù)字化圖像檢索平臺(tái)開(kāi)發(fā)在Windows環(huán)境下,編程語(yǔ)言采用 PHP,數(shù)據(jù)庫(kù)采用MySQL,Web服務(wù)器采用Apache,系統(tǒng)框架采用B/S模式,使用戶可以根據(jù)需求自主訪問(wèn)氣象檔案資料,減少對(duì)歷史紙質(zhì)資料的翻閱,在保護(hù)珍貴氣象紙質(zhì)檔案的同時(shí),極大地提高了檢索效率。
氣象檔案數(shù)字化建設(shè)工作形成的圖像文件,格式統(tǒng)一、命名規(guī)范,對(duì)于規(guī)范使用圖像資料打下了良好的基礎(chǔ)。前期,對(duì)館藏 17大類 116萬(wàn)頁(yè)歷史氣象觀測(cè)檔案掃描圖像進(jìn)行分類梳理,并結(jié)合氣象專家意見(jiàn),形成的資料目錄為:報(bào)表類資料、自記紙類資料、觀測(cè)簿類資料以及臺(tái)站沿革類資料 4個(gè)一級(jí)子類。其中,報(bào)表類資料包括地面資料、高空資料、輻射資料、農(nóng)氣資料、酸雨資料5個(gè)二級(jí)子類。
報(bào)表類地面資料包括:地面氣象觀測(cè)記錄月報(bào)表(氣表-1)、氣壓自記記錄月報(bào)表(氣表-2P)、氣溫自記記錄月報(bào)表(氣表-2T)、相對(duì)濕度記錄月報(bào)表(氣表-2U)、日照自記記錄月報(bào)表(氣表-4)、降水自記記錄月報(bào)表(氣表-5)、風(fēng)向風(fēng)速自記記錄月報(bào)表(氣表-6)、電線積冰記錄月報(bào)表(氣表-8)、地面氣象觀測(cè)記錄年報(bào)表(氣表-21)及建國(guó)前各類報(bào)表。報(bào)表類高空資料包括:探空球測(cè)風(fēng)觀測(cè)記錄表(高表-12)、雷達(dá)測(cè)風(fēng)觀測(cè)記錄表(高表-13)、探空觀測(cè)記錄表(高表-14)。報(bào)表類農(nóng)氣資料包括:農(nóng)氣表-1、農(nóng)氣表-2、農(nóng)氣表-3。
自記紙類資料包括:降水自記紙、風(fēng)向風(fēng)速自記紙、溫度自記紙、氣壓自記紙、濕度自記紙、日照自記紙、建國(guó)前各類自記紙。
觀測(cè)簿類資料包括:氣簿-1、氣簿-2、氣簿-3、農(nóng)氣簿-1、農(nóng)氣簿-2、農(nóng)氣簿-3、建國(guó)前各類觀測(cè)簿。
臺(tái)站沿革類資料包括:地面站、農(nóng)氣站、高空站、輻射站、酸雨站沿革資料。
根據(jù)歷史氣象觀測(cè)檔案數(shù)字化檢索平臺(tái)的主要功能所設(shè)計(jì)的數(shù)據(jù)庫(kù)中包含以下幾個(gè)表:報(bào)表類資料一級(jí)分類表 bigtype,如表1;報(bào)表類資料二級(jí)分類表smalltype,如表2;自記紙類資料分類表;觀測(cè)簿類資料分類表;臺(tái)站沿革類資料分類表等。
表1 資料一級(jí)分類表Tab.1 First data classification table
表2 資料二級(jí)分類表Tab.2 Secondary data classification table
根據(jù)對(duì)用戶的需求調(diào)研和使用歷史氣象觀測(cè)檔案的習(xí)慣,結(jié)合現(xiàn)有數(shù)字化文件的分類信息,采用mysql設(shè)計(jì)了系統(tǒng)數(shù)據(jù)庫(kù)表,主要包括:報(bào)表類資料一級(jí)分類表、報(bào)表類資料二級(jí)分類表、自記紙類資料分類表等,在此基礎(chǔ)上對(duì)歷史氣象觀測(cè)檔案數(shù)字化圖像檢索平臺(tái)軟件進(jìn)行設(shè)計(jì)。系統(tǒng)最關(guān)鍵的檢索模塊采用 JavaScript技術(shù)實(shí)現(xiàn)資料類別及時(shí)間的多級(jí)聯(lián)動(dòng),用戶可以按需求檢索歷史氣象觀測(cè)檔案,同時(shí)采用 JQuery技術(shù)實(shí)現(xiàn)對(duì)檢索結(jié)果圖片的縮放、漫游等顯示功能。
從歷史氣象觀測(cè)檔案涉密和安全的角度出發(fā),采用桌面虛擬化技術(shù)可實(shí)現(xiàn)較簡(jiǎn)單的共享機(jī)制無(wú)法實(shí)現(xiàn)的隔離和劃分,這些特性可實(shí)現(xiàn)對(duì)數(shù)據(jù)和服務(wù)進(jìn)行可控和安全的訪問(wèn),從底層架構(gòu)上保證了寶貴資料的安全性,如圖1所示。氣象觀測(cè)記錄檔案逐年增加,對(duì)傳統(tǒng)的系統(tǒng)存儲(chǔ)空間有很大的挑戰(zhàn),采用虛擬化技術(shù)可以在不影響用戶的情況下對(duì)物理資源進(jìn)行刪除、升級(jí)或改變。具體實(shí)現(xiàn)過(guò)程如下:
①基于已有的服務(wù)器虛擬化平臺(tái),建立虛擬機(jī),安裝虛擬桌面代理,構(gòu)成桌面虛擬化交付平臺(tái)。
②在購(gòu)置的瘦客戶機(jī)終端,為了保證用戶信息的安全,系統(tǒng)采用 MD5加密技術(shù)將用戶密碼加密存儲(chǔ)到后臺(tái)數(shù)據(jù)庫(kù),用戶在系統(tǒng)主界面登錄框輸入相應(yīng)用戶名及密碼,系統(tǒng)將后臺(tái)庫(kù)存儲(chǔ)的加密后的密碼轉(zhuǎn)換后進(jìn)行比對(duì),如果通過(guò)驗(yàn)證,即可直接登錄至虛擬桌面,訪問(wèn)數(shù)字化檢索平臺(tái)軟件。
③用戶輸入檢索條件進(jìn)行檢索,在使用過(guò)程中,虛擬桌面代理程序?qū)⑻摂M機(jī)端的圖像進(jìn)行壓縮編碼,以流的形式傳遞到客戶端,呈現(xiàn)在終端設(shè)備上,同時(shí)收集客戶終端設(shè)備上輸入的鼠標(biāo)、鍵盤(pán)指令,回傳至虛擬機(jī)端,完成桌面交互過(guò)程。
在整個(gè)使用過(guò)程中,真實(shí)數(shù)據(jù)從未離開(kāi)過(guò)數(shù)據(jù)中心,用戶終端不會(huì)接收到任何真實(shí)數(shù)據(jù)資料,傳遞至客戶端的僅僅是由服務(wù)器處理完畢的結(jié)果畫(huà)面。
圖1 平臺(tái)運(yùn)行流程圖Fig.1 Platform operation flow chart
氣象數(shù)字檔案檢索系統(tǒng)已經(jīng)部署完成,并實(shí)現(xiàn)了業(yè)務(wù)化使用。隨著虛擬化技術(shù)的應(yīng)用,本成果在技術(shù)上具備的共性程度很高,在氣象系統(tǒng)推廣應(yīng)用的前景很好,同時(shí)在其他行業(yè)的檔案管理方面也具備擴(kuò)散的能力。
氣象觀測(cè)記錄檔案是珍貴的檔案資料,因其特殊性及技術(shù)手段的缺失,未能有效利用這些數(shù)字圖像資料為業(yè)務(wù)和科研人員服務(wù)。本文以虛擬化技術(shù)為研究視角,搭建了歷史氣象觀測(cè)檔案數(shù)字化圖像檢索平臺(tái),從底層保證了檔案的安全性,提高了原始觀測(cè)記錄檔案的利用率,從而更好地為業(yè)務(wù)、科研和決策服務(wù),提高了氣象檔案信息化管理水平,推動(dòng)和促進(jìn)了氣象檔案信息化建設(shè)。