王敏 汪瑋 張世國 王毛翠 方海濤 竇煒明
[摘 要] 利用數(shù)據(jù)分析方法從大量數(shù)據(jù)中發(fā)掘潛在價值,具有重要的研究意義和實際價值。文中以《省級氣象裝備動態(tài)管理系統(tǒng)》數(shù)據(jù)庫中數(shù)據(jù)為研究基礎(chǔ),詳細介紹了數(shù)據(jù)開發(fā)應(yīng)用方向、過程和實現(xiàn)方法。首先,介紹了《省級氣象裝備動態(tài)管理系統(tǒng)》的系統(tǒng)結(jié)構(gòu)和數(shù)據(jù)分類,分析了數(shù)據(jù)類型和特點;然后,展示了數(shù)據(jù)分析框架和數(shù)據(jù)預(yù)處理方法,結(jié)合業(yè)務(wù)工作提出了應(yīng)用方向和實際需求。最后,利用多元線性回歸分析方法,建立了倉儲分析、裝備性能分析及站點運行情況分析數(shù)學(xué)模型,闡述了各技術(shù)指標在業(yè)務(wù)工作中的預(yù)期作用,對提升氣象裝備的信息化管理水平具有指導(dǎo)意義。
[關(guān)鍵詞] 氣象裝備;數(shù)據(jù)開發(fā);信息化;線性回歸
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 07. 090
[中圖分類號] P413 [文獻標識碼] A [文章編號] 1673 - 0194(2016)07- 0193- 03
0 引 言
氣象裝備是現(xiàn)代氣象業(yè)務(wù)的重要組成部分,是實現(xiàn)氣象業(yè)務(wù)現(xiàn)代化的基礎(chǔ),是基層臺站綜合氣象業(yè)務(wù)的重要環(huán)節(jié)。隨著綜合氣象探測系統(tǒng)建設(shè)規(guī)模的不斷提高,對氣象裝備的信息化管理提出新的需求[1-4]。2013年安徽省大氣探測技術(shù)保障中心承擔(dān)《省級氣象裝備動態(tài)管理系統(tǒng)》(2013 -2014年中國局關(guān)鍵技術(shù)集成項目)的開發(fā)、設(shè)計工作。該系統(tǒng)從氣象裝備業(yè)務(wù)實際需求出發(fā),應(yīng)用物聯(lián)網(wǎng)信息跟蹤技術(shù),根據(jù)業(yè)務(wù)流程分類設(shè)計用戶角色功能,利用激光掃描和NFC識別技術(shù)采集氣象裝備各類狀態(tài)、屬地等變化信息,實現(xiàn)省級氣象裝備動態(tài)管理。
信息是新經(jīng)濟的導(dǎo)向和潮流,是社會廣泛關(guān)注的熱點。大數(shù)據(jù)中隱藏著巨大的機會和價值,并在金融領(lǐng)域、物流、社交、醫(yī)療等領(lǐng)域獲益匪淺[5-7]。在物聯(lián)網(wǎng)技術(shù)、NFC識別技術(shù)支撐下,《省級氣象裝備動態(tài)管理系統(tǒng)》數(shù)據(jù)庫數(shù)據(jù)量快速增長,在2年多的時間內(nèi)收集和存儲了2萬多條信息,并以每年幾千條的速度逐年增加。雖然數(shù)據(jù)庫中的數(shù)據(jù)量與大數(shù)據(jù)的海量數(shù)據(jù)相差甚遠,但是這些數(shù)據(jù)涵蓋了多種氣象探測裝備全生命周期內(nèi)狀態(tài)信息、地域?qū)傩孕畔?、流轉(zhuǎn)信息等。如何將這些信息進行有效提取、分類和關(guān)聯(lián)性分析,轉(zhuǎn)化為管理者關(guān)注的信息,對提升裝備信息化管理水平具有重要意義。
1 系統(tǒng)結(jié)構(gòu)及數(shù)據(jù)分類
1.1 系統(tǒng)結(jié)構(gòu)
《省級氣象裝備動態(tài)管理系統(tǒng)》可用于全省氣象觀測裝備采購、供應(yīng)、檢定、維修、流轉(zhuǎn)、報廢、統(tǒng)計和分析等方面,系統(tǒng)的總體架構(gòu)如圖1所示。該系統(tǒng)利用移動系統(tǒng)、NFC等多種感知設(shè)備將氣象裝備信息由網(wǎng)絡(luò)存儲在數(shù)據(jù)庫中,并通過服務(wù)層的功能控制實現(xiàn)個人事務(wù)管理、設(shè)備庫存管理、設(shè)備狀態(tài)管理等業(yè)務(wù)應(yīng)用。
1.2 數(shù)據(jù)分類
系統(tǒng)數(shù)據(jù)庫采用SQL Server2008開發(fā),2013年運行至今,產(chǎn)生數(shù)據(jù)量約2.3萬條。表1為《省級氣象裝備動態(tài)管理系統(tǒng)》的主要數(shù)據(jù)項目和數(shù)據(jù)量。
從數(shù)據(jù)開發(fā)應(yīng)用的技術(shù)角度來看,數(shù)據(jù)主要分為5類:
(1)裝備類型及狀態(tài)統(tǒng)計信息:記錄氣象裝備的類型、數(shù)量、狀態(tài)信息,如氣象裝備的型號、生產(chǎn)廠家,在用、待用、待檢等狀態(tài)信息,可用于指導(dǎo)氣象裝備的采購、調(diào)撥、制定倉儲計劃等。
(2)裝備地域?qū)傩孕畔ⅲ河涗浟搜b備在流轉(zhuǎn)過程中地域?qū)傩缘淖兏畔?,便于建立氣象裝備運行狀態(tài)和地域?qū)傩灾g的聯(lián)系。
(3)裝備技術(shù)性能信息:記錄了氣象裝備的檢定、維修、報廢等信息,為對比分析氣象裝備的特點、性能提供基礎(chǔ)數(shù)據(jù)。
(4)裝備時空特性信息:記錄了氣象裝備的技術(shù)性能與應(yīng)用季節(jié)、地域等信息,便于建立時空關(guān)聯(lián)性。
(5)站點運行狀態(tài)信息:記錄氣象臺站觀測裝備的檢定、維修信息,可分析站點運行狀態(tài),實時監(jiān)控站點的運行情況。
1.3 數(shù)據(jù)特點
《省級氣象裝備動態(tài)管理系統(tǒng)》數(shù)據(jù)庫中的數(shù)據(jù)具有數(shù)據(jù)量較大、信息多樣、地域范圍廣、持續(xù)時間長、數(shù)據(jù)質(zhì)量不同等特點。信息在全省2 000多個氣象站產(chǎn)生,操作人員分為省、市、縣三級多個角色,信息涵蓋每個進入系統(tǒng)的氣象裝備在全生命周期內(nèi)的操作信息,包括狀態(tài)信息、地域?qū)傩孕畔?、流轉(zhuǎn)操作信息等。同時,數(shù)據(jù)庫中數(shù)據(jù)質(zhì)量參差不齊,在系統(tǒng)應(yīng)用初期有部分測試數(shù)據(jù)未及時刪除,部分操作用戶誤操作信息等。