方錫惠
(池州市國土資源規(guī)劃勘測院,安徽 池州 247000)
當前階段我國大力發(fā)展數(shù)據(jù)資源庫,人們采用先進的技術手段和方法獲得更多的數(shù)據(jù)資源,這使得數(shù)據(jù)的挖掘工作更加的高效準確。由此數(shù)據(jù)挖據(jù)這一概念應運而生,數(shù)據(jù)挖據(jù)技術是一種科學化利用的分析技術手段,以某種規(guī)律化的形式將巨大的數(shù)據(jù)資源進行分析處理,讓使用者更快速實現(xiàn)自己的需求。數(shù)據(jù)挖掘技術將多種學科理論知識進行了結合,相互關聯(lián)的分析了數(shù)據(jù)庫中的信息,只要通過一個關鍵詞的搜索就能夠關聯(lián)出與關鍵詞相關的一系列相關的概念,這使得相關數(shù)據(jù)的挖掘更加的快捷高效。近年來,數(shù)據(jù)挖掘技術在我國的發(fā)展的已經(jīng)初見成效,并且經(jīng)歷了從理論到實踐的整個過程,有效化的數(shù)據(jù)挖掘通過運用科學技術得以實現(xiàn)。
常見的數(shù)據(jù)挖掘方法主要有以下幾種,分類分析、回歸數(shù)據(jù)挖掘,在國土資源信息化中應用數(shù)據(jù)挖掘技術需要建立龐大的數(shù)據(jù)庫作為前提的,并且分析方法要采用專業(yè)的技術進行分析挖掘數(shù)據(jù)。在龐大的數(shù)據(jù)庫中,有非常多的隱藏重要數(shù)據(jù)概念和規(guī)律,這就需要對這些數(shù)據(jù)進行研究總結。進行國土資源信息化需要有更龐大的數(shù)據(jù)庫的支撐,將相關的國土信息領域從大型的數(shù)據(jù)庫中挖掘出來。主要的分析方法有分析模型、分析時間、分析聚類、分析關聯(lián)和分析序列。這些分析方法都是有嚴謹?shù)目茖W理論知識進行指導的,總結歸納出來具體的數(shù)據(jù)挖掘情況。分類分析法是找出大量數(shù)據(jù)本身具有的共同屬性進行分類,表現(xiàn)形式通??梢酝ㄟ^結構圖和決策樹進行表現(xiàn)?;貧w模型分析以分類分析方法為基礎,通過提供的連續(xù)預測值進行分析數(shù)據(jù)。時間序列模式是按照時間的先后順序來進行數(shù)據(jù)分類,根據(jù)生成數(shù)據(jù)的時間進行排列,通過對過去連續(xù)的數(shù)據(jù)進行科學分析,能夠更加科學的推測出未來發(fā)展的數(shù)據(jù)。聚類分析是按照固定的模式把豐富的數(shù)據(jù)進行聚類,形成科學的數(shù)據(jù)組,并且保證每組數(shù)據(jù)都是進行理論劃分的,從而幫助使用者更有效的獲取數(shù)據(jù)。
關于國土資源數(shù)據(jù)化綜合分析與決策系統(tǒng)(簡稱決策系統(tǒng)) 的主要設計內(nèi)容由需求分析系統(tǒng)、設計系統(tǒng)、開發(fā)實現(xiàn)系統(tǒng)、集成與測試系統(tǒng)等部分組成。 每一個部分都有各自相應工作內(nèi)容。
系統(tǒng)分析:系統(tǒng)的需求分析必須要將相關部門對現(xiàn)有資源的管理充分的考慮進去以及通過本系統(tǒng)的應用。在充分調(diào)研系統(tǒng)用戶需求的基礎上,再對系統(tǒng)進行需求分析。具體的系統(tǒng)分析主要包括以下幾個方面:l) 分析管理用戶業(yè)務;2)用戶對系統(tǒng)功能的需求;3) 調(diào)查與分析數(shù)據(jù)源;4) 對業(yè)務流程進行分析與建模;5) 分析系統(tǒng)界面。
設計系統(tǒng)架構和網(wǎng)絡結構:整個信息系統(tǒng)的骨架就稱作為系統(tǒng)架構, 系統(tǒng)架構決定了系統(tǒng)中各個邏輯組成部分,而其中的重要部分是網(wǎng)絡結構。設計系統(tǒng)架構要以系統(tǒng)組織的層次與組成部分的關系為基礎, 系統(tǒng)的架構要具備實用、靈活、可擴展性。
子系統(tǒng)功能的設計:系統(tǒng)的特點功能較多,必須深入分析各個部分的具體功能、并進行規(guī)范與分類,將功能子系統(tǒng)進行建立, 在各個功能子系統(tǒng)中融入具體功能點,才能使用戶使用起來方便快捷。
整合數(shù)據(jù)與集成設計:由于國土資源數(shù)據(jù)的特點是多源性、多格式,因此,在系統(tǒng)建設中整合和集成這些大數(shù)量、多樣、同時具備定量和定性特點的數(shù)據(jù)是十分重要的內(nèi)容。在將數(shù)據(jù)庫的概念體系結構進行確定之后, 整合和集成數(shù)據(jù)的設計過程成為了大型數(shù)據(jù)庫構建中最難的內(nèi)容。在具體設計過程中會遇到諸多的技術難點,必須將這些問題通過科學的集成方法和技術解決好。
組織數(shù)據(jù)與設計管理:國土資源數(shù)據(jù)的特點是非常復雜十分龐大數(shù)據(jù),因此,國土資源數(shù)據(jù)倉庫的建設是非常有必要的。通過建設的流程與方法,針對國土資源數(shù)據(jù)倉庫的特點采用設計概念、設計邏輯和物理設計共同完成設計數(shù)據(jù)倉庫。
可視化分析表達設計:利用最新的可視化表達技術,針對數(shù)據(jù)七個主題中的特點,進行可視化分析和表達方式的設計,最終展現(xiàn)給用戶的是以文字、圖表、地圖、報表等多種形式的內(nèi)容,從而更好的為管理決策部門提供科學的決策功能。
通過系統(tǒng)分析國土資源數(shù)據(jù),從整體上對國土資源的有效性及數(shù)據(jù)挖掘的程度進行把握,從總體角度出發(fā)進行系統(tǒng)需求分析,通過對數(shù)據(jù)進行不同流程設計以及綜合歸納將系統(tǒng)設計出來。由于國土資源系統(tǒng)的數(shù)據(jù)比較龐大,就需要將子系統(tǒng)建立起來,將數(shù)據(jù)的分類進行細化,從而更有效的利用數(shù)據(jù)系統(tǒng)。國土資源數(shù)據(jù)需要進行綜合性的整合分析,在分析有規(guī)律數(shù)據(jù)的基礎上,才能將數(shù)據(jù)資源從綜合形態(tài)上利用好,將有效資源挖掘出來,進而建立綜合性強的國土資源信息化系統(tǒng)。要從不同的應用形式進行綜合分析,提供的系統(tǒng)要有每一種形式對應的數(shù)據(jù),才能將國土資源信息化有效發(fā)展起來。
綜上所述,歷經(jīng)了數(shù)十年數(shù)據(jù)挖掘技術的發(fā)展,主要技術涉及到數(shù)據(jù)、人工智能、決策樹、統(tǒng)計分析等,在大型數(shù)據(jù)倉庫和OLAP 系統(tǒng)中已經(jīng)集成了這些技術。未來還要繼續(xù)在國土資源信息化中應用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術, 這樣才能更加深入的推進國土資源信息化發(fā)展。