摘 要:本文從大數(shù)據(jù)時代下的空間數(shù)據(jù)挖掘定義及常用手段歸納入手,分析空間數(shù)據(jù)挖掘的現(xiàn)狀及特點,提煉其思想核心內容。以大量文獻資料的凝練理論為依托,探討空間數(shù)據(jù)挖掘的研究體系及今后的發(fā)展趨勢。
關鍵詞:大數(shù)據(jù)時代;空間數(shù)據(jù)挖掘;發(fā)展趨勢
中圖分類號:TP311.13
隨空間信息的概念進入公眾視野、成為研究人員的探討議題后,部分專家便預測了空間數(shù)據(jù)挖掘的必然出現(xiàn),由于大數(shù)據(jù)時代對于數(shù)據(jù)的特殊要求及屬性定位,勢必會帶動一股對于數(shù)據(jù)整合手段的討論熱潮,而空間數(shù)據(jù)挖掘技術隨之應運而生。從簡單的同類事件各類型數(shù)據(jù)的對比提煉,到各類型事件多樣化數(shù)據(jù)的收集、整合,空間數(shù)據(jù)挖掘技術較數(shù)據(jù)挖掘技術的提升空間巨大。
1 論文議題概念與意義
隨各類型資料、信息的聚集量逐漸擴大,信息整合技術手段層出不窮,可以說,我們當下生活的環(huán)境已進入大數(shù)據(jù)時代。各類型事件、各類型組織、各類型研究議題均無法脫離大數(shù)據(jù)時代的長遠影響。大數(shù)據(jù)時代已經開啟便注定其今后的主導地位。而空間數(shù)據(jù)挖掘則是大數(shù)據(jù)時代的主要代表思想,從其概念看,空間數(shù)據(jù)挖掘指的是將存在于空間領域、表面看毫無規(guī)律、內在聯(lián)系不明顯的隱含數(shù)據(jù)信息運用相關特征及模型建立手段進行提煉的過程。其操作過程包含數(shù)據(jù)的準備過程、選擇過程、預處理過程、縮減過程、變換過程、配套研發(fā)過程等多個環(huán)節(jié),每一環(huán)節(jié)都緊密相扣。就已有空間數(shù)據(jù)挖掘研究現(xiàn)狀看,較成熟的空間數(shù)據(jù)挖掘手段包括概率論、空間分析、統(tǒng)計分析、歸納學習、空間關聯(lián)、聚類分析、神經網絡、決策樹、粗集、趨勢探測、云理論、遺傳算法、可視化處理等等類型。大數(shù)據(jù)時代的空間數(shù)據(jù)挖掘技術研究所經歷的發(fā)展歷程呈現(xiàn)初步提升、類型多元化變換的良性趨勢。
對于空間數(shù)據(jù)挖掘技術,人們由最初的簡單數(shù)據(jù)提取逐步演化為如今對技術手段的不斷優(yōu)化,可以說,大數(shù)據(jù)時代的社會輪廓愈發(fā)清晰明朗。大數(shù)據(jù)時代的空間挖掘技術也逐漸從專業(yè)領域研究人員所用手段逐步變?yōu)槿粘I钪薪洺3霈F(xiàn)的行為模式。從政府執(zhí)政參考、學校教學手段提升、專業(yè)領域研究、到社會現(xiàn)象規(guī)律探究,各行各業(yè)隨處可見大數(shù)據(jù)空間數(shù)據(jù)挖掘思想的影子?;蛟S人們在操作過程中并不確定其手段的數(shù)據(jù)挖掘屬性,然而大數(shù)據(jù)時代的空間數(shù)據(jù)挖掘思想就這樣的逐步滲透到我們的生活中。
本文議題設定原則在于協(xié)助人們明確自身所處社會時代的大數(shù)據(jù)特性,以前人思想分析為基礎,明晰空間數(shù)據(jù)挖掘思想對人們日常生活的重大影響及其優(yōu)勢。
2 空間數(shù)據(jù)挖掘的特點及應用范圍
信息時代必然的結果是巨大數(shù)量級的各樣信息的逐漸積累,無章可循的大量信息無法給人提供有效信息及功能,那么我們可以稱之為垃圾信息。倘若沒有空間數(shù)據(jù)挖掘作用,那么我們周圍的所有信息將以雜亂無章的混亂形式充填,加之空間信息的增長速度極快,根據(jù)領域個性化要求進行的空間數(shù)據(jù)挖掘技術的出現(xiàn)十分必要。
2.1 空間數(shù)據(jù)挖掘的特點歸納??臻g數(shù)據(jù)由于其區(qū)別于普通數(shù)據(jù)的多樣性及復雜性,注定了空間數(shù)據(jù)挖掘手段具備一定特殊屬性。在查閱相關資料后筆者發(fā)現(xiàn)空間數(shù)據(jù)挖掘的特點可以從其本身特性及應用特性兩方面予以概括。
(1)數(shù)據(jù)來源多樣且豐富、數(shù)據(jù)數(shù)量級龐大、數(shù)據(jù)類型眾多、數(shù)據(jù)呈現(xiàn)形式表面看非常復雜;(2)所依托手段水平較高,常常借助空間搜索引擎使用機制對復雜空間數(shù)據(jù)予以組織。由于空間數(shù)據(jù)挖掘技術的定位較此前大數(shù)據(jù)環(huán)境下的簡單數(shù)據(jù)整合、聚類而言有很大提升,所涉及的相關技術手段的水平自然而然隨之提升;(3)空間數(shù)據(jù)挖掘手段類別多樣,對于不同領域要求有不同屬性表現(xiàn)。由于應用范圍多樣且復雜,空間數(shù)據(jù)挖掘手段的類型也隨之發(fā)生不同變化,每一類空間數(shù)據(jù)挖掘技術都依據(jù)所負責的領域研究內容而在側重點上有所不同;(4)空間數(shù)據(jù)挖掘原則為多尺度、多維度并行分析。面對現(xiàn)代社會日趨多元化、復雜化、空間化的數(shù)據(jù)信息整合需求,空間數(shù)據(jù)挖掘手段雖然各自存在不同,但其發(fā)展趨勢方向為多領域并行分析。原因在于各類型領域的共同性注定了今后信息整合的歸一性。
2.2 空間數(shù)據(jù)挖掘的技術支撐。目前國際上公認的具有代表性的空間數(shù)據(jù)挖掘技術支持系統(tǒng)包括Descartes、GeoMiner、ArcViewGIS的S_plus接口數(shù)據(jù)庫系統(tǒng)。這三種SDM系統(tǒng)在不斷的實踐應用過程中均表現(xiàn)出令人滿意的可視化地圖與DM之間的結合能力??梢蕴峁└鶕?jù)用戶數(shù)據(jù)需求的多樣聚類、數(shù)據(jù)信息分類等挖掘形式。Descartes作為專門的空間數(shù)據(jù)可視化技術,其工作原則為與DM工具Kepler兩者聯(lián)合在一起。而GeoMiner系統(tǒng)相對龐大,在實際運用過程中會對空間數(shù)據(jù)信息平臺的資源配置要求過高,也可能會造成一定程度的資源浪費。而較為常用的GIS系統(tǒng)在應用過程中同樣存在一定缺陷,雖然其技術本質為解釋性語言的一種,但其功能性上較C語言而言較慢,也就是說,GIS系統(tǒng)較難實現(xiàn)對相對量多的數(shù)據(jù)庫的挖掘。
以GIS中數(shù)據(jù)挖掘的過程,幫助理解空間數(shù)據(jù)挖掘的技術方案。首先,根據(jù)一定的主題要求及背景知識,從現(xiàn)有的空間數(shù)據(jù)中提取數(shù)據(jù)進行分析、處理。其次,選擇合適的算法,確定參數(shù)。得出挖掘數(shù)據(jù)后對其進行評價,再以用戶能夠全面理解的方式呈現(xiàn)給用戶。
2.3 空間數(shù)據(jù)挖掘的應用領域。正如前文所說,空間數(shù)據(jù)挖掘的涉及領域范圍極廣,對人們工作、生活、學者研究乃至國家政策都有潛移默化的影響,其優(yōu)勢已被國際認可。就目前空間數(shù)據(jù)挖掘的發(fā)展現(xiàn)狀看,其應用領域包括國家國防建設及安全籌劃、人們日常生活及身體健康、氣候變化及天氣預測、地質勘探及環(huán)境調研、地震預防及突發(fā)性事件應對規(guī)律等。近幾年來被熱議的智慧城市、智慧地球等新興理念也同樣受到空間數(shù)據(jù)挖掘的影響。
天文學、地質學、災害學等領域需要依托以往經驗、規(guī)律進行有效預測、算法設置、要點歸納,而大數(shù)據(jù)時代下的空間數(shù)據(jù)挖掘思想恰恰迎合了這種需求,值得注意的是,空間數(shù)據(jù)挖掘技術在危機管理及危機預警行業(yè)的應用頻繁、效用顯著。由此可以推測,今后空間數(shù)據(jù)挖掘技術在經驗探究、規(guī)律總結類研究領域的應用比重將會更大。
3 空間數(shù)據(jù)挖掘的應用趨勢及發(fā)展預測
分析大數(shù)據(jù)下的空間數(shù)據(jù)挖掘現(xiàn)狀筆者發(fā)現(xiàn),就目前社會市場環(huán)境下的應用需要,空間數(shù)據(jù)的所有特征并未被人們完整地注意到,某些待開發(fā)領域特征的存在注定了空間數(shù)據(jù)挖掘技術的深入研發(fā)遠景。比如,對于多來源的空間數(shù)據(jù)的預處理技術水平尚不能完全滿足各行業(yè)、各類型組織的應用需求,對于空間數(shù)據(jù)的種類劃分及對應技術方法的研討仍在進行。
而今互聯(lián)網的迅猛發(fā)展也為空間數(shù)據(jù)挖掘技術的前行助力,空間上必然存在的信息屬性不確定性逼迫著空間數(shù)據(jù)挖掘者們持續(xù)進步。在分析空間數(shù)據(jù)挖掘思想的特征、目標、現(xiàn)狀的基礎上,筆者認為,空間數(shù)據(jù)挖掘今后的發(fā)展方向必然是各類型、領域、行業(yè)的專業(yè)化空間數(shù)據(jù)整合技術的研發(fā),其目標在于協(xié)助人類更直觀、多角度、完整地認知世界、環(huán)境及社會,幫助人們提升自身面對知識的有效提取能力??梢哉f,大數(shù)據(jù)時代下的空間數(shù)據(jù)挖掘技術的核心發(fā)展目標在于更好的服務于人類社會的發(fā)展。
4 結束語
雖然已有空間數(shù)據(jù)挖掘技術水平基本滿足現(xiàn)有信息結構化處理需求,但隨各領域研發(fā)進度的深入、多樣化,已有的空間數(shù)據(jù)挖掘技術的不斷強化、提升成為大數(shù)據(jù)時代下的空間數(shù)據(jù)挖掘技術的必然發(fā)展趨勢。從技術及理論方法兩方面,完成實踐與理論的雙向完善,成為各領域專家、研究人員今后的工作重點。
參考文獻:
[1]蔣良孝.空間數(shù)據(jù)挖掘的回顧與展望[J].計算機工程與應用,2003(06).
[2]李德仁.論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)[J].武漢大學學報,2011(06).
[3]段曉君.可視化數(shù)據(jù)挖掘技術及其應用[J].計算機應用,2000(01).
作者單位:貴陽職業(yè)技術學院,貴陽 550081