羅興賢+李巧玲+周智勇+高江錦
摘要:地質(zhì)公園的地質(zhì)遺跡具有高度的景觀價值,而公園的地質(zhì)遺跡數(shù)據(jù)庫中保存有這些地質(zhì)遺跡的位置數(shù)據(jù);空間數(shù)據(jù)挖掘就是根據(jù)空間點的位置關(guān)系來獲取空間點的有價值信息;DBSCAN算法是一種基于密度的空間聚類方法;通過將地質(zhì)遺跡數(shù)據(jù)庫中的地質(zhì)遺跡的原始位置信息轉(zhuǎn)換為便于數(shù)據(jù)挖掘所使用的形式,采用DBSCAN算法對地質(zhì)遺跡進行聚類,為地質(zhì)公園制作景區(qū)劃分方案提供科學(xué)依據(jù)。
關(guān)鍵詞:地質(zhì)公園;地質(zhì)遺跡;景區(qū);空間數(shù)據(jù)挖掘;DBSCAN
中圖分類號:TP39 文獻標(biāo)識碼:A 文章編號:1007-9416(2017)07-0118-03
1 引言
地質(zhì)公園是以具有一定規(guī)模和分布范圍的、有代表意義的地質(zhì)遺跡為主體,并融合其他自然景觀或人文景觀構(gòu)成的特定地區(qū),它具有特殊的科學(xué)意義、稀有的自然屬性、優(yōu)雅的美學(xué)觀賞價值。
對于以地質(zhì)遺跡為本的地質(zhì)公園,要以科學(xué)發(fā)展觀為指導(dǎo)思想,嚴格遵循“保護優(yōu)先,科學(xué)規(guī)劃,合理利用”的原則,確保公園所在地區(qū)的經(jīng)濟可持續(xù)發(fā)展的目標(biāo)。對于地質(zhì)公園獨特的自然遺產(chǎn)與文化遺產(chǎn)首先要進行妥善的保護,在此基礎(chǔ)上,再提供相應(yīng)的科學(xué)研究、科普教育以及旅游經(jīng)濟開發(fā)。
地質(zhì)公園主要以地質(zhì)遺跡為觀賞景點,而地質(zhì)遺跡主要是由于自然或歷史原因而產(chǎn)生的,具有獨特的自然屬性,地理位置固定,具有人工難以構(gòu)建的特點,決定了地質(zhì)公園景區(qū)的劃分必須圍繞地質(zhì)遺跡這個核心來進行合理規(guī)劃,在保護地質(zhì)遺跡的前提下,提供其觀賞價值,來進行旅游經(jīng)濟開發(fā)。
地質(zhì)遺跡的相關(guān)信息一般存在于地質(zhì)遺跡數(shù)據(jù)庫中,其中就包含了地質(zhì)遺跡的空間位置信息,要從這些地質(zhì)遺跡的空間位置信息中來劃分景區(qū)[1],利用空間數(shù)據(jù)挖掘技術(shù)是一個有效的手段。
2 空間數(shù)據(jù)挖掘
2.1 空間數(shù)據(jù)挖掘的概念
空間數(shù)據(jù)挖掘(Spatial Data Mining)是指在空間數(shù)據(jù)庫的基礎(chǔ)上,綜合利用統(tǒng)計學(xué)方法、模式識別技術(shù)、人工智能方法、神經(jīng)網(wǎng)絡(luò)技術(shù)、粗集、模糊數(shù)學(xué)、機器學(xué)習(xí)、專家系統(tǒng)和相關(guān)信息技術(shù)等,從大量的空間生產(chǎn)數(shù)據(jù)、管理數(shù)據(jù)、經(jīng)營數(shù)據(jù)或遙感數(shù)據(jù)中析取人們可信的、新穎的、感興趣的、隱藏的、事先未知的、潛在有用的和最終可理解的知識,從而揭示出蘊含在數(shù)據(jù)背后的客觀世界的本質(zhì)規(guī)律、內(nèi)在聯(lián)系和發(fā)展趨勢,實現(xiàn)知識的自動獲取,提供技術(shù)決策與經(jīng)營決策的依據(jù)[2]??梢姡抢脭?shù)據(jù)挖掘方法,按照一定的度量值和臨界值從空間數(shù)據(jù)庫中抽取知識以及與之相關(guān)的預(yù)處理、抽樣和數(shù)據(jù)變換的一個多步驟相互鏈接、反復(fù)進行的人機交互過程。
2.2 空間數(shù)據(jù)挖掘的過程
空間數(shù)據(jù)挖掘包括四個主要的過程:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、結(jié)果解釋、知識表示[3]。整個過程是一個不斷循環(huán)和反復(fù)的過程,因上可對所發(fā)掘出的知識不斷求精和深化,其挖掘過程可用圖1來表示。
2.3 空間數(shù)據(jù)挖掘的方法
常見的空間數(shù)據(jù)挖掘方法有:基于概率統(tǒng)計的分析方法、基于泛化和歸納的方法、基于聚類的方法、基于分類的方法、基于空間關(guān)聯(lián)的方法、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、支撐向量機(SVM)、圖像分析和模式識別、Rough集方法和云理論方法等[4]。
3 空間數(shù)據(jù)挖掘方案
3.1 挖掘方法的選擇
由于地質(zhì)公園的地質(zhì)遺跡數(shù)據(jù)庫在記錄地質(zhì)遺跡的時候,通常把地質(zhì)遺跡抽象為一個個的點來看,并記錄下這些點的經(jīng)度和緯度等與位置相關(guān)的信息,因此,擬采用空間點聚類方法中的經(jīng)典算法——DBSCAN算法來對地質(zhì)遺跡分布進行景區(qū)劃分[5][6]。
3.2 DBSCAN算法簡介
在基于點聚類的空間聚類算法中,DBSCAN算法是一種經(jīng)典算法,它是基于密度的空間聚類方法。它的基本原理是采用一定鄰域內(nèi)包含空間實體的最小數(shù)目來定義空間密度,并通過不斷增長高密度區(qū)域進行空間聚類,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)庫中發(fā)現(xiàn)任意形狀的聚類。其算法過程如下:
輸入: 包含n個對象的數(shù)據(jù)庫,半徑Eps,最少數(shù)目MinPts;
輸出: 所有生成的簇,達到密度要求。
(1)Repeat;
(2)從數(shù)據(jù)庫中抽出一個未處理的點;
(3)IF抽出的點是核心點 THEN 找出所有從該點密度可達的對象,形成一個簇;
(4)ELSE 抽出的點是邊緣點(非核心對象),跳出本次循環(huán),尋找下一個點;
(5)UNTIL 所有的點都被處理。
由于DBSCAN對用戶定義的參數(shù)很敏感,細微的不同都可能導(dǎo)致差別很大的結(jié)果,而參數(shù)的選擇無規(guī)律可循,只能靠經(jīng)驗確定,因此,往往要通過多次實驗才能確定一個較滿意的結(jié)果。
3.3 數(shù)據(jù)的準備
從地質(zhì)遺跡數(shù)據(jù)庫中抽取的地質(zhì)遺跡的原始的經(jīng)度與緯度數(shù)據(jù)如表1所示。
由于地質(zhì)遺跡的位置數(shù)據(jù)采用的是度分秒的形式來記錄的,因此先通過轉(zhuǎn)換公式,將度分秒的坐標(biāo)形式轉(zhuǎn)換為實數(shù)的坐標(biāo)形式,如表2所示。
在表2的數(shù)據(jù)中可以看出,由于地質(zhì)遺跡的位置常常集中于一個經(jīng)緯度變化很小的范圍內(nèi),位置數(shù)據(jù)區(qū)分度太小,因此,可以將位置數(shù)據(jù)的實數(shù)放大,以便讓地質(zhì)遺跡位置數(shù)據(jù)之間有明顯的區(qū)分度。將表2中的位置數(shù)據(jù)放大10000倍后得到如表3所示的結(jié)果,從中可以看出各地質(zhì)遺跡的位置數(shù)據(jù)有著明顯的區(qū)別。這樣,就可以使用準備好的數(shù)據(jù)進行實驗。
4 實驗
將格式化好的數(shù)據(jù)按要求導(dǎo)出到指定的文本文件中,使用R語言[7]自帶的函數(shù)DBSCAN進行空間聚類,經(jīng)過多次實驗,發(fā)現(xiàn)當(dāng)MinPts=2,eps=180或eps=190時聚類結(jié)果較為理想,均只有一個噪聲點,其結(jié)果分別如圖2和圖3所示;當(dāng)eps為180時,可以將53個點聚為5個類,而當(dāng)eps取190時,DBSCAN將圖2中的④⑤兩個類聚為了一個類,從而縮減為4個類。
5 結(jié)語
由于地質(zhì)公園均建設(shè)有地質(zhì)遺跡數(shù)據(jù)庫,該數(shù)據(jù)庫中就包含了各地質(zhì)遺跡的位置數(shù)據(jù),因此,利用基于密度的空間聚類方法,根據(jù)地質(zhì)遺跡數(shù)據(jù)庫中的位置信息來對公園內(nèi)各地質(zhì)遺跡進行聚類,聚類的結(jié)果可以作為地質(zhì)公園管理者制定景區(qū)劃分方案的科學(xué)依據(jù),如圖2和圖3。到底采用哪種景區(qū)劃分方案,可結(jié)合地質(zhì)公園景區(qū)管理的實際需求來進行選擇和修訂。
參考文獻
[1]辜寄蓉,陳先偉,楊海龍.城市功能區(qū)劃分空間聚類算法研究[J].測繪科學(xué),2011, (05):65-67+64.
[2]李德仁,王樹良,史文中,王新洲.論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)[J].武漢大學(xué)學(xué)報(信息科學(xué)版),2001,(06):491-499.
[3]張志兵.空間數(shù)據(jù)挖掘及其相關(guān)問題研究[M].武漢:華中科技大學(xué)出版社,2011.
[4]柳盛,吉根林.空間聚類技術(shù)研究綜述[J].南京師范大學(xué)學(xué)報(工程技術(shù)版),2010,(02):57-62.
[5]張文元,談國新,朱相舟.停留點空間聚類在景區(qū)熱點分析中的應(yīng)用[J].計算機工程與應(yīng)用,2017,(02):1-9.
[6]李新延,李德仁.DBSCAN空間聚類算法及其在城市規(guī)劃中的應(yīng)用[J].測繪科學(xué),2005,(03):51-53+5.
[7]黃文,王正林.數(shù)據(jù)挖掘:R語言實戰(zhàn)[M].北京:電子工業(yè)出版社,2014.endprint