亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Ward法的區(qū)域空間聚類分析

        2010-09-28 02:46:20楊志恒
        中國人口·資源與環(huán)境 2010年1期
        關(guān)鍵詞:平方和類別聚類

        楊志恒

        (山東經(jīng)濟(jì)學(xué)院山東區(qū)域經(jīng)濟(jì)研究院,山東濟(jì)南 250014)

        基于Ward法的區(qū)域空間聚類分析

        楊志恒

        (山東經(jīng)濟(jì)學(xué)院山東區(qū)域經(jīng)濟(jì)研究院,山東濟(jì)南 250014)

        作為數(shù)據(jù)挖掘和數(shù)據(jù)信息分析的一個重要技術(shù),空間聚類方法是確定區(qū)域劃分方案的一種定量分析方法。本文以Ward系統(tǒng)聚類法為基礎(chǔ),采用自下而上的層次方法,定義了由地理空間距離與空間鄰接關(guān)系提取的空間鄰近指數(shù),將其作為判斷離差平方和增幅最小類別是否聚合的指示值,對給定的數(shù)據(jù)進(jìn)行逐層篩選判別,進(jìn)行空間聚合分析。將該算法應(yīng)用于昆明市經(jīng)濟(jì)發(fā)展分區(qū),所得結(jié)果較好的體現(xiàn)了昆明市經(jīng)濟(jì)發(fā)展水平的地域特征,實現(xiàn)了空間上自動聚合,使得分區(qū)結(jié)果符合區(qū)域劃分原則。

        Ward法;空間鄰近指數(shù);空間聚類算法;優(yōu)先度

        聚類分析又稱群分析,是研究(樣本或指標(biāo))分類問題的一種多元統(tǒng)計方法。聚類分析中的類,通俗地說,指的就是相似元素的集合。對于區(qū)域樣本來說,通過聚類分析得到的分類結(jié)果在空間上表現(xiàn)為不同的類型區(qū),可以作為區(qū)域劃分的依據(jù)。目前較為成熟的聚類方法主要有采用層次的方法(亦稱系統(tǒng)聚類法)(hierarchicalmethod)、劃分的方法(partitioningmethod)、基于密度的方法(densitybased method)、基于網(wǎng)格的方法(grid-based method)和基于模型的方法(model-based method)等。本文選用Ward系統(tǒng)聚類法,強(qiáng)調(diào)同類事物的內(nèi)部差異(相當(dāng)于方差或標(biāo)準(zhǔn)差)應(yīng)該很小,而不同類之間的差異應(yīng)該很大,突出強(qiáng)調(diào)類型區(qū)內(nèi)部的同質(zhì)性,適用于以區(qū)域為樣本的集群聚類,輔助分區(qū)決策。地理空間上的區(qū)域分區(qū)研究,其實質(zhì)就是將地理特征(包括空間信息特征和非空間信息特征)相似的區(qū)域聚合在一起,是聚類方法在地理空間上的推廣應(yīng)用,目前這方面的研究雖然體現(xiàn)了樣本區(qū)域的空間信息特征,但在反映區(qū)域樣本的綜合地理空間信息上有所失真[1-8],僅考慮區(qū)域樣本之間的空間距離[9]或空間鄰接關(guān)系[10-11]的單一指標(biāo),這樣聚類后的結(jié)果有可能出現(xiàn)同類區(qū)域地域上相互分離和“飛地型”的空間表現(xiàn)形式,無法滿足區(qū)劃要求的同一類型的區(qū)域樣本在地域上相互流通,空間上“集結(jié)成片”之需要。本文在經(jīng)典統(tǒng)計學(xué)定義的距離聚類算法基礎(chǔ)上,深入探討區(qū)域樣本在地理空間特征上的相似性,實現(xiàn)相同類型的聚類對象在空間上能夠自動合并為一個連通的區(qū)域,而不同類型的聚類對象之間在空間上相互獨立,這種空間聚類算法可以有效解決三維空間聚類問題,幫助發(fā)掘更具地理信息價值的區(qū)域類型。

        1 研究方法

        1.1 聚類準(zhǔn)則

        (1)Tobler地學(xué)第一定律提出的空間自相關(guān)性,即鄰近的位置將具有相互類似的值;

        (2)區(qū)域劃分要求地理屬性一致,空間上相互毗鄰。

        1.2 Ward法

        Ward法又稱離差平方和法[12-14],即以平方歐氏距離作為兩類之間的距離,先將集合中每個樣本自成一類,在進(jìn)行類別合并時,計算類重心間方差,將離差平方和增加的幅度最小的兩類首先合并,再依次將所有類別逐級合并。具體算法如下:

        1.3 空間信息表征

        影響區(qū)域樣本聚類合并的地理空間信息主要表現(xiàn)為類間的空間距離與空間鄰接關(guān)系,空間距離zij可以用類在地理空間上的幾何中心O(m,n)兩兩之間的歐幾里德距離量算。

        相對于空間集聚效應(yīng)來說,空間距離是一個負(fù)指標(biāo),即空間距離愈大,類間的距離愈遠(yuǎn),空間集聚效應(yīng)愈小,為此,需要對zij進(jìn)行轉(zhuǎn)換,形成空間距離矩陣,用Z表示。

        空間鄰接關(guān)系aij表征樣本區(qū)域類型i與類型j在空間上是否鄰接。類別的兩兩鄰接關(guān)系可以寫成空間鄰接矩陣,用A表示。

        為了表征同一類型區(qū)域樣本的空間信息,空間距離矩陣與空間鄰接矩陣可以通過元素求積,形成空間鄰近指數(shù)nij,寫成矩陣N,獲取空間上鄰接、類間距離最近的最小累積成本[1314]。

        這樣就構(gòu)造出不同區(qū)域類型兩兩對應(yīng)的空間鄰近指數(shù)矩陣,nij愈大,空間鄰近度愈大,nij=0,說明空間上不鄰近。當(dāng)進(jìn)行聚類時,兩個類別合并后形成了一個新的區(qū)域類型后,空間鄰近指數(shù)需要重新計算。

        1.5 空間聚類算法

        空間聚類算法采用自下而上的層次方法,從每個對象均為一個(單獨的)組開始;逐步將這些(對象)組進(jìn)行合并,直到組合并在層次頂端或滿足終止條件為止,其具體思路為:在優(yōu)先體現(xiàn)樣本系統(tǒng)聚類指標(biāo)集群度的基礎(chǔ)上,將空間鄰近指數(shù)作為聚合的判別依據(jù),參與聚類過程。也就是說,首先計算類兩兩之間的離差平方和增幅,確定Ward法合并類的距離矩陣,然后篩選離差平方和增幅最小的類內(nèi)所有樣本,比較空間鄰近指數(shù),取對應(yīng)最大鄰近值的樣本優(yōu)先聚類,對聚合后的新類重新計算離差平方和空間鄰近指數(shù),依照方差最小、空間最鄰近原則將所有樣本逐級搜索聚類,確保類內(nèi)樣本在空間上相連。具體算法如下:

        依照p個系統(tǒng)聚類指標(biāo)將n個區(qū)域樣本分成k類,計算St,Ward法合并類的距離公式為:

        得到距離矩陣,篩選距離最小的對應(yīng)的類別Git和Gjt,比較Git和Gjt的空間鄰近指數(shù)N(t)ij,當(dāng):聚合后形成新類G(k+1),重新計算空間鄰近指數(shù)Niji,j

        ∈(1,n-1),重復(fù)以上步驟,直至所有樣本聚合完畢(見圖1)。

        圖1 基于Ward法的空間聚類算法流程圖

        1.4 空間聚類算法的實現(xiàn)

        依據(jù)上述算法,利用ArcGIS Desktop9.0與MATLAB6.5軟件聯(lián)合實現(xiàn)空間聚類。首先,利用ArcGIS軟件中SpatialAnalysis模塊,導(dǎo)入GR I D數(shù)據(jù),利用已有程序計算空間距離和空間鄰接關(guān)系;利用Cost-Weighted Distance工具計算得到空間鄰近指數(shù)矩陣;然后,利用MATLAB軟件中Statistics Toolbox模塊,輸入系統(tǒng)聚類指標(biāo),計算離差平方和,比較對應(yīng)最小離差平方和類別的樣本的空間鄰近指數(shù),篩選優(yōu)先合并類別;繼而,將結(jié)果返回ArcGIS,合并記為新的一類,重新計算空間鄰近指數(shù)矩陣,再返回MATLAB進(jìn)行聚類;最后,依次將所有類別逐級合并,得到最終結(jié)果。

        2 實例研究

        對昆明市域(除滇池外)經(jīng)濟(jì)發(fā)展水平進(jìn)行聚類分析,試驗數(shù)據(jù)包括昆明市14個區(qū)(縣、市)的經(jīng)濟(jì)發(fā)展數(shù)據(jù)(2006年)與1:10000行政區(qū)劃圖。擬將昆明市經(jīng)濟(jì)發(fā)展水平分為四類經(jīng)濟(jì)區(qū),結(jié)合當(dāng)?shù)靥攸c制訂經(jīng)濟(jì)發(fā)展戰(zhàn)略并以此作為規(guī)劃分區(qū)的依據(jù)。為了便于說明,本文以14個區(qū)(縣、市)為樣本進(jìn)行空間聚類分析,與采用傳統(tǒng)系統(tǒng)聚類方法得到的聚類結(jié)果進(jìn)行對比,分析兩種方法對昆明市的經(jīng)濟(jì)發(fā)展水平類型劃分的影響。

        2.1 系統(tǒng)聚類指標(biāo)選取

        選擇人均GDP、GDP增速、產(chǎn)業(yè)結(jié)構(gòu)比、人均財政收入、固定資產(chǎn)投資總額、對外出口額等六項指標(biāo)分別用來表征經(jīng)濟(jì)規(guī)模、經(jīng)濟(jì)結(jié)構(gòu)、增長質(zhì)量、發(fā)展?jié)摿?、對外開放度等經(jīng)濟(jì)發(fā)展特征。指標(biāo)值經(jīng)過極差標(biāo)準(zhǔn)化處理后,得出系統(tǒng)聚類指標(biāo)值。

        2.2 空間信息提取

        將14個區(qū)(縣、市)每一個樣本看作一類,見表1。

        在ArcGIS里將區(qū)域轉(zhuǎn)換成點,得到區(qū)域幾何中心,計算兩兩中心之間的空間距離,進(jìn)行歸一化處理后得到地理空間距離矩陣:

        2.3 空間聚類結(jié)果

        優(yōu)先采用Ward法進(jìn)行聚類,將14個樣本各自看成一類,此時類內(nèi)離差平方和S=0;將一切可能的任意兩列合并,計算所增加的離差平方和,列表如下:

        表1 聚類樣本

        自動搜索樣本的邊界,根據(jù)圖形拓?fù)潢P(guān)系,判斷共有公共邊界的相鄰接樣本,得到空間鄰接指示表。寫成矩陣形式為:

        累積計算所得的空間鄰近指數(shù)矩陣為:

        表中非對角線最小元素是0.01,說明將G13、G14增加的S最少,從空間鄰近指數(shù)矩陣獲取N13,14為0.70,G13、G14在空間上鄰近,合并為新類G15,繼續(xù)計算G1-G12與

        G15的空間鄰近指數(shù),G15與其它類的距離見表3:

        表2 兩兩合并的離差平方和

        表3 兩兩合并的離差平方和(D2(1))

        圖3 空間聚類結(jié)果

        3 結(jié)論與結(jié)語

        本文以昆明市14個區(qū)(縣、市)的經(jīng)濟(jì)發(fā)展分區(qū)聚類為例,在Ward法聚類過程中,加入類別之間的地理空間鄰近信息作為聚類的判別指示,將昆明經(jīng)濟(jì)發(fā)展特征落實到地域上,從圖1來看,劃分到同一類別的樣本在空間上集結(jié)成片,而采用傳統(tǒng)系統(tǒng)聚類方法得到的分類結(jié)果,有兩組同一類別的樣本在空間上是相互分離的。不同的聚類方法劃分的結(jié)果差別較大,除盤龍區(qū)、五華區(qū)、西山區(qū)和官渡區(qū)組成的一類沒有變動外,其它樣本的類別歸屬都有較大改變,如采用空間聚合方法,東川區(qū)與北部的祿勸縣、尋甸縣和富民縣合并;安寧市與晉寧縣、呈貢縣合并為環(huán)滇池區(qū)域;由于宜良縣的空間鄰接傳遞作用,使得嵩明縣和石林縣最終合并為一類。這樣的分類聚合結(jié)果與昆明市對區(qū)(縣、市)的規(guī)劃分區(qū)結(jié)果接近,類內(nèi)樣本的同質(zhì)性較強(qiáng),滿足了同一類樣本在地理空間上的自動聚合目的,較好的體現(xiàn)出昆明市域內(nèi)的經(jīng)濟(jì)發(fā)展差異,解決了區(qū)域樣本聚類過程中產(chǎn)生相互分離和“飛地”問題,該算法在進(jìn)行區(qū)域樣本的空間聚類方面具有良好的應(yīng)用效果。

        本研究僅根據(jù)各區(qū)(縣、市)的經(jīng)濟(jì)特征進(jìn)行分類,并未就經(jīng)濟(jì)發(fā)展水平進(jìn)行評價,所以劃分出的類別不代表級別。另外,在聚類指標(biāo)選擇上只照顧到樣本間的經(jīng)濟(jì)特征一致性,所劃分的類別作為經(jīng)濟(jì)區(qū)來說,沒有設(shè)計體現(xiàn)樣本間的經(jīng)濟(jì)聯(lián)系和經(jīng)濟(jì)互補(bǔ)性的指標(biāo)。

        在今后的研究中,本算法將逐步考慮尺度對樣本的類別信息的影響,增加對研究對象的粒度和幅度的研究,將研究樣本擴(kuò)展到鄉(xiāng)鎮(zhèn)級別,研究范圍擴(kuò)展到區(qū)域,并探索應(yīng)用空間自相關(guān)分析等技術(shù)在空間聚類過程中的應(yīng)用,指導(dǎo)區(qū)域劃分。

        (編輯:于 杰)

        [1]王平,史培軍.自下而上進(jìn)行區(qū)域自然災(zāi)害綜合區(qū)劃的方法研究──以湖南省為案例[J].自然災(zāi)害學(xué)報,1999,(3):54-60.

        [2]駱劍承,梁怡.多尺度空間單元區(qū)域劃分方法[J].地理學(xué)報,2002,57(2):167-173.

        [3]陳明.區(qū)域化變量的空間聚類分析[J].長春科技大學(xué)學(xué)報,1995,(2):222-228.

        [4]王博,遲忠先,岳訓(xùn).一種面向GIS系統(tǒng)的新型雙層聚類方法[J].計算機(jī)工程,2006,32(7):84-85,125.

        [5]曹陽,陳天滋,柴勇.基于GIS的道路事故黑點聚類應(yīng)用研究[J].微計算機(jī)信息,2006,(11S):253-255.

        [6]周前祥,敬忠良.高光譜遙感圖像聯(lián)合加權(quán)隨機(jī)分類器的設(shè)計與應(yīng)用[J].測繪學(xué)報,2004,33(3):254-257.

        [7]張燕文.基于空間聚類的區(qū)域經(jīng)濟(jì)差異分析方法[J].經(jīng)濟(jì)地理,2006,26(4):557-560.

        [8]王海軍,張德禮.基于空間聚類的城鎮(zhèn)土地定級方法研究[J].武漢大學(xué)學(xué)報:信息科學(xué)版,2006,31(7):628-631.

        [9]厙向陽等.基于GIS的空間聚類算法研究[J].計算機(jī)工程與應(yīng)用,2005,41(29):24-26,31.

        [10]文俊浩等.基于鄰接關(guān)系的空間聚類算法研究[J].計算機(jī)工程與應(yīng)用.2003,39(34):184-186.

        [11]Christophe Dematte,NicolasMolinari,Jean-PierreDaurès.Arbitrarily ShapedMultiple Spatial ClusterDetection Forcase EventData[J].Computational Statistics&Data Analysis,2007,(51):3931–3945.

        [12]羅伯特.約翰遜,帕特里夏.庫貝著,屠俊如等譯.基礎(chǔ)統(tǒng)計學(xué)[M].北京:科學(xué)出版社,2003:7.

        [13]張建同.以Excel和SPSS為工具的管理統(tǒng)計[M].北京:清華大學(xué)出版,2005:8.

        [14]趙驊,朱莉華,劉丹.Ward系統(tǒng)聚類法在多變量分層抽樣技術(shù)中的運用[J].統(tǒng)計與決策,2006,(23):67-68.

        AbstractThe cluster analysis called the group analysis,is the multi-dimensional statistical method to research(sample or target)classifies.In the cluster analysis,the kind refers the similar element set.For regional samples,the classified result which obtains through the cluster analysis displays in the space for the different type areas,which can be used as the basis for the region division.As an i mportant technology of data mining and data information analysis,spatial clustermethod is a type of quantitative analysismethod to definite regional assignment program.This article takesWard systemic cluster method as foundation,uses hierarchical method(from bottom to top),defines neighborhood index refined from geographical space distance and spatial adjacency relationship,which judges whether the classeswithminimal SSD(sum of squaresof deviations)amplitude could cluster,and then filters prior data layer-by-layer,carries out spatial cluster analysis.Applying this algorithm in economical region assignment of Kunming,the results preferably reflect regional characterof Kunming economic development level,realize spatial auto-cluster,and correspondwith regional assignmentprinciple.Thismethod haswide range applicability and affectivity.

        Key wordsWard method;the spatial neighborhood index;the spatial clustermethod;the precedence

        Region Spatial Cluster Algorithm Based on WardM ethod

        YANG Zhi-heng
        (Regional Economy Institute of Shandong Economic University,Jinan Shandong 250014,China)

        P208,TP301.6

        A

        1002-2104(2010)03專-0382-05

        2010-01-10

        楊志恒,博士,副教授,主要研究方向為區(qū)域分析與區(qū)域規(guī)劃。

        猜你喜歡
        平方和類別聚類
        費馬—歐拉兩平方和定理
        利用平方和方法證明不等式賽題
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        勾股定理的擴(kuò)展
        關(guān)于四奇數(shù)平方和問題
        服務(wù)類別
        新校長(2016年8期)2016-01-10 06:43:59
        基于改進(jìn)的遺傳算法的模糊聚類算法
        一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
        論類別股東會
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
        国产精品一区二区三区四区亚洲| 永久无码在线观看| 日本精品久久久久中文字幕1| 亚洲a级视频在线播放| 成人欧美一区二区三区在线| 精品久久久噜噜噜久久久| 国产九色AV刺激露脸对白| 久久亚洲精品中文字幕蜜潮| 又硬又粗进去好爽免费| 国产va在线观看免费| 欧美xxxx新一区二区三区 | 美利坚合众国亚洲视频| 久久午夜福利无码1000合集| 人人玩人人添人人澡| 欧美v日韩v亚洲综合国产高清| 亚洲精品中文字幕91| 亚洲国产美女精品久久久久∴| 99久久免费看少妇高潮a片特黄| 无码av专区丝袜专区| 性色av色香蕉一区二区蜜桃| 国产成人精品久久一区二区三区| 最新精品亚洲成a人在线观看| 国产伦精品一区二区三区在线 | 国产精品自拍视频免费看| 国产成人精品免费视频大全软件| 国产美女露脸口爆吞精| a级国产精品片在线观看| 国产熟女白浆精品视频二| 国产电影一区二区三区| 国产精品video| 日韩国产自拍成人在线| 18禁裸体动漫美女无遮挡网站 | 一区二区免费国产a在亚洲| www国产亚洲精品| a级毛片毛片免费观看久潮喷| 国产AV秘 无码一区二区三区 | 国内精品无码一区二区三区| 日韩人妻无码精品系列专区无遮| 亚洲国产色婷婷久久精品| 又粗又粗又黄又硬又深色的| 国产亚洲美女精品久久|