吳越
摘 要 空間聚類分析是空間分析的一種重要的方法及技術,并廣泛應用于城市規(guī)劃、生態(tài)環(huán)境、交通、商業(yè)市場分析、公共衛(wèi)生與社會等領域。因而,本文按照該五個領域,選取具有參考價值的代表性中外文獻,針對空間聚類技術的相關應用進行綜述。分析出空間聚類技術的普遍短板與未來發(fā)展方向,為相關學者的進一步研究提供參考。
關鍵詞 空間聚類 空間分析 文獻綜述
中圖分類號:TP274 文獻標識碼:A DOI:10.16400/j.cnki.kjdkz.2017.09.015
A Literature Review of Spatial Clustering Applications
WU Yue
(School of Resource and Environmental Sciences, Wuhan University, Wuhan, Hubei 430072)
Abstract Spatial clustering analysis is an important method and technology of spatial analysis, and is widely used in urban planning, ecological environment, transportation, commercial market analysis, public health and social fields. Therefore, according to the five fields, this paper selects representative Chinese and foreign literature with reference value, and summarizes the related applications of spatial clustering technology. The general short board and future development direction of spatial clustering technology are analyzed, which will provide reference for further research of related scholars.
Keywords spatial clustering; spatial analysis; literature review
0 引言
空間聚類分析是數據分析的一種重要方法及技術。通過對空間數據的凝聚趨勢、分布規(guī)律的研究分析,GIS人員可以發(fā)現其隱含的模式和規(guī)律,甚至預測對象未來發(fā)展方向,為G1S智能化分析和GIS決策提供支持。
目前,空間聚類分析已廣泛應用于城市規(guī)劃、生態(tài)環(huán)境、交通、商業(yè)市場分析、公共衛(wèi)生與社會等領域。國內外學者針對不同領域,提出多種改進的空間聚類算法。在此背景下,本文按照該五個領域,選取具有參考價值的代表性中外文獻,針對空間聚類技術的相關應用進行綜述。分析出空間聚類技術的普遍短板與未來發(fā)展方向,為相關學者的進一步研究提供參考。
1 空間聚類方法的現狀
目前,根據數據類型、應用目的等的不同,聚類算法可以分為:劃分法,層次法,密度法,網格法,模型法等五類方法。
(1)劃分法,該方法為最早出現的經典算法,其典型代表為k-means聚類算法。該方法效率高且易于理解,所以應用廣泛。該算法把n個對象分成k個簇,使簇內具有較高的相似度,而簇間的相似度較低。(2)層次法,該方法將數據對象組成一棵聚類的樹。根據其層次分解方向的不同,可分為凝聚法或分裂法。(3)密度法,該方法按照區(qū)域密度進行劃分,不同于傳統(tǒng)距離劃分得到的類圓形聚類區(qū)域,其可以獲得任意形狀的聚類區(qū)域。(4)網格法,該方法以多分辨率的網格數據結構為基礎,計算以單個網格進行開展,從而節(jié)約大量計算時間。(5)模型法,該方法以數學模型為核心,通?;跀祿弦欢ǖ臄祵W規(guī)律進行分布的假設進行研究。
2 空間聚類應用領域分析
2.1 城市規(guī)劃方面
城市規(guī)劃是以科學思想、客觀數據、專家決策為基礎,對城市經濟結構、空間結構、社會結構等多方面發(fā)展進行規(guī)劃,發(fā)揮著指導城市建設、確定城市發(fā)展方向的重要作用。而由于城市系統(tǒng)本身的復雜性,城市規(guī)劃是一個需要反復修訂,長期調整的決策過程。
在此背景下,GIS人員可以憑借空間聚類技術,通過研究不同設施的分布模式,從而合理設定、評估城市空間布局方案,為城市規(guī)劃決策提供建議,提高城市居民的生活質量。
其中最典型的便是DBSCAN空間聚類算法的應用。針對空間聚類過程中對非空間屬性的忽略問題,Sander(1998)在DBSCAN算法基礎上提出了GDBSCAN算法,可有效結合點目標的空間屬性和非空間屬性。國內,李新延(2005)在城市規(guī)劃領域,對DBSCAN空間聚類算法進行了實例研究。他的研究結果表明,該算法可以發(fā)現城市點狀設施(如公共設施和市政公用設施)的聚集特征和分布模式中存在的問題。從而對規(guī)劃設計中的某些規(guī)范或指標進行修正,為城市規(guī)劃提供科學的依據和指導。
用空間聚類方法進行城市功能分區(qū)也是一種有益的嘗試,它不僅能為準確地劃分功能區(qū)提供依據,而且也可以減少主觀性,具有較強的客觀性。楊帆(2007)提出將面狀統(tǒng)計單元進行網格劃分,引入基于網格密度聚類算法的思想,克服傳統(tǒng)面狀聚類的諸多缺點。但其結果受k值選取的主觀性影響。王艷(2009)分別運用K—平均算法、神經網絡模型進行空間聚類計算,挖掘研究對象隱含的空間聚集信息。其研究結果表明,K—平均算法受分類過程的隨機性與分類人員的主觀不確定性影響較大,缺乏自學習能力。而神經網絡模型由于具有較強的自學習和自適應能力,其分類結果更加客觀。辜寄蓉(2011)則利用Delaunay三角剖分和格雷厄姆方法構造了功能區(qū)自動劃分算法。該算法可以自動實現功能區(qū)劃分,同樣降低了人為主觀因素對劃分結果的影響。endprint
王海軍(2006)分析了傳統(tǒng)城鎮(zhèn)土地定級方法的不足后,提出了基于空間聚類的地價分區(qū)定級法,并以石獅市土地定級為例,驗證了此方法。但該方法在城鎮(zhèn)土地市場發(fā)育不成熟、土地市場機制不完善、土地交易樣點較少的城鎮(zhèn)應用受到限制。
在城市突發(fā)事件的應急管理方面,空間聚類技術同樣有良好的表現。樊博(2008)研究提出的(COD-MEANS-CLASA)的空間聚類算法,綜合考慮了空間障礙因素和空間環(huán)境因素,探索出基于數據驅動的城市應急機構選址方案。與其他空間聚類方法進行對比,在執(zhí)行效率和解質量兩方面具有更好的表現。
城市文化建設方面,Mommaas(2004)通過研究新西蘭在過去五到十年間的城市文化聚類現象,探索了文化與經濟發(fā)展之間的聯(lián)系,為城市文化建設政策提供了指導意見。
2.2 商業(yè)市場領域
選址的正確與否對商業(yè)活動的成功起著舉足輕重的作用,傳統(tǒng)的商業(yè)選址方法多以數學模型或經驗法則為主,而近年來隨著城鎮(zhèn)化進程的急速發(fā)展,利用傳統(tǒng)數理方法進行商業(yè)選址不能滿足商業(yè)選址的迫切需求??臻g分析為商業(yè)選址決策提供快速有效的可視化定量分析方法。
姜亞莉(2014)以珠海市為例,通過地域性數據,如某區(qū)人口數目、某區(qū)道路數量等,加權平均得出某區(qū)域的商業(yè)發(fā)展?jié)摿?。其從宏觀層面上利用空間聚類對商業(yè)選址進行可視化定量操作的結果較為滿意,但微觀層面(如選址因素、地點)仍有待進一步精確。
空間聚類應用于具體產業(yè)分析,對于該產業(yè)的設址、銷售、服務等決策問題均發(fā)揮著指導作用。汽車業(yè),高濤(2017)采用車載GPS技術和改進的DBSCAN算法將陜重汽的不同類型車輛的行駛GPS數據進行空間聚類分析,最終得到不同車輛的活動熱點地區(qū)分布數據。分析結果對今后車輛的設計、銷售及售后的相關決策問題有著重要的參考價值。餐飲業(yè)方面,Austin(2005)研究了學校周邊的快餐店集聚現象,為快餐店具體選址提供了依據。
2.3 交通領域
隨著私家車占有率的不斷提高,出行安全與道路堵塞問題始終占據著民生問題的焦點。出行方面,肖慎(2002)采用基于模糊劃分的模糊聚類方法,建立了公路交通事故黑點成因分析方法和模型。該模型可幫助交通管理人員歸納事故成因,促進其采取相應的道路改善和交通管理措施,有效治理和防范公共交通事故。
交通流預測同樣對于路徑誘導、路網管控有著重要的作用。許榕(2015)提出了基于空間聚類的短時交通流預測Cluster-NN模型,以遙控視頻攝像數據作為預測模型的輸入,對區(qū)域內交通流進行了聚類分析預測。
此外,隨著電子商務的發(fā)展,物流作為供應鏈管理的組成部分,成為決定電子商務公司成敗與否的關鍵因素。梅新(2008)通過研究地理信息系統(tǒng)與車輛運輸導航、物流配送的結合并形成空間決策的過程,提出了一種基于城市道路距離的兩次空間聚類的實現框架和算法思想,并以煙草企業(yè)的物流配送為例進行了驗證。不單單在公路運輸方面,海運方面,王加勝(2016)提出了基于空間聚類分析的南海主要航線提取方法。
2.4 環(huán)境生態(tài)領域
空間聚類可通過數字化的手段對環(huán)境問題、程度、過程進行描述,不僅可辨別出污染問題嚴重的地區(qū),還可以研究與社會經濟相關的不同范圍的環(huán)境問題。
水污染問題中,農業(yè)非點源污染一直是主要原因之一。王少平(2000)探討了空間聚類等GIS手段在農業(yè)非點源污染研究中的應用與發(fā)展趨勢。戴曉燕(2005)結合遙感圖像信息,運用空間分析,實現了在多種空間因素影響下研究區(qū)農業(yè)非點源污染負荷的流域分配。且在此基礎上,同時運用K—均值法對研究區(qū)內的水系污染狀況進行了聚類分析,得到了各支流受農業(yè)非點源污染的影響程度。該結果有助于評估導致水環(huán)境質量降低的影響因子,為科學化管理流域內農業(yè)非點源污染提供了參考依據。
趙玉婷(2009)對廊坊地下水的監(jiān)測點位及監(jiān)測指標分別進行了空間聚類分析,并對結果進行了空間變異性評價。其研究表明空間聚類分析是有效合理的。它一方面可以指導環(huán)境監(jiān)測點的重新布置,提高監(jiān)測效率、監(jiān)測點的代表性,另一方面可為環(huán)境監(jiān)測指標的確定與提供理論依據,進而為環(huán)境綜合管理與利用提供基礎依據。
大氣污染方面,白永亮(2016)通過計算全國工業(yè)二氧化硫污染的全局空間自相關、局部空間自相關、空間核密度,對未來空間集聚趨勢進行了預測。其發(fā)現:工業(yè)二氧化硫污染總體呈現多中心、條帶狀、不均衡的“兩帶六極”空間集聚特征;通過熱點探測模型,發(fā)現污染呈現以長江為界北重南輕的空間聚類趨勢。根據以上手段得出的污染區(qū)空間格局和聚類趨勢可有效進行協(xié)同防控的空間協(xié)作、協(xié)同機制構建、分類分級分區(qū)管理和管理技術創(chuàng)新。
2.5 公共衛(wèi)生與社會領域
在疾病衛(wèi)生領域,空間聚類技術同樣為疾病研究提供了新思路,并越來越受重視。該技術不僅幫助醫(yī)學者了解其傳播機理,還可以幫助控制有關疾病的傳播。Kulldoref(1995)提出通過空間聚類觀察研究疾病的新方法,并通過紐約北部的白血病數據進行了驗證。Mammen(2008)驗證了登革熱病毒傳播的空間相關性,并提出以學校為據點的檢疫點可有效控制該病毒的傳播。Tanser(2009)借助空間聚類手段,標識出南非農村HIV感染高危區(qū)域。
人口研究方面,Cuzick(1990)較早便進行人口的空間聚類研究。Francois(2006) 在隱馬爾可夫隨機場(Hidden Markov Random Field,HMRF)模型基礎上采用新的貝葉斯聚類算法,對人口結構進行了研究。Combes (2006)針對勞動人口聚類進行了相關分析。Chen(2007)同樣在貝葉斯聚類算法上有所創(chuàng)新,推斷社會人口的空間分布結構。
3 展望
通過以上的研究分析,空間聚類分析通常存在以下兩個普遍問題:(1)地理位置與屬性特征未有效結合;(2)受人為主觀因素影響。針對第一個問題,現在已有多種改進算法,可有效結合研究對象的空間屬性與非空間屬性。至于第二個問題,相比傳統(tǒng)的劃分聚類法,神經網絡模型的應用可有效提高研究結果的客觀性。endprint
應用方面,空間聚類分析的作用范圍廣泛,且越來越受到重視。該技術與傳統(tǒng)研究領域相結合,可提供嶄新的研究思路,打開研究瓶頸。將國內外應用領域進行比較,國外在公共衛(wèi)生與疾病控制領域的空間聚類研究較多,而國內在該部分的研究相對比較空缺。
至于發(fā)展方向,空間聚類分析在宏觀層面上的指導已相對成熟,在微觀層面的準確度研究仍有待提高。未來,更加適用于微觀層面的空間聚類分析技術將會是發(fā)展前景之一。
參考文獻
[1] 徐芃,景海濤.基于GIS的河南省縣級城市空間聚類研究與實現[J].測繪與空間地理信息,2016(9):50-53.
[2] 王加勝,劉永學,楊昆,李滿春,孫超.基于空間聚類分析的南海主要航線提取方法[J].交通運輸工程學報,2016(6):91-98.
[3] 高濤,王釗,雷正潮,吳曉龍,趙祥模.基于改進DBSCAN算法的汽車行駛熱區(qū)提取方法[J].測控技術,2017(3):24-27.
[4] 姜亞莉,蔡心田,丁振興.基于空間分析方法的商業(yè)選址研究——以珠海市香洲區(qū)為例[J].測繪與空間地理信息,2014(12):131-133.
[5] 許榕,繆李囡,施靜靜,陳啟美.基于空間聚類的交通流預測模型[J].南京大學學報(自然科學),2015(2):251-256.
[6] 白永亮,郭珊,孫涵.大氣污染的空間關聯(lián)與區(qū)域間防控協(xié)作——基于全國288個地市工業(yè)SO_2污染數據的空間統(tǒng)計分析[J].中國地質大學學報(社會科學版),2016(3):63-72,171.
[7] 周翠竹,朱建軍,石巖.一種基于雙重距離約束的多層次空間聚類方法[J].測繪科學,2014(10):98-101.
[8] 辜寄蓉,陳先偉,楊海龍.城市功能區(qū)劃分空間聚類算法研究[J].測繪科學,2011(5):65-67,64.
[9] 戴曉燕,過仲陽,石純,吳健平.空間聚類在農業(yè)非點源污染研究中的應用[J].華東師范大學學報(自然科學版),2005(3):59-64.
[10] 趙玉婷,張征,呂連宏,牟向玉,李道峰.基于地下水多變量空間聚類分析的變異性評價[J].地球科學與環(huán)境學報,2009(1):79-84.
[11] 曾紹琴,李光強,廖志強.空間聚類方法的分類[J].測繪科學,2012(5):103-106.
[12] 楊帆,米紅.一種基于網格的空間聚類方法在區(qū)域劃分中的應用[J].測繪科學,2007(S1):66-69,5.
[13] 梅新,崔偉宏,高飛,劉俊怡.基于空間聚類的物流配送決策研究[J].武漢大學學報(信息科學版),2008(4):371-374+383.
[14] 王艷,宋振柏,吳佩林.城市功能分區(qū)的空間聚類方法研究及其應用——以濟南市為例[J].地域研究與開發(fā),2009(1):27-31.
[15] 柳盛,吉根林.空間聚類技術研究綜述[J].南京師范大學學報(工程技術版),2010(2):57-62.
[16] 樊博.基于空間聚類挖掘的城市應急救援機構選址研究[J].管理科學學報,2008(3):16-24+26-28.
[17] 李新延,李德仁.DBSCAN空間聚類算法及其在城市規(guī)劃中的應用[J].測繪科學,2005(3):51-53,5.
[18] 肖慎,過秀成,徐建東.模糊聚類法在公路交通事故黑點成因分析中的應用[J].交通運輸系統(tǒng)工程與信息,2002(3):40-43.
[19] 王海軍,張德禮.基于空間聚類的城鎮(zhèn)土地定級方法研究[J].武漢大學學報(信息科學版),2006(7):628-631.
[20] 王少平,陳滿榮,俞立中,許世遠.GIS在農業(yè)非點源污染研究中的應用[J].農業(yè)環(huán)境保護,2000(5):289-292.
[21] 李新運,鄭新奇,閆弘文.坐標與屬性一體化的空間聚類方法研究[J].地理與地理信息科學,2004(2):38-40.
[22] Kulldorff M;Nagarwalla N.Spatial disease clusters: detection and inference[J].Statistics in medicine,1995,14(8).
[23] Fran?ois Olivier, Ancelet Sophie, GuillotGilles. Bayesian clustering using hidden Markov random fields in spatial population genetics.[J].Genetics(Print),2006.174(2).
[24] Chen, C; Durand, E; Forbes, F; Francois, O. Bayesian clustering algorithms ascertaining spatial population structure: a new computer program and a comparison study. [J]. MOLECULAR ECOLOGY NOTES. 2007.7(5).
[25] Sander J; Ester M; Kriegel HP; Xu XW. Density-based clustering in spatial databases: The algorithm GDBSCAN and its applications. [J]. Data Mining & Knowledge Discovery 1998.2(2).
[26] Cuzick J; Edwaeds R. Spatial clustering for inhomogeneous populations. [J]. JOURNAL OF THE ROYAL STATISTICAL SOCIETY SERIES B-METHODOLOGICAL. 1990.52(1).
[27] Mommaas, H. Cultural clusters and the post-industrial city: Towards the remapping of urban cultural policy. [J]. URBAN STUDIES. 2004.41(3).
[28] Austin, SB; Melly, SJ; Sanchez, BN; Patel, A; Buka, S; Gortmaker, SL. Clustering of fast-food restaurants around schools: A novel application of spatial statistics to the study of food environments.[J]. AMERICAN JOURNAL OF PUBLIC HEALTH.2005.95(9).
[29] Mammen, MP; Pimgate, C; Koenraadt, CJM. Spatial and Temporal Clustering of Dengue Virus Transmission in Thai Villages.[J].2008.5(11).
[30] Tanser, F; Barnighausen, T; Cooke, GS; Newell, ML. Localized spatial clustering of HIV infections in a widely disseminated rural South African epidemic.[J].2009.38(4).endprint