[摘 要]在智慧城市的建設(shè)過程中,大量運(yùn)行數(shù)據(jù)伴隨著城市管理事部件的處置產(chǎn)生并積累。為分析此類數(shù)據(jù),本文利用聚類分析技術(shù),以溫嶺市太平街道為例,對數(shù)據(jù)進(jìn)行挖掘分析,產(chǎn)生輔助管理者決策的有用信息,探究應(yīng)用于智慧城市建設(shè)的新知識,提升浙江省智慧城市建設(shè)的水平和效能。
[關(guān)鍵詞]聚類分析;智慧城市;城市管理
doi:10.3969/j.issn.1673 - 0194.2016.22.085
[中圖分類號]F275;F224 [文獻(xiàn)標(biāo)識碼]A [文章編號]1673-0194(2016)22-0-02
伴隨著城市化迅猛的發(fā)展,城市管理中事件與部件量呈現(xiàn)指數(shù)型增長的態(tài)勢。城市管理各部門固有的單一直線的管理模式面臨挑戰(zhàn),部門間信息流通不暢、協(xié)同性差的狀況已不能滿足現(xiàn)代化城市管理的要求。為解決這一難題,近年來,政府通過大推動智慧城市建設(shè),將信息化技術(shù)應(yīng)用于城市管理,采用將城市分區(qū)網(wǎng)格化管理,利用數(shù)字化傳輸技術(shù),產(chǎn)生城市管理多方聯(lián)動效應(yīng),提升城市的管理水準(zhǔn)和效率,力求實(shí)現(xiàn)長效科學(xué)管理城市。
1 智慧城市現(xiàn)狀
智慧城市是在發(fā)達(dá)的互聯(lián)網(wǎng)、物聯(lián)網(wǎng)基礎(chǔ)上建立的,構(gòu)建應(yīng)用云計(jì)算技術(shù)的城市管理平臺是必需配置。智慧城市的根本目的是應(yīng)用信息技術(shù),實(shí)現(xiàn)城市范圍內(nèi)多部門多行業(yè)多群體的數(shù)據(jù)融合,其智慧性就體現(xiàn)在對城市管理運(yùn)營數(shù)據(jù)的創(chuàng)新應(yīng)用,即對數(shù)據(jù)的分析應(yīng)用度決定了智慧城市的成熟度。從大量數(shù)據(jù)中可以發(fā)現(xiàn)知識、提升智能、創(chuàng)造價值,依托數(shù)據(jù)分析,為政府管理決策提供強(qiáng)大的支持,提高城市居民的生活品質(zhì),提升企業(yè)的核心競爭力,即城市管理可以從經(jīng)驗(yàn)治理轉(zhuǎn)向科學(xué)治理。
目前,浙江省大部分城市已建立智慧城市(數(shù)字化城市管理)信息平臺,多部門實(shí)現(xiàn)信息數(shù)據(jù)共享、協(xié)同管理合作,實(shí)現(xiàn)以信息化手段對城市管理中公用設(shè)施、市容環(huán)境和環(huán)境秩序等的監(jiān)管。在智慧城市建設(shè)過程中,信息系統(tǒng)經(jīng)歷數(shù)據(jù)采集、數(shù)據(jù)錄入、數(shù)據(jù)審核與數(shù)據(jù)庫更新,積累了大量紛雜而珍貴的信息數(shù)據(jù)。這些數(shù)據(jù)是平臺運(yùn)行的靈魂和價值所在,從海量的原始數(shù)據(jù)中分析挖掘?qū)嵱谩⑷娴男畔?,并通過數(shù)學(xué)知識建立模型,綜合運(yùn)用數(shù)據(jù)分析及挖掘技術(shù),提煉能幫助進(jìn)行復(fù)雜決策的價值信息,促進(jìn)城市管理應(yīng)用的知識發(fā)現(xiàn),提升浙江省智慧城市建設(shè)的水平和效能。
2 聚類分析概述
聚類分析方法作為一種定量研究法,常用于探究龐大數(shù)據(jù)信息中所隱含的分類規(guī)則,以純數(shù)據(jù)的視角,給出具有經(jīng)驗(yàn)和更準(zhǔn)確、細(xì)致的專業(yè)判斷,也能夠結(jié)合其他多種數(shù)據(jù)挖掘技術(shù),找出更深層次的隱含信息,大大提高數(shù)據(jù)挖掘的效率與效應(yīng)。聚類分析主要是對多個樣本或多個指標(biāo)進(jìn)行定量分類的一種多元統(tǒng)計(jì)分析方法。其中對樣本進(jìn)行分類并命名為Q型聚類分析,另一種R型聚類分析則是對指標(biāo)進(jìn)行分類。聚類分析通過將數(shù)據(jù)分組成為多個簇,相似的數(shù)據(jù)對象構(gòu)成同一聚類簇,不同簇中的數(shù)據(jù)相異程度較大。因此,最重要的聚類標(biāo)準(zhǔn)即為數(shù)據(jù)對象屬性同簇相似、簇間相異。
首先需要將原始數(shù)據(jù)及數(shù)據(jù)標(biāo)準(zhǔn)化,一般給定具有m個指標(biāo)的變量,進(jìn)行n次觀察,可以將某個樣本的觀測值看出Rm空間中的一個點(diǎn),因此這n個樣本就構(gòu)成了Rm空間中的n個點(diǎn),聚類的關(guān)鍵在于定義Rm空間中兩個點(diǎn)xi=(xi1,xi2,…,xim)和xj=(xj1,xj2,…,xjm)的距離,Q型聚類分析常常采用 Minkowski距離或Euclidean距離,用于度量樣本間的距離,其定義為:
Minkowski距離(p階):
Euclidean距離(歐式距離),即當(dāng)Minkowski距離p=2時情形:
當(dāng)空間中各指標(biāo)存在相關(guān)性時,采用斜交空間距離或相似系數(shù)來度量兩個樣本直接的親疏程度。主要用于指標(biāo)變量的分類,即R型聚類采用。其相似系數(shù)主要為夾角余弦,其定義為:
夾角余弦:
在聚類分析的某個中間過程,當(dāng)一個類別有兩個及以上樣本時,需要和另外的類聚成新的類,這就需要解決類與類之間的距離定義。這和前面的距離不一樣,前面是空間中兩個點(diǎn)的距離,而這里是兩個類別之間的距離,類中的元素大于等于兩個。
設(shè)兩個類Gp和Gq中分別有S和t個樣本,它們的重心是對應(yīng)指標(biāo)的平均值,分別記為和,兩個類之間的距離用D(p,q)表示。常采用類間距離為組間平均法,即定義:
本文主要采取系統(tǒng)聚類和K-均值聚類進(jìn)行數(shù)據(jù)分析。系統(tǒng)聚類主要將空間數(shù)據(jù)實(shí)體組成一棵聚類樹,通過反復(fù)聚合或分裂獲取滿足條件的空間聚類結(jié)果。明確距離的定義選取歐式距離;確定類間的距離使用組間平均法。讓每個樣本自成一類,即n個樣本共建立n個類。進(jìn)而得n×n維的距離矩陣。通過矩陣合并最近距離的兩個樣本歸納一個新類,重新計(jì)算類別間的距離,得到新的距離矩陣,再重復(fù)直到所有類歸為一類為止。K-均值聚類是最簡潔和高效率的非系統(tǒng)聚類方法,先預(yù)設(shè)最終的分類數(shù)N0,隨機(jī)生成N0個初始聚類中心點(diǎn),通過設(shè)置最大迭代步驟和收斂誤差標(biāo)準(zhǔn),計(jì)算每個樣本到聚類中心點(diǎn)的距離,以距離最小原則將全部樣本劃入N0個類中,此時聚類中心變成新的群中心,重復(fù)迭代直至聚類中心不再變化,或達(dá)到預(yù)設(shè)的最大迭代步驟和收斂誤差標(biāo)準(zhǔn)時,終止計(jì)算。最終得到每個樣本所屬的類別和相應(yīng)類別的聚類中心。
3 溫嶺市太平街道事部件數(shù)據(jù)分析
溫嶺市是浙江省為數(shù)不多的縣級智慧城市建設(shè)試點(diǎn)市。太平街道為溫嶺市政治、經(jīng)濟(jì)和文化中心,下轄東輝社區(qū)、繁昌社區(qū)等14個社區(qū),總面積為34.7平方千米,常住人口為9.6萬人。
城市管理案件數(shù)據(jù)是溫嶺市太平街道城管監(jiān)督員巡查時上報的案件,現(xiàn)分析2014年全年數(shù)據(jù),可以發(fā)現(xiàn)案件種類繁多,案件大類12種,屬于事件類型的大類有6種,屬于部件類型的有6種;每一大類又可分為種種小類,為簡化指標(biāo),統(tǒng)計(jì)時按如下指標(biāo)。
利用SPSS軟件進(jìn)行簡易操作,其描述性統(tǒng)計(jì)見表2。
將數(shù)據(jù)標(biāo)準(zhǔn)化處理后進(jìn)行系統(tǒng)聚類,得其平均連結(jié)(組間)和樹狀圖分別見表3和圖1。
進(jìn)而采用K-均值聚類分析方法,得到分析結(jié)果,見表4、表5。
從聚類分析的結(jié)果可得,太平街道各社區(qū)城市管理現(xiàn)狀存在較大的差異,事部案件發(fā)生數(shù)分布很不均勻。如果根據(jù)各社區(qū)城市管理狀況把14個社區(qū)分為3類。第一類:東輝社區(qū)、繁昌社區(qū)、月河社區(qū)等10個社區(qū)。第二類:錦屏社區(qū)1個社區(qū)。第三類:方城社區(qū)、尚書房社區(qū)、西園社區(qū)等3個社區(qū)。
從以上結(jié)果結(jié)合聚類圖中的合并距離可以看出第三類方城社區(qū)、尚書房社區(qū)、西園社區(qū)等3個社區(qū)城市管理總體情況優(yōu)異,發(fā)生的案件數(shù)總體偏少;第二類錦屏社區(qū)發(fā)生的案例數(shù)偏多,應(yīng)加派管理人員,重點(diǎn)監(jiān)督;第一類東輝社區(qū)、繁昌社區(qū)、月河社區(qū)等10個社區(qū)情況總體相仿,應(yīng)采取同一管理模式應(yīng)對。
4 結(jié) 語
基于聚類分析的方法對智慧城市數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)從地理空間的角度,探究城市管理事部件產(chǎn)生的特征及規(guī)律,為城市管理中案件發(fā)生作出預(yù)警,為管理者提供決策依據(jù),從而提升城市整體管理水平,促進(jìn)智慧城市的健康發(fā)展和科學(xué)管理。
主要參考文獻(xiàn)
[1]王靜遠(yuǎn),李超,熊璋,等.以數(shù)據(jù)為中心的智慧城市研究綜述[J].計(jì)算機(jī)研究與發(fā)展,2014(2).
[2]司守奎,孫璽菁.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2013.
[3]魏海洋.城市案件空間聚類技術(shù)研究[D].北京:北京建筑大學(xué),2015.