段冰若 王 鵬 郝新華 蔡玉蘅 石 淼
?
見(jiàn)物見(jiàn)人
——時(shí)空大數(shù)據(jù)支持下的存量規(guī)劃方法論
段冰若 王 鵬 郝新華 蔡玉蘅 石 淼
相比于傳統(tǒng)的增量規(guī)劃,存量規(guī)劃中主要在產(chǎn)權(quán)本質(zhì)、時(shí)間邏輯和空間處理尺度上有著本質(zhì)的不同。因此,存量規(guī)劃對(duì)現(xiàn)有用地現(xiàn)狀和性質(zhì)的精準(zhǔn)刻畫提出了更高的要求。作為當(dāng)前傳統(tǒng)的用地現(xiàn)狀分析圖在存量規(guī)劃中存在著地塊特征刻畫精度有限與用地分類維度過(guò)低等不足。對(duì)用地類型的混合、同種用地類型的規(guī)模、同一地塊的時(shí)間屬性等用地特征,傳統(tǒng)的現(xiàn)狀分析圖也難以進(jìn)行描述。隨著互聯(lián)網(wǎng)LBS(Location-Based Service)服務(wù)的發(fā)展,越來(lái)越多LBS時(shí)空數(shù)據(jù)因其巨大的用戶基數(shù)和完善的時(shí)空地理信息,受到規(guī)劃師的關(guān)注。這些新的時(shí)空地理數(shù)據(jù)使得對(duì)用地功能和人口活動(dòng)特征的詳細(xì)刻畫成為可能。使用互聯(lián)網(wǎng)某LBS平臺(tái)人口分時(shí)活動(dòng)密度數(shù)據(jù),疊加百度POI(Place of Interest),通過(guò)非監(jiān)督分類和非負(fù)矩陣分解的方法,分別對(duì)北京市六環(huán)內(nèi)的地塊尺度、500 m網(wǎng)格尺度和25 m點(diǎn)陣尺度進(jìn)行用地功能的識(shí)別與分類。通過(guò)多維度分類結(jié)果的疊加,對(duì)研究區(qū)域的用地功能、人口時(shí)空活動(dòng)特征進(jìn)行深入刻畫,探討通過(guò)大數(shù)據(jù)進(jìn)一步輔助存量規(guī)劃的用地功能研究方法。
AbstractCompared to the traditional incremental planning in China, inventory planning is different in the perspective of property, time and space. Thus, a higher demand for the depiction of existing space is needed in the inventory planning process. However, the depiction method used in incremental planning such as land use analysis map cannot fulfill this demand. With the prevalence of internet LBS (Location-Based Service) data, planners see a new opportunity to make a more detailed depiction of the existing space. This paper intends to use an LBS data of population density by hour, together with POI (Place of Interest) from Baidu. With the help of unsupervised learning algorithm, a detailed depiction of land use and population activity pattern will be presented, showing more opportunities for big data analysis in the current urban planning research.
存量規(guī)劃 | 機(jī)器學(xué)習(xí) | 用地分類 | LBS數(shù)據(jù)
KeywordsInventory planning | Machine learning | Land use clustering | LBS data
(1)存量規(guī)劃轉(zhuǎn)型與挑戰(zhàn)
隨著城市的不斷擴(kuò)張與發(fā)展,城市中,尤其是城市中心區(qū)的用地功能混合度隨之增高。在傳統(tǒng)的用地分類中,城市的用地功能依照居住、商業(yè)、公共服務(wù)設(shè)施等,共分為2大類、9中類、14小類。然而傳統(tǒng)的用地分類方式已經(jīng)難以描述功能日益復(fù)雜的城市用地。舊城區(qū)自下而上在地塊功能上的自然生長(zhǎng),通勤交通方式的變化等,向傳統(tǒng)的用地分類提出了諸多挑戰(zhàn)。在這一過(guò)程中,傳統(tǒng)用地難以實(shí)現(xiàn)對(duì)混合類用地功能的描述、同種用地類型規(guī)模的描述,以及對(duì)同一地塊時(shí)間屬性的描述。
另一方面,隨著越來(lái)越多的國(guó)內(nèi)一線城市,由于其自身人口、交通、環(huán)境和資源的壓力,紛紛開(kāi)始在其下一階段的城市規(guī)劃工作中融入了控制城市規(guī)模和外向擴(kuò)張的內(nèi)容,存量規(guī)劃和規(guī)劃轉(zhuǎn)型逐漸成為了國(guó)內(nèi)城市發(fā)展所關(guān)注的焦點(diǎn)。2007年深圳市提出將城市總體規(guī)劃的戰(zhàn)略由增量規(guī)劃轉(zhuǎn)變?yōu)榇媪恳?guī)劃,成為第一個(gè)將存量規(guī)劃作為其規(guī)劃思想的城市。最新一輪的上海市城市總體規(guī)劃中,也提出了“嚴(yán)守用地底線,實(shí)現(xiàn)建設(shè)用地零增長(zhǎng)甚至負(fù)增長(zhǎng)”的目標(biāo)。類似的,北京市也在新一輪總規(guī)中提出“簡(jiǎn)單規(guī)劃、瘦身健體”的規(guī)劃指導(dǎo)思想。相比于傳統(tǒng)的增量規(guī)劃,存量規(guī)劃對(duì)用地現(xiàn)狀和性質(zhì)的精準(zhǔn)刻畫提出了更高的要求和挑戰(zhàn)。存量規(guī)劃主要有以下3個(gè)不同點(diǎn)。第一,產(chǎn)權(quán)本質(zhì)不同:在存量規(guī)劃中,涉及的權(quán)利關(guān)系更加復(fù)雜。這對(duì)現(xiàn)場(chǎng)及周邊環(huán)境的深入解讀提出了更高的要求。第二,時(shí)間邏輯不同:增量規(guī)劃是預(yù)期性的,著眼的是未來(lái)的利益分配,可以花費(fèi)數(shù)月時(shí)間調(diào)研,并可伴隨規(guī)劃實(shí)施的過(guò)程逐步調(diào)整。而存量規(guī)劃的頻次將會(huì)顯著高于增量規(guī)劃,需要實(shí)時(shí)精確地了解現(xiàn)實(shí)矛盾,以及對(duì)受損方的影響。因此一旦對(duì)用地現(xiàn)狀理解出現(xiàn)偏差,就可能出現(xiàn)較大的負(fù)面影響。第三,空間處理尺度不同:存量規(guī)劃代表著由大規(guī)劃到小微規(guī)劃的轉(zhuǎn)變。由長(zhǎng)遠(yuǎn)的空間構(gòu)想轉(zhuǎn)變?yōu)槲⑻幚?、微設(shè)計(jì)、微更新。結(jié)構(gòu)調(diào)整更加趨向精細(xì)化,在空間結(jié)構(gòu)格局變化不大的情況下,通過(guò)用地結(jié)構(gòu)的調(diào)整來(lái)改善城市的功能結(jié)構(gòu),為城市提供更好的發(fā)展環(huán)境[1]。由以上3點(diǎn)不同可以得出,當(dāng)前存量規(guī)劃的主要任務(wù)之一即對(duì)用地現(xiàn)狀進(jìn)行快速精準(zhǔn)的描述與深入的刻畫。
由于傳統(tǒng)用地分類描述方法的局限性,互聯(lián)網(wǎng)大數(shù)據(jù)成為了另一種解決問(wèn)題的途徑。隨著智能終端的大范圍普及和互聯(lián)網(wǎng)LBS (Location-Based Service)服務(wù)的日益完善,越來(lái)越多的LBS時(shí)空數(shù)據(jù)因其覆蓋用戶廣、時(shí)空信息完善,走進(jìn)了城市研究者的視野。其分布顆粒度細(xì)、覆蓋時(shí)間廣、可按需抓取的特點(diǎn),使得使用該類分時(shí)人口時(shí)空地理數(shù)據(jù)刻畫用地功能、反映人口活動(dòng)特征成為可能。
本文擬使用互聯(lián)網(wǎng)某LBS平臺(tái)人口分時(shí)活動(dòng)密度數(shù)據(jù),疊加百度POI(Place of Interest)數(shù)據(jù),通過(guò)非監(jiān)督分類和非負(fù)矩陣分解的方法,分別對(duì)北京市六環(huán)內(nèi)的地塊尺度、500 m網(wǎng)格尺度和25 m點(diǎn)陣尺度進(jìn)行用地功能識(shí)別與分類。通過(guò)多維度的分類結(jié)果疊加,對(duì)研究區(qū)域的用地功能、人口時(shí)空活動(dòng)特征進(jìn)行深入刻畫,探討可以進(jìn)一步輔助存量規(guī)劃的用地功能研究方法。本章第二部分將對(duì)使用分時(shí)人口數(shù)據(jù)進(jìn)行的研究進(jìn)行總結(jié)回顧。第一章將對(duì)研究方法進(jìn)行具體介紹,包括對(duì)數(shù)據(jù)、方法論和研究尺度進(jìn)行詳細(xì)解釋。第二章將對(duì)研究結(jié)果進(jìn)行分層分析。第三章將對(duì)全文進(jìn)行總結(jié),并對(duì)下一步研究做出展望。
(2)研究現(xiàn)狀
目前應(yīng)用較多的用地識(shí)別方式是從地理學(xué)角度通過(guò)衛(wèi)星遙感測(cè)定判定用地性質(zhì)。Halder等人就通過(guò)蟻群算法對(duì)衛(wèi)星照片中的建設(shè)用地與非建設(shè)用地進(jìn)行了識(shí)別[2]。隨著識(shí)別方法的改進(jìn),通過(guò)衛(wèi)星照片也能對(duì)生態(tài)用地以及工業(yè)用地進(jìn)行較為精準(zhǔn)的識(shí)別[3]。近年來(lái)基于地圖服務(wù)產(chǎn)生的大數(shù)據(jù)POI(Point of Interests)也逐漸被應(yīng)用于用地的識(shí)別。王芳等人就通過(guò)POI數(shù)據(jù)對(duì)由城市路網(wǎng)劃分的功能單位進(jìn)行識(shí)別,通過(guò)聚類分析將傳統(tǒng)意義上的商業(yè)區(qū)細(xì)化為飲食文化型商業(yè)區(qū)、專營(yíng)型商業(yè)區(qū)等5個(gè)功能類型[4]。該類數(shù)據(jù)本身自帶的地點(diǎn)用途分類能夠輔助分析人員對(duì)用地本身功能的多樣性及復(fù)合性進(jìn)行精細(xì)化的描述。然而不論是衛(wèi)星遙感還是POI識(shí)別都只能測(cè)定出城市的物理空間屬性,而隨著存量規(guī)劃的興起,規(guī)劃師正逐漸關(guān)注用地的復(fù)合屬性。實(shí)體尺度的建筑空間的規(guī)模、用途、性質(zhì)以及社會(huì)活動(dòng)尺度上的就業(yè)、住房、通勤等都是在進(jìn)行用地描述時(shí)需要關(guān)注的重點(diǎn)。在深圳存量規(guī)劃的城市發(fā)展評(píng)估指標(biāo)體系中既加入了傳統(tǒng)規(guī)劃中土地利用、市政、交通、公服設(shè)施等指標(biāo),又引入了用于描述社會(huì)屬性的人口、就業(yè)、住房等指標(biāo)。從存量規(guī)劃的角度來(lái)看,用地本身的屬性其實(shí)是實(shí)體物理空間與社會(huì)活動(dòng)空間相互作用的產(chǎn)物。
分時(shí)人口數(shù)據(jù),一般指帶有時(shí)間信息的人口統(tǒng)計(jì)數(shù)據(jù),在與地理坐標(biāo)結(jié)合時(shí)能夠用于描述用地的社會(huì)空間活動(dòng)。常用的分時(shí)人口數(shù)據(jù)來(lái)源有手機(jī)信令數(shù)據(jù)[5],出租車OD數(shù)據(jù)[6],公交刷卡數(shù)據(jù)[7],社交媒體簽到數(shù)據(jù)等。相比于規(guī)劃常用的統(tǒng)計(jì)公報(bào)、普查或年鑒數(shù)據(jù),分時(shí)數(shù)據(jù)的統(tǒng)計(jì)口徑能夠通過(guò)數(shù)據(jù)處理細(xì)化到城市地塊的規(guī)?;蛘邊R總為一個(gè)單一的城市指標(biāo)。由于分時(shí)數(shù)據(jù)多為實(shí)時(shí)采集的數(shù)據(jù),所以也具備了實(shí)時(shí)進(jìn)行地塊屬性評(píng)判的潛在能力。裘煒毅等人就利用手機(jī)信令數(shù)據(jù)對(duì)上海市張江高科技園區(qū)及莘莊工業(yè)區(qū)的職住分布進(jìn)行了研究[8]。雖然兩用地周邊都有居住用地的布局配置,但是通過(guò)手機(jī)信令數(shù)據(jù)生成出行鏈并對(duì)用戶OD點(diǎn)的識(shí)別能夠判斷出張江高科技園區(qū)的職住比略低于莘莊工業(yè)區(qū)的職住比,顯示高科技園區(qū)周邊的居住用地從社會(huì)屬性上并未較好地為園區(qū)職工提供住房。
本研究中采用的分時(shí)人口數(shù)據(jù)相較于目前使用的手機(jī)信令、社交媒體數(shù)據(jù)、出租車、公交刷卡數(shù)據(jù)而言的優(yōu)勢(shì)在于直接同需要分析的地塊人口密度變化掛鉤。不需要通過(guò)繁瑣的處理,通過(guò)生成軌跡鏈等方式進(jìn)行二次統(tǒng)計(jì)。這保證了數(shù)據(jù)在未來(lái)用于實(shí)時(shí)評(píng)估用地狀況的運(yùn)算中能夠大幅縮減運(yùn)算時(shí)間。在數(shù)據(jù)精度方面,手機(jī)信令對(duì)基站的依賴程度巨大,平均精度在500 m×500 m左右。出租車、公交刷卡等數(shù)據(jù)更是受到了道路尺度的大幅限制。而主要依靠GPS提供定位的分時(shí)人口密度數(shù)據(jù)能夠提供精度達(dá)到25 m×25 m網(wǎng)格的細(xì)度數(shù)據(jù),基本達(dá)到了建筑的分析尺度。此外該數(shù)據(jù)本身的獲取門檻較低,通過(guò)互聯(lián)網(wǎng)抓取技術(shù)就能持續(xù)獲取數(shù)據(jù)。綜上可知,新的數(shù)據(jù)環(huán)境和分析方法降低了數(shù)據(jù)獲取的難度和數(shù)據(jù)分析的技術(shù)門檻,因此,如何對(duì)當(dāng)前環(huán)境下的數(shù)據(jù)加以運(yùn)用,使規(guī)劃制訂與實(shí)施更能滿足城市運(yùn)行的需要及市民生活的需求,則需要規(guī)劃師在提高自身數(shù)據(jù)研究技術(shù)的同時(shí),對(duì)當(dāng)前的數(shù)據(jù)環(huán)境進(jìn)行進(jìn)一步的思考。當(dāng)前研究中,龍瀛等已對(duì)數(shù)據(jù)在規(guī)劃應(yīng)用中的角色進(jìn)行了系統(tǒng)的思考與梳理,提出了數(shù)據(jù)增強(qiáng)設(shè)計(jì)的概念。本文將從數(shù)據(jù)增強(qiáng)設(shè)計(jì)的概念出發(fā),對(duì)人口密度數(shù)據(jù)進(jìn)行深入挖掘,輔助存量規(guī)劃的進(jìn)行[9]。
1.1研究對(duì)象及研究數(shù)據(jù)
本次研究范圍為北京六環(huán)內(nèi)區(qū)域。所采用的主數(shù)據(jù)源為互聯(lián)網(wǎng)某LBS產(chǎn)品的分時(shí)人口活動(dòng)熱度數(shù)據(jù)。該數(shù)據(jù)的主要來(lái)源是該互聯(lián)網(wǎng)產(chǎn)品的桌面端和移動(dòng)端APP的用戶使用過(guò)程中產(chǎn)生的過(guò)程數(shù)據(jù)。該服務(wù)通過(guò)采集桌面端的IP地址和移動(dòng)端用戶主動(dòng)產(chǎn)生的定位信息,計(jì)算每一位置每個(gè)時(shí)刻的人口統(tǒng)計(jì)。原始的數(shù)據(jù)包含3個(gè)字段,分別為數(shù)據(jù)采集點(diǎn)的坐標(biāo)、日期和該小時(shí)的人口密度。其中,人口密度值已經(jīng)過(guò)服務(wù)后臺(tái)預(yù)處理,與實(shí)際人口數(shù)量存在正相關(guān)的轉(zhuǎn)換關(guān)系。數(shù)據(jù)采集點(diǎn)的網(wǎng)格密度為25 m,點(diǎn)呈均勻點(diǎn)陣分布。目前筆者通過(guò)網(wǎng)絡(luò)爬蟲,采集了2015年7月30日至8月2日北京六環(huán)以內(nèi)的數(shù)據(jù),數(shù)據(jù)量在每小時(shí)230萬(wàn)個(gè)點(diǎn)左右(圖1)。因抓取頻次的限制,個(gè)別郊區(qū)區(qū)塊存在數(shù)據(jù)缺失,但是并不影響對(duì)功能復(fù)雜的城市中心城區(qū)的分析。
圖1 原始數(shù)據(jù)點(diǎn)范圍
為保證該分時(shí)人口數(shù)據(jù)能夠較好地對(duì)不同類型的城市功能,尤其是混合功能進(jìn)行深入解讀,在正式研究前,筆者對(duì)幾處熟知的特征地塊進(jìn)行了預(yù)試研究。首先,筆者對(duì)同一主導(dǎo)功能的不同地塊的人口活動(dòng)進(jìn)行了橫向?qū)Ρ取9P者分別選擇了3種用地功能與人口活動(dòng)特征截然不同的地塊,通過(guò)將地塊內(nèi)的點(diǎn)數(shù)據(jù)匹配到地塊中,計(jì)算出每個(gè)地塊的分時(shí)人口熱度曲線。其中S代表周末,W代表工作日,后面的數(shù)字代表整點(diǎn)時(shí)間。
這3個(gè)地塊分別為市級(jí)活動(dòng)中心西單大悅城、市級(jí)商業(yè)辦公中心金融街和市級(jí)綠地奧林匹克森林公園(圖2)。其中,西單大悅城的人口活動(dòng)熱度在工作日和周末都較高,且一般于下午14至16點(diǎn)左右達(dá)到高峰。金融街則呈現(xiàn)出明顯的辦公特征,即工作日的人口活動(dòng)熱度顯著高于休息日。而奧林匹克森林公園則相反,在周末吸引著更多的人前來(lái)活動(dòng)。
圖2 3種特征地塊對(duì)比
通過(guò)觀察尺度較大、地塊特征較為明顯的若干地塊后可以看出該分時(shí)人口密度在地塊上所表達(dá)的特征與趨勢(shì)已經(jīng)能夠滿足用于機(jī)器學(xué)習(xí)的識(shí)別需求。為了進(jìn)一步對(duì)數(shù)據(jù)質(zhì)量與其所能反映的特征進(jìn)行評(píng)估,筆者選取了一棟建筑中點(diǎn)層面的數(shù)據(jù)進(jìn)行對(duì)比(圖3)。所選擇的是辦公建筑“百度大廈”。在研究中對(duì)大廈中不同區(qū)域的分時(shí)人口活動(dòng)變化規(guī)律進(jìn)行對(duì)比。從圖3可以看出,在百度大廈中,除1號(hào)點(diǎn)外,其余3點(diǎn)有著相似的曲線特征,即典型的辦公活動(dòng)特征。由此可知,在同一建筑中的不同區(qū)域,因其空間使用功能的不同,所反映出的人口活動(dòng)變化規(guī)律也大相徑庭。因此這些數(shù)據(jù)所反映的用地功能特征及精細(xì)程度,是傳統(tǒng)用地分析方法無(wú)法比擬的。
圖3 建筑內(nèi)數(shù)據(jù)點(diǎn)對(duì)比
另外,為了更好地配合分時(shí)人口數(shù)據(jù),對(duì)用地功能進(jìn)行深入解讀,筆者使用了百度POI作為輔助數(shù)據(jù)源。通過(guò)百度地圖提供的API (Application Programming Interface,應(yīng)用程序編程接口),筆者采集了2015年初北京市域范圍內(nèi)的5大類、20小類約20萬(wàn)個(gè)POI,涵蓋居住、商業(yè)、娛樂(lè)、公共服務(wù)設(shè)施、交通、綠地等內(nèi)容。每個(gè)POI點(diǎn)包括唯一編號(hào)、POI名稱、坐標(biāo)、一級(jí)分類、二級(jí)分類、用戶評(píng)價(jià)等字段(圖4)。
圖4 POI數(shù)據(jù)樣例
1.23層研究空間尺度匹配體系
觀察數(shù)據(jù)特征可知,在不同空間尺度中,分時(shí)人口數(shù)據(jù)所反映出的用地特征也有不同的側(cè)重。在傳統(tǒng)的地塊尺度中,數(shù)據(jù)能夠較好地體現(xiàn)出該地的人口活動(dòng)規(guī)律,但是面對(duì)地塊內(nèi)部的大型建筑,尤其是重要建筑節(jié)點(diǎn)時(shí),地塊尺度則顯示了其自身分析尺度過(guò)大的缺陷。這時(shí),更為精細(xì)的點(diǎn)陣尺度數(shù)據(jù)則可以對(duì)地塊內(nèi)部的混合功能進(jìn)行全方位的立體描述。與此同時(shí),在郊區(qū)存在許多自身面積較大的地塊,此時(shí)再使用地塊尺度進(jìn)行分析,則會(huì)因其包含太多數(shù)據(jù)而使分析結(jié)果過(guò)于籠統(tǒng),難以滿足精細(xì)刻畫的需求。因此,將較大的地塊劃分為若干空間尺度較小的研究單元,可以對(duì)這些大尺度的地塊進(jìn)行進(jìn)一步的精細(xì)刻畫。
結(jié)合以上空間研究單元需求,筆者將整個(gè)研究單元分為3層空間尺度,分別進(jìn)行數(shù)據(jù)匹配。3層空間尺度體系分別為原始地塊尺度(由路網(wǎng)分割)、500×500 m網(wǎng)格尺度,及25×25 m原始數(shù)據(jù)點(diǎn)陣尺度(圖5)。其中,原始地塊尺度對(duì)于多數(shù)空間單元能夠做到較好的描述,但是對(duì)于極大的郊區(qū)地塊和極小的內(nèi)城地塊,其描述結(jié)果并不能很好地體現(xiàn)該空間所在的本身特征。因此,我們使用均分額500 m網(wǎng)格,對(duì)地塊尺度的描述進(jìn)行補(bǔ)充說(shuō)明。在點(diǎn)陣尺度,研究結(jié)果則會(huì)更多地傾向于對(duì)建筑尺度的對(duì)比,包括建筑內(nèi)部的時(shí)空特征,以及建筑與地塊的時(shí)空關(guān)聯(lián)等。通過(guò)3層空間尺度體系的分門別類與描述,筆者對(duì)同一研究對(duì)象進(jìn)行基于地塊、網(wǎng)格和內(nèi)部點(diǎn)的多維立體描述,為存量規(guī)劃所需的深度精細(xì)刻畫提供理論支持。
圖5 空間匹配流程與結(jié)果
1.3非監(jiān)督分類與矩陣分解在研究中的使用
由觀察數(shù)據(jù)可知,分時(shí)人口密度數(shù)據(jù)作為曲線類數(shù)據(jù),其自身特點(diǎn)非常適合使用機(jī)器學(xué)習(xí)的方法進(jìn)行非監(jiān)督分類。筆者將數(shù)據(jù)整理為休息日的24小時(shí)分時(shí)人口數(shù)據(jù)與工作日的24小時(shí)分時(shí)人口數(shù)據(jù),共48個(gè)時(shí)刻,結(jié)合20種不同類型POI的數(shù)量,對(duì)3層空間尺度的研究單元進(jìn)行k-means聚類分析(圖6)。
圖6 機(jī)器學(xué)習(xí)流程
為了能夠確定k-means中k的取值,筆者在每組數(shù)據(jù)進(jìn)行k-means分類之前均進(jìn)行了silhouette檢驗(yàn),尋找每組合適的k值,保證在分類過(guò)程中,既不會(huì)出現(xiàn)因?yàn)閗值過(guò)小而忽略某些特征,也不會(huì)出現(xiàn)因?yàn)閗值過(guò)大使得多組分類結(jié)果高度重合的情況。
在使用k-means進(jìn)行聚類時(shí),為了分別對(duì)時(shí)間活動(dòng)的趨勢(shì)規(guī)律和地塊人口活動(dòng)規(guī)模進(jìn)行進(jìn)一步區(qū)分,筆者分別使用了歸一化的48個(gè)時(shí)刻數(shù)據(jù)和未歸一化的數(shù)據(jù)進(jìn)行非監(jiān)督學(xué)習(xí),使分類結(jié)果更加詳細(xì)。在進(jìn)行48個(gè)時(shí)刻的非監(jiān)督分類同時(shí),筆者也嘗試了使用非負(fù)矩陣分解(NMF)的方法,將每個(gè)研究單元48個(gè)時(shí)刻中的特征提取出來(lái),在放大特征的基礎(chǔ)上進(jìn)行非監(jiān)督分類。
2.1地塊尺度研究結(jié)果
考慮到48個(gè)變量仍是一個(gè)很高的維度,而k-means聚類對(duì)高維度的聚類仍力度不足,為進(jìn)一步降低數(shù)據(jù)的維度,本部分采用了非負(fù)矩陣分解(NMF)的方法,以歸一化之后的48個(gè)變量作為輸入,最終將變量降為4維,然后以降維之后的5個(gè)變量作為k-means聚類的輸入,經(jīng)過(guò)實(shí)驗(yàn)證明,降維之后再聚類的方法比直接聚類的方法所得精度更好。因此,地塊尺度的分類方法是,采用非負(fù)矩陣分解(NMF)的方法先對(duì)歸一化后的48個(gè)變量進(jìn)行降維(降成5維),然后采用k-means聚類的方法對(duì)降維之后的5個(gè)變量進(jìn)行聚類。多次試驗(yàn),進(jìn)行silhouette檢驗(yàn),發(fā)現(xiàn)當(dāng)分類類別數(shù)為9時(shí),silhouette檢驗(yàn)的得分最高,意味著k=9時(shí),分類精度最高,因此,選擇k=9類作為最終的分類結(jié)果。
圖7 地塊尺度分類結(jié)果
圖7展示了地塊尺度分類的結(jié)果,地塊的類別根據(jù)各類別的曲線特征確定,同時(shí)抽樣選取已知功能的典型地塊。從地塊尺度分類結(jié)果圖可以看出,該方法對(duì)商務(wù)辦公、商業(yè)商務(wù)混合、商業(yè)識(shí)別度最高。能夠很好地識(shí)別出這3類對(duì)應(yīng)的典型區(qū)域,如東二環(huán)的東直門—朝外一帶,財(cái)富中心,望京的商務(wù)樓集中區(qū),豐臺(tái)總部基地,金融街及中關(guān)村辦公樓集中區(qū)等商務(wù)辦公區(qū);南鑼鼓巷,王府井,西單,中關(guān)村購(gòu)物中心等典型商業(yè)主導(dǎo)區(qū)域;復(fù)興門、建國(guó)門等商業(yè)商務(wù)混合區(qū)。此外,對(duì)游憩—公園、居住主導(dǎo)、商住混合—居住為主等功能的地塊也有較好的識(shí)別度。例如,奧林匹克森林公園、頤和園、圓明園、天壇公園、北海公園等公園均能分到一類(公園游憩類),但同時(shí)陶然亭公園、玉淵潭公園等則沒(méi)有能夠正確識(shí)別。居住主導(dǎo)類和商住混合—居住為主類別在空間分布上的明顯區(qū)別是居住主導(dǎo)類更具外圍性,且分布更多在南邊,而商住混合—居住為主類則更多分布在北邊,這與北京北部較南部發(fā)達(dá)的特征一致。而混合—居住主導(dǎo),及其他兩類混合類則無(wú)法準(zhǔn)確判斷類別,而實(shí)際上,這3類在五環(huán)內(nèi)的地塊中所占比例非常小,可以說(shuō),總體上,本部分基于地塊尺度的地塊分類方法具有較高的精度。
除對(duì)典型的功能區(qū)能有較高的識(shí)別度之外,該分類對(duì)非典型功能區(qū)中精細(xì)地塊也能有較好的識(shí)別。以?shī)W林匹克森林公園所在區(qū)域?yàn)槔▓D8),這塊區(qū)域包括了居住、商業(yè)、辦公、游憩公園等多種類型,隨機(jī)抽取幾個(gè)地塊,觀察所識(shí)別的精度,結(jié)果如圖8所示。圖中,地塊1經(jīng)過(guò)機(jī)器學(xué)習(xí)識(shí)別出來(lái)的結(jié)果是游憩公園類型,其所表現(xiàn)的曲線特征為周末人多、平時(shí)人少、高峰在下午14—17點(diǎn)的特征,與人們游憩娛樂(lè)的行為習(xí)慣一致,進(jìn)一步對(duì)比百度地圖的結(jié)果,發(fā)現(xiàn)該地塊為奧林匹克森林公園南園所在地,為綠地類型用地;地塊2經(jīng)過(guò)機(jī)器學(xué)習(xí)識(shí)別出來(lái)的結(jié)果是商務(wù)主導(dǎo)的用地,曲線特征為明顯的周末幾乎無(wú)人、平時(shí)人多、10—18點(diǎn)長(zhǎng)高峰的特征,與人們工作的行為習(xí)慣一致,而在百度地圖中顯示該地塊為京東總部未搬遷之前的辦公所在地,為商務(wù)辦公用地類型;地塊3識(shí)別的結(jié)果是商業(yè)主導(dǎo)的用地類型,曲線表現(xiàn)為周末、平時(shí)略突出的雙高峰的特征,由于該購(gòu)物中心為片區(qū)級(jí)購(gòu)物中心,主要服務(wù)周邊居住、辦公的人群,因此商業(yè)特征相較商業(yè)中心不太明顯,但仍表現(xiàn)為商業(yè)主導(dǎo)的特征,而百度地圖上顯示該地塊為漂亮陽(yáng)光廣場(chǎng),為商業(yè)服務(wù)業(yè)用地類型,曲線、以及地圖上的實(shí)景展示均驗(yàn)證了本部分所用分類方法在精細(xì)地塊尺度上具有較高的識(shí)別度。
圖8 奧林匹克森林公園區(qū)域地塊識(shí)別功能、對(duì)應(yīng)曲線、實(shí)際功能
雖然在典型功能及精細(xì)地塊尺度上都能有較好的分類結(jié)果,但仍存在部分識(shí)別效果的比例,如前文所述陶然亭公園、玉淵潭公園等無(wú)法與其他公園分為一類,故宮、景山公園等被分成了商業(yè)主導(dǎo)類型等,這些均屬于不恰當(dāng)?shù)念悇e劃分。說(shuō)明單一從人類活動(dòng)的特征推測(cè)用地功能在功能更加混合的用地上區(qū)分度不夠,且小地塊的人類活動(dòng)數(shù)量會(huì)對(duì)異常事件有敏感的反應(yīng),導(dǎo)致分類結(jié)果的誤差,后續(xù)還得結(jié)合POI數(shù)據(jù)和人類活動(dòng)的數(shù)據(jù),共同判斷地塊的用地功能。值得一提的是,本部分所談商業(yè)主導(dǎo)、居住主導(dǎo)、商務(wù)主導(dǎo)等各用地功能,均是指承載更多人類活動(dòng)的功能,而不單純是從地塊中的占地面積來(lái)判斷。要掌握用地的運(yùn)行狀況,人的活動(dòng)實(shí)際是一個(gè)更合理的角度。此外,地塊的數(shù)據(jù)去除了道路、廣場(chǎng),而這兩者本身也承載人類重要活動(dòng),是一類重要的用地類型,而基于地塊的用地功能無(wú)法進(jìn)行識(shí)別,也是遺憾之一。
2.2網(wǎng)格尺度研究結(jié)果
為了更好地體現(xiàn)500 m網(wǎng)格的特點(diǎn),彌補(bǔ)郊區(qū)大地塊中分類精度的不足,網(wǎng)格尺度分別對(duì)POI數(shù)據(jù)、歸一化后的48個(gè)小時(shí)的分時(shí)人口曲線數(shù)據(jù)和原始曲線數(shù)據(jù)進(jìn)行了空間匹配。通過(guò)POI的分類結(jié)果輔助判斷用地的主導(dǎo)功能。歸一化曲線的分類結(jié)果對(duì)時(shí)間活動(dòng)特征進(jìn)行強(qiáng)化描述。原始曲線分類結(jié)果則側(cè)重描述各網(wǎng)格內(nèi)的人口活動(dòng)規(guī)模。通過(guò)3類數(shù)據(jù)分類結(jié)果的疊加,可以對(duì)單一網(wǎng)格進(jìn)行更為立體的解讀。
在使用k-means進(jìn)行分類前,通過(guò)Silhouette檢驗(yàn),得知3組數(shù)據(jù)潛在的理想k值,即分組組數(shù)均為5組。在非監(jiān)督分類后,通過(guò)觀察每組數(shù)據(jù)的不同分組的統(tǒng)計(jì)學(xué)特征,研究可以結(jié)合網(wǎng)格對(duì)應(yīng)的實(shí)際地塊對(duì)分組結(jié)果進(jìn)行合理解釋。
在POI分組中(圖9),分組依據(jù)主要為不同種類POI的比重。5類分組結(jié)果分別為商業(yè)商務(wù)綜合地塊、交通服務(wù)富集地塊、商業(yè)混合地塊、市級(jí)活動(dòng)中心,及居住企業(yè)學(xué)校地塊。從分組結(jié)果可以得知,POI的分組結(jié)果更偏重對(duì)商業(yè)的描述,而對(duì)居住及公共服務(wù)功能的描述則略有不足。而這也是由POI自身為商業(yè)導(dǎo)航的性質(zhì)所決定的。因此,使用分時(shí)人口數(shù)據(jù)分類結(jié)果進(jìn)行疊加在這里顯得更有必要。
圖9 POI分類內(nèi)結(jié)果分析
在未歸一化的原始曲線的分類結(jié)果中,分類依據(jù)主要是人口活動(dòng)規(guī)模。人口活動(dòng)規(guī)模由低到高共分為5類。對(duì)于歸一化的曲線,其分類結(jié)果主要體現(xiàn)了地塊的職住特性與工作日和休息日的特征差異。分類結(jié)果的職住性質(zhì)分別從純工作場(chǎng)所類到職住平衡類再到居住娛樂(lè)類共分5類。而在此分類方法中無(wú)法完好區(qū)分的居住和娛樂(lè)則可由POI的分類結(jié)果進(jìn)行很好的彌補(bǔ)(圖10)。
圖10 分時(shí)人口密度分類結(jié)果
通過(guò)將3種分類方法的分類結(jié)果進(jìn)行疊加,排除不存在及特征重復(fù)的組合,共得到11類用地功能分類。通過(guò)與已知特征的地塊進(jìn)行比對(duì),可以發(fā)現(xiàn)該用地功能分類的結(jié)果能夠較好地對(duì)研究范圍內(nèi)的500 m網(wǎng)格進(jìn)行功能區(qū)分,并且區(qū)分結(jié)果可以進(jìn)行較好的解釋。以筆者較為熟悉的五道口地區(qū)為例(圖11),在該區(qū)域內(nèi),用地功能混合度較高、類型較為多樣化。既有以商業(yè)辦公為主的華聯(lián),以教學(xué)為主的各大高校,也有類似華清嘉園這類混合度較高、功能較為多樣化的住宅區(qū)。從分類結(jié)果上,筆者發(fā)現(xiàn)該尺度分類方法對(duì)學(xué)校的識(shí)別效果較好,區(qū)域內(nèi)的北大、清華、北語(yǔ)等學(xué)校均可以被較好地識(shí)別。華清嘉園等小區(qū)則被識(shí)別為商務(wù)中心類型,與其小區(qū)內(nèi)數(shù)量眾多的小公司及周邊繁華的餐飲零售業(yè)的現(xiàn)狀相契合。各研究院所及清華科技園所在地塊在該分類方法中也可以被較好地識(shí)別出來(lái),呈現(xiàn)出與學(xué)校和零售商業(yè)截然不同的分類結(jié)果。
2.3點(diǎn)陣尺度研究結(jié)果
點(diǎn)陣尺度的研究目的是為了通過(guò)將原始點(diǎn)陣數(shù)據(jù)的48小時(shí)分時(shí)曲線數(shù)據(jù)進(jìn)行聚類分析,對(duì)地塊內(nèi)部的人口活動(dòng)熱點(diǎn)及特征進(jìn)行精細(xì)區(qū)分與刻畫,對(duì)地塊內(nèi)部的地塊性質(zhì)主導(dǎo)因素進(jìn)行識(shí)別,發(fā)現(xiàn)地塊熱點(diǎn)。
圖11 疊加結(jié)果分析
在Silhouette檢驗(yàn)后,k-means分類中的k取值確定為15。不同于地塊尺度與網(wǎng)格尺度,點(diǎn)陣尺度的分類結(jié)果所主要表達(dá)的是根據(jù)曲線的特征及規(guī)模反映出地塊中建筑的外輪廓和建筑中的不同功能。以西二旗為例(圖12),點(diǎn)陣尺度的分類結(jié)果很好地體現(xiàn)了西二旗地鐵站及百度大廈區(qū)域的高人口活動(dòng)熱度。高人口活動(dòng)熱度的點(diǎn)均落入建筑內(nèi)部,25 m的點(diǎn)陣精度也保證了其可以對(duì)建筑外輪廓進(jìn)行較好的勾勒與反映。與此同時(shí),也可以通過(guò)對(duì)比分類結(jié)果的方法,對(duì)不同建筑的人口規(guī)模及活動(dòng)特征進(jìn)行區(qū)分。
圖12 點(diǎn)陣分類結(jié)果局部
另一方面,通過(guò)對(duì)分時(shí)人口數(shù)進(jìn)行疊加,可以在點(diǎn)陣尺度對(duì)以人口密度為基礎(chǔ)的三維空間進(jìn)行進(jìn)一步刻畫與可視化表達(dá)(圖13)。由此圖可以判斷,百度大廈是該地區(qū)人口活動(dòng)的絕對(duì)熱點(diǎn),其規(guī)模甚至遠(yuǎn)大于西二旗地鐵站。同時(shí),百度大廈北側(cè)的聯(lián)想研究院則是該地塊另一人口活動(dòng)熱度較高的區(qū)域。
圖13 點(diǎn)陣分類三維刻畫
分時(shí)人口密度數(shù)據(jù)為城市定量研究數(shù)據(jù)源選擇提供了全新的視角。其自身特征決定了在刻畫城市用地功能上,有著其他數(shù)據(jù)無(wú)法取代的優(yōu)勢(shì)。同時(shí),在結(jié)合POI等其他輔助數(shù)據(jù)源配合時(shí),分時(shí)人口密度數(shù)據(jù)可以對(duì)城市中的混合功能進(jìn)行較好的辨認(rèn)與區(qū)分,幫助研究者與規(guī)劃人員發(fā)現(xiàn)傳統(tǒng)研究方法所無(wú)法發(fā)現(xiàn)的城市特征。在3層空間尺度下,該數(shù)據(jù)也能夠?qū)Σ煌叨鹊某鞘泄δ芴卣鬟M(jìn)行詮釋,對(duì)同一研究對(duì)象進(jìn)行多維立體描述,保證分類結(jié)果的精準(zhǔn)和有效性。
總體而言,分時(shí)人口密度數(shù)據(jù)解決了在規(guī)模、規(guī)律和功能3個(gè)方面的認(rèn)知過(guò)程中產(chǎn)生的問(wèn)題。首先,在規(guī)模識(shí)別上,該數(shù)據(jù)可以對(duì)分時(shí)人口規(guī)模進(jìn)行深度刻畫,達(dá)到對(duì)同種功能不同級(jí)別的識(shí)別,解決傳統(tǒng)分析方法中對(duì)不同規(guī)模的居住區(qū)、商業(yè)區(qū)分類過(guò)程中遇到的困難。第二,在活動(dòng)規(guī)律識(shí)別上,分時(shí)人口密度打破了傳統(tǒng)分析方法中單一結(jié)果、缺乏時(shí)間維度的構(gòu)造,對(duì)同一地塊不同時(shí)間段的特征進(jìn)行了有效的反映,對(duì)地塊人口活動(dòng)規(guī)律的單日內(nèi)變化、工作日與周末的差異進(jìn)行了突出表達(dá)。第三,在城市功能認(rèn)知上,結(jié)合POI的約束,分時(shí)人口數(shù)據(jù)可以發(fā)現(xiàn)傳統(tǒng)用地分類中無(wú)法刻畫的隱藏屬性,如小區(qū)里的公司。
但是在城市定量研究中,分時(shí)人口密度也有著其自身的不足與局限性。該數(shù)據(jù)最大的局限性在于,由于數(shù)據(jù)是經(jīng)過(guò)點(diǎn)陣進(jìn)行采集的,點(diǎn)陣的數(shù)據(jù)中并不包括單一用戶的行為信息。這也意味著,對(duì)于用戶的時(shí)空軌跡,使用此種數(shù)據(jù)無(wú)法進(jìn)行分析。在大規(guī)模遷徙和行為路線選擇研究方面,該數(shù)據(jù)無(wú)法提供有效支持與幫助。
本研究通過(guò)使用非監(jiān)督分類的方法對(duì)城市用地進(jìn)行人口活動(dòng)特征與功能上的重新劃分,其主要貢獻(xiàn)包括3點(diǎn)。第一,為建成環(huán)境使用后評(píng)價(jià)提供了新的途徑與思路,超越傳統(tǒng)評(píng)估方法中訪談、問(wèn)卷的小樣本與局限性,為調(diào)研提供更為多元化的視角。第二,為研究城市功能歷史轉(zhuǎn)變提供了可能。傳統(tǒng)調(diào)研方法對(duì)于歷史數(shù)據(jù)的獲取和反饋能力相對(duì)有限。而本方法可以通過(guò)個(gè)性化抓取,選擇需要的時(shí)間與地理范圍,對(duì)研究對(duì)象進(jìn)行分類描述與刻畫。第三,研究尺度更為精細(xì),在小微尺度上的數(shù)據(jù)分析為更多的小尺度空間研究提供了可能,也滿足了存量規(guī)劃的自身需求。在人流擁堵點(diǎn)識(shí)別、建筑與地塊的微觀聯(lián)系上,都有著可供挖掘的潛力。
通過(guò)此次研究,筆者了解到該數(shù)據(jù)與方法在存量規(guī)劃中的應(yīng)用潛力。在下一研究階段中,通過(guò)完善該方法,可以對(duì)更為宏觀和熱點(diǎn)的規(guī)劃問(wèn)題進(jìn)行挖掘與分析。例如研發(fā)可供非首都核心功能疏解評(píng)估的人口規(guī)模監(jiān)測(cè)模式、京津冀協(xié)同發(fā)展中重點(diǎn)對(duì)接單位和區(qū)塊的用地人口特征變化分析等。課題組也將對(duì)分析方法進(jìn)行進(jìn)一步完善,通過(guò)該方法對(duì)城市的運(yùn)行狀況進(jìn)行常態(tài)化監(jiān)測(cè),在發(fā)現(xiàn)規(guī)劃問(wèn)題的同時(shí),對(duì)規(guī)劃進(jìn)行精確輔助。
References
[1]鄒兵. 增量規(guī)劃,存量規(guī)劃與政策規(guī)劃[J]. 城市規(guī)[9]劃,2013(2):35-37. ZOU Bing. Increment planning, inventory planning and policy planning[J]. Urban Planning, 2013(2): 35-37.
[2]Halder A, Ghosh A, Ghosh S. Supervised and unsupervised land-use map generation from remotely sensed images using ant based systems[J]. Applied Soft Computing Journal, 2011, 11(8): 5770-5781.
[3]梁松. 城市規(guī)劃動(dòng)態(tài)監(jiān)管衛(wèi)星遙感關(guān)鍵技術(shù)研究[D]. 北京:中國(guó)礦業(yè)大學(xué)博士學(xué)位論文,2010. LIANG Song. Study on the key technology of satellite remote sensing for urban planning dynamic supervising[D]. Beijing: The Dessertation for Doctoral Degree of China University of Mining and Technology, 2010.
[4]王芳,高曉路,許澤寧. 基于街區(qū)尺度的城市商業(yè)區(qū)識(shí)別與分類及其空間分布格局——以北京為例[J]. 地理研究,2015,34(6):1125-1134. WANG Fang, GAO Xiaolu, XU Zening. Identification and classification of urban commercial districts at Block Scale[J]. Geographical Research, 2015,34(6): 1125-1134.
[5]王德,王燦,謝棟燦,等. 基于手機(jī)信令數(shù)據(jù)的上海市不同等級(jí)商業(yè)中心商圈的比較——以南京東路、五角場(chǎng)、鞍山路為例[J]. 城市規(guī)劃學(xué)刊,2015(3):50-60. WANG De, WANG Can, XIE Dongcan, et al. Comparison of retail trade areas of retail centers with different hierarchical levels: a case study of East Nanjing Road, Wujiaochang, Anshan Road in Shanghai[J]. Urban Planning Forum, 2015(3): 50-60.
[6]張曉亮,陳智宏,劉冬梅,等. 一種基于多源數(shù)據(jù)的出租車分布預(yù)測(cè)方法研究[J]. 道路交通與安全,2015(1):47-51. ZHANG Xiaoliang, CHEN Zhihong, LIU Dongmei, et al. A taxi travel forecasting method based on multi-source data[J]. Road Traffic and Safety, 2015(1): 47-51.
[7]龍瀛,張宇,崔承印. 利用公交刷卡數(shù)據(jù)分析北京職住關(guān)系和通勤出行[J]. 地理學(xué)報(bào),2012,67 (10):1339-1352. LONG Ying, ZHANG Yu, CUI Chengyin. Identifying commuting pattern of Beijing using bus smart card data[J]. Acta Geographica Sinica, 2012, 67(10): 1339-1352.
[8]裘煒毅,劉杰. 手機(jī)大數(shù)據(jù)視角下的工業(yè)區(qū)職住平衡分析方法[C]//中國(guó)城市規(guī)劃年會(huì)論文集:城市規(guī)劃新技術(shù)應(yīng)用. 北京:中國(guó)建筑工業(yè)出版社,2015. QIU Weiyi, LIU Jie. Industrial job-housing balance in the perspective of mobile phone big data[C]// China Annual Urban Planning Forum Proceedings. Beijing: China Architecture & Building Press, 2015.龍瀛,沈堯. 數(shù)據(jù)增強(qiáng)設(shè)計(jì)——新數(shù)據(jù)環(huán)境下的規(guī)劃設(shè)計(jì)回應(yīng)與改變[J]. 上海城市規(guī)劃,2015 (2):81-87. LONG Ying, SHEN Yao. Data augmented design: urban planning and design in the new data environment[J]. Shanghai Urban Planning Review, 2015(2): 81-87.
City Sensing: An Inventory Planning Tool Based on Spatial-temporal Big Data
1673-8985(2016)03-0009-08 中圖分類號(hào)TU981 文獻(xiàn)標(biāo)識(shí)碼A
段冰若
北京清華同衡規(guī)劃設(shè)計(jì)研究院有限公司技術(shù)創(chuàng)新中心
規(guī)劃師,碩士
王 鵬
北京清華同衡規(guī)劃設(shè)計(jì)研究院有限公司技術(shù)創(chuàng)新中心
副主任,高級(jí)工程師,碩士
郝新華
北京清華同衡規(guī)劃設(shè)計(jì)研究院有限公司技術(shù)創(chuàng)新中心
規(guī)劃師,碩士
蔡玉蘅
北京清華同衡規(guī)劃設(shè)計(jì)研究院有限公司技術(shù)創(chuàng)新中心
規(guī)劃師,碩士
石 淼
北京清華同衡規(guī)劃設(shè)計(jì)研究院有限公司技術(shù)創(chuàng)新中心
數(shù)據(jù)分析師,碩士