李 楠
(成都市規(guī)劃設(shè)計(jì)研究院,四川成都 610041)
與規(guī)劃編制相關(guān)的網(wǎng)絡(luò)開源數(shù)據(jù)獲取應(yīng)用研究
李楠
(成都市規(guī)劃設(shè)計(jì)研究院,四川成都610041)
城市規(guī)劃,涉及到社會(huì)的方方面面,并對(duì)生活在其中的人們產(chǎn)生千絲萬縷的聯(lián)系,它并不是靜態(tài)的設(shè)計(jì),而是為社會(huì)動(dòng)態(tài)發(fā)展,人類動(dòng)態(tài)生活而服務(wù)的。本文介紹了網(wǎng)絡(luò)開源數(shù)據(jù)在規(guī)劃編制中的應(yīng)用前景,分析討論了幾種可行的網(wǎng)絡(luò)開源數(shù)據(jù)的獲取方法,就開源數(shù)據(jù)的的安全性及具體在在Gephi軟件的展示應(yīng)用進(jìn)行了簡單的介紹。
開源數(shù)據(jù)規(guī)劃編制數(shù)據(jù)獲取數(shù)據(jù)展示
隨著這些年互聯(lián)網(wǎng)的蓬勃發(fā)展,已經(jīng)積累了相當(dāng)量級(jí)的待挖掘數(shù)據(jù)。這些數(shù)據(jù)產(chǎn)生于人們?nèi)粘I钪幸蕾嚮ヂ?lián)網(wǎng)工作、生活留下的痕跡,將人們生活的形態(tài)在大尺度上向世人展示?;谶@些特點(diǎn),我們幾乎可以斷言 “網(wǎng)絡(luò)開源大數(shù)據(jù)”應(yīng)該會(huì)成為城市規(guī)劃未來發(fā)展提供有利的分析基礎(chǔ)和條件。而實(shí)際上,有很多研究學(xué)者已經(jīng)就大數(shù)據(jù)挖掘出的數(shù)據(jù)信息應(yīng)用于城市規(guī)劃中。大數(shù)據(jù)的產(chǎn)生獲取途徑繁多,很多并不源于規(guī)劃部門,如通信、電商、交通、社交媒體、醫(yī)療、銀行等。如何獲取這些數(shù)據(jù),獲取后如何應(yīng)用?本文就大數(shù)據(jù)的獲取及應(yīng)用舉例如下。
1.1百度地圖API獲取開源免費(fèi)數(shù)據(jù)
百度地圖API是為開發(fā)者免費(fèi)提供的一套基于百度地圖服務(wù)的應(yīng)用接口,包括JavaScript API、Web服務(wù)API、Android SDK、iOS SDK、定位SDK、車聯(lián)網(wǎng)API、LBS云等多種開發(fā)工具與服務(wù),提供基本地圖展現(xiàn)、搜索、定位、逆/地理編碼、路線規(guī)劃、LBS云存儲(chǔ)與檢索等功能,適用于PC端、移動(dòng)端、服務(wù)器等多種設(shè)備,多種操作系統(tǒng)下的地圖應(yīng)用開發(fā)。
我們通過對(duì)百度地圖Place API接口的調(diào)用,在Visio Studio 2010編譯軟件中,通過以下程序提取調(diào)用出四川周邊城市,如瀘州、綿陽、自貢等地的銀行、醫(yī)院、學(xué)校等公共配套設(shè)施的分布地理坐標(biāo)及其他詳細(xì)信息,以便于日后對(duì)這類地區(qū)規(guī)劃分析提供參考。Place API 是一類簡單的HTTP接口,用于返回查詢某個(gè)區(qū)域的某類POI數(shù)據(jù),且提供單個(gè)POI的詳情查詢服務(wù),用戶可以使用C#、C++、Java等開發(fā)語言發(fā)送HTTP請(qǐng)求且接收json、xml的數(shù)據(jù)。返回的Xml數(shù)據(jù)可直接在程序中處理后存入MS Sql數(shù)據(jù)庫中,以備后續(xù)使用。百度地圖提取部分程序代碼圖1所示。
圖1 百度地圖提取部分程序代碼
1.2新浪微博數(shù)據(jù)提取與應(yīng)用
新浪微博擁有數(shù)量巨大的用戶群基礎(chǔ),用戶狀態(tài)、用戶關(guān)注及粉絲等已經(jīng)形成非常龐大且具有價(jià)值的數(shù)據(jù),如何獲取及處理這些數(shù)據(jù),已經(jīng)成為十分熱門且值得關(guān)注的研究方向。
此外,隨著越來越多的規(guī)劃師開始使用微博等新媒體,新浪微博上規(guī)劃師成為一個(gè)活躍的群體,2012年黃虎對(duì)北上廣深的規(guī)劃師群體進(jìn)行調(diào)查,發(fā)現(xiàn)規(guī)劃師群體微博使用比例明顯高于整個(gè)網(wǎng)民群體中的微博使用比例。如何突破傳統(tǒng)方法,通過新興媒體數(shù)據(jù)積累分析出規(guī)劃師群體間的交流及人脈關(guān)系?北規(guī)院的茅明睿[1]給我們提供了一個(gè)新的思路與解決方案,即通過新浪微博api數(shù)據(jù)接口對(duì)微博上中規(guī)院、清規(guī)院、和北規(guī)院的三院用戶的粉絲和好友數(shù)據(jù)進(jìn)行可視化分析,總結(jié)比較出三個(gè)院的用戶的粉絲和好友數(shù)據(jù)進(jìn)行可視化與分析,總結(jié)比較三個(gè)院的人脈特征、組織特征和相互聯(lián)系與影響的情況,從而實(shí)現(xiàn)傳統(tǒng)技術(shù)手段難以達(dá)成的分析效果,成功給予我們對(duì)規(guī)劃行業(yè)利用大數(shù)據(jù)進(jìn)行分析的啟示。
從數(shù)據(jù)的獲取手段來看,目前主要有兩種方法獲得新浪微博的數(shù)據(jù),一是利用爬蟲程序通過解析微博頁面獲得微博數(shù)據(jù);二是通過創(chuàng)建應(yīng)用,利用新浪官方API獲取微博數(shù)據(jù),步驟如下:
(1)下載weibo開發(fā)的SDK開發(fā)幫助包;(2)注冊(cè)用于獲取數(shù)據(jù)的新浪微博賬號(hào);(3)在新浪微博開放平臺(tái)注冊(cè)應(yīng)用,并獲取APP Key和App Secret;(4)由App Key和App Secret得到PIN值碼,并得到token和密碼。
圖2 某社交網(wǎng)站用戶注冊(cè)情況
圖3 個(gè)人郵件可視化來往分析
利用新浪API接口進(jìn)行獲取數(shù)據(jù)更加簡潔高效,在OAuth2.0標(biāo)注下調(diào)用新浪微博APi,返回均為Json格式的數(shù)據(jù)。Json是一種輕量級(jí)的數(shù)據(jù)交換格式,文件不具有明顯的強(qiáng)結(jié)構(gòu)特征。但在使用API之前,需要了解新浪微博API的接口定義及各個(gè)參數(shù)含義。新浪微博接口限制用戶每個(gè)小時(shí)請(qǐng)求的次數(shù)。為了避免過高頻率的訪問新浪API接口,一方面可以通過接口實(shí)時(shí)查詢當(dāng)前剩余的訪問次數(shù),另一方面,需要對(duì)程序進(jìn)行線程控制,以品均訪問頻率。
1.3網(wǎng)絡(luò)爬蟲工具獲取開源數(shù)據(jù)
以上例子均需要借助一定的計(jì)算機(jī)編程實(shí)現(xiàn),但也有一些互聯(lián)網(wǎng)上的網(wǎng)絡(luò)數(shù)據(jù)抓取軟件,只要對(duì)計(jì)算機(jī)的正則表達(dá)式掌握和了解,也可以自行配置進(jìn)行抓取目標(biāo)網(wǎng)站的數(shù)據(jù)。如火車頭采集器、網(wǎng)絡(luò)快車、gooseeker等。
在我們得到了一定量的數(shù)據(jù)后,往往需要進(jìn)行對(duì)數(shù)據(jù)的分析和展現(xiàn),在此介紹一個(gè)非常強(qiáng)大的可視化展現(xiàn)工具——Gephi。被稱為數(shù)據(jù)可視化領(lǐng)域的photoshop。 它是一款開源免費(fèi)跨平臺(tái)基于JVM的復(fù)雜網(wǎng)絡(luò)分析軟件, 其主要用于各種網(wǎng)絡(luò)和復(fù)雜系統(tǒng),動(dòng)態(tài)和分層圖的交互可視化與探測開源工具??捎米鳎禾剿餍詳?shù)據(jù)分析,鏈接分析,社交網(wǎng)絡(luò)分析,生物網(wǎng)絡(luò)分析等。gephi是一款信息數(shù)據(jù)可視化利器。Gephi 內(nèi)嵌數(shù)據(jù)展示算法,只需要通過導(dǎo)數(shù)將不同數(shù)據(jù)賦予其邊和點(diǎn)的信息,就可進(jìn)行強(qiáng)大的分析和展現(xiàn)。 在上文我們介紹的新浪微博展現(xiàn)三個(gè)規(guī)劃院的人脈分析,也是通過Gephi 軟件分析得出的。以下是一些用Gephi做出的數(shù)據(jù)分析效果圖2-3所示。
大數(shù)據(jù)的獲取有許多不同的方式,大數(shù)據(jù)的展現(xiàn)也將帶給我們新的思路和啟迪。只要我們細(xì)心抓取數(shù)據(jù),并通過再加工和生產(chǎn),大數(shù)據(jù)定能為規(guī)劃編制做出更好的服務(wù)!
[1]茅明睿.北京城市規(guī)劃設(shè)計(jì)研究院.規(guī)劃行業(yè)微博人脈特征分析——以中規(guī)院、清規(guī)院和北規(guī)院為例,10045.
李楠(1988—),女,四川成都,碩士研究生,助理工程師,研究方向:規(guī)劃信息化、規(guī)劃編制的知識(shí)管理。