劉帥,王佳
(1.南京市城市與交通規(guī)劃設(shè)計(jì)研究院股份有限公司,江蘇 南京 210018;2.長(zhǎng)沙理工大學(xué) 交通運(yùn)輸工程學(xué)院,湖南 長(zhǎng)沙 410114)
隨著大數(shù)據(jù)的發(fā)展,電子地圖提供的各類興趣點(diǎn)(point of interest,簡(jiǎn)稱為POI)為交通規(guī)劃設(shè)計(jì)提供了一種新的數(shù)據(jù)支撐。國(guó)外對(duì)于POI 數(shù)據(jù)的獲取和應(yīng)用研究較早。Mummidi[1]等人通過(guò)分析用戶在地圖上注釋的標(biāo)簽,發(fā)現(xiàn)興趣點(diǎn),增加了POI 數(shù)據(jù)的獲取途徑。Xie[2]等人提出網(wǎng)絡(luò)核密度分析,將線要素引入核密度分析,提高了核密度的運(yùn)算效率。Lian[3]等人將POI 簽到信息劃分權(quán)重,通過(guò)用戶的簽到頻率增大POI 的影響區(qū)域,幫助用戶推薦感興趣的POI 信息。李偉[4]等人通過(guò)GIS 平臺(tái)對(duì)POI 數(shù)據(jù)進(jìn)行處理,對(duì)廈門島內(nèi)常規(guī)公交線路的可達(dá)性進(jìn)行了評(píng)價(jià)。于浩川[5]等人以公交線路數(shù)據(jù)和POI 數(shù)據(jù)為基礎(chǔ),通過(guò)開(kāi)發(fā)軟件對(duì)城市公交線路進(jìn)行規(guī)劃。這些研究成果表明:國(guó)外研究主要集中于POI數(shù)據(jù)分析,而國(guó)內(nèi)主要集中于POI 應(yīng)用,但POI 數(shù)據(jù)在交通規(guī)劃應(yīng)用中還有諸多缺陷。因此,作者通過(guò)分析POI 數(shù)據(jù)的獲取和處理,擬構(gòu)建研究區(qū)域格網(wǎng)坐標(biāo),提取模型和分區(qū)導(dǎo)出模型,提高POI 數(shù)據(jù)扒取的準(zhǔn)確性和處理效率,以期為交通規(guī)劃提供前期的基礎(chǔ)數(shù)據(jù)。
POI 與人們的日常生活息息相關(guān)[6],其含有地理信息的空間實(shí)體[7],是可以通過(guò)計(jì)算機(jī)編程語(yǔ)言從電子地圖檢索和扒取的位置大數(shù)據(jù)來(lái)獲取。通常包含ID、名稱、經(jīng)緯度、類別等相關(guān)信息,其中經(jīng)緯度是POI 數(shù)據(jù)的核心屬性。
POI 數(shù)據(jù)具有樣本量大、獲取成本低、更新速度快、位置精度高及涵蓋信息詳細(xì)等優(yōu)勢(shì)[8]。POI的空間分布可以反映城市的空間結(jié)構(gòu)。POI 數(shù)據(jù)越密集,城市功能越集中,則該區(qū)域可獲得的機(jī)會(huì)越多。POI 的空間分布對(duì)交通規(guī)劃設(shè)計(jì)和交通基礎(chǔ)設(shè)施的布局有重要指導(dǎo)作用[9]。
本研究采用高德地圖POI 三級(jí)分類標(biāo)準(zhǔn),一級(jí)分類23 種,二級(jí)分類264 種,三級(jí)分類869 種。通過(guò)分析各分類POI 對(duì)交通規(guī)劃影響程度的大小,基于居民使用頻次和設(shè)施點(diǎn)數(shù)量,對(duì)電子地圖POI各類設(shè)施進(jìn)行篩選和分類,篩選出與交通規(guī)劃相關(guān)程度較大的設(shè)施類型。從一級(jí)分類中,選出12 個(gè)POI 類型,見(jiàn)表1。
表1 溆浦縣城區(qū)主要POI 數(shù)量表Table 1 Quantity table of main POI in Xupu County
傳統(tǒng)的POI 獲取方式是實(shí)地調(diào)研采集,但數(shù)據(jù)量小不能大范圍的進(jìn)行數(shù)據(jù)分析。隨著地理信息大數(shù)據(jù)的發(fā)展,人們對(duì)全球地理信息數(shù)據(jù)的需求也日趨增加,獲取方式也更加便利。
目前,POI 獲取主要有3 種途徑:①通過(guò)爬蟲(chóng)代碼從電子地圖扒??;②通過(guò)電子地圖開(kāi)放平臺(tái)(百度地圖API、高德地圖API 等)來(lái)扒取POI,這些網(wǎng)站開(kāi)放了較為完善的開(kāi)發(fā)接口[10];③通過(guò)集客大數(shù)據(jù)、Geosharp、火車頭和八爪魚(yú)等軟件,直接采集POI 數(shù)據(jù)。利用Geosharp 軟件獲取POI 數(shù)據(jù)的操作相對(duì)簡(jiǎn)單、可行性高,并且POI 數(shù)據(jù)的準(zhǔn)確率高,因此,通過(guò)它獲取研究區(qū)域的POI。
Geosharp 是一種網(wǎng)絡(luò)地圖數(shù)據(jù)采集軟件,主要包括地理編碼、坐標(biāo)轉(zhuǎn)換和數(shù)據(jù)采集3 個(gè)模塊。地理編碼模塊可以把地址信息解析為經(jīng)緯度;坐標(biāo)轉(zhuǎn)換提供百度、WGS84 和火星坐標(biāo)系之間的轉(zhuǎn)換;數(shù)據(jù)采集模塊可采取所有類型的POI 數(shù)據(jù)和天氣預(yù)報(bào)數(shù)據(jù)。
Geosharp 獲取POI 數(shù)據(jù)可分為3 個(gè)步驟:①選擇需要獲取的POI 類型。根據(jù)高德地圖分類標(biāo)準(zhǔn),采用POI 的一級(jí)分類獲取。②確定研究區(qū)域,設(shè)置研究區(qū)域的經(jīng)緯度。如果研究范圍不大,則可以直接獲取。但研究范圍過(guò)大,需要進(jìn)行格網(wǎng)劃分,分區(qū)獲取。③確定數(shù)據(jù)保存路徑。
Geosharp 的“高德地圖POI 采集工具”只需研究范圍的經(jīng)緯度,即可采集該矩形范圍內(nèi)所有POI數(shù)據(jù),根據(jù)需要導(dǎo)出到Excel 中。通過(guò)經(jīng)緯度在地圖上添加X(jué),Y 坐標(biāo),生成位置信息。通過(guò)POI 類別,研究各類型POI 的出行特征。通過(guò)ID,確定POI的唯一性。
POI 數(shù)據(jù)在進(jìn)行大范圍采集時(shí),由于研究區(qū)域過(guò)大,如果一次輸入整個(gè)范圍的經(jīng)緯度,不僅會(huì)花費(fèi)大量時(shí)間,而且容易造成軟件異常和數(shù)據(jù)丟失。因此,會(huì)增加獲取數(shù)據(jù)的難度,其結(jié)果的誤差也較大。其解決辦法是對(duì)該區(qū)域劃分成格網(wǎng)單元[11],按照每個(gè)網(wǎng)格的經(jīng)緯度坐標(biāo)扒取POI,再對(duì)數(shù)據(jù)進(jìn)行合并。通過(guò)多種區(qū)域格網(wǎng)劃分方法進(jìn)行比較,發(fā)現(xiàn)FME[12]數(shù)據(jù)的交換與處理操作最簡(jiǎn)單,自動(dòng)化程度高。因此,采用FME 對(duì)區(qū)域進(jìn)行格網(wǎng)劃分,并自動(dòng)提取格網(wǎng)坐標(biāo)。FME 可以實(shí)現(xiàn)超過(guò)200 種不同空間數(shù)據(jù)格式(模型)之間的轉(zhuǎn)換,是一款無(wú)縫連接多平臺(tái)空間數(shù)據(jù)的操作工具。FME 的操作流程主要分為讀模塊、轉(zhuǎn)化器模塊和寫(xiě)模塊3 個(gè)部分。讀模塊可以從外部數(shù)據(jù)源讀取要素?cái)?shù)據(jù)。轉(zhuǎn)換器可以在使用者的控制下,將這些數(shù)據(jù)合并或分割,從一種表達(dá)格式轉(zhuǎn)換為另一種表達(dá)格式,也可以將這些要素掛接到外部數(shù)據(jù)庫(kù)上。寫(xiě)模塊將這些要素以一種支持的格式進(jìn)行輸出。
本研究通過(guò)FME 軟件進(jìn)行建模,自動(dòng)對(duì)城市的格網(wǎng)進(jìn)行劃分,提取格網(wǎng)坐標(biāo)。具體流程:
1) 通過(guò)讀模塊將研究范圍地理文件進(jìn)行導(dǎo)入;
2) 通過(guò)2DGridAccumulator 轉(zhuǎn)換器生成格網(wǎng),按照行列數(shù)進(jìn)行拆分,創(chuàng)建格網(wǎng)類型,選擇Polygons;
3) 通過(guò)GeometryCoercer 轉(zhuǎn)換器將研究范圍面轉(zhuǎn)換為線,幾何對(duì)象類型改為fme_line;
4) 通過(guò)BoundsExtractor 轉(zhuǎn)換器提取格網(wǎng)坐標(biāo);
5) 通過(guò)AttributeManager 轉(zhuǎn)換器將經(jīng)緯度合并成一個(gè)單元格;
6) 通過(guò)counter 轉(zhuǎn)換器進(jìn)行計(jì)數(shù),設(shè)置計(jì)數(shù)從1 開(kāi)始;
7) 通過(guò)寫(xiě)模塊將格網(wǎng)經(jīng)緯度輸出到 Excel文件。
根據(jù)FME 構(gòu)造模型,將研究區(qū)域進(jìn)行自動(dòng)化劃分格網(wǎng),得到每個(gè)格網(wǎng)左上角和右下角的經(jīng)緯度坐標(biāo)。再將經(jīng)緯度坐標(biāo)依次輸入Geosharp 高德地圖的POI 采集工具。最后,通過(guò)Geosharp 分區(qū)獲取POI 數(shù)據(jù),得到整個(gè)研究區(qū)域所有的POI 數(shù)據(jù)。
通過(guò)Geosharp,從高德地圖中采集POI 數(shù)據(jù)類型較多,但采用手動(dòng)方法對(duì)各類Excel 進(jìn)行合并的,操作比較繁瑣。因此,采用FME 進(jìn)行建模,自動(dòng)將各類型POI 進(jìn)行合并。FME 模型構(gòu)建流程為:
1) 讀取文件夾,將POI 的Excel 文件通過(guò)讀模塊進(jìn)行導(dǎo)入。
2) 通過(guò)AttributeSplitter 轉(zhuǎn)換器,對(duì)POI 類別進(jìn)行拆分,創(chuàng)建3 個(gè)屬性。Attribute Value 值分別為type_list{0},type_list{1},type_list{2}。
3) 通過(guò)寫(xiě)模塊將所有數(shù)據(jù)輸出到Excel。
通過(guò)ArcGIS for Desktop 實(shí)現(xiàn)POI 數(shù)據(jù)和地圖的關(guān)聯(lián)。ArcGIS for Desktop 作為GIS 中的主流產(chǎn)品,其特點(diǎn)是數(shù)據(jù)管理效率高、空間分析能力強(qiáng)、可視化程度高。ArcGIS 為大數(shù)據(jù)的管理、分析和可視化提供了有效的處理工具。ArcGIS for Desktop主要由ArcCalalog (管理空間數(shù)據(jù))、ArcGlobe(大型三維場(chǎng)景處理與分析)、ArcMap(二維數(shù)據(jù)的處理、管理和分析)和ArcScene(小型三維場(chǎng)景處理與分析)4 個(gè)部分構(gòu)成。
通過(guò)FME 數(shù)據(jù)合并模型對(duì)POI 數(shù)據(jù)進(jìn)行整合,導(dǎo)入到ArcMap 中,按照經(jīng)緯度屬性添加X(jué),Y 坐標(biāo),生成位置信息,設(shè)置坐標(biāo)系統(tǒng),將POI 地理信息數(shù)據(jù)可視化,得到整個(gè)研究區(qū)域的POI 分布情況。POI 數(shù)據(jù)可視化結(jié)果如圖1 所示。
圖1 POI 點(diǎn)數(shù)據(jù)空間分布示意Fig.1 Spatial distribution of POI point data
如果將每個(gè)POI 點(diǎn)均作為一個(gè)功能單元,POI密度越高,表明該地區(qū)城市功能越集中。為了分析POI 的聚集特征,了解各類服務(wù)設(shè)施的空間分布狀況,利用ArcMap 10.2 的密度分析工具,對(duì)研究區(qū)域內(nèi)的各類興趣點(diǎn)進(jìn)行分析。
3.3.1 核密度分析原理
密度分析是通過(guò)輸入數(shù)據(jù)的數(shù)量計(jì)算數(shù)據(jù)的集散程度,生成一個(gè)連續(xù)的密度分析面。通過(guò)計(jì)算得到密度,將每個(gè)點(diǎn)的密度值分布在研究區(qū)域上,最后得到每個(gè)柵格的像元值[13]。
密度分析中,最為重要的是核密度分析。核密度分析一般用于計(jì)算要素周圍鄰域的密度。既可以計(jì)算點(diǎn)要素的密度,也可以計(jì)算線要素的密度。核密度分析示意圖如圖2 所示。
根據(jù)概率理論,核密度分析模型為[14?15]:
圖2 核密度分析輸出要素示意Fig.2 Schematic diagram of output elements of kernel density analysis
式中: k( )為核函數(shù);h 為帶寬,h > 0; x - Xi為估值點(diǎn)x 到事件Xi處的距離。
核密度分析可以體現(xiàn)POI 數(shù)據(jù)點(diǎn)的空間分布,對(duì)點(diǎn)狀數(shù)據(jù)進(jìn)行分析尤為有效。通過(guò)核密度分析,計(jì)算每個(gè)輸出柵格像元周圍點(diǎn)要素的密度,生成POI 數(shù)據(jù)點(diǎn)熱力圖。
核密度分析中,需要設(shè)置輸出像元大小和搜索半徑2 個(gè)參數(shù)。設(shè)置的搜索半徑越大,生成的密度柵格越平滑,概化程度越高;搜索半徑值越小,生成柵格顯示的信息越詳細(xì)。
3.3.2 交通小區(qū)劃分
交通規(guī)劃需要全面了解POI 對(duì)各類交通源的吸引程度。由于不可能對(duì)每個(gè)POI 單獨(dú)進(jìn)行研究,因此,分析POI 時(shí),需要根據(jù)交通小區(qū)對(duì)POI 進(jìn)行合并處理。
為了將所有POI 數(shù)據(jù)按照交通小區(qū)依次導(dǎo)出,得到每個(gè)小區(qū)的各類POI。傳統(tǒng)的方法是劃分好交通小區(qū),依次裁剪,導(dǎo)出POI 數(shù)據(jù)。但當(dāng)數(shù)據(jù)量較大,該方法費(fèi)時(shí)費(fèi)力,效率較差。ArcMap 可提供一種自動(dòng)化處理工具—ModelBuilder,通過(guò)ArcMap的模型構(gòu)建器,輕松實(shí)現(xiàn)批處理工作。
ModelBuilder 是創(chuàng)建、編輯和管理模型的應(yīng)用程序[16]。其原理是將一系列地理處理工具串聯(lián)在一起的工作流,它將其中一個(gè)工具的輸出作為另一個(gè)工具的輸入??蓪odelBuilder 看作一種簡(jiǎn)單創(chuàng)建、可循環(huán)操作的可視化編程語(yǔ)言。進(jìn)行模型構(gòu)建時(shí),可以直接將工具箱的各種地理處理工具和需要處理的數(shù)據(jù)集拖動(dòng)到模型構(gòu)建器界面中。然后,有序地把它們連接起來(lái),實(shí)現(xiàn)批處理工作。
模型構(gòu)建器的優(yōu)勢(shì):①M(fèi)odelBuilder 可以集合ArcToolbox 各種工具,進(jìn)行創(chuàng)建,并且自動(dòng)化處理所構(gòu)建的工作流;②結(jié)合使用ModelBuilder 和腳本,可將ArcGIS 與其他應(yīng)用程序進(jìn)行集成;③Model?Builder 創(chuàng)建的自動(dòng)化模型,可以在Python 腳本中使用。
本模型構(gòu)建中,將劃分好的交通小區(qū)在ArcMap 按字段依次導(dǎo)出,添加裁剪工具,輸入要素為POI 點(diǎn)數(shù)據(jù),裁剪要素為交通小區(qū)面數(shù)據(jù),得到各個(gè)交通小區(qū)的POI 數(shù)量。
通過(guò)ArcMap 中ModelBuilder 構(gòu)造,批量導(dǎo)出模型,將整體POI 數(shù)據(jù)按照交通小區(qū)進(jìn)行劃分,依次導(dǎo)出。交通小區(qū)內(nèi),不同類型的POI 對(duì)于交通規(guī)劃的影響程度不一。通過(guò)結(jié)構(gòu)熵權(quán)法,確定各類POI對(duì)公交出行的影響權(quán)重,依次對(duì)不同類別POI 進(jìn)行量化計(jì)算,得到各個(gè)小區(qū)的當(dāng)量POI 數(shù)據(jù),為后續(xù)交通規(guī)劃、公交線網(wǎng)優(yōu)化[17]提供數(shù)據(jù)支撐。量化公式為:
式中:Di為交通小區(qū)i 的當(dāng)量POI;E 為獲取的POI類型數(shù);we為第e 類POI 的權(quán)重;die為交通小區(qū)i第e 類POI 數(shù)量。
以溆浦縣為例,通過(guò)Geosharp 軟件和高德地圖,獲取城區(qū)各類POI 數(shù)據(jù)。獲取POI 之前,避免區(qū)域過(guò)大,造成數(shù)據(jù)丟失,對(duì)研究區(qū)域進(jìn)行格網(wǎng)劃分,采用FME 格網(wǎng)劃分模型對(duì)溆浦縣城區(qū)進(jìn)行格網(wǎng)劃分,如圖3 所示。
通過(guò)Geosharp,由高德地圖分區(qū),獲取格網(wǎng)小區(qū)POI。根據(jù)FME 的數(shù)據(jù)合并模型,將格網(wǎng)小區(qū)POI 數(shù)據(jù)進(jìn)行合并、數(shù)據(jù)清洗,為ArcGIS 建立POI地理數(shù)據(jù)庫(kù)進(jìn)行前期數(shù)據(jù)準(zhǔn)備。本試驗(yàn)獲取了12個(gè)POI 類型,有效POI 數(shù)量為1 800 條,見(jiàn)表1。
圖3 溆浦縣格網(wǎng)劃分示意Fig.3 Grid division diagram of the Xupu County
先將POI 數(shù)據(jù)導(dǎo)入ArcGIS,添加經(jīng)緯度信息,設(shè)置地理坐標(biāo)系為WGS 1984,導(dǎo)入溆浦縣中心城區(qū)用地現(xiàn)狀圖,進(jìn)行地理配準(zhǔn)。再將POI 數(shù)據(jù)加載到溆浦縣中心城區(qū)用地現(xiàn)狀圖進(jìn)行核密度分析。設(shè)置熱力圖顏色,顏色越深,表示POI 數(shù)據(jù)比較密集;顏色越淺,表示POI 聚集程度較為稀疏。溆浦縣POI數(shù)據(jù)空間分布如圖4 所示。
圖4 溆浦縣POI 空間分布熱力Fig.4 Thermal map of of POI in the Xupu County
根據(jù)溆浦縣城區(qū)道路現(xiàn)狀和城市規(guī)劃分區(qū)情況,將該區(qū)域劃分為22 個(gè)交通小區(qū),小區(qū)劃分示意圖如圖5 所示。
通過(guò)ArcMap 的ModelBuilder 構(gòu)造,批量導(dǎo)出模型,將所有POI 數(shù)據(jù)按照劃分的交通小區(qū)依次導(dǎo)出,得到每個(gè)小區(qū)的POI 類別和數(shù)量,通過(guò)權(quán)重進(jìn)行量化見(jiàn)表2。
圖5 溆浦縣交通小區(qū)劃分示意Fig.5 Division diagram of traffic district of the Xupu County
表2 量化后交通小區(qū)POI 數(shù)量Table 2 Number of POI in traffic area after quantification
通過(guò)FME 構(gòu)造格網(wǎng)坐標(biāo)提取模型,對(duì)研究區(qū)域進(jìn)行格網(wǎng)劃分,再采用Geosharp 軟件獲取POI數(shù)據(jù),最后基于ArcGIS 模型構(gòu)建分區(qū)導(dǎo)出模型,將POI 數(shù)據(jù)分區(qū)導(dǎo)出,并進(jìn)行量化處理。通過(guò)采用格網(wǎng)坐標(biāo)提取模型和分區(qū)導(dǎo)出模型進(jìn)行自動(dòng)化處理,再導(dǎo)出各類POI 數(shù)據(jù)。該方法比原有裁剪導(dǎo)出操作更節(jié)省時(shí)間,也更有效率。