楊勤信,楊德宏
?
Python腳本在shape文件中的運(yùn)用
楊勤信,楊德宏
(昆明理工大學(xué),云南 昆明 650093)
對于shap文件,包含很多的地理信息,但是在實(shí)際工作學(xué)習(xí)中,并非所有信息都能被利用。利用python腳本語言,可以單獨(dú)獲取所需要的特定shapefile文件屬性信息,點(diǎn)位坐標(biāo)信息,并且轉(zhuǎn)換為必要投影系統(tǒng)下的坐標(biāo)。本文借助python腳本處理shapefile文件,利用某地區(qū)人口密度分布圖,生成等值區(qū)域圖,實(shí)現(xiàn)python與shapefile的實(shí)踐結(jié)合,為更多地理空間信息開發(fā)提供參考。
Shapefile文件;python腳本;等值區(qū)域圖;函數(shù)庫
目前使用最普遍的地理空間格式是Esri的Shapefile文件,1998年該文件格式被正式標(biāo)準(zhǔn)化,作為一種開放規(guī)范發(fā)布。Esri特意為ArcView開發(fā)這種文件格式。是一種低端GIS產(chǎn)品,但是可以實(shí)現(xiàn)其高端產(chǎn)品ArcInfo的一些基本操作。Shapefile由多個(gè)文件格式,少則3種,多則可達(dá)15種不同文件。例如:.shp、.shx和.dbf等有效文件。在一些Esri的軟件中,這些數(shù)據(jù)作為一個(gè)整體,Shapefile文件對于GIS數(shù)據(jù)交換和GIS分析而言是一種基礎(chǔ)數(shù)據(jù)格式[1-3]。
Python自誕生以來,人們使用較少。自從人工智能的興起,使得python迅速擠進(jìn)計(jì)算機(jī)語言前五,并且排名仍在以較大幅度上升。僅次于Java、c++、 c等幾種熱門語言。Python最大的特點(diǎn)就是免費(fèi)開源跨平臺,易上手且功能強(qiáng)大。其附帶的核心語言包及眾多模塊代碼,使得開發(fā)更加容易。對于Shapefile文件,主要使用python的PyShp庫(也可以使用OGR庫的python綁定,但此處為了盡量使用python代碼的風(fēng)格,選擇安裝PyShp庫)[4-5]。
對于Shapefile文件的編輯和其他相關(guān)操作,只需要關(guān)注.shp和.dbf文件即可,二者是Shapefile文件的核心文件。.shp文件包含幾何圖形,.dbf文件包含幾何圖形所必要的屬性信息。Shapefile文件中,每一個(gè)圖形信息都含有對應(yīng)的屬性列表。這些屬性信息是沒有特定編號或者標(biāo)記的,如果從shapefile文件修改相關(guān)信息時(shí),需保證與其相關(guān)的文件也做了相應(yīng)修改。
在訪問shapefile文件時(shí),利用PyShp庫,導(dǎo)入PyShp庫:import shapefile
Python的PyShp庫利用方法Reader(”Filed name”)打開shapefile文件。Filed name可以不使用擴(kuò)展名,因?yàn)樘幚淼臄?shù)據(jù)至少包括.shp和.dbf等文件,否則會導(dǎo)致打開文件失敗。當(dāng)成功創(chuàng)建一個(gè)讀取器對象后,通過.bbox方法就可以獲取文件邊框信息,.shapeType獲取文件類型(1代表點(diǎn),3代表線,5代表多邊形等),.numRecords獲取記錄總數(shù)。dbf文件是一種簡單的數(shù)據(jù)庫,類似于電子表格,可以通過讀取器對象(.fields)的字段屬性查看該信息。運(yùn)行結(jié)果如圖1。
圖1 屬性表
該shape文件在ArcGIS中圖形如圖2。
圖2 Shape文件
由圖2知,該shape文件是一個(gè)點(diǎn)shapefile文件,python腳本解析出共有298個(gè)點(diǎn)。
點(diǎn)shapefile文件中,每一條記錄都包含一個(gè)點(diǎn),讀取每一個(gè)點(diǎn)的經(jīng)緯度(緯度在經(jīng)度之前)。采用.shape(num).points可獲取到選定點(diǎn)的坐標(biāo)信息,這里提取第200個(gè)點(diǎn)的坐標(biāo)信息如圖3。
圖3 點(diǎn)坐標(biāo)信息
此處的坐標(biāo)信息是經(jīng)緯度,可以使用python的utm庫中的.from_latlon()方法將其轉(zhuǎn)換為utm投影下的坐標(biāo)值,并獲得utm水平方向的編號和豎直方向的字母編號,如圖4。
圖4 utm坐標(biāo)信息
用來顯示密度的地圖稱為等值區(qū)域圖,用陰影的深淺度來表達(dá)密度,使得閱讀更為容易,可以作為分析某區(qū)域內(nèi)點(diǎn)密度的直接參考。本文用某區(qū)域人口密度圖來解析出密度等值區(qū)域圖。
因?yàn)樘幚韴D像,所以首先要利用python自帶圖像處理庫-PIL(Python Imaging Library),PIL為了保證速度,采用的是C語言編寫,專門針對python做了一些優(yōu)化,正式被python調(diào)用。本文程序均由python3版本編寫,所以使用PIL庫的升級版本Pillow庫。Pillow其他方法使用此處不做贅述。本案例由shapefile文件根據(jù)每單位面積的人口得出密度比率,然后由該比率配置相應(yīng)的顏色,密度越大則顏色越深,密度越小,顏色越淺。整體開發(fā)思路如圖5。
圖5 示意圖
在處理shapefile文件之前,需要將地理空間坐標(biāo)系轉(zhuǎn)換到屏幕坐標(biāo)[6-7],此處定義一個(gè)函數(shù)srn():
def srn(bbox, w, h, x, y):
mix, miy, xx, xy = bbox
xd = xx - mix
yd = xy - miy
xr = w/xd
yr = h/yd
px = int(w - ((xx - x) * xr))
py = int((xy - y) * yr)
return (px, py)
打開shapefile文件并且初始化一個(gè)圖像對象,利用PIL庫的Draw方法填充不同的多邊形:
Ip = shapefile.Reader("F:Projects論文實(shí)例population")
ight =500
idth=500
img = Image.new("RGB", (idth, ight), (255, 255, 255))
draw = ImageDraw.Draw(img)
繪制區(qū)域陰影和多邊形:
pi = None
ai = None
for i, f in enumerate(Ip.fields):
if f[0] == "POPULAT11":
pi = i-1
elif f[0] == "AREASQKM":
ai = i-1
for sr in Ip.shapeRecords():
density = sr.record[pi]/sr.record[ai]
weight = min(math.sqrt(density/80.0), 1.0) * 50
R = int(200 - weight)
G = int(215 - weight)
B = int(235 - weight)
pixels = []
for x, y in sr.shape.points:
(px, py) = srn(Ip.bbox, idth, ight, x, y)
pixels.append((px, py))
draw.polygon(pixels, outline=(255, 255, 255), fill=(R, G, B))
將繪制完成的等值區(qū)域圖保存為.png文件:img.save("Exportpopulation.png")。下圖分別是shape-file文件和.png文件在ArcGIS軟件中的效果圖。
通過對比,很明顯發(fā)現(xiàn),圖7的讀取更加容易,范圍界限也更加明顯,這對于分析人口密度分布十分有用。
Shapefile文件是測繪工作者工作中經(jīng)常處理的文件類型,而python腳本語言也作為ArcGIS軟件的腳本語言十分方便快捷[8-9]。隨著人工智能和大數(shù)據(jù)時(shí)代的炙熱化發(fā)展,python憑借其簡單又強(qiáng)大的特性,必將在編程語言中舉足輕重。應(yīng)用python開發(fā)一些測繪軟件和處理一些數(shù)據(jù)文件,為實(shí)際工作提供良好的工作平臺。
圖6 人口密度圖shape文件
圖7 人口密度等值區(qū)域圖
[1] 田慶, 陳美陽, 田慧云. ArcGIS地理信息系統(tǒng)詳解(10. 1版)[M]. 北京: 希望電子出版社, 2014.
[2] PaulA. Zandbergen. 面向hrcGIS的Python腳本編程[M]. 北京: 人民郵電出版社, 2014.
[3] 邵保華, 田學(xué)志. 談Python在ARCGIS地理處理中的應(yīng)用[J]. 林業(yè)勘查設(shè)計(jì), 2012(2): 70-72
[4] Wesley J. Chun. Python核心編程[M]. 第2版. . 北京: 人民郵電出版社, 2008
[5] Magnus Lie Hetland. Python基礎(chǔ)教程[M]. 第2版. 北京: 人民郵電出版社, 2010.
[6] 郭仁忠. 空間分析[M]. 北京: 高等教育出版社, 2001.
[7] 劉南, 劉仁義. 地理信息系統(tǒng)[M]. 北京: 高等教育出版社. 2002.
[8] Mark Pilgrim. Diive Into Python 3[M]. 2nd ed. Berkeley: Apress, 2009.
[9] Alex Martelli, Anna Ravenscorft, David Ascher. Python Cookbook [M]. 北京: 人民郵電出版社, 2010.
Application of Python Script in Shape File
YANG Qin-xin, YANG De-hong
(Kunming University of Science and Technology, 650093)
Shap files contain a lot of geographic information, but not all information can be used in practical work and learning. Using Python scripting language, we can obtain the required attribute information of the specific ShapeFile, point coordinate information, and transform it into the coordinates of the necessary projection system. In this paper, Python script is used to process ShapeFile, and the population density distribution map of a region is used to generate an equivalent area map. The practice of Python and ShapeFile is combined to provide reference for the development of more geospatial information.
Shapefile; Python script; Equivalent area graph; Function library
TP312
A
10.3969/j.issn.1003-6970.2018.12.036
楊勤信(1993-),男,大學(xué)本科,主要研究方向?yàn)榇蟮販y量;楊德宏(1965-),男,研究生,主要研究方向?yàn)闇y量數(shù)據(jù)處理與質(zhì)量控制研究。
楊勤信,楊德宏. Python腳本在shape文件中的運(yùn)用[J]. 軟件,2018,39(12):159-161