艾 廷 華,何 亞 坤,杜 欣
(武漢大學資源與環(huán)境科學學院,湖北 武漢 430079)
?
GIS數(shù)據(jù)尺度變換中的信息熵變化
艾 廷 華,何 亞 坤,杜 欣
(武漢大學資源與環(huán)境科學學院,湖北 武漢 430079)
基于Shannon信息熵原理的GIS數(shù)據(jù)信息量表達屬于語言學信息體系中的語法層次,描述了空間目標分布結構上的不確定性特征。該文將該信息量測度方法應用于空間數(shù)據(jù)的尺度變換中,考察尺度變換中空間數(shù)據(jù)語法結構在統(tǒng)計意義上的變化特點,進而通過信息熵的變化發(fā)掘尺度變化中空間數(shù)據(jù)信息量的變化規(guī)律?;诳臻g目標群的Voronoi圖剖分建立信息熵度量,以空間尺度變換中的移位、合并兩種典型操作為案例,研究了面狀目標群尺度變換中信息量衰減的初步規(guī)律,并嘗試將其結論用于地圖綜合方法質量評價。
空間尺度變換;信息熵;地圖綜合;Voronoi圖
旨在壓縮數(shù)據(jù)量、簡化表達、概括主體特征的地圖綜合技術是空間數(shù)據(jù)處理的經(jīng)典方法,是傳統(tǒng)系列比例尺地圖生產(chǎn)、跨尺度地圖更新的技術支持。在地理信息服務新技術背景下,以海量空間數(shù)據(jù)為代表的“大數(shù)據(jù)”時代[1]需要在網(wǎng)絡上實時傳輸用戶感興趣的信息內容,海量化、多元化、實時化、網(wǎng)絡化的技術需求使得空間數(shù)據(jù)的處理、傳輸與分析都需要自動綜合與尺度變換的支持,這對新技術背景下地圖綜合的研究提出了新的挑戰(zhàn)。
顧及多種技術需求,地圖綜合和尺度變換首先要回答“在限定的表達空間中合理的信息量是多少?”的問題,網(wǎng)絡實時傳輸?shù)囊环貓D不能包含太多的信息。為了使信息表達合理,同時自適應滿足不同層次用戶的要求,地圖綜合需要采取有效的策略度量信息量,并分析尺度變換中的信息量變化規(guī)律。地圖綜合領域的T?pfer法則[2]總結了尺度變換中的目標圖形數(shù)量變化規(guī)律,但“數(shù)量”與“信息量”有差別,“信息量”的內涵更豐富、外延更廣,如何發(fā)現(xiàn)尺度變換中的信息量變化規(guī)律是一個難點。
地圖作為一種圖形語言,具有語言學的共同特質,根據(jù)語言學層次系統(tǒng)將地圖信息分為語法信息、語義信息和語用信息。Klir等[3]對三種信息進行了詮釋,認為語法信息是事物運動的狀態(tài)和方式的外在形式,語義信息是事物運動狀態(tài)及其變化方式的含義,語用信息則關心事物運動狀態(tài)及變化方式的效用。廣泛應用的Shannon的信息熵理論是基于概率論而建立的統(tǒng)計信息熵[4],屬于語法層次的信息量度量,描述了空間目標分布結構上的不確定特征。Sukhov[5,6]將這一理論應用于地圖信息量算,提出了符號信息熵,這種信息熵并沒有考慮符號的空間分布,所以也被稱為統(tǒng)計信息熵;隨后,Neumann[7]提出了一種度量地圖拓撲信息量的方法,將地圖符號之間的鄰接關系用對偶圖表示并計算對偶圖的熵,這種方法計算的熵只是表示符號類型的統(tǒng)計分布而不是空間分布;Bjφrke[8]設計了一種基于信息論的在道路地圖中去除弧段新算法,將信息論的原理成功應用于地圖綜合;Li等[9]提出了基于Voronoi圖的空間信息度量方法,將地圖的信息量從簡單的統(tǒng)計信息量擴展到了拓撲信息量、幾何信息量和專題信息量的計算;Harrie等[10,11]提出了將地圖信息的量算分為信息量和信息分布兩方面進行度量。
以上研究只是對單一的靜止的空間分布狀態(tài)的信息描述,缺乏不同表達狀態(tài)間的過程比較。按照Shannon信息熵原理[4],信息的度量反映在信息編碼、信息通道、信息解碼3個環(huán)節(jié)中,由于信息通道的噪音產(chǎn)生信息變異,導致信息量的損失與誤差產(chǎn)生。地圖綜合與尺度變換可以與信息傳輸過程對應,綜合前的大比例尺地圖為信息編碼,綜合后的小比例尺地圖為信息解碼,地圖綜合操作則為信息通道,通過綜合操作即信息通道的有效處理,信息量壓縮并產(chǎn)生誤差信息,這一信息傳輸過程與地圖綜合的效應相一致[12]。因此,在變化過程中討論地圖信息量,更符合Shannon信息熵原理。本研究即是基于該思路將信息傳輸理論與制圖綜合過程相結合探討尺度變化中的信息量變化規(guī)律。
Shannon定義信息量含義為收到信息后解除的不確定度的值,解除的不確定量越大,則信息量越大。其數(shù)學表達式為:
H(X)=-∑P(ai)logP(ai) (i=1,2,…,n),∑P(ai)=1(1)
其中:P(ai)是ai事件發(fā)生的先驗概率,H(X)為信息熵[13]。文中所有對數(shù)均以2為底,單位為:bit。
在地圖與地理信息領域,應用Shannon信息熵原理度量信息量的關鍵在于空間分布概率P(ai)的定義與計算,目前定義空間目標群分布概率的形式主要有:1)數(shù)量百分比,以每種地圖符號類型的數(shù)量在總的符號數(shù)量中所占的比例作為每種符號類型的概率。2)面積百分比,以每個地圖符號的面積占地圖總面積的百分比作為該符號的概率。數(shù)量百分比和面積百分比是Shannon信息熵原理在制圖領域的直接應用。這兩種信息量并沒有考慮到地圖符號的空間分布。從制圖學的角度看,這種忽略符號空間分布來計算信息熵的方法是不合理的。Sukhov提出的符號信息熵[5,6]就屬于這一類。3)類型比率,按照某種分類指標,將地圖中的符號歸類,以每類符號類型占地圖符號總數(shù)量的比例作為該符號的概率。這種計算方法只考慮了統(tǒng)計意義上不同類型符號的分布,并沒有很好地顧及空間分布。Neumann提出的拓撲信息熵[7]屬于類型比率。4)基于Voronoi空間剖分的百分比,Voronoi圖是基于鄰近規(guī)則與空間競爭效應對空間目標影響區(qū)域的剖分,是空間分布分析的有力工具[14]。基于Voronoi圖剖分的信息熵度量方法將符號所占有的Voronoi剖分單元(泰森多邊形面積)與總的面積之比作為該符號的分布概率,不僅反映了實體對空間占有的勢力劃分,同時也體現(xiàn)出地物之間的鄰接關系。
本研究即采用基于Voronoi空間剖分的百分比進行信息量量算(圖1),對于點群目標可直接構建Voronoi圖;對于線群目標可采用基于道路網(wǎng)絡連通圖最短路徑分析的Voronoi圖空間劃分方法構建道路網(wǎng)的Voronoi圖[15];對于面群目標可以采用基于骨架線連接得到的仿Voronoi圖的剖分結構[16]。
限于篇幅本研究只討論面目標的信息量變化規(guī)律。假設S是整個地圖區(qū)域,通過建立Voronoi圖,S被N個Voronoi區(qū)域Si覆蓋,i=1,2,…,N,N為整個地圖區(qū)域地圖符號個數(shù),則每個地圖符號的概率表示如下:
圖1 三種幾何實體的Voronoi圖
Fig.1 Voronoi diagram of three kinds of geometric entities
(2)
(3)
(4)
由上述公式可得出影響信息熵大小的因素有:地圖符號的數(shù)量和Voronoi空間分割均衡度。當比較兩幅具有不同符號數(shù)量的地圖時,可對式(4)做標準化處理:
HI(M)=H(M)/Hmax(M),Hmax(M)
(5)
移位是地圖綜合中處理各圖形目標相互關系并解決空間沖突的基本方法,其目的是要保證地圖各圖形目標總體結構特征的適應性,即與實地的相似性?!耙莆弧辈僮骺疾斓膶ο笫悄繕藢蚰繕巳?。群目標的綜合需顧及上下文環(huán)境的影響,既要考慮針對單個目標的綜合約束,也要考慮在群結構上整體空間分布規(guī)律的保持及統(tǒng)計特征維護等綜合約束。信息熵所衡量的是目標的空間分布結構的變化,影響信息熵大小的因素有地圖符號的數(shù)量和Voronoi空間分割均衡度。單一的移位操作不改變地圖符號的數(shù)量,進行移位的同時要求保證目標物的空間分布與原圖一致,即Voronoi空間分割均衡度保持不變。通過以上分析得出,由于影響信息熵大小的兩因素均保持不變,移位過程中信息熵需保持不變,或圍繞原圖信息熵上下微小波動。多組手動移位實驗結果均顯示,信息熵變化符合上述規(guī)律。
根據(jù)移位前后信息熵變化規(guī)律對基于場論分析的兩種移位方法:單力源移位場模型[16]和多力源移位場[17]模型的移位結果進行質量評價。1)單力源移位場模型:街區(qū)塊多邊形邊界的收縮產(chǎn)生了向街區(qū)塊內部逐步傳遞并衰減的作用力,建立移位場“等距離關系曲線”,在移位場中目標的運動方向與運動距離由矢量和運算及梯度衰減函數(shù)計算完成。2)多力源移位場模型:周啟等[17]提出的多力源移位場模型同時考慮外部擠壓時產(chǎn)生的外力和通過鄰近距離閾值探測空間沖突作為內力發(fā)生源引發(fā)的內力,通過計算外力與內力的矢量和得到每個空間目標最終移位的方向與偏移距離。如圖2所示,從移位后的Voronoi圖剖分結果看,可以明顯看出圖2c對應的多力源場模型移位方法在滿足綜合約束條件上占優(yōu),尤其在處理空間沖突和保持空間相對位置關系上。圖2b中用虛線圈出了在移位過程中產(chǎn)生的空間沖突(A,B)及空間相對位置關系的變化(C,D),這些問題在圖2c中均得到了較好的效果。
圖2 兩種移位方法結果對比
Fig.2 Comparison of two displacement results
以上的定性分析多依賴于制圖人員的認知,從實驗效果看,多力源移位場模型能夠更好地避免次生沖突。為了更直觀更準確地表達移位前后空間分布的變化,本研究結合Shannon信息熵原理將空間分布的變化用信息熵作為指標來衡量,考察移位偏移量與信息熵之間的關系,研究移位過程中信息熵變化規(guī)律。考慮到移位過程中不改變地圖符號的數(shù)量,采用式(2)、式(3)計算信息熵,并將實驗結果呈現(xiàn)在表1中。
表1 實驗結果
Table 1 Test results
Offse(mm)單力源移位場模型信息熵(bit)多力源移位場模型信息熵(bit)06.1434026.1434020.56.1391715.84149516.1333735.7952471.56.1296095.62900426.1326715.6830312.56.1271445.78944136.1241335.4103633.55.9899455.40926145.7131095.5379644.55.7589835.38739755.5098075.2649255.55.5695495.00711365.4893984.8772326.55.0177594.950177
對得到的實驗結果進行分析,針對移位信息熵變化規(guī)律,設定兩個指標(表2):1)極差R:用以衡量信息熵波動的范圍。波動范圍愈小,即極差愈小愈好。2)標準差δ:用以衡量信息熵的波動率。波動率愈小,即標準差愈小愈好。
表2 實驗結果比較
Table 2 Comparison of test results
方法原圖信息熵(bit)最小信息熵(bit)極差R標準差δ單力源移位場模型多力源移位場模型6.1434024.8772321.26617 0.3684745.0177591.1256430.353364
兩種方法所得到的信息熵均為衰減變化,并伴隨微小波動,從表1的實驗數(shù)據(jù)中可以看出,多力源移位場模型信息熵相鄰狀態(tài)間變化相對單力源移位場模型較小,信息衰減量也較小。表2 中,多力源移位場模型的極差較小,標準差也較小,說明其波動范圍較小,波動性也較小,相對穩(wěn)定,保證地圖內容各圖形目標總體結構特征與實地的相似性。實驗結果與最初的認知分析結果一致,多力源移位場模型更好地保持了空間目標的分布模式。兩種移位均產(chǎn)生了不同程度的信息熵衰減,制圖綜合過程總會伴隨著信息量的衰減,在實際操作過程中由于街區(qū)塊的壓縮和衰減移位距離函數(shù)的限制使得可支配的空間總面積減少,并且Voronoi剖分面積也趨向于均衡變化,差異性減小,這些變化均會導致信息熵衰減。
多邊形合并是建筑物群綜合的另一個重要環(huán)節(jié),鄰近關系是合并過程的重要依據(jù)。在空間尺度變化過程中,當制圖物體的圖形及其間距小于可辨析距離時(面群目標為圖上距離大于0.2 mm[18]),采用合并操作。多邊形的合并分為多邊形的鄰近分析和多邊形合并兩種情形。群目標的綜合操作要考慮群體分布所隱含的空間結構化信息,本研究采用基于最小支撐樹MST的聚類方法挖掘建筑物群的分布模式(圖3),通過改變合并間距,研究合并信息量的變化規(guī)律。對圖4中的街區(qū)進行合并操作,并根據(jù)式(2)、式(4)計算不同的合并間距所得到的合并信息熵。對實驗數(shù)據(jù)進行最小二乘三次多項式擬合(圖5),擬合優(yōu)度R2達0.9963,實驗數(shù)據(jù)與擬合數(shù)據(jù)的分布基本一致。
圖3 基于最小支撐樹MST的建筑物分布群識別
Fig.3 Building cluster recognition based on MST
圖4 不同合并間距的合并結果
Fig.4 The aggregation result of different aggregation interval
圖5 合并信息量的擬合曲線
Fig.5 The fitting curve of aggregation information entropy
合并操作意味著刪除標志輪廓間隔的那部分數(shù)據(jù),合并目標間的細部,使得地圖目標空間占據(jù)面積增大,區(qū)域劃分減少,制圖物體的數(shù)量也減少,信息量減少。從實驗結果擬合曲線上可以清楚地看到信息量損失速率(即擬合曲線的斜率)逐漸減小,頭尾緩變,中間突變,并且有明顯的拐點,呈現(xiàn)反“S”形曲線的特征。圖5中A區(qū)和C區(qū)比較平緩,B區(qū)有明顯的線性衰減的特征,在A區(qū),由于合并間距小于0.2 mm,小于可辨析距離,地圖目標的所有細節(jié)基本保留;當合并間距超過了0.2 mm,進入B區(qū),低層次的細節(jié)均需要合并,合并信息熵受合并間距的影響逐漸增大;到達C區(qū)后,由于地圖目標數(shù)量和低層次細節(jié)的減少,此時已經(jīng)探測不到低層次細節(jié)的信息,曲線也趨近于平緩變化。
本研究將信息傳輸理論與制圖綜合過程結合,并基于空間目標群的Voronoi圖剖分建立語法信息熵度量。以空間尺度變換中的移位、合并兩種典型操作為案例,研究了面狀目標群尺度變換中信息量衰減的初步規(guī)律。移位過程中信息熵保持在原圖信息熵上下微小波動,伴隨移位程度的加深做緩慢衰減。合并則呈現(xiàn)反“S”形衰減變化的特征。以移位為例,基于信息量衰減規(guī)律對兩種移位算法進行了質量評價,并得到了可行可信的結果。
本研究的實驗對象均為面狀目標,下一步將拓寬尺度變換操作(化簡、夸大、選取)和目標對象(點目標、線目標),總結歸納一般意義上的尺度變化導致信息量變化的規(guī)律,從而為地圖綜合方法質量評價提供評判依據(jù)。
[1] GOODCHILD M F,GUO H,ANNONI A,et al.Next-generation digital earth[J].Proceedings of the National Academy of Sciences,2012,109(28):11088-11094.
[2] T?PFER F,PILLEWIZER W.The principles of selection:A means of cartographic generalization[J].The Cartographic Journal,1966,3(1):10-16.
[3] KLIR G J,FOLGER T A.Fuzzy Sets,Uncertainty,and Information[M].New York:Prentice Hall,1988.
[4] SHANNON C E.Mathematical theory of communication[J].The Bell System Technical Journal,1948,27:379-423,623-656.
[5] SUKHOV V I.Information capacity of a map entropy[J].Geodesy and Aero Photography,1967,X:212-215.
[6] SUKHOV V I.Application of information theory in generalization of map contents[J].International Yearbook of Cartography,1970,X:41-47.
[7] NEUMANN J.The topological information content of a map/an attempt at a rehabilitation of information theory in cartography[J].Cartographica:The International Journal for Geographic Information and Geovisualization,1994,31(1):26-34.
[8] BJO/RKE J T.Framework for entropy-based map evaluation[J].Cartography and Geographic Information Systems,1996,23(2):78-95.
[9] LI Z,HUANG P.Quantitative measures for spatial information of maps[J].International Journal of Geographical Information Science,2002,16(7):699-709.
[10] HARRIE L,STIGMAR H.An evaluation of measures for quantifying map information[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(3):266-274.
[11] STIGMAR H,HARRIE L.Evaluation of analytical methods to describe map readability[J].Cartographic Journal,2011,48(1):41-53.
[12] 艾廷華.基于空間映射觀念的地圖綜合概念模式[J].測繪學報,2003,32(1):87-92.
[13] 鐘義信.信息科學原理[M].北京:北京郵電大學出版社,1996.
[14] GOLD C M.Problems with handling spatial data-the Voronoi approach[J].CISM Journal,1991,45(1):65-80.
[15] 謝順平,馮學智,魯偉.基于道路網(wǎng)絡分析的Voronoi面域圖構建算法[J].測繪學報,2010,39(2):88-94.
[16] 艾廷華.基于場論分析的建筑物群的移位[J].測繪學報,2004,33(1):89-94.
[17] 周啟,艾廷華,張翔.面向多重空間沖突解決的移位場模型[J].測繪學報,2013,42(4):615-620.
[18] 祝國瑞.地圖學[M].武漢:武漢大學出版社,2003.226.
Information Entropy Change in GIS Data Scale Transformation
AI Ting-hua,HE Ya-kun,DU Xin
(SchoolofResourceandEnvironmentalSciences,WuhanUniversity,Wuhan430079,China)
The information representation of GIS data belongs to the syntactic field in linguistic information system.It is based on the Shannon information theory and describes the uncertainty of spatial distributions which is related to the spatial layouts and associations.This study applies the measure of information entropy to investigate how the spatial data syntactic information changes in scale transformations and tries to detect the principles of information variation in map generalization.The entropy measure is based on the Voronoi cells of the object cluster partitioning.This study explores the law of information reduction in scale transformations by two typical generalization operators:displacement and aggregation.And this study tries to use these findings to evaluate the quality of map generalization.
spatial scale transformations;information entropy;map generalization;Voronoi diagram
2014-07-21;
2014-09-13
國家測繪地理信息局重點實驗室開放基金(KLM201304)
艾廷華(1969-),男,教授,博士生導師,研究方向為地圖綜合和空間認知。E-mail:tinghua_ai@tom.com
10.3969/j.issn.1672-0504.2015.02.002
P208
A
1672-0504(2015)02-0007-05