(國網(wǎng)黃山供電公司,安徽 黃山 245000)
地理數(shù)據(jù)廣泛應(yīng)用于電力行業(yè)各類業(yè)務(wù),包括導航地圖、遙感影像、電網(wǎng)設(shè)備、傳感器、用戶等的位置信息。地理數(shù)據(jù)隱含高精度空間信息,因此地理數(shù)據(jù)在共享過程中存在著較大的安全隱患[1-2],應(yīng)進行脫密等處理。對涉密地理數(shù)據(jù)進行脫密處理包括數(shù)據(jù)抽取、幾何精度降低、屬性和高程處理等。其中,幾何精度脫密是指使用專業(yè)脫密技術(shù)進行位移和空間位置精度隨機干擾,使得脫密后的數(shù)據(jù)不易糾正恢復,避免要素泄密。
完成幾何精度脫密的地理數(shù)據(jù),是否仍然能夠滿足業(yè)務(wù)應(yīng)用,需建立地理數(shù)據(jù)可用性評估模型[3]。通過分析地理信息數(shù)據(jù)及電網(wǎng)數(shù)據(jù)的使用和展示特點,構(gòu)建一個綜合評估模型,包括可用性評估內(nèi)容分析、確定可用性評估量化因子、確定可用性評估等級等。模型用于評估脫密后數(shù)據(jù)或者通過其他變形手段變化的地理數(shù)據(jù),是否滿足應(yīng)用場景需求。
地理數(shù)據(jù)的可用性是指地理數(shù)據(jù)被使用時,所表現(xiàn)出的有效性、效率和滿意度[4-5]。脫密地理數(shù)據(jù)可用性問題的來源分為兩部分:空間數(shù)據(jù)質(zhì)量問題和脫密過程引入的可用性問題。
地理數(shù)據(jù)幾何精度脫密是對地理數(shù)據(jù)的離散點坐標進行變換,其實質(zhì)是建立原始地理坐標到目標地理坐標的函數(shù)映射。
幾何精度脫密模型主要包括線性模型、非線性模型、混合模型、神經(jīng)網(wǎng)絡(luò)[6]。無論是采用哪種脫密模型,都能對地理數(shù)據(jù)加以不均勻的擾動,產(chǎn)生一定程度的影響,達到保密效果。脫密技術(shù)對地理數(shù)據(jù)的影響包括對精度的影響、對空間關(guān)系的影響以及對數(shù)據(jù)可視化效果的影響。
脫密技術(shù)對精度的影響體現(xiàn)在位置精度和圖形精度兩方面。位置精度是指空間數(shù)據(jù)表示的對象位置與現(xiàn)實世界中對應(yīng)實體位置之間的準確度。圖形精度是指空間數(shù)據(jù)中表示的對象形狀與現(xiàn)實世界中對應(yīng)實體形狀之間的差異程度。
脫密技術(shù)對空間關(guān)系的影響主要體現(xiàn)在對空間現(xiàn)象的幾何特性引起的空間關(guān)系,如距離、方位、連通性、相似性等。
脫密技術(shù)對地理數(shù)據(jù)可視化效果的影響,主要體現(xiàn)在用戶對地圖上以符號形式表達的地理環(huán)境信息的認識和解譯的過程。由于脫密處理通常采用的是非線性方式,其對地理數(shù)據(jù)可視化產(chǎn)生相對較大的影響。
地理數(shù)據(jù)可用性的評估內(nèi)容主要包括數(shù)據(jù)可視化效果、數(shù)據(jù)在使用時的可靠性和有效性3個方面,如圖1所示。
可視化效果是指地理數(shù)據(jù)經(jīng)過變化處理前后所體現(xiàn)出來的整體相似程度[7-8]。較低的相似度使得用戶在認知信息的過程中產(chǎn)生錯誤的理解,對用戶所處位置與環(huán)境產(chǎn)生錯誤的認知,從而使得地理數(shù)據(jù)的可用性降低。
使用變化處理后的地理數(shù)據(jù)時,可靠性是指要素之間的相對位置準確度??煽啃岳碚撌墙⒃诮?jīng)典概率論基礎(chǔ)上的,主要考慮的是隨機不確定性,認為變化前后保持要素之間的相對位置是一個隨機事件。
有效性則是指變化后地理數(shù)據(jù)所能提供服務(wù)正確生效的程度。對變化處理后地理數(shù)據(jù)的有效性評估主要指地理數(shù)據(jù)變化前后空間相關(guān)關(guān)系一致性。
地理數(shù)據(jù)可用性評估分為3個步驟:1)對變化前后地理數(shù)據(jù)中要素的各個特征進行描述;2)比較變化前后要素的各特征,根據(jù)提出的評估指標依次對其進行計算,可得各指標的評估結(jié)果;3)根據(jù)特定應(yīng)用特征分別賦予各指標相應(yīng)的權(quán)重,在此基礎(chǔ)上整合各指標的評估結(jié)果得到最終的評估結(jié)果。如圖2所示。
圖1 地理數(shù)據(jù)可用性評估內(nèi)容
圖2 地理數(shù)據(jù)可用性評估概念框架
在地理數(shù)據(jù)中,通常用點、線、面3類數(shù)據(jù)表示各類地理實體,從而可以將地理數(shù)據(jù)劃分為點群、線群和面群3類空間群組目標[9]。對于不同的空間群對象,結(jié)合變化處理對數(shù)據(jù)的影響,分別采用不同的度量方法。
2.1.1 點群目標的相似性度量
1)點群目標方向關(guān)系相似性度量
現(xiàn)實空間的點群分布,通常是描述帶有一定的方向偏離的地理現(xiàn)象[10-11]。度量方法為:對目標點群生成標準差橢圓,計算其方向偏離程度來度量點群目標方向相似度,并在此基礎(chǔ)上,根據(jù)目標點群的標準差橢圓的長、短軸之間的關(guān)系來進行點群目標距離相似度的度量。
標準差橢圓的圓心利用算術(shù)平均中心計算得到,公式為
(1)
(2)
標準差橢圓的方向以x軸為準,正北方向為0°,順時針旋轉(zhuǎn)θ,計算公式為
(3)
(4)
(5)
(6)
標準差橢圓的長、短軸的長度計算公式為
(7)
(8)
對空間點群目標生成標準差橢圓,點群目標的主要分布方向可用橢圓的長軸方向進行表示。那么該方向與x軸的夾角θ的取值范圍為[0,π],則對標準差橢圓夾角分別為θ1和θ2的兩個點群來說,其方向相似度為
SIMdire=|cos(θ1-θ2)|
(9)
當兩點群的標準差橢圓方向相互垂直時,點群之間的空間方向相似度為0;當兩點群的標準差橢圓在同一方向時,其之間的空間方向相似度為1。
2)點群要素距離關(guān)系相似性度量
點群的距離關(guān)系可用點群中要素的集中程度來表示,采用標準差的長、短軸的距離之比來描述[12]。對標準差橢圓長、短軸分別為a1、b1和a2、b2的兩個點群來說,定義其距離相似度為
(10)
3)點群要素幾何特征相似性度量
對于空間點群要素的幾何特征描述,主要是通過點群分布范圍來對空間點群目標的幾何相似性進行度量[13]??紤]到分布范圍相似度的度量需要具有旋轉(zhuǎn)、平移和縮放不變性,提出了一種形狀描述函數(shù)來計算面要素之間的形狀相似度。
(11)
式中,f(li)為點群最小外包多邊形的描述參數(shù),即點群外包多邊形各點到形心點的距離。
4)點群要素綜合相似性度量
考慮到空間要素間的空間關(guān)系和幾何特征分布,通過其對空間點群要素相似度的影響進行分析,因此對前述3個相似度度量指標分別賦以0.4、0.3、0.3的權(quán)值,得到點要素的綜合相似度計算公式為
Spoi=0.4SIMdire+0.3SIMdist+0.3SIMscope
(12)
2.1.2 線群要素的相似性度量
1)線群要素方向關(guān)系相似性度量
利用解析幾何的方法,采用獨立于空間線狀要素之外的直接坐標系對線狀要素整體進行統(tǒng)計,計算整個線群要素的方向均值,利用方向均值的象限角度對線群要素的空間方向關(guān)系進行定量描述[14]。方向均值的計算公式為
(13)
式中:θv為各個線要素的方向;θR為線群要素的方向均值。
若變化前后線群要素的方向均值分別為θ1與θ2,那么兩組線群要素的空間方向關(guān)系相似度的計算方法為
Simdir=cos|θ1-θ2|
(14)
2)線群要素距離關(guān)系相似性度量
用空間線群要素的空間距離關(guān)系相似度來描述各個要素之間方向關(guān)系的不一致性程度[15]。用環(huán)形方差來對方向距離關(guān)系進行度量。計算公式為
(15)
環(huán)形方差即線群距離關(guān)系的值域在0和1之間。當OR=0時,表明線群的集中方向之間的距離為0;當OR=1時,認為各要素與線群的整體方向的距離最遠。那么距離相似度計算方法為
(16)
3)線群要素幾何特征相似性度量
線群要素幾何特征可用曲折度描述。線的曲折度可簡單定義為線的實際長度和其直線長度的比值[16]。實際長度用坐標串中點與點之間的直線距離累加來近似計算。其計算公式為
(17)
式中:L為線要素的長度;S為線要素首尾端點的直線距離。那么可以計算線群要素1和要素2的幾何相似度,計算方法為
(18)
4)線群要素綜合相似性度量
考慮到空間要素間的空間關(guān)系和幾何特征分布,通過其對空間線群要素相似度的影響分析,分別對前述計算出的3個相似度分別賦0.4、0.2、0.4的權(quán)值。那么線要素的綜合相似度計算公式為
Spline=0.4Simdire+0.2Simdist+0.4Simgeo
(19)
2.1.3 面群要素的相似性度量
1)面群要素方向關(guān)系、距離關(guān)系相似性度量
空間面群要素多為比較規(guī)則的面狀要素,因此可生成其最小面積外接矩形,如圖3所示。該面狀要素的方向就是其最小外接矩形的最長邊的方向,則可將二維的面狀要素降維至一維的線狀要素[17]。
圖3 多邊形最小面積外接矩形
2)面群要素幾何特征相似性度量
面狀要素的幾何特征值采用緊致度來描述[18]。緊致度用來描述一個給定的多邊形區(qū)域離某一特定形狀的面的偏離程度。面的緊致度采用其面積與周長之間的比率描述。對于多邊形X,其緊致度C(X)為
(20)
式中:P(Xi)為多邊形Xi的周長;Are(Xi)為多邊形的面積。那么,空間面群要素的幾何相似度為
(21)
3)面群要素綜合相似性度量
考慮到空間要素間的空間關(guān)系和幾何特征分布,通過其對空間線群要素相似度的影響分析,對前述計算出的3個相似度分別賦0.3、0.3、0.4的權(quán)值。面要素的綜合相似度計算公式為
Spgone=0.3Simdire+0.3Simdist+0.4Simgeo
(22)
2.1.4 地理數(shù)據(jù)的綜合相似性度量
人們是基于背景要素來獲取其所處的空間位置,因此在對地理數(shù)據(jù)變化前后整體相似性度量時,應(yīng)分別對點、線、面要素賦予不同的權(quán)值,即0.2、0.3、0.5。那么,變化前后地理數(shù)據(jù)的可視化度量模型為
Sim=(0.2Spoi+0.3Spline+0.5Spgone)×100
(23)
相對位置準確度就是各地理要素在變化前后,其相對位置變化程度[19]。變化前隨機選取多邊形區(qū)域Si,在此區(qū)域中隨機選取mi個點,經(jīng)過處理后,得到對應(yīng)的Si′、mi′,其中處理后仍在Si′區(qū)域中的點數(shù)為mi″。相對位置準確度計算公式為
(24)
式中,n表示隨機選取的區(qū)域個數(shù)。
那么,變化前后地理數(shù)據(jù)可靠性度量模型為
W=100×Ac
(25)
式中,W表示地理數(shù)據(jù)可靠性綜合評分。
變化前后空間相關(guān)關(guān)系一致性是指要素間的空間相關(guān)關(guān)系在處理后得到的保持和延續(xù)。因為組成線、面的點空間相關(guān)關(guān)系不變,則線、面的空間相關(guān)關(guān)系也保持不變。因此,在采樣點的規(guī)模足夠大的情況下,空間相關(guān)關(guān)系一致性只考慮點要素的空間相關(guān)關(guān)系。
設(shè)抽象前的地理空間場景為DB,其中的空間要素集合為OB1,OB2,…,OBn,各個空間要素之間的拓撲關(guān)系分別為r(OBi,OBj)(1≤i 在對變化前后地理數(shù)據(jù)進行空間相關(guān)關(guān)系評估時,首先確定評估目標,并確定對應(yīng)的空間要素。對于確定的空間場景DB和DA,其中任意兩個要素之間的關(guān)系r(OBi,OBj)和r(OAi,OAj)都是已知的,那么就可以將它們的關(guān)系進行比較,判斷它們之間的空間相關(guān)關(guān)系是否得到保持。若關(guān)系等價的,則認為空間相關(guān)關(guān)系一致,此時空間相關(guān)關(guān)系一致性為1。若關(guān)系不等價,則認為空間相關(guān)關(guān)系不一致,此時一致性為0,即有: EQU(r(OAi,OAj),r(OBi,OBj)) (26) 這樣通過計算變化前后地理數(shù)據(jù)要素之間的空間相關(guān)關(guān)系一致性程度,可以確定變化前后場景DB和DA之間的空間相關(guān)關(guān)系一致性大小。計算公式為 E=EQU(DB,DA) (27) 那么地理數(shù)據(jù)的有效性度量計算公式為 Eff=E×100 (28) 地理數(shù)據(jù)可用性評估的目的是對地理數(shù)據(jù)的處理(脫密等)結(jié)果進行分析與評估,其評估結(jié)果可表明處理后的地理數(shù)據(jù)的可用性,可用性評估越高說明其處理技術(shù)越優(yōu),處理結(jié)果越準確[20]??蓪⑵浞答伣o處理(脫密等)過程中的各個環(huán)節(jié),對處理技術(shù)進行調(diào)控和整改 ,從而得到高可用性的處理成果。 根據(jù)地理數(shù)據(jù)的可用性評估內(nèi)容,可用性評估涉及到可視化效果、可靠性及有效性三方面,因此地理數(shù)據(jù)可用性評估應(yīng)綜合考慮這三方面的影響。由于各個指標在評估中的重要性并不完全相同,可賦予一定的權(quán)重對地理數(shù)據(jù)可用性進行綜合評估。 在對地理數(shù)據(jù)進行可用性綜合評估前,要對其進行可用性檢測,規(guī)則如下: 1)地理數(shù)據(jù)可視化效果評價指標,在評估過程中,綜合相似度計算結(jié)果低于85時,認定數(shù)據(jù)視覺效果嚴重失真,評定該地理數(shù)據(jù)可用性為不合格。 2)地理數(shù)據(jù)可靠性評價指標,采樣規(guī)模龐大時,結(jié)果低于95,則會出現(xiàn)變化前后地理數(shù)據(jù)中大量點、面相對位置關(guān)系不一致的情況,不能滿足電力行業(yè)的應(yīng)用需求,認定為不合格。 3)地理數(shù)據(jù)有效性評價指標,在采樣規(guī)模龐大時,結(jié)果低于95,則會出現(xiàn)變化前后地理數(shù)據(jù)中大量點、點空間相關(guān)關(guān)系不一致的情況,導致線、面的空間相關(guān)關(guān)系也出現(xiàn)不一致的情況,對地理數(shù)據(jù)的使用產(chǎn)生誤導,認定為不合格。 除了上述指標評價之外,對地理數(shù)據(jù)進行敏感性檢查,若存在不符合國家相關(guān)規(guī)定的要素,則評定該地理數(shù)據(jù)可用性為不合格。 當對地理數(shù)據(jù)的可用性評估通過以上檢測時,可對地理數(shù)據(jù)進行綜合評估,基于業(yè)務(wù)需求與相關(guān)標準以及處理技術(shù)特點,分析可視化效果、可靠性、有效性對地理數(shù)據(jù)可用性的影響,分別對其賦予權(quán)值并進行計算,其計算方式為 Q=Sim×0.2+W×0.4+Eff×0.4 (29) 式中:Sim表示可視化效果度量結(jié)果;W表示可靠性度量結(jié)果;Eff表示有效性度量結(jié)果。 根據(jù)相關(guān)要求與規(guī)定及用戶需求,將地理數(shù)據(jù)可用性分為4個等級,分別是優(yōu)秀、良好、合格和不合格。各可用性等級對應(yīng)的評分值見表1。 表1 地理數(shù)據(jù)可用性的平直區(qū)間表 實驗所采用的數(shù)據(jù)為某公園附近1:10 000地圖地理數(shù)據(jù),實驗數(shù)據(jù)所涉及的區(qū)域約1.93 km2,采用相對獨立坐標系,按要素類型可分為點要素、線要素、面要素,如圖4所示。 首先對脫密地理數(shù)據(jù)進行檢查,檢查的內(nèi)容包括數(shù)據(jù)敏感要素、數(shù)據(jù)格式、數(shù)據(jù)組織、完整性、邏輯一致性、位置準確度、專題準確度、時間準確度等等。然后依據(jù)可用性度量模型將檢測結(jié)果轉(zhuǎn)化為對地理數(shù)據(jù)可用性元素的度量,最后計算出地理數(shù)據(jù)可用性綜合評估結(jié)果。下面以模型A(自主研發(fā)地理數(shù)據(jù)脫密算法)為例進行計算說明。 圖4 實驗數(shù)據(jù)示意 1)脫密前后可視化計標計算 脫密前后可視化指標計算如表2所示。 表2 脫密地理數(shù)據(jù)可視化效果評估表 從表2中的計算結(jié)果來看,各類要素各項指標的相似度相對較高,表明此脫密較好地保證了脫密前后地理數(shù)據(jù)空間方向、空間距離及幾何相似性。脫密前后地理數(shù)據(jù)綜合相似度為99.55,表明此脫密算法較好地保持了空間方向、空間距離、圖形幾何等特征內(nèi)容,評測結(jié)果與人的視覺一致。 2)脫密前后可靠性指標計算 在試驗區(qū)域隨機選取2個面要素與其中的10個點要素,根據(jù)可靠性計算方法得到評估結(jié)論,如表3所示。 表3 脫密地理數(shù)據(jù)可靠性評估表 3)脫密前后有效性指標計算 在試驗區(qū)域選取100點要素作為采集對象進行有效性計算。通過計算發(fā)現(xiàn),脫密后未出現(xiàn)點要素之間的拓撲關(guān)系不一致,因此脫密前后拓撲關(guān)系一致性為1,有效性指標結(jié)果為100。 4)脫密地理數(shù)據(jù)綜合可用性評估與分析 根據(jù)第3節(jié)給出的方法,對脫密地理數(shù)據(jù)的可用性進行綜合評估,可用性得分為99.91。那么可認定采用模型A對地理數(shù)據(jù)脫密處理后,數(shù)據(jù)的可用性評估為優(yōu)秀。 在對地理數(shù)據(jù)可用性基本理論和地理數(shù)據(jù)脫密理論分析的基礎(chǔ)上,對地理數(shù)據(jù)(主要針對脫密處理)的可用性評估進行剖析,研究了地理數(shù)據(jù)可用性概念框架,并根據(jù)脫密地理數(shù)據(jù)可用性問題來源,提出了基于可視化效果、可靠性、有效性的可用性綜合評估模型。所提研究可量化評估地理數(shù)據(jù)的可用性,并根據(jù)地理數(shù)據(jù)可用性評估結(jié)果預(yù)判其在應(yīng)用場景中的可用性。3 地理數(shù)據(jù)可用性評估模型
4 地理數(shù)據(jù)可用性評估實驗
4.1 概述
4.2 實驗與分析
5 結(jié) 語