嚴(yán)泰來,陳亞婷,劉 哲
(中國(guó)農(nóng)業(yè)大學(xué),北京100083)
在地圖上,一個(gè)用曲線勾劃的封閉區(qū)域就稱為圖斑(parcel),即一個(gè)地塊。每一個(gè)縣、鄉(xiāng)或村都有邊界,用邊界圍成一個(gè)區(qū)域就是圖斑。對(duì)于圖斑,人們首先關(guān)心其面積,這是任何一個(gè)圖斑最為基本的地理信息之一。
GIS表現(xiàn)地圖的地理信息有兩種基本資料數(shù)據(jù)格式(data format),即網(wǎng)格格式(grid)和矢量格式(vector),如圖1所示。
圖1 數(shù)字化地圖數(shù)據(jù)的網(wǎng)格格式和矢量格式
圖1(a)為數(shù)字化地圖數(shù)據(jù)的網(wǎng)格格式,所謂網(wǎng)格格式是指用透明、細(xì)密、均勻的方格網(wǎng)“覆蓋”在地圖上,網(wǎng)格有具體的尺寸,網(wǎng)上的每一方格在地圖上覆蓋的部位具有某一屬性,如網(wǎng)格格式表達(dá)行政區(qū)劃圖,則各個(gè)網(wǎng)格就被賦予對(duì)應(yīng)地圖部位的行政編碼。當(dāng)然,有一些網(wǎng)格可能處于兩個(gè)或三個(gè)地塊的交界處,此種網(wǎng)格的屬性就以分割出最大地塊的屬性為準(zhǔn)。顯然,此時(shí)圖斑的面積A即為屬于該圖斑的網(wǎng)格數(shù)目n乘以一個(gè)網(wǎng)格的面積a,即
這種方法簡(jiǎn)單,但是在GIS中并不常用,原因有兩點(diǎn):①GIS空間數(shù)據(jù)庫基本用矢量格式,網(wǎng)格格式的空間數(shù)據(jù)庫并不多見;②網(wǎng)格格式的精度受制于空間數(shù)據(jù)庫存儲(chǔ)量的限制,不能將網(wǎng)格設(shè)置過小,所以用這種方法量測(cè)圖斑面積的精度不高,難以滿足實(shí)際需要。
圖1(b)即為數(shù)字化地圖數(shù)據(jù)的矢量格式,所謂矢量格式是指用首尾相接的多條線段鏈接起來的折線,每一個(gè)線段都有方向,用折線逼近曲線的數(shù)據(jù)表達(dá)格式。如果這種折線圍成一個(gè)封閉區(qū)域,就構(gòu)成一個(gè)圖斑,于是圖斑就變?yōu)橛糜邢迋€(gè)線段鏈接起來的多邊形,n個(gè)線段鏈接起來就成為n邊形,有n個(gè)頂點(diǎn),每個(gè)頂點(diǎn)都有其坐標(biāo)值(xi,yi),這里i=1,2,…n。對(duì)于這樣的多邊形,其面積可以用辛普森求積公式計(jì)算,見式(2)。
式(2)是用高等數(shù)學(xué)環(huán)積分的思想推導(dǎo)得到,見圖2,圖2(a)中的陰影部分就是積分的積分單元,是一條線段向y軸投影的面積。這個(gè)單元是一個(gè)梯形,在已知點(diǎn)(xi,yi)和點(diǎn)(xi+1,yi+1)坐標(biāo)情況下,該梯形面積可計(jì)算,然后將各線段對(duì)應(yīng)的面積單元累加得到積分單元面積的代數(shù)和、并經(jīng)過整理可得到如式(2)所示的辛普森公式,式中用到絕對(duì)值符號(hào),這是因?yàn)槊娣e沒有負(fù)值。請(qǐng)注意公式最右端對(duì)于y0與yn+1的注解,因?yàn)橐阎c(diǎn)中并沒有(x0,y0)與(xn+1,yn+1)這兩點(diǎn)。
任何圖斑都是一個(gè)邊界封閉的圖形,任何一段線段向y坐標(biāo)軸的投影總會(huì)與另一條或多條線段向y坐標(biāo)軸的投影重疊,而且單元面積的代數(shù)和就留下圖斑這一線段條帶在圖斑內(nèi)的面積,以圖2(b)為例,在d-d+條帶中,就有6個(gè)線段陰影條帶重疊,其代數(shù)和就留下多邊形內(nèi)部的區(qū)域。這樣,所有線段向y坐標(biāo)軸的投影的陰影面積代數(shù)和就構(gòu)成了待測(cè)多邊形的面積。
在GIS矢量格式空間數(shù)據(jù)庫中,對(duì)于每個(gè)圖斑邊界的每個(gè)頂點(diǎn)都按照一定順序存儲(chǔ)坐標(biāo)數(shù)據(jù),因此,GIS軟件在此基礎(chǔ)上能夠快速、準(zhǔn)確地按照式(2)計(jì)算每個(gè)圖斑的面積。
圖2 辛普森求積公式原理圖
如果一個(gè)閉合區(qū)域確實(shí)是一個(gè)真正的多邊形,即區(qū)域邊界是由直線段組成,而且該多邊形頂點(diǎn)的坐標(biāo)資料完全準(zhǔn)確,用式(2)計(jì)算其面積是沒有誤差的,因?yàn)槭?2)是經(jīng)過嚴(yán)格數(shù)學(xué)證明的。但是基于矢量格式數(shù)據(jù)用式(2)測(cè)算圖斑面積存在誤差,問題在于采集用光滑曲線圍成的閉合區(qū)域坐標(biāo)存在誤差,這里有兩種采集誤差。
1)布點(diǎn)誤差。如圖3所示,一般閉合區(qū)域邊界是一條平滑、自然隨機(jī)彎曲的曲線,而在這種曲線上采集有限個(gè)點(diǎn),用折線逼近曲線,一定會(huì)有誤差。比如,在A點(diǎn)處,因布點(diǎn)原因,形成的多邊形在這里面積減少了;而在B點(diǎn)處,因布點(diǎn)原因,形成的多邊形在這里面積增加了。對(duì)于整個(gè)區(qū)域,因布點(diǎn)帶來的正負(fù)誤差不能完全抵消,就使面積測(cè)算最終結(jié)果有誤差。
圖3 圖斑邊界采集布點(diǎn)誤差示意圖
2)采點(diǎn)坐標(biāo)誤差。區(qū)域邊界嚴(yán)格意義上是沒有寬度的,但是實(shí)際地圖上區(qū)域邊界總是有寬度的,夸大一點(diǎn)說是一個(gè)條帶。對(duì)地圖上區(qū)域邊界采點(diǎn),理想位置應(yīng)當(dāng)在邊界條帶的中軸線上,但是人工采點(diǎn)是難以做到的,總會(huì)偏離理想位置,這就產(chǎn)生誤差。
以上布點(diǎn)誤差與采點(diǎn)誤差,不可避免地致使測(cè)算圖斑面積存在誤差,相對(duì)誤差可由式(3)估計(jì)
式中,r為面積計(jì)算的相對(duì)誤差;m為多邊形邊界坐標(biāo)采點(diǎn)的方差;L為多邊形周長(zhǎng);A為多邊形面積;n為多邊形邊界坐標(biāo)采點(diǎn)的數(shù)目。
由式(3)可以看出,面積測(cè)算的相對(duì)誤差與多邊形邊界坐標(biāo)采點(diǎn)的方差成正比;與多邊形的周長(zhǎng)面積比成正比;與采點(diǎn)數(shù)目的平方根成反比。這里“周長(zhǎng)面積比”這一新概念值得注意,事實(shí)上如果一個(gè)圖形的周長(zhǎng)很長(zhǎng)、而面積相對(duì)很小,自然地表物件,如大壩在河流攔截形成的水庫,常常具有這樣的特點(diǎn)。由此說明物件圖形形狀越復(fù)雜,面積測(cè)算誤差就越大。此外,多邊形邊界坐標(biāo)采點(diǎn)的數(shù)目對(duì)面積測(cè)算也有重要影響,采點(diǎn)數(shù)目越多,面積測(cè)算相對(duì)誤差越小,這是因?yàn)殡S著采點(diǎn)數(shù)目的增加,面積測(cè)算正負(fù)誤差相互補(bǔ)償?shù)母怕室苍谠黾樱率瓜鄬?duì)誤差減少。
式(3)適用于估算一個(gè)多邊形面積的測(cè)算誤差,也適用于估算一幅數(shù)字化地圖測(cè)算各圖斑面積的總體相對(duì)誤差,此時(shí),L取地圖中各多邊形周長(zhǎng)的平均值;A取各多邊形面積的平均值;m經(jīng)試驗(yàn)得到,通常有一個(gè)經(jīng)驗(yàn)值;n取各多邊形邊界坐標(biāo)采點(diǎn)數(shù)目的平均值,在GIS軟件支持下獲取以上數(shù)據(jù)是不困難的。由此可以看出,地圖的圖形越復(fù)雜,測(cè)算各圖斑面積的總體誤差也就越大。
式(2)所示的辛普森公式有絕對(duì)值符號(hào),如果將絕對(duì)值符號(hào)去掉,由圖2可知,在左手坐標(biāo)系(Y坐標(biāo)軸橫向,向右為正;X坐標(biāo)軸縱向,向上為正)條件下,多邊形頂點(diǎn)坐標(biāo)按順時(shí)針(如圖2所示)排列,則公式計(jì)算值為正值;反之,多邊形頂點(diǎn)坐標(biāo)按逆時(shí)針排列,則公式計(jì)算值為負(fù)值。這個(gè)性質(zhì)可以在GIS拓?fù)渑袛嘀惺褂?,如圖4所示。辛普森公式適用于計(jì)算三角形面積,如圖4中的△ABP,計(jì)算其面積將頂點(diǎn)坐標(biāo)代入式(2)則有
圖4 拓?fù)渑袛嘣韴D
對(duì)于A值有3種可能:即A>0,則△ABP按順時(shí)針方向排列,即點(diǎn) P在矢量 AB的右面,如圖4(a)實(shí)線所示;A<0,則點(diǎn)P'在矢量AB的左面,如圖4(a)虛線所示;A=0,則點(diǎn)P在矢量AB的線上。又分以下三種情況:即點(diǎn)P在矢量AB的線段上,如圖4(b);點(diǎn) P在矢量 AB的延長(zhǎng)線上,如圖4(c);點(diǎn) P在矢量 AB的反向延長(zhǎng)線上,如圖4(d)。3種情況歸于哪一種,由3點(diǎn)坐標(biāo)數(shù)值關(guān)系決定。
這里提到的拓?fù)?Topology)關(guān)系是指空間幾何體,包括點(diǎn)與點(diǎn)、線與線、點(diǎn)與線、面與面、點(diǎn)與面、面與線等相互之間的方位關(guān)系,在GIS軟體運(yùn)行工作中,有大批量的空間資料需要判斷其空間拓?fù)潢P(guān)系。
多邊形在形狀上有多種特征,計(jì)算機(jī)軟體可以自動(dòng)提取這些特征,為識(shí)別多邊形對(duì)應(yīng)的物件提供線索。這里給出多邊形形狀特征的一種判斷表達(dá)方法,見圖5。圖5所示的多邊形是一個(gè)凹多邊形,其頂點(diǎn)按逆時(shí)針方向排列,這可以用以上介紹的辛普森公式
圖5 多邊形的一種空間特征提取方法
計(jì)算面積是負(fù)值的結(jié)果判斷出來。進(jìn)一步觀察可以發(fā)現(xiàn),連續(xù)取多邊形3個(gè)頂點(diǎn)組成三角形,其中,△ABC、△BCD、△CDE、△HIJ、△KLA、△LAB 是逆時(shí)針方向排列;而△EFG、△IJK、△JKL 3個(gè)三角形是順時(shí)針排列,與整個(gè)多邊形頂點(diǎn)排列方向逆向。整個(gè)多邊形的面積可以計(jì)算,逆向排列的三角形面積累加和也可計(jì)算,兩者之比可以作為一個(gè)多邊形的特征加以定量計(jì)算,這個(gè)比稱之為圖形邊界的凹凸比。圖形邊界的凹凸比作為圖形特征的一個(gè)參數(shù)具有實(shí)際意義,因?yàn)橐粋€(gè)物件的影像中難以避免因投影、物件呈現(xiàn)的姿態(tài)等多種原因產(chǎn)生種種變形,而物件對(duì)應(yīng)圖形邊界的凹凸比卻變化很小,利用這一特征參數(shù)就可能為識(shí)別這一物件提供依據(jù)。圖6顯示圖形凹凸比特征在昆蟲識(shí)別中的一個(gè)應(yīng)用。
仔細(xì)觀察圖6可以發(fā)現(xiàn),圖6左邊蝴蝶包括翅膀在內(nèi)的身體輪廓凹陷點(diǎn)較少,凹陷較淺,但是左右副翼下面各有一個(gè)黑色凸出條帶,致使總體上邊界的凹凸比指數(shù)較大;而右邊蝴蝶包括主翼瘦窄,上下主、副翼之間裂隙較深,但是左右副翼邊界平滑,沒有凸出條帶,致使總體上邊界的凹凸比指數(shù)較小。此外,兩個(gè)蝴蝶的顏色差異較大,用色度學(xué)(Chromatics)原理進(jìn)行分析,又會(huì)發(fā)現(xiàn)更多的不同。除了物種形體邊界的凹凸比特征指數(shù)外,周長(zhǎng)面積比也是一個(gè)特征指數(shù),經(jīng)研究還有更多的特征指數(shù),用計(jì)算機(jī)軟體都可以計(jì)算提取。
如果在計(jì)算機(jī)信息系統(tǒng)中帶有儲(chǔ)存各種昆蟲物種的特征指數(shù)數(shù)據(jù)庫,對(duì)于實(shí)際工作采集來的昆蟲影像樣品計(jì)算其形體特征及色調(diào)特征,并且與特征指數(shù)數(shù)據(jù)庫的資料數(shù)據(jù)逐一加以比對(duì),就可以判斷待判斷昆蟲物種的歸屬。對(duì)于國(guó)家邊境口岸的海關(guān)人員,識(shí)別境外有害昆蟲物種十分重要,因?yàn)榉胚^帶有有害昆蟲物種的蔬菜、水果入境,將會(huì)造成不可挽回的巨大損失。計(jì)算機(jī)信息系統(tǒng)輔助判別有害昆蟲物種對(duì)于保障國(guó)家的生態(tài)安全、農(nóng)產(chǎn)品安全具有重大意義。事實(shí)上,采用與以上類似算法發(fā)展的計(jì)算機(jī)軟件已經(jīng)應(yīng)用在各個(gè)邊防口岸、衛(wèi)生檢疫部門,應(yīng)用面正在不斷擴(kuò)大。
圖6 兩種蝴蝶影像圖
(略)