林東銓 張俊鑫
(1.廣東省國(guó)土資源測(cè)繪院,廣東 廣州 510663;2.自然資源部華南熱帶亞熱帶自然資源重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510663;3.廣東省自然資源科技協(xié)同創(chuàng)新中心,廣東 廣州 510663)
在國(guó)土變更調(diào)查縣級(jí)數(shù)據(jù)庫(kù)建設(shè)工作中,涉及大量圖斑矢量圖形的調(diào)整、修正及空間分析。由于各類業(yè)務(wù)數(shù)據(jù)的來(lái)源及工作要求不同,且在作業(yè)過(guò)程存在大量人工整理的步驟,導(dǎo)致未經(jīng)檢查的數(shù)據(jù)庫(kù)成果中常存在重疊、縫隙、局部狹長(zhǎng)、節(jié)點(diǎn)過(guò)密、自相交等拓?fù)鋯?wèn)題,嚴(yán)重影響后續(xù)數(shù)據(jù)的治理與使用。因此,對(duì)圖斑的矢量圖形進(jìn)行系統(tǒng)檢查并修正,對(duì)建庫(kù)成果質(zhì)量至關(guān)重要。在數(shù)據(jù)庫(kù)存在的拓?fù)鋯?wèn)題中,對(duì)圖形重疊等有明確定義的情況,可直接通過(guò)矢量圖形的簡(jiǎn)單處理進(jìn)行檢查及修復(fù)。針對(duì)圖斑存在局部狹長(zhǎng)的情況,目前雖已有不少學(xué)者研究,但由于缺少量化且精確的定義,未形成具備穩(wěn)定性與普適性的方法。
目前,針對(duì)國(guó)土變更調(diào)查數(shù)據(jù),已有較為成熟的數(shù)據(jù)檢查軟件[1-3],對(duì)地理國(guó)情監(jiān)測(cè)、新型基礎(chǔ)測(cè)繪等同樣涉及圖形拓?fù)錂z查的工作,也有相應(yīng)的研究并形成質(zhì)檢工具[4-7]或數(shù)據(jù)檢查機(jī)制[8],實(shí)現(xiàn)圖形拓?fù)錂z查與數(shù)據(jù)精度控制。同時(shí),也有學(xué)者針對(duì)狹長(zhǎng)圖斑、圖斑狹長(zhǎng)分支等的判定與處理方法[9-15]進(jìn)行研究。在上述研究中,對(duì)圖斑狹長(zhǎng)情況的識(shí)別多基于圖斑的矢量特征進(jìn)行判定,如采用圖斑邊界平移、計(jì)算圖形周長(zhǎng)面積比例等方式,該些方法能識(shí)別出一部分狹長(zhǎng)的圖形,但矢量圖形中狹長(zhǎng)的位置可能存在節(jié)點(diǎn)過(guò)密、多余節(jié)點(diǎn)等不規(guī)律、不可預(yù)測(cè)的情況,過(guò)度依賴圖形的邊、點(diǎn)等特征進(jìn)行識(shí)別的方法,其穩(wěn)定性以及普適性將會(huì)大大降低。
因此,本文從圖斑本身的圖形分布特征出發(fā),分析并研究對(duì)圖斑局部狹長(zhǎng)區(qū)域進(jìn)行識(shí)別及定位的方法,通過(guò)規(guī)避圖斑矢量圖形本身拓?fù)鋯?wèn)題帶來(lái)的不可預(yù)測(cè)因素,提高方法的穩(wěn)定性與普適性。
為保證識(shí)別過(guò)程中不受矢量圖形拓?fù)鋯?wèn)題的影響,本文通過(guò)將圖斑柵格化,以柵格單元集代表圖形范圍,并基于柵格單元開(kāi)展研究。同時(shí),由于局部狹長(zhǎng)區(qū)域呈狹窄、細(xì)長(zhǎng)、尖銳的形狀,位于該區(qū)域的柵格單元集呈具有一定長(zhǎng)度但寬度有限的特點(diǎn),即該區(qū)域內(nèi)的每柵格單元,以其為中心的一定范圍內(nèi)可搜索到的柵格單元數(shù)量相比其他區(qū)域相對(duì)較少。根據(jù)該特點(diǎn),本文在柵格化的基礎(chǔ)上,為每柵格單元設(shè)置一個(gè)初始累積值并逐漸追加,當(dāng)各柵格單元的累計(jì)值達(dá)到一定程度后,將值逐漸往周邊擴(kuò)散,使周邊柵格單元數(shù)量多的區(qū)域轉(zhuǎn)移速度快、柵格單元的值則分布均勻,反之轉(zhuǎn)移速度慢、柵格單元的值集中,則柵格單元累計(jì)值集中的部分可認(rèn)為是局部狹長(zhǎng)區(qū)域,如圖1所示。
圖1 狹長(zhǎng)區(qū)域示意圖
本文首先將圖斑進(jìn)行柵格化,通過(guò)設(shè)定固定大小的柵格單元,將圖斑矢量圖形所覆蓋到的位置轉(zhuǎn)化為柵格單元的集合,作為圖斑范圍UA。
在柵格化的基礎(chǔ)上,本文由圖斑邊緣開(kāi)始,按一定速度增加?xùn)鸥駟卧闹担瑸榇耍瑢⑽挥趫D斑范圍UA中且與圖斑范圍UA外存在接觸的柵格單元認(rèn)為是邊緣柵格單元,將其集合作為柵格邊緣UE。接著,設(shè)定一定周期,每周期內(nèi)柵格邊緣UE中的柵格單元增加一個(gè)累積值,并對(duì)整圖斑范圍UA中的柵格單元進(jìn)行遍歷,如有柵格單元的累積值高于周邊其他柵格單元,則將較高累積值往較低累積值處進(jìn)行擴(kuò)散,具體如下:
(1)將圖斑范圍UA中每柵格單元的累積值設(shè)置為0個(gè)。
(2)設(shè)定一定周期,在每周期內(nèi)柵格邊緣UE中柵格單元的累積值均增加1個(gè)。
(3)在圖斑范圍UA內(nèi),每周期內(nèi)當(dāng)有柵格單元相對(duì)相鄰柵格單元的累積值更高且差值大于1 個(gè)時(shí),則將當(dāng)前柵格單元的累積值減少1 個(gè),將目標(biāo)柵格單元的累積值增加1個(gè)。
在此方法下,隨圖斑范圍UA中總體的柵格單元累積值越來(lái)越高,各區(qū)域柵格單元的累積值逐漸往低處擴(kuò)散,在經(jīng)歷足夠多的周期后,位于局部狹長(zhǎng)區(qū)域的柵格單元由于可進(jìn)行擴(kuò)散的其他柵格單元較少,累積值難于擴(kuò)散,相對(duì)其他區(qū)域的累積值將相對(duì)較高。
如圖2(a)和圖2(b)所示,分別為圖1 中的圖斑經(jīng)柵格化后進(jìn)行10 次、60 次演算后的柵格單元累積值分布示意。
圖2 柵格單元累積值分布示意圖
可以看出,隨演算次數(shù)增加,對(duì)圖斑范圍內(nèi)非局部狹長(zhǎng)區(qū)域,其柵格單元累積值分布愈加均勻,且越遠(yuǎn)離邊緣或折點(diǎn)處越低;而對(duì)圖斑范圍內(nèi)局部狹長(zhǎng)區(qū)域,其柵格單元累積值則遠(yuǎn)高于其他位置。
根據(jù)多次演算后各柵格單元反映的特征,本文分別選取存在局部狹長(zhǎng)區(qū)域的圖斑與無(wú)局部狹長(zhǎng)區(qū)域的圖斑,通過(guò)上文方法演算相同的次數(shù),并在演算后獲取各柵格單元的累積值,對(duì)數(shù)值一致的累計(jì)值僅統(tǒng)計(jì)一次,并由小至大排序,分析其變化趨勢(shì)。
由圖3可以看出,進(jìn)行相同次數(shù)的演算后,無(wú)局部狹長(zhǎng)區(qū)域的圖斑的柵格單元累計(jì)值的上升速度平緩,而存在局部狹長(zhǎng)的圖斑的柵格單元累計(jì)值起初上升平緩,在某范圍內(nèi)迅速上升后又重新趨于平緩。結(jié)合圖2 的示例可以看出,柵格單元累積值起初上升平緩的部分對(duì)應(yīng)圖斑范圍內(nèi)分布均勻的位置,突然迅速上升的部分則對(duì)應(yīng)圖斑范圍內(nèi)分布均勻位置與局部狹長(zhǎng)位置的交界部分,最終重新趨于平緩的部分為對(duì)應(yīng)該圖斑的局部狹長(zhǎng)范圍。
圖3 柵格單元累積值變化趨勢(shì)示意圖
根據(jù)該特征,將柵格單元的累積值由小至大依次排序,如存在累計(jì)值上升速度急劇增加的情況,則認(rèn)為該圖斑包含局部狹長(zhǎng)區(qū)域,并將該值作為判斷局部狹長(zhǎng)區(qū)域的閾值,對(duì)大于局部狹長(zhǎng)區(qū)域閾值的柵格單元值,認(rèn)為是局部狹長(zhǎng)區(qū)域?qū)?yīng)的柵格單元值;而對(duì)柵格單元值持續(xù)以較為穩(wěn)定的效率上升的,則認(rèn)為是不包含局部狹長(zhǎng)區(qū)域的圖斑。根據(jù)該方法,對(duì)包含局部狹長(zhǎng)區(qū)域的圖斑,將判定為局部狹長(zhǎng)區(qū)域的柵格單元提取并轉(zhuǎn)化為矢量圖形,最終定位至圖斑矢量圖形中的局部狹長(zhǎng)區(qū)域。
如圖4 所示,經(jīng)對(duì)圖1 中圖斑進(jìn)行柵格化并演算后,將判定為局部狹長(zhǎng)區(qū)域的柵格單元提取并轉(zhuǎn)化為矢量圖形,即可定位至圖斑中的局部狹長(zhǎng)區(qū)域。
圖4 局部狹長(zhǎng)區(qū)域定位示意圖
為驗(yàn)證方法的有效性,同時(shí)保證實(shí)驗(yàn)結(jié)論的準(zhǔn)確性及合理性,本文選取了某縣區(qū)的國(guó)土變更調(diào)查數(shù)據(jù)庫(kù)進(jìn)行實(shí)驗(yàn),除驗(yàn)證該方法是否能識(shí)別出局部狹長(zhǎng)區(qū)域的存在外,同時(shí)考慮到同一圖斑包含的多個(gè)局部狹長(zhǎng)區(qū)域可能會(huì)對(duì)識(shí)別結(jié)果產(chǎn)生影響,對(duì)該方法是否適應(yīng)同一圖斑同時(shí)包含多個(gè)局部狹長(zhǎng)區(qū)域的情況也一并驗(yàn)證。因此,本文對(duì)選取的數(shù)據(jù)庫(kù)中的每個(gè)圖斑,隨機(jī)勾繪若干個(gè)局部狹長(zhǎng)區(qū)域,并通過(guò)本文方法對(duì)每圖斑進(jìn)行識(shí)別,驗(yàn)證是否能識(shí)別出圖斑中的每個(gè)局部狹長(zhǎng)區(qū)域并定位,對(duì)單一圖斑中每狹長(zhǎng)區(qū)域均識(shí)別成功的情況認(rèn)為是“識(shí)別成功”,對(duì)部分識(shí)別成功或全部識(shí)別失敗的情況認(rèn)為是“識(shí)別失敗”,對(duì)各類圖斑以“識(shí)別成功”的圖斑數(shù)占圖斑總數(shù)的比例計(jì)算識(shí)別成功率。
本文選取的數(shù)據(jù)庫(kù)共包含2 137 個(gè)圖斑,并對(duì)每圖斑隨機(jī)勾繪1~3 個(gè)局部狹長(zhǎng)區(qū)域,其中包含局部狹長(zhǎng)區(qū)域個(gè)數(shù)為1、2、3 的圖斑數(shù)分別為1 337、491、309,成功識(shí)別的個(gè)數(shù)分別為1 223、439、283,識(shí)別成功率分別為91%、89%、92%,總識(shí)別成功數(shù)為1 945,總識(shí)別成功率為91%。具體如表1所示。
表1 識(shí)別結(jié)果表
由實(shí)驗(yàn)結(jié)果可以看出,分別包含1~3 個(gè)局部狹長(zhǎng)情況的圖斑的識(shí)別成功率在89%~92%,單個(gè)圖斑內(nèi)局部狹長(zhǎng)區(qū)域的個(gè)數(shù)對(duì)識(shí)別成功率未產(chǎn)生明顯影響,總識(shí)別成功率達(dá)到91%。另外,本文對(duì)未成功識(shí)別的圖斑進(jìn)行分析,發(fā)現(xiàn)由于實(shí)驗(yàn)時(shí)采用了固定的柵格單元大小進(jìn)行柵格化,未成功識(shí)別的圖斑基本屬于狹長(zhǎng)區(qū)域與圖斑主體較為貼近的情況,導(dǎo)致柵格化過(guò)程中狹長(zhǎng)區(qū)域與主體融為一體。對(duì)該部分圖斑,本文采用長(zhǎng)、寬較小的柵格單元對(duì)圖斑進(jìn)行柵格化后,即可正確區(qū)分開(kāi)來(lái),并進(jìn)行后續(xù)識(shí)別與定位,但因柵格化后的柵格單元數(shù)大大增加,識(shí)別效率受到一定影響。此時(shí),本文將演算次數(shù)減少,在不影響識(shí)別成功率的前提下,識(shí)別效率得到一定提升。
經(jīng)實(shí)驗(yàn)證明,本文的研究方法能夠有效識(shí)別圖形存在的局部狹長(zhǎng)區(qū)域并進(jìn)行定位,同時(shí)能夠規(guī)避矢量圖形拓?fù)鋯?wèn)題的影響。另外,方法中涉及的柵格單元大小、演算次數(shù)等多個(gè)參數(shù)均在不同程度上對(duì)識(shí)別成功率及效率產(chǎn)生影響,參數(shù)的合理設(shè)置方法仍有研究空間。
本文基于目前對(duì)圖斑局部狹長(zhǎng)情況的檢查方法的穩(wěn)定性與普適性有限的情況,提出一種基于圖斑位置分布識(shí)別圖斑局部狹長(zhǎng)區(qū)域的新方法,并通過(guò)實(shí)驗(yàn)證明該方法的有效性。通過(guò)將圖斑柵格化并基于其形狀特征進(jìn)行演化計(jì)算,根據(jù)計(jì)算后的柵格單元值特征區(qū)分圖斑內(nèi)部的狹長(zhǎng)與非狹長(zhǎng)區(qū)域,實(shí)現(xiàn)對(duì)圖斑局部狹長(zhǎng)區(qū)域進(jìn)行快速檢測(cè)及定位,在規(guī)避圖斑矢量圖形自身拓?fù)鋯?wèn)題帶來(lái)的不可預(yù)測(cè)因素的前提下,提升對(duì)圖斑局部狹長(zhǎng)區(qū)域的檢查精度,具有較高的穩(wěn)定性、普適性和推廣價(jià)值。