鄒磊,高健,曹文濤
(1.廣東南方數(shù)碼科技股份有限公司,廣東 廣州 510665; 2.武漢市測(cè)繪研究院,湖北 武漢 430022)
按照自然資源部《全國(guó)基礎(chǔ)測(cè)繪中長(zhǎng)期規(guī)劃綱要(2015-2030年)》文件的要求,到2030年需全面建成新型基礎(chǔ)測(cè)繪體系[1]。目前,我國(guó)多個(gè)城市和地區(qū)都在探索新型基礎(chǔ)測(cè)繪相關(guān)工作,積極申報(bào)試點(diǎn),從各個(gè)方面探索新型基礎(chǔ)測(cè)繪系統(tǒng)的工作[2,3]。雖然各地試點(diǎn)內(nèi)容不盡相同,所采取的方法與技術(shù)手段也有差異,但地理實(shí)體產(chǎn)品的生產(chǎn)工作,都是整個(gè)試點(diǎn)工作的重要組成部分,也是新型基礎(chǔ)測(cè)繪工作中的重點(diǎn)內(nèi)容[4,5]。
目前已有的研究工作顯示,當(dāng)前地理實(shí)體產(chǎn)品生產(chǎn)方法,主要分為存量數(shù)據(jù)轉(zhuǎn)換和全息采集兩個(gè)大類(lèi)[6]。存量數(shù)據(jù)轉(zhuǎn)換是利用現(xiàn)存的滿足精度要求并且現(xiàn)勢(shì)性較好的數(shù)據(jù),進(jìn)行提取和轉(zhuǎn)換為圖元數(shù)據(jù),再由此生產(chǎn)地理實(shí)體;全息采集則是利用傾斜攝影、激光點(diǎn)云等現(xiàn)代化的手段,測(cè)量并采集繪制圖元數(shù)據(jù),之后再生產(chǎn)地理實(shí)體??梢?jiàn),無(wú)論是哪種地理實(shí)體生產(chǎn)方法,其邏輯都是先得到圖元數(shù)據(jù),之后在圖元數(shù)據(jù)的基礎(chǔ)之上構(gòu)建地理實(shí)體。
現(xiàn)有的地理實(shí)體數(shù)據(jù)構(gòu)建方法主要是在設(shè)計(jì)的圖元數(shù)據(jù)和地理實(shí)體數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)上,由圖元數(shù)據(jù)依賴(lài)于軟件平臺(tái)人工手動(dòng)構(gòu)建或基于FME半自動(dòng)構(gòu)建加部分人工的方式生產(chǎn)[7]?,F(xiàn)行方案具有較強(qiáng)的人工依賴(lài)性,導(dǎo)致生產(chǎn)效率低下。一方面,在現(xiàn)行圖元和地理實(shí)體數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)上,作業(yè)人員從圖元數(shù)據(jù)構(gòu)建地理實(shí)體數(shù)據(jù)時(shí),不可避免人工參與,導(dǎo)致效率低下;另一方面,對(duì)于FME半自動(dòng)構(gòu)建的方式,在更改或優(yōu)化地理實(shí)體數(shù)據(jù)庫(kù)設(shè)計(jì)的標(biāo)準(zhǔn)后,須反復(fù)修改FME的方案,也會(huì)造成地理實(shí)體數(shù)據(jù)生產(chǎn)的效率低下。
因此,本文重點(diǎn)研究從地理要素,自動(dòng)化生產(chǎn)地理實(shí)體的方法,使得在地理實(shí)體標(biāo)準(zhǔn)發(fā)生變化,或者需要針對(duì)不同需求生產(chǎn)不同地理實(shí)體時(shí),能夠快速高效地生產(chǎn)數(shù)據(jù)。
在《新型基礎(chǔ)測(cè)繪與實(shí)景三維中國(guó)建設(shè)技術(shù)文件(1-4)》中,地理實(shí)體被定義為現(xiàn)實(shí)世界中占據(jù)一定且連續(xù)空間位置和范圍、單獨(dú)具有同一屬性或完整功能的地理對(duì)象[8]。而圖元數(shù)據(jù)則是地理實(shí)體的構(gòu)成部分[9],是構(gòu)建地理實(shí)體的基本數(shù)據(jù),是地理實(shí)體數(shù)據(jù)生產(chǎn)的必要數(shù)據(jù),其包括根圖元(構(gòu)建地理實(shí)體數(shù)據(jù)必要數(shù)據(jù))、主體圖元、構(gòu)件圖元[6]。按照組成分類(lèi),地理實(shí)體可以分為單地理實(shí)體、組合/聚合地理實(shí)體。單地理實(shí)體由一個(gè)根圖元,或者一個(gè)根圖元加若干個(gè)主體圖元、構(gòu)件圖元組成,組合/聚合地理實(shí)體除擁有和單地理實(shí)體相同的組成部分以外,還有其子級(jí)關(guān)系的地理實(shí)體(以下稱(chēng)子實(shí)體)組成。圖1展示了地理實(shí)體與圖元之間的組成關(guān)系。
圖1 地理實(shí)體與圖元的組成關(guān)系
需要注意的是,在不同的標(biāo)準(zhǔn)規(guī)范下,或者在不同的應(yīng)用需求下,單地理實(shí)體、組合/聚合地理實(shí)體的組成關(guān)系并不唯一,即在不同的需要下,同一份圖元數(shù)據(jù),可能需要生產(chǎn)出不同的單地理實(shí)體數(shù)據(jù)和組合/聚合地理實(shí)體數(shù)據(jù),這也增加了從圖元生產(chǎn)地理實(shí)體的復(fù)雜性。
從上文描述的地理實(shí)體與圖元數(shù)據(jù)的關(guān)系可以看出,根圖元與地理實(shí)體存在一一對(duì)應(yīng)關(guān)系,因此在自動(dòng)化構(gòu)建地理實(shí)體時(shí),可以以根圖元為單位,依次構(gòu)建單地理實(shí)體,進(jìn)而構(gòu)建出組合/聚合地理實(shí)體,形成完整的地理實(shí)體產(chǎn)品數(shù)據(jù)。此過(guò)程的邏輯如圖2所示。
圖2 從圖元構(gòu)建地理實(shí)體的方式
實(shí)現(xiàn)從圖元數(shù)據(jù)構(gòu)建地理實(shí)體的自動(dòng)化,需要讓上面的流程批量化自動(dòng)執(zhí)行,因此可以借助于ETL(Extract Transform Load,ETL)工具,以根圖元為單位,按照數(shù)據(jù)流的形式執(zhí)行。需要執(zhí)行的流程如圖3所示,主要步驟如下:
圖3 圖元自動(dòng)生產(chǎn)地理實(shí)體流程圖
(1)依據(jù)地理實(shí)體和圖元的設(shè)計(jì)標(biāo)準(zhǔn),自動(dòng)化生成單圖元的構(gòu)建方案、子實(shí)體的構(gòu)建方案以及組成關(guān)系約束規(guī)則。其中,單圖元構(gòu)建方案負(fù)責(zé)構(gòu)建地理實(shí)體的圖元組成部分,子實(shí)體構(gòu)建方案負(fù)責(zé)地理實(shí)體的子實(shí)體組成部分,組成關(guān)系約束規(guī)則負(fù)責(zé)對(duì)地理實(shí)體構(gòu)建過(guò)程進(jìn)行約束,使其符合標(biāo)準(zhǔn)規(guī)范要求。
(2)單地理實(shí)體構(gòu)建。單地理實(shí)體構(gòu)建又分兩種情況,一種是僅有根圖元的情況,另一種是有根圖元和主體圖元、構(gòu)件圖元的情況。僅有根圖元的情況,僅需要根據(jù)根圖元與實(shí)體的對(duì)應(yīng)關(guān)系,進(jìn)行一對(duì)一的單元構(gòu)建,之后賦值地理實(shí)體唯一標(biāo)識(shí)碼,即可實(shí)現(xiàn)單地理實(shí)體的構(gòu)建;有根圖元和主體圖元、構(gòu)件圖元的情況,需要采用范圍線構(gòu)建的方式,即以根圖元為單位,按照能夠包絡(luò)圖元范圍的輪廓線,依據(jù)組成關(guān)系約束規(guī)則,得到其組成部分的主體圖元和構(gòu)件圖元,與根圖元一起賦值地理實(shí)體唯一標(biāo)識(shí)碼,實(shí)現(xiàn)地理實(shí)體的構(gòu)建工作。
(3)組合/聚合地理實(shí)體構(gòu)建。在得到單地理實(shí)體后,可以對(duì)單地理實(shí)體進(jìn)行添加子實(shí)體的方式構(gòu)建組合/聚合地理實(shí)體。根據(jù)子實(shí)體構(gòu)建方案,以能夠包絡(luò)地理實(shí)體范圍的輪廓線為單位,依據(jù)組成關(guān)系約束規(guī)則,得到其組成部分的子實(shí)體,添加到實(shí)體組成關(guān)系中,實(shí)現(xiàn)組合/聚合地理實(shí)體的構(gòu)建工作。
需要注意的是,有些情況下,單地理也可能是最后的產(chǎn)品,因此第三步組合/聚合地理實(shí)體的構(gòu)建步驟,需要按照具體的需要執(zhí)行。
從上述圖元數(shù)據(jù)自動(dòng)化構(gòu)建地理實(shí)體的流程中可看出,組成關(guān)系約束規(guī)則起到了關(guān)鍵作用,不同的組成關(guān)系約束規(guī)則,可構(gòu)建出不同的地理實(shí)體數(shù)據(jù)。
組成關(guān)系約束規(guī)則,即在給定的范圍內(nèi),按照規(guī)定的查找方式和過(guò)濾條件,尋找到需要的數(shù)據(jù)部分。
其中,過(guò)濾方式即地理實(shí)體允許的組成部分,可依據(jù)地理實(shí)體和圖元的標(biāo)準(zhǔn)規(guī)范,自動(dòng)生成。比如房屋可以由屋頂面、陽(yáng)臺(tái)組成,但不能由河流組成,當(dāng)在給定的范圍內(nèi)查找到不允許的組成部分,比如河流,需要將其過(guò)濾掉。
查找方式即在指定的范圍內(nèi)按照哪種方法查找需要的組成部分。從存量數(shù)據(jù)生產(chǎn)地理實(shí)體和全息采集地理實(shí)體可以采用不同的查找方式實(shí)現(xiàn)地理實(shí)體的自動(dòng)構(gòu)建工作。
存量數(shù)據(jù)生產(chǎn)地理實(shí)體,一般是從存量數(shù)據(jù)的要素批量轉(zhuǎn)換為圖元,因此這過(guò)程中無(wú)法給圖元指定關(guān)系。此時(shí)可以通過(guò)能夠包絡(luò)根圖元的范圍線,給予一定的緩沖區(qū),在范圍內(nèi)搜索全部圖元,之后進(jìn)行組成關(guān)系過(guò)濾。這種方式完全無(wú)須人工干預(yù),效率極高,但對(duì)于圖元非常密集的區(qū)域,可能會(huì)出現(xiàn)多余的組成關(guān)系。
全息采集生產(chǎn)地理實(shí)體,一般是從傾斜模型、激光點(diǎn)云等數(shù)據(jù)上直接繪制圖元數(shù)據(jù),在繪制圖元的過(guò)程中,即可指定包含關(guān)系,例如將繪制出來(lái)的屋頂圖元和陽(yáng)臺(tái)圖元標(biāo)記為一組,這樣在自動(dòng)化生產(chǎn)地理實(shí)體時(shí),可在規(guī)定的范圍內(nèi),直接搜索與根圖元同在一組的圖元,即得到地理實(shí)體的組成部分。這種方式在圖元的繪制過(guò)程中,需要少量的人工干預(yù),但后期處理效率和精確程度都非常的高。
本文作者在iData數(shù)據(jù)工廠軟件以及其提供的ETL工具SME模塊上[10],按照數(shù)據(jù)流的形式實(shí)現(xiàn)了從圖元數(shù)據(jù)到地理實(shí)體的自動(dòng)化生產(chǎn)SME方案,并應(yīng)用在國(guó)家新型基礎(chǔ)測(cè)繪武漢試點(diǎn)中。
方案的流程圖如圖4所示,首先由項(xiàng)目中設(shè)計(jì)的地理實(shí)體標(biāo)準(zhǔn),自動(dòng)生成地理實(shí)體的構(gòu)建方案(包括單元構(gòu)建和范圍線構(gòu)建)以及地理實(shí)體的組成關(guān)系約束(圖元、地理實(shí)體的關(guān)系和地理實(shí)體之間的關(guān)系),之后在全部數(shù)據(jù)中,逐個(gè)選取根圖元,在組成關(guān)系約束條件下,構(gòu)建單地理實(shí)體,最后再給單地理實(shí)體搭建子實(shí)體關(guān)系,賦值標(biāo)識(shí)碼并保存關(guān)系,得到地理實(shí)體數(shù)據(jù)。當(dāng)?shù)乩韺?shí)體的規(guī)則發(fā)生變化時(shí),則可以快速地重新執(zhí)行該流程,得到新的地理實(shí)體數(shù)據(jù)。
圖4 圖元自動(dòng)生產(chǎn)地理實(shí)體的SME方案流程圖
圖5是自動(dòng)化生成的SME方案的部分截圖,圖6是地理實(shí)體和圖元的組成關(guān)系約束配置截圖,圖中最左側(cè)分類(lèi)列出了各類(lèi)地理實(shí)體,中間和右側(cè)分別表達(dá)了左側(cè)地理實(shí)體允許被選中的子實(shí)體、圖元來(lái)組成,以此配置組成關(guān)系約束。
圖5 圖元自動(dòng)生產(chǎn)地理實(shí)體的SME方案截圖
圖6 地理實(shí)體和圖元的組成關(guān)系約束配置截圖
在iData數(shù)據(jù)工廠軟件中執(zhí)行該方案,即可得到需要的地理實(shí)體數(shù)據(jù)。圖7展示了一個(gè)自動(dòng)構(gòu)建的房屋地理實(shí)體的示例,示例房屋是一個(gè)由5個(gè)圖元組成的單地理實(shí)體,2個(gè)屋頂面、2個(gè)雨罩和1個(gè)表達(dá)自然幢的房屋面共同組成一個(gè)房屋地理實(shí)體,同時(shí)示例房屋還有一個(gè)機(jī)關(guān)團(tuán)體用地的父實(shí)體(即機(jī)關(guān)團(tuán)體用地實(shí)體是包含了這個(gè)房屋實(shí)體的聚合實(shí)體)。
圖7 自動(dòng)生成的房屋地理實(shí)體示例
在國(guó)家新型基礎(chǔ)測(cè)繪武漢試點(diǎn)項(xiàng)目中,該SME方案運(yùn)行效率較高,主流配置的筆記本電腦上,3分鐘即可構(gòu)建大約10萬(wàn)條地理實(shí)體數(shù)據(jù)。
依據(jù)本文的分析和實(shí)踐,從要素到圖元,再自動(dòng)化生成地理實(shí)體數(shù)據(jù)的過(guò)程可以通過(guò)ETL工具自動(dòng)化實(shí)現(xiàn),根據(jù)此流程設(shè)計(jì)的基于iData數(shù)據(jù)工廠的SME方案在國(guó)家新型基礎(chǔ)測(cè)繪武漢試點(diǎn)中,快速完成了地理實(shí)體構(gòu)建和建庫(kù)工作。
該方法可以在地理實(shí)體組成規(guī)則發(fā)生變化時(shí),快速地構(gòu)建出符合新規(guī)則要求的地理實(shí)體數(shù)據(jù),因此也適合地理實(shí)體數(shù)據(jù)的按需組裝。當(dāng)需要按需組裝時(shí),僅需修改組成規(guī)則,之后執(zhí)行SME方案,即可快速得到新的地理實(shí)體數(shù)據(jù)。
可見(jiàn),該方法既能夠應(yīng)用于從圖元數(shù)據(jù)構(gòu)建地理實(shí)體并建庫(kù),也能夠應(yīng)用與不同需求場(chǎng)合下獲得不同的地理實(shí)體庫(kù),具有較強(qiáng)的實(shí)用價(jià)值。