朱 曉 林,鄒 宇,易 琳,俞 肇 元
(南京師范大學(xué)虛擬地理環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210023)
基于模型需求模板匹配的多源地理數(shù)據(jù)推送方法研究
朱 曉 林,鄒 宇,易 琳,俞 肇 元*
(南京師范大學(xué)虛擬地理環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210023)
針對(duì)現(xiàn)有地理分析模型同多源復(fù)雜地學(xué)數(shù)據(jù)之間耦合困難、模型運(yùn)算數(shù)據(jù)處理過(guò)程復(fù)雜等問(wèn)題,構(gòu)建了以模型需求模板匹配為基礎(chǔ)的多源地理數(shù)據(jù)自動(dòng)處理與推送方法。利用元數(shù)據(jù)對(duì)多源地理數(shù)據(jù)進(jìn)行統(tǒng)一描述,并從模型的數(shù)據(jù)需求和任務(wù)需求兩個(gè)角度生成模型需求模板,最后通過(guò)基于XML的元數(shù)據(jù)與模型需求模板的匹配求得數(shù)據(jù)操作模板。在數(shù)據(jù)操作模板中應(yīng)用算子庫(kù)作為轉(zhuǎn)換工具,實(shí)現(xiàn)了數(shù)據(jù)庫(kù)數(shù)據(jù)到模型需求數(shù)據(jù)的轉(zhuǎn)換,完成模型運(yùn)算數(shù)據(jù)的自動(dòng)推送?;诮K沿海灘涂數(shù)據(jù)庫(kù)的分析案例表明,該文提出的模型模板匹配方法可對(duì)模型運(yùn)行數(shù)據(jù)進(jìn)行有效解析,并通過(guò)數(shù)據(jù)操作流的構(gòu)建實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)推送。該研究可為服務(wù)型GIS的發(fā)展及地理模型的集成提供理論參考與方法借鑒。
模型需求模板;模板匹配;操作模板;數(shù)據(jù)推送
GIS大眾化和服務(wù)化的發(fā)展趨勢(shì)要求能夠深入領(lǐng)會(huì)與理解大眾需求,提供簡(jiǎn)便易用的操作方式和良好的交互式體驗(yàn),減少用戶(hù)在原始數(shù)據(jù)預(yù)處理、需求數(shù)據(jù)提取上的重復(fù)工作與大量的人力、財(cái)力耗費(fèi)。以任務(wù)為出發(fā)點(diǎn)的GIS服務(wù)和以復(fù)雜地理空間數(shù)據(jù)為基礎(chǔ)的地理模型之間的矛盾導(dǎo)致在模型分析前需要對(duì)原始地理數(shù)據(jù)經(jīng)過(guò)復(fù)雜而專(zhuān)業(yè)的處理。地理分析任務(wù)的日益復(fù)雜化促進(jìn)了模型之間的耦合與集成,導(dǎo)致即使對(duì)于同一地理分析任務(wù),其中間的數(shù)據(jù)轉(zhuǎn)換與變換也可能存在較大的差異。上述新特性使得傳統(tǒng)基于數(shù)據(jù)抽取的方式已經(jīng)無(wú)法滿(mǎn)足目前的應(yīng)用需求,無(wú)論是從GIS服務(wù)易用性還是從模型集成的視角,均需要架構(gòu)地理模型與多源地理數(shù)據(jù)間的橋梁,通過(guò)明確模型對(duì)數(shù)據(jù)的具體需求,實(shí)現(xiàn)多源地理數(shù)據(jù)的按需推送。
數(shù)據(jù)推送是指數(shù)據(jù)庫(kù)服務(wù)器根據(jù)任務(wù)需求主動(dòng)發(fā)送數(shù)據(jù),同時(shí)保持?jǐn)?shù)據(jù)的實(shí)時(shí)更新與增量傳輸,相對(duì)于數(shù)據(jù)抽取方式的數(shù)據(jù)服務(wù),數(shù)據(jù)推送效率更高且不需要建立后續(xù)的服務(wù)連接,可實(shí)現(xiàn)任務(wù)數(shù)據(jù)的動(dòng)態(tài)更新[1]。基于任務(wù)自適應(yīng)的數(shù)據(jù)推送還可實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)匹配,并可有效控制數(shù)據(jù)更新的時(shí)間與頻率,保證任務(wù)的有序進(jìn)行[2,3]。數(shù)據(jù)推送因其靈活的數(shù)據(jù)共享機(jī)制和智能化數(shù)據(jù)交換方式,已在物聯(lián)網(wǎng)[4]、數(shù)據(jù)共享平臺(tái)構(gòu)建[5-7]、傳染病數(shù)據(jù)監(jiān)測(cè)[7]、空間信息服務(wù)[8]、金融交易監(jiān)測(cè)[9]等領(lǐng)域得到廣泛應(yīng)用,并提出了一系列數(shù)據(jù)推送系統(tǒng)[4,10]。以上研究雖然在數(shù)據(jù)推送方法上做了一定的探索,并將其應(yīng)用于各個(gè)領(lǐng)域,但也存在兩點(diǎn)不足:首先,需要的人工干預(yù)較多,模型的規(guī)則難以確定,可擴(kuò)展性和適應(yīng)性能力不強(qiáng)[11];其次,所處理的數(shù)據(jù)類(lèi)型和維度較為單一,不適用于多源地學(xué)數(shù)據(jù)。本文針對(duì)地理數(shù)據(jù)的維度特性,從數(shù)據(jù)的時(shí)間維度、空間維度、要素維度和類(lèi)型維度等出發(fā),構(gòu)建多源地理數(shù)據(jù)的專(zhuān)題分類(lèi)和元數(shù)據(jù)描述,同時(shí)通過(guò)對(duì)地理模型在任務(wù)和數(shù)據(jù)層結(jié)構(gòu)化的需求解析,實(shí)現(xiàn)模型需求模板的構(gòu)建。設(shè)計(jì)多源地理數(shù)據(jù)在空間坐標(biāo)、數(shù)據(jù)格式和數(shù)據(jù)處理等方面的基礎(chǔ)操作庫(kù),結(jié)合模型需求模板,搭建數(shù)據(jù)庫(kù)數(shù)據(jù)向模型需求數(shù)據(jù)轉(zhuǎn)化的數(shù)據(jù)流,實(shí)現(xiàn)數(shù)據(jù)的智能抽取和自動(dòng)推送,并以江蘇沿海灘涂數(shù)據(jù)為例做出應(yīng)用示范。
地理模型是數(shù)據(jù)應(yīng)用的落腳點(diǎn),也是地理數(shù)據(jù)轉(zhuǎn)換為信息的主要手段。模型內(nèi)部物理機(jī)制的差異性決定了其對(duì)數(shù)據(jù)類(lèi)型、專(zhuān)題等需求的差異,因而可構(gòu)建模型對(duì)數(shù)據(jù)的需求表征,建立數(shù)據(jù)相對(duì)于模型的統(tǒng)一接口描述,構(gòu)建模型到地理數(shù)據(jù)的匹配關(guān)系。為此,構(gòu)建了基于模型需求模板的數(shù)據(jù)推送流程: 1)針對(duì)多源地理數(shù)據(jù)構(gòu)建基于專(zhuān)題分類(lèi)的元數(shù)據(jù)描述,為需求模板匹配提供必要的接口;2)從模板任務(wù)和模板數(shù)據(jù)兩方面入手,構(gòu)建模型需求模板,并將生成的模板與地理數(shù)據(jù)元數(shù)據(jù)描述相匹配,得到從地理數(shù)據(jù)到模型運(yùn)行所需數(shù)據(jù)的映射;3)建立包含數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)處理和數(shù)據(jù)整合的操作算子庫(kù)系統(tǒng),結(jié)合數(shù)據(jù)與模型間的映射關(guān)系,構(gòu)建數(shù)據(jù)自動(dòng)推送的數(shù)據(jù)流結(jié)構(gòu),實(shí)現(xiàn)基于地理模型數(shù)據(jù)需求模板的數(shù)據(jù)推送。
2.1 多源地理數(shù)據(jù)專(zhuān)題分類(lèi)
地理數(shù)據(jù)分類(lèi)與地理數(shù)據(jù)編碼是地理數(shù)據(jù)建庫(kù)和編碼的基礎(chǔ)[12,13]。為了更好地組織多源地理數(shù)據(jù)并為地理模型的數(shù)據(jù)匹配提供基礎(chǔ),根據(jù)地理數(shù)據(jù)類(lèi)型和專(zhuān)題將多源地理數(shù)據(jù)劃分為5層:主題層、一級(jí)子類(lèi)、二級(jí)子類(lèi)、三級(jí)子類(lèi)和數(shù)據(jù)類(lèi)型層。主題層主要從地理信息專(zhuān)題屬性出發(fā),確定數(shù)據(jù)在高層次上的類(lèi)屬性,確定數(shù)據(jù)的專(zhuān)題數(shù)據(jù)和基礎(chǔ)數(shù)據(jù)歸屬;一級(jí)和二級(jí)子類(lèi)是對(duì)數(shù)據(jù)在專(zhuān)題和子類(lèi)專(zhuān)題上的劃分;三級(jí)子類(lèi)和數(shù)據(jù)類(lèi)型是對(duì)具體數(shù)據(jù)的劃分,確定數(shù)據(jù)的格式,為數(shù)據(jù)存儲(chǔ)提供便利。根據(jù)上述原則與方法,結(jié)合現(xiàn)有的多源地理數(shù)據(jù)資源情況,構(gòu)建多源地學(xué)數(shù)據(jù)專(zhuān)題分類(lèi)體系的一般描述:
M0={mi∈M|Ri}i=1,2,…,n
(1)
式中:Ri為第i類(lèi)數(shù)據(jù)的分類(lèi)體系,mi為第i類(lèi)數(shù)據(jù)的具體數(shù)據(jù)類(lèi)型。本文構(gòu)建的多源數(shù)據(jù)專(zhuān)題分類(lèi)體系和數(shù)據(jù)類(lèi)型的劃分與描述如表1所示。
表1 數(shù)據(jù)專(zhuān)題分類(lèi)
Table 1 Data classification by features
主題類(lèi)一級(jí)子類(lèi)二級(jí)子類(lèi)三級(jí)子類(lèi)數(shù)據(jù)類(lèi)型類(lèi)基礎(chǔ)數(shù)據(jù)專(zhuān)題數(shù)據(jù)地理格網(wǎng)經(jīng)緯網(wǎng)、控制點(diǎn)1∶5萬(wàn)格網(wǎng)矢量地形高程點(diǎn)、等高線、DEM江蘇省DEM矢量行政區(qū)國(guó)家級(jí)、地市級(jí)南京市柵格自然條件地質(zhì)、地貌、氣候氣候類(lèi)型文本數(shù)據(jù)社會(huì)經(jīng)濟(jì)人口、綜合經(jīng)濟(jì)文化程度二維表生態(tài)環(huán)境自然災(zāi)害、環(huán)境污染PM2.5數(shù)值數(shù)據(jù)
將多源地理數(shù)據(jù)在主類(lèi)劃分為基礎(chǔ)數(shù)據(jù)和專(zhuān)題數(shù)據(jù),其中基礎(chǔ)數(shù)據(jù)表示一類(lèi)可以通用的數(shù)據(jù),是專(zhuān)題數(shù)據(jù)劃分的基礎(chǔ),在一級(jí)子類(lèi)中表現(xiàn)為地理格網(wǎng)、居民地、行政區(qū)、地形等。專(zhuān)題數(shù)據(jù)表示以專(zhuān)題要素內(nèi)容信息為主要的分類(lèi)對(duì)象,在一級(jí)子類(lèi)中劃分為自然條件、自然資源、社會(huì)經(jīng)濟(jì)、基礎(chǔ)設(shè)施、生態(tài)環(huán)境等。
根據(jù)上述分類(lèi),構(gòu)建數(shù)據(jù)的十位數(shù)編碼系統(tǒng)。該分類(lèi)編碼中第一位為主碼,0表示基礎(chǔ)地理數(shù)據(jù),1表示專(zhuān)題數(shù)據(jù)。一、二、三級(jí)子類(lèi)分別表示數(shù)據(jù)的專(zhuān)題和子類(lèi)專(zhuān)題的劃分,共占6個(gè)字符位。最后三位表示數(shù)據(jù)類(lèi)型,其中第一個(gè)數(shù)據(jù)位表示數(shù)據(jù)的種類(lèi),如矢量數(shù)據(jù)、柵格數(shù)據(jù)和表數(shù)據(jù)等;后二位則對(duì)應(yīng)不同數(shù)據(jù)種類(lèi)的不同數(shù)據(jù)格式,如矢量數(shù)據(jù)有E00、Shapfile格式等。因此,該編碼系統(tǒng)具有分類(lèi)邏輯性強(qiáng)、代碼信息量豐富、便于進(jìn)行要素間關(guān)系推理判別等特點(diǎn)。
2.2 地理元數(shù)據(jù)描述
地理元數(shù)據(jù)(Metada)用于地理信息中地理數(shù)據(jù)集的內(nèi)容、質(zhì)量、表示方式、空間參考、管理方式等特征的描述,是實(shí)現(xiàn)地理空間信息共享的核心標(biāo)準(zhǔn)之一[14,15]。本文主要通過(guò)地理元數(shù)據(jù)實(shí)現(xiàn)對(duì)模型輸入數(shù)據(jù)和數(shù)據(jù)操作算子的接口匹配,并利用XML Schema實(shí)現(xiàn)地理元數(shù)據(jù)描述。 本文所使用的地理元數(shù)據(jù)主要包含:1)空間參數(shù)信息,包括數(shù)據(jù)的空間范圍、空間尺度、空間參考系和空間分辨率等,用于識(shí)別地理數(shù)據(jù)在空間上的特征;2)時(shí)間參數(shù)信息,包括數(shù)據(jù)的時(shí)間范圍、時(shí)間頻率和時(shí)間尺度等,用于數(shù)據(jù)在時(shí)間維度上的抽取與匹配;3)基本參數(shù)信息,包括數(shù)據(jù)的編碼、數(shù)據(jù)的格式和數(shù)據(jù)的其他必要信息,如數(shù)據(jù)的名字等。
3.1 地理模型的需求分析
對(duì)照常見(jiàn)的地理模型對(duì)數(shù)據(jù)的需求,可將其歸納為兩部分:基于模型任務(wù)解析的數(shù)據(jù)需求和基于模型數(shù)據(jù)解析的數(shù)據(jù)需求(圖1)。
圖1 模型的數(shù)據(jù)需求
Fig.1 Data requirements of models
從圖1可以看出,模型的任務(wù)需求主要建立在模型的整體應(yīng)用上,可分為空間和時(shí)間需求兩方面內(nèi)容。其中空間需求包括模型應(yīng)用的具體空間范圍和空間尺度的選擇。時(shí)間需求又可分為時(shí)間點(diǎn)或時(shí)間段的需求。模型的數(shù)據(jù)需求則是模型對(duì)不同類(lèi)型模型輸入數(shù)據(jù)的詳細(xì)要求,包括空間數(shù)據(jù)的投影、分辨率信息和非空間數(shù)據(jù)的格式、編碼等,主要用于確定數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)與模型輸入數(shù)據(jù)之間的差距,從而為后續(xù)操作算子的選取提供借鑒。
3.2 地理模型需求模板構(gòu)建
由于模型對(duì)數(shù)據(jù)的需求必須轉(zhuǎn)換為計(jì)算機(jī)可以識(shí)別的方式,構(gòu)建模型需求模板,在分析和歸納模型對(duì)地理數(shù)據(jù)的具體需求的前提下,統(tǒng)一用戶(hù)對(duì)模型數(shù)據(jù)的描述,實(shí)現(xiàn)需求的參數(shù)化設(shè)計(jì)。
根據(jù)上述模型任務(wù)需求的分析,模型對(duì)時(shí)間和空間的需求可轉(zhuǎn)換為模型在時(shí)間維度和空間維度上的范圍選取,對(duì)應(yīng)的任務(wù)需求模板構(gòu)建過(guò)程如圖2a所示。根據(jù)模型對(duì)具體數(shù)據(jù)的需求分析,模型數(shù)據(jù)的需求模板的構(gòu)建可以轉(zhuǎn)換為對(duì)具體數(shù)據(jù)的編碼、空間分辨率、數(shù)據(jù)格式、投影和基本操作的信息獲取,構(gòu)建過(guò)程如圖2b所示。
圖2 模型需求模板構(gòu)建
Fig.2 Requirements template of models
模型模板是用戶(hù)提供模型需求信息的入口,也是計(jì)算機(jī)匹配數(shù)據(jù)庫(kù)數(shù)據(jù)的基礎(chǔ),還是構(gòu)建數(shù)據(jù)流的條件。對(duì)模型模板的描述可統(tǒng)一模型到操作、模型到數(shù)據(jù)庫(kù)之間的接口,便于數(shù)據(jù)在三者之間的抽取與推送。對(duì)模型模板的XML描述如圖3所示:
圖3 模型需求模板X(qián)ML描述
Fig.3 The XML description of template
3.3 地理模型需求模板匹配
模型模板與數(shù)據(jù)庫(kù)元數(shù)據(jù)的匹配是指從模型模板中獲取關(guān)于數(shù)據(jù)的時(shí)間、空間、編碼、格式、坐標(biāo)等需求信息,并將其與數(shù)據(jù)庫(kù)元數(shù)據(jù)相應(yīng)要素對(duì)比,確定數(shù)據(jù)與需求之間的匹配程度和差異性,設(shè)定4種不同的操作模板。模型模板與數(shù)據(jù)庫(kù)元數(shù)據(jù)匹配過(guò)程及操作模板設(shè)定如圖4所示:其中A類(lèi)型模板是指當(dāng)數(shù)據(jù)庫(kù)數(shù)據(jù)和模型需求數(shù)據(jù)完全匹配時(shí),可直接推送數(shù)據(jù)庫(kù)數(shù)據(jù);B類(lèi)型模板是指數(shù)據(jù)庫(kù)數(shù)據(jù)與模型需求數(shù)據(jù)之間存在數(shù)據(jù)格式、坐標(biāo)等不匹配時(shí),需要調(diào)用數(shù)據(jù)轉(zhuǎn)換算子庫(kù)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理;C類(lèi)型模板是當(dāng)模型需要對(duì)屬性數(shù)據(jù)進(jìn)行一定處理時(shí),需要調(diào)用數(shù)據(jù)操作算子;D類(lèi)型模板則是指當(dāng)數(shù)據(jù)專(zhuān)題不匹配,需求將空間數(shù)據(jù)與屬性數(shù)據(jù)集成處理時(shí),調(diào)用數(shù)據(jù)整合操作。
圖4 不同情況下的數(shù)據(jù)操作模板
Fig.4 Different operation templates to different situations
4.1 操作算子庫(kù)構(gòu)建
通過(guò)地理模型任務(wù)解析,生成對(duì)應(yīng)于每個(gè)數(shù)據(jù)的操作算子,構(gòu)建數(shù)據(jù)庫(kù)數(shù)據(jù)到模型數(shù)據(jù)之間的銜接??紤]模型對(duì)數(shù)據(jù)的多類(lèi)型需求,本文構(gòu)建了如表2所示的算子庫(kù),主要包括3個(gè)部分:轉(zhuǎn)換算子庫(kù)、數(shù)據(jù)處理算子庫(kù)和整合算子庫(kù)。其中轉(zhuǎn)換算子庫(kù)又分為空間數(shù)據(jù)的轉(zhuǎn)換和統(tǒng)計(jì)數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)處理算子庫(kù)主要有針對(duì)統(tǒng)計(jì)數(shù)據(jù)的四則運(yùn)算和針對(duì)空間數(shù)據(jù)的數(shù)據(jù)剪切操作等;數(shù)據(jù)的整合算子主要實(shí)現(xiàn)空間數(shù)據(jù)和屬性數(shù)據(jù)的融合。
4.2 數(shù)據(jù)操作流構(gòu)建
根據(jù)上述模板匹配結(jié)果,確定數(shù)據(jù)庫(kù)數(shù)據(jù)與模型數(shù)據(jù)之間的差異性,選定對(duì)應(yīng)的操作模板,將操作算子嵌入到對(duì)應(yīng)的模板中,實(shí)現(xiàn)數(shù)據(jù)操作流的構(gòu)建。其實(shí)現(xiàn)過(guò)程為:通過(guò)模型與數(shù)據(jù)庫(kù)的對(duì)比和匹配,得出數(shù)據(jù)庫(kù)數(shù)據(jù)向模型輸入數(shù)據(jù)之間的抽取、轉(zhuǎn)換和操作等信息,以已經(jīng)構(gòu)建好的數(shù)據(jù)操作模板為引導(dǎo),自動(dòng)生成相應(yīng)的數(shù)據(jù)流,最后通過(guò)用戶(hù)手工選擇,填寫(xiě)或修改相應(yīng)的操作參數(shù)完成對(duì)數(shù)據(jù)流的構(gòu)建。數(shù)據(jù)流的自動(dòng)構(gòu)建流程如圖5所示。
表2 數(shù)據(jù)操作算子庫(kù)
Table 2 The operator libraries
算子集算子說(shuō)明空間數(shù)據(jù)轉(zhuǎn)換算子集統(tǒng)計(jì)數(shù)據(jù)轉(zhuǎn)換算子集數(shù)據(jù)處理算子集數(shù)據(jù)整合算子集DataTypeTrans()數(shù)據(jù)格式轉(zhuǎn)換DataCoordTrans()數(shù)據(jù)坐標(biāo)轉(zhuǎn)換Vector2RasterTrans()數(shù)據(jù)類(lèi)型轉(zhuǎn)換…………DataTypeTrans()柵格存儲(chǔ)格式之間轉(zhuǎn)換CodeTrans編碼轉(zhuǎn)換…………DataCalc()主要實(shí)現(xiàn)柵格單元的四則運(yùn)算DataCut()實(shí)現(xiàn)數(shù)據(jù)的剪切操作DataMerge()實(shí)現(xiàn)數(shù)據(jù)的合并操作AreaCalc實(shí)現(xiàn)面積和柵格數(shù)據(jù)分類(lèi)計(jì)算…………DataConjection()數(shù)據(jù)疊加融合
圖5 數(shù)據(jù)流的自動(dòng)構(gòu)建
Fig.5 Auto-construction of data flow
系統(tǒng)通過(guò)模型任務(wù)需求的時(shí)間和空間參數(shù),結(jié)合模型數(shù)據(jù)需求中的數(shù)據(jù)編碼參數(shù),實(shí)現(xiàn)數(shù)據(jù)抽取在時(shí)間、空間和屬性3個(gè)維度上的限定;數(shù)據(jù)的格式、地圖投影、分辨率等信息則對(duì)應(yīng)數(shù)據(jù)清洗操作中的數(shù)據(jù)格式轉(zhuǎn)換、投影轉(zhuǎn)換和重采樣等操作;數(shù)據(jù)的處理操作由模型數(shù)據(jù)需求的基礎(chǔ)操作信息提供,同時(shí)也可以通過(guò)用戶(hù)手動(dòng)選擇相應(yīng)的操作完成對(duì)數(shù)據(jù)處理的過(guò)程自定義;對(duì)于空間數(shù)據(jù)與統(tǒng)計(jì)數(shù)據(jù)整合的操作則需要按模型需求選定特定數(shù)據(jù)來(lái)完成。
4.3 基于數(shù)據(jù)流的地理數(shù)據(jù)推送方法
數(shù)據(jù)推送是將用戶(hù)主動(dòng)查詢(xún)、獲取信息改為系統(tǒng)主動(dòng)發(fā)送信息。通過(guò)已經(jīng)構(gòu)建好的數(shù)據(jù)流引導(dǎo),將數(shù)據(jù)庫(kù)中對(duì)應(yīng)數(shù)據(jù)抽取出來(lái),交互給數(shù)據(jù)流,實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換,最后推送給地理模型實(shí)現(xiàn)模型應(yīng)用。為實(shí)現(xiàn)自適應(yīng)的數(shù)據(jù)推送,本文利用XML構(gòu)建數(shù)據(jù)、操作、模型之間的統(tǒng)一接口,實(shí)現(xiàn)數(shù)據(jù)庫(kù)數(shù)據(jù)到模型數(shù)據(jù)的自動(dòng)轉(zhuǎn)換。數(shù)據(jù)庫(kù)與模型之間的XML信息用于判斷當(dāng)前流數(shù)據(jù)能否滿(mǎn)足模型運(yùn)算需求,數(shù)據(jù)與操作間的XML信息用于匹配適用的操作算子。
數(shù)據(jù)的推送過(guò)程如圖6所示,該過(guò)程以模型的特定需求為觸發(fā)器,若數(shù)據(jù)庫(kù)中數(shù)據(jù)直接滿(mǎn)足需要?jiǎng)t直接完成推送,否則需要在多源地理數(shù)據(jù)庫(kù)中獲取基礎(chǔ)數(shù)據(jù),再對(duì)數(shù)據(jù)進(jìn)行二次加工,將處理后數(shù)據(jù)再次與模型需求模板相匹配,達(dá)到模型應(yīng)用需求則構(gòu)建數(shù)據(jù)流操作,并推送處理后的數(shù)據(jù),否則推送失敗。與傳統(tǒng)的基于模型的數(shù)據(jù)抽取方法不同,基于數(shù)據(jù)流的和模型需求模板的推送是以模型應(yīng)用為目的,經(jīng)過(guò)抽取與數(shù)據(jù)的二次加工,針對(duì)模型需求的數(shù)據(jù)轉(zhuǎn)換,最后將其推送至模型應(yīng)用。
圖6 基于模板匹配的數(shù)據(jù)推送流程
Fig.6 Data pushing process based on template matching
以江蘇沿海大豐市為例,進(jìn)行海岸帶灘涂演變分析、土地利用結(jié)構(gòu)變化分析和景觀格局分析,并對(duì)上述方法的性能進(jìn)行驗(yàn)證。
5.1 數(shù)據(jù)與模型說(shuō)明
案例中使用的多源地理數(shù)據(jù)包括:2000年大豐市灘涂矢量數(shù)據(jù);1995年、2000年、2005年大豐市土地利用分類(lèi)解譯數(shù)據(jù)、景觀格局分類(lèi)解譯數(shù)據(jù)以及人口數(shù)據(jù)和面積數(shù)據(jù)。所使用的主要分析模型包括:1)大豐灘涂演變分析,通過(guò)對(duì)遙感數(shù)據(jù)的分類(lèi)解譯,得出灘涂結(jié)構(gòu)多年的變化情況;2)大豐市土地利用人均占比分析;3)景觀格局分析,利用分類(lèi)好的景觀柵格數(shù)據(jù),統(tǒng)計(jì)各單元值,計(jì)算景觀的各指數(shù)。
5.2 模型需求模板與操作流構(gòu)建
利用模型的數(shù)據(jù)需求,構(gòu)建模型需求模板,通過(guò)比對(duì)數(shù)據(jù)庫(kù)中的多源數(shù)據(jù),選取針對(duì)不同需求的操作模板,構(gòu)建符合模型數(shù)據(jù)需求的操作流。下面詳細(xì)分析各模型構(gòu)建的操作流:1)大豐灘涂演變分析:為了獲取大豐市灘涂范圍數(shù)據(jù),需要獲取多年的遙感數(shù)據(jù)、大豐市灘涂范圍的矢量數(shù)據(jù),通過(guò)柵格數(shù)據(jù)的剪切操作獲取灘涂數(shù)據(jù)。同時(shí),為了保證數(shù)據(jù)的一致性,需要保證矢量和柵格數(shù)據(jù)都在同一個(gè)坐標(biāo)系下。2)大豐市土地利用人均占比分析:人均土地利用需要獲取多年的大豐市土地利用的遙感解譯圖和同時(shí)段大豐市人口數(shù)據(jù),通過(guò)柵格單元統(tǒng)計(jì)和人口比值計(jì)算,得到土地利用的人均占比數(shù)據(jù)。3)景觀格局分析:需要景觀柵格的分類(lèi)數(shù)據(jù)作為數(shù)據(jù)源,通過(guò)柵格單元統(tǒng)計(jì)得到分析模型數(shù)據(jù)。
5.3 數(shù)據(jù)推送與模型分析結(jié)果
利用模型需求模板匹配,從原始數(shù)據(jù)庫(kù)里抽取灘涂矢量數(shù)據(jù)、遙感數(shù)據(jù)和屬性數(shù)據(jù),經(jīng)模型數(shù)據(jù)操作流處理,得到圖7a所示的3個(gè)不同年份的推送結(jié)果。進(jìn)一步對(duì)其分析,設(shè)定模型運(yùn)行參數(shù)(圖7b),最終得到大豐景觀格局分析結(jié)果(圖7c)和土地利用格局分析結(jié)果(圖7d)。
圖7 推送數(shù)據(jù)及模型分析結(jié)果
Fig.7 Pushing data and the results of model analyzing
地理模型與地理數(shù)據(jù)的有效對(duì)接是實(shí)現(xiàn)快速、整合的地理分析的關(guān)鍵?;谀P托枨蟮牡乩頂?shù)據(jù)快速匹配與推送可有效降低地理模型耦合、集成共享的復(fù)雜度。本文基于常用的地理數(shù)據(jù)格式及其分類(lèi)定義了多源地學(xué)數(shù)據(jù)的元數(shù)據(jù)描述,為模型需求匹配建立統(tǒng)一的接口;構(gòu)建了基于任務(wù)需求和數(shù)據(jù)需求的模型模板生成方法,并將其與元數(shù)據(jù)描述相匹配,得到不同匹配程度下的操作模板;構(gòu)建了數(shù)據(jù)操作算子集,并將其插入到操作模板中形成數(shù)據(jù)操作流,得到源數(shù)據(jù)到模型需求數(shù)據(jù)的轉(zhuǎn)換,從而實(shí)現(xiàn)模型運(yùn)行數(shù)據(jù)的自動(dòng)推送?;谝陨侠碚撆c思路,進(jìn)行了原型系統(tǒng)的設(shè)計(jì)與構(gòu)建,基于典型地理數(shù)據(jù)的案例分析表明:通過(guò)整合多源地理數(shù)據(jù),構(gòu)建基于模型需求的數(shù)據(jù)維度抽取和數(shù)據(jù)流的推送方法可以實(shí)現(xiàn)模型與數(shù)據(jù)之間的對(duì)接,進(jìn)而實(shí)現(xiàn)模塊化、結(jié)構(gòu)化的模型分析操作流與應(yīng)用;基于模型需求模板解析的自動(dòng)推送,在方法和應(yīng)用上都對(duì)大眾化GIS的發(fā)展起到借鑒作用。
[1] 孫君曼,方華京.基于推技術(shù)的網(wǎng)絡(luò)化監(jiān)控報(bào)警系統(tǒng)[J].計(jì)算機(jī)工程,2008(4):269-271.
[2] FRANKLIN M,ZDONIK S."Data in your face":Push technology in perspective:ACM SIGMOD Record,1998[C].ACM.1998.
[3] BESSIS N.Model architecture for a user tailored data push service in data grids[A].Grid Technology for Maximizing Collaborative Decision Management and Support:Advancing Effective Virtual Organizations[C].2009.235-255.
[4] 梁昌勇,張怡遠(yuǎn),張俊嶺.基于Pushlet的RFID數(shù)據(jù)推送技術(shù)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009(10):85-88.
[5] 廖一蘭,王勁峰,孟斌,等.人口統(tǒng)計(jì)數(shù)據(jù)空間化的一種方法[J].地理學(xué)報(bào),2007(10):1110-1119.
[6] 諸云強(qiáng),馮敏,宋佳,等.基于SOA的地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)[J].地球信息科學(xué)學(xué)報(bào),2009(1):1-9.
[7] 李新,南卓銅,吳立宗,等.中國(guó)西部環(huán)境與生態(tài)科學(xué)數(shù)據(jù)中心:面向西部環(huán)境與生態(tài)科學(xué)的數(shù)據(jù)集成與共享[J].地球科學(xué)進(jìn)展,2008(6):628-637.
[8] 亢孟軍,王貝,杜清運(yùn),等.上下文敏感的空間信息服務(wù)智能推送研究[J].測(cè)繪科學(xué),2011,36(3):155-157.
[9] 薛真真.基于服務(wù)器推送和事件流處理技術(shù)的實(shí)時(shí) Web 系統(tǒng)研究[D].杭州:浙江大學(xué),2008.
[10] 汪紅兵,佘春東,范植華,等.基于JMS的數(shù)據(jù)推送系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2005,25(Z1):366-368.
[11] SUN X,BYNA S,CHEN Y.Server-based data push architecture for multi-processor environments[J].Journal of Computer Science and Technology,2007,22(5):641-652.
[12] 王大力.數(shù)字化地圖制圖要素分類(lèi)編碼[J].地球信息科學(xué),2008,10(6):736-740.
[13] 符海芳,牛振國(guó),崔偉宏.多維農(nóng)業(yè)地理信息分類(lèi)和編碼[J].地理與地理信息科學(xué),2003,19(3):29-31,58.
[14] 王卷樂(lè),游松財(cái),謝傳節(jié).地學(xué)數(shù)據(jù)共享中的元數(shù)據(jù)標(biāo)準(zhǔn)結(jié)構(gòu)分析與設(shè)計(jì)[J].地理與地理信息科學(xué),2005,21(1):16-18,37.
[15] DUKE C,STEELE J.Geology and lithic procurement in Upper Palaeolithic Europe:A weights-of-evidence based GIS model of lithic resource potential[J].Journal of Archaeological Science,2010,37(4):813-824.
Study on Pushing Method for Multi-resource Geographic Data Based on the Matching of RTOM
ZHU Xiao-lin,ZOU Yu,YI Lin,YU Zhao-yuan
(Key Laboratory of VGE,Ministry of Education,Nanjing Normal University,Nanjing 210023,China)
The coupled integration of geographic analyzing models with multi-resource complex geographic data is complex.To reduce the complexity of the model computing and data manipulating in the model-data integration process,this paper constructs an automatic manipulating and pushing method for multi-resource geographic data based on the matching of requirement template of models(RTOM).The multi-resource geographic data are first uniformly described by the metadata.Based on the standpoints of data and mission requirements,the requirement templates of the models are generated.Then,the data manipulating template is obtained by matching XML-based metadata with the requirement templates of the models.In the data manipulating template,operator library is used as transforming tool to realize the transform from database data to model-requirement data and achieve automatic push of model computing data.Case studies based on the coastal beach database of Jiangsu Province are operated.The results suggest our method can effectively analyze model data and realize automatic data push by construction of data operation flow.Therefore,this research provides useful theoretic and methodological references for development of service-oriented GIS and integration of geographic models.
requirement template of models(RTOM);template matching;data manipulating template;data pushing
2014-09-24;
2014-11-29
國(guó)家科技支撐計(jì)劃課題(2012BAC07B01);國(guó)土部海岸帶開(kāi)發(fā)與保護(hù)重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金項(xiàng)目(2013CZEPK08);江蘇省高校自然科學(xué)基金項(xiàng)目(12KJD170003)
朱曉林(1989-),男,碩士研究生,主要研究領(lǐng)域?yàn)榈乩硇畔⑾到y(tǒng)。*通訊作者E-mail:yuzhaoyuan@njnu.edu.cn
10.3969/j.issn.1672-0504.2016.01.005
P208
A
1672-0504(2016)01-0024-05