楊先洪 諸云強(qiáng) 朱 騰 楊秀權(quán) 楊 杰 孫 凱
(1.貴州國土資源技術(shù)信息中心,貴州貴陽 550000;2.中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京 100101;3.白洋淀流域生態(tài)保護(hù)與京津冀可持續(xù)發(fā)展協(xié)同創(chuàng)新中心,河北保定 071002;4.江蘇省地理信息協(xié)同創(chuàng)新中心,江蘇南京 210023;5.河南理工大學(xué)測繪與國土信息工程學(xué)院,河南焦作 454000;6.中國科學(xué)院大學(xué)資源與環(huán)境學(xué)院,北京 100049)
基于本體的地學(xué)數(shù)據(jù)建庫方法
楊先洪1諸云強(qiáng)2,3,4朱 騰5楊秀權(quán)1楊 杰2,6孫 凱2,6
(1.貴州國土資源技術(shù)信息中心,貴州貴陽 550000;2.中國科學(xué)院地理科學(xué)與資源研究所資源與環(huán)境信息系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室,北京 100101;3.白洋淀流域生態(tài)保護(hù)與京津冀可持續(xù)發(fā)展協(xié)同創(chuàng)新中心,河北保定 071002;4.江蘇省地理信息協(xié)同創(chuàng)新中心,江蘇南京 210023;5.河南理工大學(xué)測繪與國土信息工程學(xué)院,河南焦作 454000;6.中國科學(xué)院大學(xué)資源與環(huán)境學(xué)院,北京 100049)
地學(xué)數(shù)據(jù)資源具有多源、分散、異構(gòu)等特征,為了能夠充分共享和利用地學(xué)數(shù)據(jù)資源,必須有效集成并建立地學(xué)數(shù)據(jù)庫,但是傳統(tǒng)地學(xué)數(shù)據(jù)建庫方法存在著難以系統(tǒng)地認(rèn)知建庫對(duì)象,缺乏統(tǒng)一的語義支撐等問題。針對(duì)這些問題,本文提出并定義了地學(xué)數(shù)據(jù)本體模型、概念體系及其構(gòu)建方法,闡述了基于地學(xué)數(shù)據(jù)本體的數(shù)據(jù)建庫方法和流程。該方法在數(shù)據(jù)本體明確語義的支撐下,抽取出完善的數(shù)據(jù)實(shí)體關(guān)系模型,實(shí)現(xiàn)多源、異構(gòu)數(shù)據(jù)的映射、轉(zhuǎn)換與規(guī)范化處理,并利用數(shù)據(jù)本體準(zhǔn)確表達(dá)數(shù)據(jù)庫的語義信息。最后以貴州巖溶地下水?dāng)?shù)據(jù)庫構(gòu)建為例,進(jìn)行了方法的應(yīng)用驗(yàn)證。研究表明:地學(xué)數(shù)據(jù)本體通過對(duì)數(shù)據(jù)資源全生命周期共識(shí)概念、屬性、實(shí)例及其關(guān)系的形式化描述,可以有效克服傳統(tǒng)地學(xué)數(shù)據(jù)建庫方法的缺陷,更好地支撐和促進(jìn)地學(xué)數(shù)據(jù)資源的集成建庫。
數(shù)據(jù)本體;數(shù)據(jù)庫建設(shè);巖溶地下水;語義
地學(xué)數(shù)據(jù)是人們從事地球科學(xué)理論研究、調(diào)查考察、觀測探測、試驗(yàn)實(shí)驗(yàn)、模擬分析等活動(dòng)所產(chǎn)生的數(shù)據(jù),具有來源分散、時(shí)空跨度廣、類型格式多樣、數(shù)據(jù)量大等特點(diǎn)[1-2]。為了能夠有效利用地學(xué)數(shù)據(jù)資源,往往需要將這些多源、分散、異構(gòu)的數(shù)據(jù)進(jìn)行集成并建立規(guī)范化的數(shù)據(jù)庫。已有的傳統(tǒng)數(shù)據(jù)建庫方法,通常是利用實(shí)體關(guān)系模型(E-R),即先設(shè)計(jì)統(tǒng)一的關(guān)系型數(shù)據(jù)庫,然后利用ETL(抽取、轉(zhuǎn)換、裝載)、互操作或網(wǎng)絡(luò)服務(wù)等方法,將數(shù)據(jù)集成導(dǎo)入數(shù)據(jù)庫中[3-4]。但是,該方法存在兩大問題:一是由于缺乏對(duì)實(shí)體對(duì)象本質(zhì)的深刻認(rèn)知,在設(shè)計(jì)階段,實(shí)體屬性及其關(guān)系并沒有被系統(tǒng)梳理出來,導(dǎo)致實(shí)體關(guān)系模型設(shè)計(jì)的數(shù)據(jù)庫結(jié)構(gòu)往往只能反映實(shí)體對(duì)象的某個(gè)或某幾個(gè)方面的特性;二是由于缺乏對(duì)實(shí)體概念、屬性及其屬性值語義信息的準(zhǔn)確描述,導(dǎo)致不同來源語義異構(gòu)的數(shù)據(jù)很難集成在同一個(gè)數(shù)據(jù)庫中。本體作為領(lǐng)域共識(shí)的概念及其相互關(guān)系的形式化說明,已經(jīng)被廣泛用于解決領(lǐng)域地理對(duì)象識(shí)別、實(shí)體語義模糊性、語義搜索、數(shù)據(jù)分類、集成與關(guān)聯(lián)等方面的研究中[5-16]。然而,上述基于本體的建庫方法主要是利用領(lǐng)域本體解決專題數(shù)據(jù)分類、集成與關(guān)聯(lián)應(yīng)用等問題,還沒有將本體應(yīng)用到數(shù)據(jù)庫設(shè)計(jì)階段,也缺乏基礎(chǔ)的地學(xué)數(shù)據(jù)本體模型的支撐,導(dǎo)致領(lǐng)域本體間難以融合和轉(zhuǎn)換的問題。為此,本文開展了基于本體的地學(xué)數(shù)據(jù)建庫方法的研究。
地學(xué)數(shù)據(jù)本體是以地學(xué)數(shù)據(jù)為核心,地學(xué)數(shù)據(jù)全生命周期所涉及的、通過形式化方式表達(dá)的共識(shí)概念、實(shí)例及其關(guān)系。數(shù)據(jù)本體涉及數(shù)據(jù)采集生產(chǎn)、加工處理、存儲(chǔ)管理、交換共享和應(yīng)用分析等過程的所有概念和實(shí)例,包含數(shù)據(jù)特征概念,以及支撐或作用于數(shù)據(jù)的責(zé)任者、儀器設(shè)備和模型工具等。面向地學(xué)數(shù)據(jù)全生命周期的數(shù)據(jù)本體抽象模型如圖1所示。
地學(xué)數(shù)據(jù)特征概念是地學(xué)數(shù)據(jù)本體的核心,通過無歧義的語義表達(dá),支撐地學(xué)數(shù)據(jù)的分類集成、交換共享和分析應(yīng)用等。地學(xué)數(shù)據(jù)特征包括反映地學(xué)數(shù)據(jù)本質(zhì)的時(shí)間、空間、主題特征概念,以及反映地學(xué)數(shù)據(jù)形態(tài)的數(shù)學(xué)基準(zhǔn)、類型格式、語言字符、屬性語義等特征概念。責(zé)任者、儀器設(shè)備和模型工具也是地學(xué)數(shù)據(jù)本體的重要組成部分,主要對(duì)數(shù)據(jù)采集生產(chǎn)、加工處理等過程進(jìn)行準(zhǔn)確描述,有利于數(shù)據(jù)源追溯和質(zhì)量控制等。地學(xué)數(shù)據(jù)本體概念體系如圖2所示。
圖1 地學(xué)數(shù)據(jù)本體抽象模型
依據(jù)圖2的數(shù)據(jù)本體概念體系,將地學(xué)數(shù)據(jù)本體分為本質(zhì)本體、形態(tài)本體和來源本體。其中,本質(zhì)本體由反映地學(xué)數(shù)據(jù)本質(zhì)特征的概念組成,包括時(shí)間本體、空間本體、要素內(nèi)容本體;形態(tài)本體由反映地學(xué)數(shù)據(jù)形態(tài)特征的概念組成;來源本體由反映數(shù)據(jù)采集、處理的儀器設(shè)備、模型工具和責(zé)任者等概念組成。從本體構(gòu)建的角度,可以進(jìn)一步將數(shù)據(jù)本體分為基礎(chǔ)本體、領(lǐng)域本體和應(yīng)用本體?;A(chǔ)本體是指與領(lǐng)域無關(guān)的共性本體,包括:時(shí)間、空間、數(shù)學(xué)基準(zhǔn)、語言字符等本體;領(lǐng)域本體是指領(lǐng)域內(nèi)共識(shí)的本體,包括:主題內(nèi)容、類型格式、屬性語義(屬性值單位、分類代碼等)、儀器設(shè)備、模型工具等本體;應(yīng)用本體是指與具體相關(guān)的本體,包括:責(zé)任者或其他與某個(gè)應(yīng)用有關(guān)的本體。數(shù)據(jù)基礎(chǔ)本體可以充分重用現(xiàn)有的DAML、KSL、SWEET、GeoNames、EPSG等時(shí)間、空間和數(shù)學(xué)基準(zhǔn)本體;數(shù)據(jù)領(lǐng)域本體和應(yīng)用本體一般需要領(lǐng)域和應(yīng)用研究者根據(jù)領(lǐng)域知識(shí)和應(yīng)用場景由自己進(jìn)行構(gòu)建。
地下水是水資源的重要組成部分,指賦存并運(yùn)移于地面以下巖土空隙中的水。地下水是在一定水文地質(zhì)基礎(chǔ)(條件)下孕育產(chǎn)生的,并通過各種開發(fā)利用手段,實(shí)現(xiàn)水資源供給和環(huán)境支撐等功能。在開發(fā)利用過程中,將產(chǎn)生一系列環(huán)境地質(zhì)問題,并通過保護(hù)治理措施加以解決。因此,地下水領(lǐng)域本體抽象模型如圖3所示。
依據(jù)地下水本體抽象模型,地下水本體涉及的頂層概念主要包括[17-21]:水文地質(zhì)基礎(chǔ)、地下水資源、地下水環(huán)境、人類活動(dòng)、環(huán)境地質(zhì)問題。水文地質(zhì)基礎(chǔ)包括:地層、地質(zhì)構(gòu)造、包氣帶水、潛水、承壓水、孔隙水、裂隙水、巖溶水、暗河、泉、地下水系統(tǒng)、地下水類型、含水巖組、水文地質(zhì)參數(shù)、含水層等二級(jí)概念。地下水資源包括:地下水水位、水量、地下水補(bǔ)給、地下水消耗等二級(jí)概念。地下水補(bǔ)給又包括降水入滲、地表水補(bǔ)給、側(cè)向補(bǔ)給、越流補(bǔ)給等,而地下水消耗包括地下水開采、蒸發(fā)、地下水溢出、側(cè)向排泄、越流排泄等。地下水環(huán)境包括:地下水化學(xué)類型、水溫、水質(zhì)、地下水污染等二級(jí)概念。人類活動(dòng)包括:責(zé)任者和事件兩個(gè)二級(jí)概念,責(zé)任者包括鉆孔實(shí)施者、地下水采樣者、測試分析者、地下水資源評(píng)價(jià)者等實(shí)例,而事件包括水文地質(zhì)調(diào)查、地下水勘察、鉆孔施工、地下水監(jiān)測、水質(zhì)測試、水資源評(píng)價(jià)等實(shí)例。環(huán)境地質(zhì)問題包括:地面塌陷、降落漏斗、地裂縫、地下水污染、鹽漬化等二級(jí)概念。地下水核心概念、屬性、關(guān)系及其實(shí)例示例如表1所示。
數(shù)據(jù)本體支持下的地學(xué)數(shù)據(jù)建庫方法主要包含四大步驟(圖4):(1)依據(jù)領(lǐng)域本體概念、概念屬性、實(shí)例及其關(guān)系,抽象出數(shù)據(jù)庫實(shí)體、屬性及其實(shí)體關(guān)系,形成實(shí)體關(guān)系模型;(2)基于實(shí)體關(guān)系模型設(shè)計(jì)數(shù)據(jù)庫結(jié)構(gòu);(3)依據(jù)基礎(chǔ)和領(lǐng)域本體,對(duì)多源數(shù)據(jù)進(jìn)行語義消歧、數(shù)據(jù)格式等規(guī)范化轉(zhuǎn)換并入庫;(4)基于數(shù)據(jù)本體明確的語義描述對(duì)最終建成的數(shù)據(jù)庫進(jìn)行形式化表達(dá),以便后繼數(shù)據(jù)的持續(xù)集成。
圖3 地下水本體抽象模型
貴州省地處我國西南連片巖溶分布區(qū)的核心部位,巖溶地貌分布面積占全省61.9%,巖溶地下水極為豐富,巖溶地下水資源量占全省總水資源量的46%。為了合理開發(fā)利用巖溶地下水,自上世紀(jì)80年代中期,貴州省開展了水文地質(zhì)調(diào)查、地下水監(jiān)測、地下水資源評(píng)價(jià)、勘察找水等工作[22],形成了全省1:20萬的水文地質(zhì)普查、部分1:5萬的水文地質(zhì)調(diào)查、6個(gè)中心城市地下水長期監(jiān)測數(shù)據(jù)成果以及各類地下水研究報(bào)告等。這些數(shù)據(jù)資料和成果主要分散在貴州省地質(zhì)環(huán)境監(jiān)測院、貴州省地質(zhì)資料館、貴州省地礦局111地質(zhì)大隊(duì)、114地質(zhì)大隊(duì)等。
表1 地下水本體概念、屬性、關(guān)系及實(shí)例示例(以貴州巖溶地下水為例)
為了整合集成上述地下水?dāng)?shù)據(jù)資料,構(gòu)建形成統(tǒng)一的貴州省巖溶地下水?dāng)?shù)據(jù)庫,主要采用了以下3種方式:一是收集并規(guī)范化處理分散在各單位的電子數(shù)據(jù)文件;二是通過互操作技術(shù),實(shí)現(xiàn)地下水監(jiān)測數(shù)據(jù)庫的互連互通;三是通過文本挖掘技術(shù),提取各類研究報(bào)告中的地下水?dāng)?shù)據(jù)。在具體實(shí)現(xiàn)時(shí)(圖5),首先建立地學(xué)時(shí)間、空間、形態(tài)本體以及地下水領(lǐng)域本體[13-16];然后基于本體完成地下水?dāng)?shù)據(jù)庫結(jié)構(gòu)的設(shè)計(jì),保證數(shù)據(jù)庫結(jié)構(gòu)的系統(tǒng)性和完整性;在此基礎(chǔ)上,在本體的支持下,消除數(shù)據(jù)時(shí)空基準(zhǔn)、類型結(jié)構(gòu)和語義等方面的異構(gòu)性,實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換處理、互操作和挖掘抽??;最后對(duì)地下水?dāng)?shù)據(jù)庫中的各類數(shù)據(jù)進(jìn)行形式化的語義描述,建立數(shù)據(jù)字典。截止到2017年5月,貴州省地下水?dāng)?shù)據(jù)庫整合集成了自上世紀(jì)80年代起的貴州省水文地質(zhì)調(diào)查、地下水勘察、監(jiān)測和評(píng)價(jià)分析等方面的研究成果以及數(shù)據(jù)資料99GB,10萬多條數(shù)據(jù)記錄,并建立了貴州地下水?dāng)?shù)據(jù)資源管理系統(tǒng)(圖6)。
圖4 基于本體的地學(xué)數(shù)據(jù)建庫方法流程
圖5 基于本體的貴州巖溶地下水?dāng)?shù)據(jù)庫構(gòu)建
圖6 貴州地下水?dāng)?shù)據(jù)資源管理系統(tǒng)
本文從數(shù)據(jù)集成共享的角度,提出地學(xué)數(shù)據(jù)本體模型,并以貴州巖溶地下水?dāng)?shù)據(jù)庫構(gòu)建為案例,提出基于地學(xué)數(shù)據(jù)本體模型的領(lǐng)域本體構(gòu)建方法及其在數(shù)據(jù)集成建庫中的應(yīng)用。
一是提出并定義了數(shù)據(jù)本體,認(rèn)為數(shù)據(jù)本體是對(duì)數(shù)據(jù)資源全生命周期涉及的共識(shí)概念、實(shí)例及其關(guān)系的形式化描述,可以為數(shù)據(jù)資源的分類集成、數(shù)據(jù)庫設(shè)計(jì)與建設(shè),甚至是數(shù)據(jù)的采集處理、存儲(chǔ)管理和交換共享等應(yīng)用提供有效的語義支撐。地學(xué)數(shù)據(jù)本體是數(shù)據(jù)本體在地球科學(xué)領(lǐng)域的應(yīng)用,由時(shí)間、空間等基礎(chǔ)本體和主題內(nèi)容等領(lǐng)域本體構(gòu)成。基礎(chǔ)本體可以引用集成現(xiàn)有的知識(shí)本體,而后者則需要依據(jù)學(xué)科領(lǐng)域的特點(diǎn),進(jìn)行手工或半自動(dòng)的構(gòu)建。
二是基于本體提出數(shù)據(jù)建庫的方法:首先基于數(shù)據(jù)本體構(gòu)建實(shí)體關(guān)系模型,然后利用實(shí)體關(guān)系模型設(shè)計(jì)完善的數(shù)據(jù)庫結(jié)構(gòu),接著在本體的支持下完成數(shù)據(jù)的映射、轉(zhuǎn)換與規(guī)范化處理并入庫,最后利用數(shù)據(jù)本體記錄和表達(dá)數(shù)據(jù)庫結(jié)構(gòu)和語義信息。
三是以貴州巖溶地下水項(xiàng)目為對(duì)象驗(yàn)證了基于本體的地學(xué)數(shù)據(jù)庫構(gòu)建方法。該方法在數(shù)據(jù)本體明確語義的支撐下,首先抽取數(shù)據(jù)實(shí)體關(guān)系模型,指導(dǎo)數(shù)據(jù)庫結(jié)構(gòu)的設(shè)計(jì);然后利用數(shù)據(jù)本體實(shí)現(xiàn)多源、異構(gòu)數(shù)據(jù)的映射、轉(zhuǎn)換與規(guī)范化處理;最后通過數(shù)據(jù)本體標(biāo)識(shí)數(shù)據(jù)庫的語義信息。從而克服了傳統(tǒng)數(shù)據(jù)建庫方法難以系統(tǒng)地認(rèn)知建庫對(duì)象,缺乏統(tǒng)一的語義支撐等問題,并通過將地學(xué)數(shù)據(jù)本體與地下水領(lǐng)域本體與數(shù)據(jù)庫設(shè)計(jì)相結(jié)合,更好地支撐和促進(jìn)建立地學(xué)數(shù)據(jù)資源庫。
盡管筆者在已往的研究中已經(jīng)構(gòu)建了時(shí)間、空間和形態(tài)本體,下一步還應(yīng)繼續(xù)加強(qiáng)領(lǐng)域本體的研究與構(gòu)建,并研發(fā)地學(xué)數(shù)據(jù)本體標(biāo)注和轉(zhuǎn)換工具,提高數(shù)據(jù)語義標(biāo)注和轉(zhuǎn)換的效率與正確性。
[1]孫九林, 施慧中.中國地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)的構(gòu)建[J]. 中國基礎(chǔ)科學(xué), 2003(1): 76-81.DOI:10.3969/j.issn.1009-2412.2003.01.015.
[2]黃鼎成.科學(xué)數(shù)據(jù)共享的理論基礎(chǔ)與共享機(jī)制[J].中國基礎(chǔ)科學(xué), 2003(2): 22-27.DOI: 10.3969/j.issn.1009-2412.2003.02.005.
[3]龔健雅, 賈文玨, 陳玉敏, 等. 從平臺(tái)GIS到跨平臺(tái)互操作GIS的發(fā)展[J]. 武漢大學(xué)學(xué)報(bào)信息科學(xué)版, 2004,29(11): 985-989.DOI: 10.3321/j.issn: 1671-8860.2004.11.011.
[4]張鳴之, 諸云強(qiáng), 羅德利, 等. 地質(zhì)環(huán)境數(shù)據(jù)集成服務(wù)及其系統(tǒng)實(shí)現(xiàn)[J]. 中國地質(zhì)災(zāi)害與防治學(xué)報(bào), 2013,24(3): 84-89.
[5]何建邦, 李新通, 畢建濤, 等. 資源環(huán)境信息分類編碼及其與地理本體關(guān)聯(lián)的思考[J]. 地理信息世界, 2003(5):6-11.DOI: 10.3969/j.issn.1672-1586.2003. 05.003.
[6]李宏偉, 李勤超. 基于本體的土地利用數(shù)據(jù)分類分級(jí)表達(dá)[J]. 地域研究與開發(fā), 2009, 28(1): 82-85.DOI:10.3969/j.issn.1003-2363.2009.01.017.
[7]劉耀林, 李紅梅, 楊淳惠. 基于本體的土地利用數(shù)據(jù)綜合研究[J]. 武漢大學(xué)學(xué)報(bào)信息科學(xué)版, 2010, 35(8):883-886.
[8]周熙然, 邵振峰, 周壽章. 基于地理本體的空間傳感網(wǎng)數(shù)據(jù)處理[J]. 云南大學(xué)學(xué)報(bào)自然科學(xué)版, 2011(Z2):196-201.
[9]陳玉鑫, 李景文, 崔爽, 等. 基于地理本體的空間數(shù)據(jù)組織方法與應(yīng)用[J]. 測繪與空間地理信息, 2011, 34(6):47-49.DOI:10.3969/j.issn.1672-5867.2011. 06.015.
[10]宋佳, 王卷樂, 諸云強(qiáng), 等. 基于地理空間本體的語義檢索相關(guān)度研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 47(5):114-117.DOI: 10.3778/j.issn.1002-8331.2011.05.035.
[11]張樸, 王錫潔. 基于地理本體建模的河流階地識(shí)別方法研究: 以漢中盆地為例[J]. 安徽農(nóng)業(yè)科學(xué), 2014(10): 3080-3082.DOI: 10.3969/j.issn.0517-6611.2014.10.093.
[12]詹長根, 嚴(yán)盼, 涂李蕾, 等. 基于地理本體的土地空間面對(duì)象模型[J]. 測繪與空間地理信息, 2015(9): 12-16.DOI: 10.3969/j.issn.1672-5867.2015.09.005.
[13]侯志偉, 諸云強(qiáng), 高星, 等. 時(shí)間本體及其在地學(xué)數(shù)據(jù)檢索中的應(yīng)用[J]. 地球信息科學(xué)學(xué)報(bào), 2015, 17(4):379-390.DOI: 10.3724/SP.J.1047.2015.00379.
[14]王東旭, 諸云強(qiáng), 潘鵬, 等. 地理數(shù)據(jù)空間本體構(gòu)建及其在數(shù)據(jù)檢索中的應(yīng)用[J]. 地球信息科學(xué)學(xué)報(bào), 2016,18(4): 443-452.DOI:10.3724/SP.J.1047.2016.00443.
[15]羅侃, 諸云強(qiáng), 程文芳, 等. 極地科學(xué)數(shù)據(jù)關(guān)聯(lián)方法及應(yīng)用研究[J]. 極地研究, 2016, 28(3): 361-369.DOI:10.13679/j.jdyj.2016.3.361.
[16]孫凱, 諸云強(qiáng), 潘鵬, 等. 形態(tài)本體及其在地理空間數(shù)據(jù)發(fā)現(xiàn)中的應(yīng)用研究[J]. 地球信息科學(xué)學(xué)報(bào), 2016,18(8): 1011-1021.DOI:10.3724/SP.J.1047.2016.01011.
[17]張永波, 梁國玲, 張禮中, 等. 中國地下水資源空間數(shù)據(jù)庫標(biāo)準(zhǔn)化研究[J]. 地球?qū)W報(bào), 2003, 24(4): 371-374.DOI: 10.3321/j.issn:1006-3021.2003.04.015.
[18]彭淑惠. 云南巖溶區(qū)地下水及地質(zhì)環(huán)境數(shù)據(jù)庫建設(shè)[J].云南地質(zhì), 2005, 24(2): 232-239.DOI: 10.3969/j.issn.1004-1885.2005.02.013.
[19]張禮中, 周小元, 張永波, 等. 西北地下水資源數(shù)據(jù)庫及其網(wǎng)上發(fā)布[J]. 地球?qū)W報(bào), 2001, 22(4): 307-310.DOI: 10.3321/j.issn:1006-3021.2001.04.005.
[20]梁國玲, 張永波, 張禮中, 等. 基于GIS的中國地下水資源空間數(shù)據(jù)庫建設(shè)[J].地球?qū)W報(bào), 2007, 28(6): 572-578.DOI: 10.3321/j.issn:1006-3021.2007.06.010.
[21]梁國玲, 張永波, 張禮中, 等. 區(qū)域地下水資源數(shù)據(jù)庫標(biāo)準(zhǔn)建設(shè)問題探討[J]. 工程勘察, 2010, 38(6): 31-34.
[22]楊勝元. 貴州環(huán)境地質(zhì)[M]. 貴州: 貴州科技出版社,2008.
Ontology-based Geoscience Database Building Method
YANG Xianhong1, ZHU Yunqiang2,3,4, ZHU Teng5, YANG Xiuquan1, YANG Jie2,6, SUN Kai2,6
(1.Guizhou land and Resources Technology Information Center, Guiyang, Guizhou 550000; 2. State Key Laboratory of Resources and Environmental Information System, Institute of Geographic Sciences and Nature Resources Research , Beijing 100101; 3. Collaborative Innovation Centre for Baiyangdian Basin Ecological Protection and Jingjinji Regional Sustainable Development, Hebei University, Baoding, Hebei 071002; 4.Jiangsu Center for Collaborative Innovation in Geographical Information Resource Development and Application, Nanjing Normal University, Nanjing, Jiangsu 210023; 5. School of Surveying and mapping, Henan Polytechnic University, Jiaozuo, Henan 454000; 6. College of Resources and Environment, University of Chinese Academy of Sciences, Beijing 100049)
Geoscience data (Geo-data) resources have many characteristics, such as multi-sources, dispersed and heterogeneous. In order to fully share and make use of Geo-data, such datasets must be effectively integrated into databases. For traditional methods of Geo-data integration and database construction, they are difficult to systematically cognize target objects and lack unified semantic support. Firstly, this paper proposes the model, concept architecture and construction method of the Geo-data ontology. And then the data integration and database building method and process are introduced based on Geo-data ontology. Finally taking Guizhou karst groundwater database construction as an example, the proposed method is applied and veri fi ed. The result shows that Geo-data ontology which is the formal description of consensus concepts,instances, attributes and relations related to the whole life cycle of Geo-data resources, can e ff ectively support and promote Geo-data integration and database building, Geo-data exchanging, sharing and application.
data ontology, database construction, karst groundwater, semantics
P208
A
10.3772/j.issn.1674-1544.2017.05.004
楊先洪(1977—),男,貴州國土資源信息中心高級(jí)工程師,研究方向:地理信息系統(tǒng);諸云強(qiáng)(1977—),男,中國科學(xué)院地理科學(xué)與資源研究所研究員,研究方向:地球數(shù)據(jù)本體與共享、資源環(huán)境信息系統(tǒng)(通訊作者);朱騰(1992—),男,河南理工大學(xué)碩士研究生,研究方向:地理信息系統(tǒng);楊秀權(quán)(1981—),男,貴州國土資源信息中心,研究方向:地理信息系統(tǒng);楊杰(1990—),男,中國科學(xué)院地理科學(xué)與資源研究所碩士研究生,研究方向:地學(xué)模型數(shù)據(jù)匹配方法;孫凱(1990—),男,中國科學(xué)院地理科學(xué)與資源研究所博士研究生,研究方向:地學(xué)本體及數(shù)據(jù)關(guān)聯(lián)。
科技基礎(chǔ)性工作專項(xiàng)重點(diǎn)項(xiàng)目“科技基礎(chǔ)性工作數(shù)據(jù)資料集成與規(guī)范化整編”(2013FY110900);貴州省公益性基礎(chǔ)性地質(zhì)工作項(xiàng)目“貴州省巖溶地下水系統(tǒng)功能可持續(xù)利用性研究”(黔國土資地環(huán)函〔2014〕23號(hào));2016年貴州省公益性基礎(chǔ)性地質(zhì)工作項(xiàng)目“貴州省國土資源可持續(xù)發(fā)展戰(zhàn)略研究”(黔國土資源函〔2016〕269號(hào))。
2017年7月31日。