張志軍,李承鑫
(1.天津市測繪院,天津 300381; 2.武漢大學(xué)測繪遙感信息工程國家重點實驗室,湖北武漢 430079)
一種構(gòu)建地理國情本體屬性庫的方法
——以天津市為例
張志軍1,2?,李承鑫1
(1.天津市測繪院,天津 300381; 2.武漢大學(xué)測繪遙感信息工程國家重點實驗室,湖北武漢 430079)
地理國情監(jiān)測是測繪服務(wù)科學(xué)發(fā)展的新手段和新途徑,其主要任務(wù)是為各級政府綜合決策提供客觀、公正和準確的專題信息。如何實現(xiàn)地理國情專題信息的語義共享是地理國情提供跨行業(yè)、跨部門和跨學(xué)科的地理信息服務(wù)亟須解決的關(guān)鍵問題。本文基于本體的理論,提出一種構(gòu)建地理國情本體屬性庫的方法,以天津市地理國情監(jiān)測內(nèi)容及其服務(wù)行業(yè)為知識域,對地理國情進行概念化和形式化表達,并用protégé軟件實現(xiàn)了本體屬性庫的建設(shè)。
地理國情監(jiān)測;地理概念;語義;本體
地理國情是我國基本國情的重要組成部分,是從地理的角度分析、研究和描述國情,是空間化可視化的國情信息[1]。其內(nèi)容涵蓋了國土疆域、地形地貌、地表覆蓋、交通網(wǎng)絡(luò)、江河湖泊、城鎮(zhèn)布局、人口與生產(chǎn)力空間分布、資源環(huán)境狀況、災(zāi)害分布等豐富的自然與人文地理信息[2]。地理國情的內(nèi)涵決定了地理國情具有跨行業(yè)、跨部門、跨學(xué)科等特性。
地理國情監(jiān)測是綜合利用以3S技術(shù)為核心的現(xiàn)代測繪技術(shù),對地理國情進行動態(tài)、定量的監(jiān)測,從地理空間的角度客觀、綜合展示國情國力。地理國情監(jiān)測是黨和國家賦予測繪工作的新職責(zé)、新任務(wù)和新要求,是測繪服務(wù)科學(xué)發(fā)展的新手段、新途徑。開展地理國情監(jiān)測工作應(yīng)立足于基礎(chǔ)測繪,重點為各級政府綜合規(guī)劃、決策、監(jiān)督等服務(wù),提供客觀、公正和準確的參考信息和數(shù)據(jù),與此同時與相關(guān)業(yè)務(wù)主管部門的管理和監(jiān)測內(nèi)容互為補充[3]。
天津市地理國情監(jiān)測項目于2011年就45個專題展開了監(jiān)測工作,并將監(jiān)測成果整理入庫,建立監(jiān)測系統(tǒng)為各行業(yè)和部門提供地理信息產(chǎn)品服務(wù)。為輔助不同領(lǐng)域的用戶對地理國情相關(guān)地理概念的理解,從而提升地理國情服務(wù)的通用性和適用性,本文試圖以該監(jiān)測體系中的地理國情專題信息為概念范疇,以形式本體為基礎(chǔ),分析地理國情涉及地理概念的語義,提出一種構(gòu)建地理國情本體屬性庫的方法。
地理信息共享和互操作一直是地理信息科學(xué)領(lǐng)域的熱點問題,目前不同系統(tǒng)之間的互操作在語法層面得到了較好解決,然而在信息語義層面僅有一些階段性的成果[4~9],想要達到地理信息系統(tǒng)設(shè)計與開發(fā)者追求的“最高境界”[10]還有待深入的研究和探索,地理信息的語義建模被認為是具有挑戰(zhàn)性的關(guān)鍵課題[11]。如何從用概念表達的對象中抽取出其本體語義,是建立地理國情本體的關(guān)鍵和實現(xiàn)地理國情信息共享的基礎(chǔ)。國內(nèi)外很多學(xué)者試圖利用本體方法研究地理概念語義[12~20],這種方法也被認為是地理信息集成和共享的有效途徑。與此同時,地理本體和應(yīng)用本體在地理信息集成方面也取得了一定的成果。
綜上所述,本體方法可以在一定條件下實現(xiàn)不同數(shù)據(jù)集的集成,也能在特定語義層次上完成地理對象的語義轉(zhuǎn)化,然而如果地理對象缺乏明確的、形式化的語義表達,將會為其共享造成巨大的不便。
3.1 概念的描述
對地理對象的概念性描述一般都是基于自然語言文字的,與描述者的知識、經(jīng)驗和背景有很大的關(guān)系,導(dǎo)致在概念描述時存在著很大的歧義性。如“高層建筑”在維基百科中被描述為:“具有較多層數(shù)高度較高的建筑”,其中“較多”和“較高”兩個術(shù)語帶有很強的主觀性,其判別閾值取決于領(lǐng)域背景:中國《民用建筑設(shè)計通則》將10層及以上的住宅建筑和高度超過24 m是公共建筑稱為高層建筑;而《日本建筑大辭典》將5層~6層至14層~15層的建筑定為高層建筑。
3.2 語義表達的方法
對地理概念的語義描述就是表達從一個地理概念空間到另一個地理概念空間的映射關(guān)系。地理概念空間之間的映射關(guān)系的研究也是當(dāng)前認識語言學(xué)領(lǐng)域?qū)φZ義理論研究的一個熱點[21]。地理概念空間的轉(zhuǎn)換或?qū)?yīng)主要有比喻法、代數(shù)法、概念集成/綁定法和屬性枚舉法,其中屬性枚舉法是最容易理解的方法,即將概念的屬性一一列舉出來。
每個概念都與一定的屬性或性質(zhì)關(guān)聯(lián),這些定義的屬性足已確定對象的相關(guān)外延[22]。屬性枚舉法就是基于這點,用地理概念擁有的屬性來描述概念。如“高層建筑”可以用“占地面積”,“建筑面積”、“層數(shù)”、“高度”等描述其特征。即如何找到概念(“高層建筑”)的本質(zhì)屬性(本體性質(zhì))是枚舉法的關(guān)鍵。
3.3 形式本體和概念化
為減少對地理國情描述的歧義和澄清自然文字描述的語義,需要對地理國情所表達的對象的本質(zhì)進行分析,明確地理對象的本體語義。為達此目標,形式本體的方法為地理國情的概念化提供了有力理論基礎(chǔ)。形式本體指用系統(tǒng)的、形式的和公理的方法對事物存在的形式和方式進行的邏輯開發(fā)的方式。本體被描述為用于描述形式詞匯意圖含義的邏輯理論,即對世界特殊概念化的本體承諾。
根據(jù)創(chuàng)建本體的5個基本準則(清晰性、一致性、可擴展性、最小編碼偏差及最小本體承諾),本文基于本體開發(fā)工程理論和已有的本體創(chuàng)建方法,結(jié)合天津市地理國情監(jiān)測內(nèi)容的特征,提出了一種構(gòu)建天津市地理國情本體的方法。主要包括5個步驟,如圖1所示。
(1)明確本體的范圍和目的:本文所要構(gòu)建的地理國情本體庫包含概念的范圍為天津市地理國情中所有的地理概念;本體建立的目的是為天津市地理國情概念建立一套語義描述體系,從而為地理國情信息的共享和語義互操作服務(wù)。
(2)列舉概念:盡可能列舉出領(lǐng)域內(nèi)的所有概念,對每個概念在不同領(lǐng)域中的定義進行資料分析和總結(jié),得到每個概念的定義并集。
圖1 構(gòu)建地理國情本體的步驟
(3)概念化:采用屬性枚舉法對每個概念進行語義表達,形成知識框架。
(4)形式化表達:用形式化語言將先前得到的天津市地理國情概念模型進行外在表達,本文采用OWL DL語言進行本體的表達和建庫。
(5)評價驗證:根據(jù)相應(yīng)的評價標準對所建立的本體進行驗證。
本文所述的方法是一個迭代的過程,所創(chuàng)建的地理國情本體在特定階段是一個相對完善的本體,隨著客觀世界的變化和地理國情內(nèi)涵的豐富,還需要反復(fù)的評價與修改。
4.1 天津市地理國情本體構(gòu)建的范圍和目的
天津市地理國情監(jiān)測項目從城市建設(shè)、生態(tài)環(huán)境、地表變化、土地利用和地質(zhì)變化5個方面就城鎮(zhèn)化進程等45個專題展開了監(jiān)測工作。本文所構(gòu)建的本體庫的所涉及的地理概念范圍與之相對應(yīng),詳情如表1所示。
天津市地理國情本體庫涉及概念示例表 表1
4.2 天津市地理國情的概念化
天津市地理國情的概念化是指以天津市地理國情所涉及的地理概念為研究對象,分析其所要服務(wù)的知識領(lǐng)域,根據(jù)相關(guān)標準建立概念的語義描述集,確定每個概念語義的描述集和屬性集,從中提取出本體屬性集,從而實現(xiàn)地理信息的概念化,具體過程如圖2所示。
圖2 地理國情的概念化過程
以水系為地理國情概念對象,其水系的概念化定義為:
D={水系對象域}
W={水系對象所有可能狀態(tài)}
假定V為地理國情中涉及水系的詞匯,水系的形式本體為:
4.3 天津市地理國情形式化表達
本體描述語言從自然語言到描述邏輯形式多種多樣,語言的形式化和規(guī)則性越高就越利于機器理解。對于地理國情本體,支持推理的能力是很重要的,它可以檢測概念間是否互相矛盾,以保證本體的質(zhì)量。網(wǎng)絡(luò)本體語言O(shè)WL(Web Ontology Language)是由W3C(國際萬維網(wǎng)聯(lián)盟)發(fā)布的共享本體的標記語言,用來描述萬維網(wǎng)文檔和應(yīng)用中的類和類之間的關(guān)系,并可以通過形式化語義實現(xiàn)邏輯推理。綜合考慮地理國情本體所需要的表達力和推理能力后,本文使用OWL DL作為地理國情本體的描述語言。它主要針對概念、性質(zhì)、個體之間關(guān)系的描述,以保證強大的語義表達能力。
由OWL描述的一個本體主要包括三種組成元素:類(class),實例(individual)和屬性(property)。類代表一些實例的集合,OWL還支持對簡單類進行并、交、補運算等集合操作得到的復(fù)雜類;實例作為類的成員出現(xiàn),是領(lǐng)域中實際感興趣的對象;屬性是實例之間的二元關(guān)系。在OWL中有兩種屬性:對象屬性和數(shù)據(jù)屬性。
4.4 地理國情本體屬性庫的構(gòu)建
選擇合適的建庫工具是快速、成功地構(gòu)建本體的關(guān)鍵。好的本體編輯軟件應(yīng)該具備本體錄入、一致性檢查、可視化、查詢、推理等功能。protégé軟件是目前使用最廣泛的本體編輯器之一,它提供了圖形化和交互式的本體設(shè)計環(huán)境,其OWL Plug-in支持OWL描述語言,滿足地理國情本體屬性庫的構(gòu)建需求。
在OWL語言語法中,一個本體屬性由類(A)、實例(B)、屬性(C)三部分組成,并采用三元組(A→CB)描述三者的關(guān)系。使用protégé軟件構(gòu)建地理國情本體屬性庫的過程也就是對地理國情本體屬性的每個組成部分進行構(gòu)建的過程:
類的構(gòu)建:建立基本本體屬性(如“對象”、“成因”、“時間性”、“物質(zhì)性”、“空間性”、“量度”等)的所有子類及實例,如圖3所示。
圖3 屬性的創(chuàng)建
實例的構(gòu)建:針對個頂?shù)谋倔w屬性(如“成因”),其分支及具體值即為實例(“成因”可分為“人工”和“天然”,而“天然”的實例有“冰川作用”、“風(fēng)蝕作用”等),如圖4所示。
屬性的構(gòu)建:對于“功能”、“目的”之類的動詞,在protégé中采用屬性進行表達,如圖5所示。
圖4 實例的創(chuàng)建
圖5 類的創(chuàng)建
測繪地理信息科技發(fā)展在“十二五”提出了“構(gòu)建數(shù)字中國、監(jiān)測地理國情、發(fā)展壯大產(chǎn)業(yè)、建設(shè)測繪強國”的總體發(fā)展戰(zhàn)略。地理國情監(jiān)測工作將是我國測繪地理信息發(fā)展的新方向,本文就如何提供地理國情信息服務(wù)展開思考和研究,通過分析發(fā)現(xiàn),要實現(xiàn)地理國情信息語義共享的關(guān)鍵是使其語義描述明確且形式化,而本體屬性枚舉法是一種有效的方法。
在此基礎(chǔ)上,本文以天津市2011年監(jiān)測成果及其服務(wù)行業(yè)為研究對象,提出了一種地理國情本體的建庫方法,這種方法可以應(yīng)用其他地理概念的形式語義分析,得出明確的形式語義,為解決地理信息的語義共享提供有效的理論基礎(chǔ)和技術(shù)方法。然而,地理國情涉及地理概念極其復(fù)雜,如何在地理國情本體屬性庫的基礎(chǔ)上,真正實現(xiàn)所有行業(yè)之間的語義關(guān)系的推理和定制化地理國情信息的提取,還有待于進一步研究。
[1] 徐德明.監(jiān)測地理國情服務(wù)科學(xué)發(fā)展[N].人民日報,2011-03-29.
[2] 張繼賢,劉繼平.關(guān)于地理國情監(jiān)測的若干思考[N].中國測繪報,2011-3-8.
[3] 劉若梅.測繪部門開展地理國情監(jiān)測工作的定位思考[N].中國測繪報,2011-4-8.
[4] Bishr Y.Overcoming the Semantic and Other Barriers to GIS Interoperability[J].International Journal of Geographical Information Science,1998,299~314.
[5] Fonseca F.Egenhofer M.Using Ontologies for Integrated Geographic Information Systems[J].Transactions in GIS,2002,6(3) [6] Frank A.U.Tiers of ontology and consistency constraints in geographic information systems[J].International Journal of Geographical Information Science, 2001,667~678.
[7] Kavouras M.and Kokla M.Ontology-Based Fusion of Geographic Databases,Spatial Information Management,Experiences and Visions for the 21st Century,International Federation of Surveyors,2000.
[8] Klien,E.,Lutz,M.Ontology-Based Discovery of Geographic Information Services-An Application in Disaster Management [J].Computers,Environment and Urban Systems,2006,30 (1):102~123.
[9] Bernard,L.,U.Einspanier,S.Ontology-based Discovery and Retrieval of Geographic Information in Spatial Data Infrastructures[R].Geotechnologien Science Report No.4,2004.
[10] Vckovsky,A.Special Issue:Interoperability in GIS[J].International Journal of Geographical Information Science,1998,12(4):297~298.
[11] Kuhn W.Modeling the Semantics of Geographic Categories through Conceptual Integration[J].GIScience 2002,108~118.
[12] Dean Jones.Developing shared ontologies in multi-agent systems[A].In ECAI’98Workshop on Intelligent Information Integration[C].Brighton,U.K.,August,1998.
[13] Kavouras M.Kokla M.Comparing Categories among geographic ontologies[J].Computers&Geosciences,2005,31 (2):145~154.
[14] Tomai E.and Spanaki M.From ontology design to ontology implementation:A web tool for building geographic ontologies[A].8th AGILE Conference on Geographic Information Science[C].2005.
[15] 張德海.NKI國家和地區(qū)地理知識的獲取與分析[D].昆明:云南師范大學(xué),2002.
[16] 陳建軍,周成虎,王敬貴.地理本體的研究進展與分析[J].地學(xué)前緣,2006,13(3):81~88.
[17] 崔巍.用本體實現(xiàn)地理信息系統(tǒng)語義集成和互操作[D].武漢:武漢大學(xué),2003.
[18] 景東升.基于本體的地理空間信息語義表達和服務(wù)研究[D].北京:中國科學(xué)院研究院,2005.
[19] 孫敏,陳秀萬,張飛舟.地理信息本體論[J].地理與地理信息科學(xué),2004,20(3):6~11.
[20] 王紅,李霖,王振峰.基于本體的基礎(chǔ)地理信息分類層次研究[J].地理信息世界,2005,3(5):27~30.
[21] Fauconnier,G.Mappings in Thought and Language[M]. Cambridge uk:Cambridge University Press,1997.
[22] 汪子嵩.亞里士多德關(guān)于本體的學(xué)說[M].北京:人民出版社,1997.
中國城市規(guī)劃協(xié)會城市勘測專業(yè)委員會華東專家組2013年工作會議在常州淹城順利召開
(本刊訊)根據(jù)年度工作計劃,中國城市規(guī)劃協(xié)會城市勘測專業(yè)委員會華東專家組2013年工作會議于5月10日~12日在常州淹城召開。本次會議由華東專家組舉辦,常州市測繪院承辦,華東專家組全體專家出席了會議。會議特邀了城市勘測專業(yè)委員會主任委員、專家委員會主任趙通海,天津市測繪院馬華山院長、華北東北專家組組長胡珂總工程師,并邀請了其他非華東專家組成員的江蘇省省轄市城市勘測院院長,共80多人參加了此次會議。
會議由城市勘測專業(yè)委員會華東專家組組長儲征偉主持,常州市規(guī)劃局李青副局長出席開幕式并致歡迎詞。會議期間,趙通海主任委員向大家傳達了協(xié)會2013年工作要點,指出當(dāng)前我們正處在城鎮(zhèn)化發(fā)展的新階段,城市規(guī)劃管理的內(nèi)容和方法不斷更新,這些對城市勘測、地理信息產(chǎn)業(yè)提供了更大的機遇和發(fā)展空間,也對城市勘測單位提出了更高的要求。城市勘測單位要加快業(yè)務(wù)拓展,壯大實力提高服務(wù)與保障能力。
儲征偉組長傳達了2013年城市勘測專業(yè)委員會專家組組長石家莊會議精神,專家組研討了今年及今后華東專家組的相關(guān)工作,與會代表與專家還交流了城市勘測工作經(jīng)驗、科研成果和學(xué)術(shù)信息,傳遞最新政策并展開了熱烈討論。常州市測繪院劉全海院長向代表們演示該院最新信息化成果;南京市測繪勘察研究院有限公司就地鐵隧道結(jié)構(gòu)安全自動化監(jiān)測系統(tǒng)應(yīng)用進行了報告。
本次會議期間得到了常州市測繪院的周到細致服務(wù),與會代表全體成員向其表示衷心感謝!
(中國城市規(guī)劃協(xié)會城市勘測專業(yè)委員會華東專家組,常州市測繪院供稿)
A M ethod for Building Geographical Conditions Ontology Attribute Library——Exem p lifying Tianjin
Zhang Zhijun1,2,Li Chengxin1
(1.Tianjin Institute of Surveying and Mapping,Tianjin 300381,China; 2.The State Key Laboratory of Information Engineering in Surveying,Mapping and Remote Sensing,Wuhan University,Wuhan 430079,China)
As a new tool and new approach in the scientific development of surveying and mapping service,themission of geographic national conditionmonitoring is to provide objective,fair and accurate thematic information for integrated decision-making atall levels of government.How to realize the semantics sharing of geographic national condition thematic information is the key problem for geographic national condition to provide cross-industry,cross-sectoral and interdisciplinary information service.Based on ontology theory,this paper proposed amethod for building geographic national conditions ontology attribute database.Conceptualization and formal representation aremade for geographic national information,and Tianjin is selected as knowledge domain for itsmonitoring content and service users,protégésoftware is used to build ontology attribute library.
fundamental geographic information;geographical concept;semantics;formal ontology
1672-8262(2013)03-9-05
P208
A
2012—12—10
張志軍(1983—),男,工程師,研究方向為地理信息應(yīng)用和智慧城市。
國家863項目(SS2013AA120303);國家自然基金(41001307)