亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        供水管網(wǎng)異構(gòu)數(shù)據(jù)集成共享關(guān)鍵技術(shù)研究

        2019-11-22 07:04:02范冬林康傳利付波霖高二濤徐雯婷藍(lán)貴文
        水力發(fā)電 2019年8期
        關(guān)鍵詞:語(yǔ)義概念

        范冬林,康傳利,付波霖,高二濤 ,徐雯婷,藍(lán)貴文

        (1.桂林理工大學(xué)測(cè)繪地理信息學(xué)院,廣西桂林541004;2.廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室,廣西桂林541004;3.東華理工大學(xué)測(cè)繪工程學(xué)院,江西南昌330013)

        0 引 言

        在信息化、智慧化浪潮的推動(dòng)下,智慧城市已成為我國(guó)城市化發(fā)展的新趨勢(shì)[1]。供水管網(wǎng)作為城市信息基礎(chǔ)設(shè)施的重要組成部分,是智慧城市建設(shè)的重要數(shù)據(jù)源之一。智慧城市的發(fā)展與數(shù)字城市的建設(shè)一脈相承[2],在數(shù)字城市建設(shè)進(jìn)程中,供水管網(wǎng)信息化系統(tǒng)作為GIS平臺(tái)的一個(gè)行業(yè)應(yīng)用,通常僅以現(xiàn)有的數(shù)據(jù)模型來(lái)解決城市管網(wǎng)的特殊應(yīng)用,未能深入考慮管網(wǎng)運(yùn)行的行業(yè)特性[3],主要表現(xiàn)在:①管網(wǎng)信息資源缺乏語(yǔ)義信息,不能滿(mǎn)足智慧城市對(duì)重要資源的整合、共享、集成的要求;②供水管網(wǎng)數(shù)據(jù)多樣化,系統(tǒng)建設(shè)層次不一。由于管網(wǎng)管理者需求的不同以及系統(tǒng)建設(shè)者對(duì)城市管網(wǎng)認(rèn)識(shí)的差異,使得現(xiàn)有系統(tǒng)的應(yīng)用層次各不相同,進(jìn)而導(dǎo)致了供水管網(wǎng)數(shù)據(jù)格式多樣化且語(yǔ)義一致性差[4]。此類(lèi)供水信息系統(tǒng)對(duì)外提供的WEB服務(wù)資源(即共享信息)缺乏統(tǒng)一的語(yǔ)義描述,難以形成具有統(tǒng)一語(yǔ)義與知識(shí)表達(dá)的信息共享。

        為解決上述問(wèn)題,必須對(duì)現(xiàn)行的異構(gòu)數(shù)據(jù)進(jìn)行集成,形成一致的數(shù)據(jù)語(yǔ)義描述,構(gòu)建集成數(shù)據(jù)模型[5]。對(duì)GIS空間數(shù)據(jù)而言,數(shù)據(jù)集成是消除源數(shù)據(jù)在數(shù)據(jù)模式、數(shù)據(jù)屬性和數(shù)據(jù)結(jié)構(gòu)上的差異和沖突,按照目標(biāo)數(shù)據(jù)進(jìn)行一致化處理,最后為用戶(hù)提供統(tǒng)一的表現(xiàn)形式[6]。本文從數(shù)據(jù)集成的層面,實(shí)現(xiàn)供水管網(wǎng)異構(gòu)數(shù)據(jù)集成研究,為城市其他行業(yè)管網(wǎng)數(shù)據(jù)集成提供參考。

        1 供水管網(wǎng)數(shù)據(jù)異構(gòu)性分析

        對(duì)供水管網(wǎng)本身數(shù)據(jù)而言,不僅存在數(shù)據(jù)格式的不同,如常見(jiàn)的數(shù)據(jù)格式有ArcGIS的SHP格式、AutoCAD的DWG格式、MapGIS的W*格式等。而且,即使是同一格式的管網(wǎng)數(shù)據(jù),對(duì)管網(wǎng)領(lǐng)域概念理解的不同,也會(huì)存在對(duì)相同實(shí)體的數(shù)據(jù)存儲(chǔ)描述的差異,如數(shù)據(jù)結(jié)構(gòu)沖突、字段命名沖突以及實(shí)例的度量單位沖突等。

        從數(shù)據(jù)的語(yǔ)義層面看,供水管網(wǎng)數(shù)據(jù)異構(gòu)包括2種類(lèi)型[7]:實(shí)例異構(gòu)和模式異構(gòu)。實(shí)例異構(gòu)是指不同的數(shù)據(jù)源對(duì)同一個(gè)實(shí)體具有不同的描述,對(duì)相同的地理實(shí)體的描述使用同義字或同形異義字。如系統(tǒng)A中材質(zhì)為“普通鑄鐵管”,而系統(tǒng)B中表示為“灰口鑄鐵管”,由于其表現(xiàn)形式不同,通過(guò)精確匹配方式則無(wú)法將2個(gè)數(shù)據(jù)描述一一對(duì)應(yīng)起來(lái)。模式異構(gòu)是指不同數(shù)據(jù)源數(shù)據(jù)含義相似或有差別,包含2方面異構(gòu):一方面是指2個(gè)局部模式的屬性具有相同的含義,但屬性名卻不相同,這種異構(gòu)亦稱(chēng)為命名異構(gòu),如在模式A中“材質(zhì)”字段名和模式B中“管材”指的是同一個(gè)概念;另一方面則指不同的數(shù)據(jù)源對(duì)相同實(shí)體的屬性采取不同的定義方法,這種異構(gòu)也稱(chēng)為結(jié)構(gòu)異構(gòu),如模式A對(duì)“地址”的表示在一個(gè)屬性字段中完成,而在模式B中“地址”由“省”、“市”、“街道”3個(gè)屬性字段描述。

        2 供水管網(wǎng)異構(gòu)數(shù)據(jù)集成技術(shù)

        2.1 集成數(shù)據(jù)模型

        本體技術(shù)能夠解決數(shù)據(jù)集成中語(yǔ)義異構(gòu)問(wèn)題,最根本的原因在于其定義的共享概念模型使用戶(hù)和應(yīng)用程序?qū)Ω拍詈托g(shù)語(yǔ)具有共同的理解[8]。因此,對(duì)供水管網(wǎng)領(lǐng)域中核心概念的抽象顯得尤為重要。在傳統(tǒng)的本體集成技術(shù)研究中,核心概念僅僅是對(duì)領(lǐng)域內(nèi)實(shí)體和關(guān)系的表達(dá)[9],而在本文中,核心概念不僅包含供水管網(wǎng)中的實(shí)體類(lèi)型與關(guān)系,同時(shí)包含實(shí)體內(nèi)屬性集合的抽象。為了構(gòu)建供水管網(wǎng)集成數(shù)據(jù)模型,本文將屬性集合的概念抽象為特性,其邏輯上是對(duì)供水管網(wǎng)概念的形式化表述,而物理上則是一組屬性的集合。本文將特性分為3類(lèi):存儲(chǔ)特性、普通特性和標(biāo)識(shí)特性。

        (1)存儲(chǔ)特性。用于管理數(shù)據(jù)類(lèi)型的存儲(chǔ)方式,主要功能包括基于類(lèi)型的數(shù)據(jù)創(chuàng)建、數(shù)據(jù)選擇、數(shù)據(jù)讀取和修改等。

        (2)普通特性。包含一定數(shù)量的固有屬性字段,并在該固有屬性字段的基礎(chǔ)上定義了基于特性的基礎(chǔ)應(yīng)用操作,如管材特性中的獲取管材信息,規(guī)格特性中的獲取設(shè)備規(guī)格信息以及進(jìn)行設(shè)備規(guī)格檢查等。

        (3)標(biāo)識(shí)特性。用于對(duì)管線(xiàn)設(shè)備標(biāo)識(shí),這類(lèi)特性不需要匹配固有的屬性字段信息,如針對(duì)供水的閥門(mén)設(shè)備以及燃?xì)獾恼{(diào)壓站設(shè)備都具有的關(guān)斷特性,當(dāng)給某一數(shù)據(jù)類(lèi)型賦予了關(guān)斷特性時(shí),說(shuō)明該數(shù)據(jù)所存儲(chǔ)的設(shè)備具有阻斷網(wǎng)絡(luò)流通功能的特性。

        按照地下管線(xiàn)探測(cè)規(guī)程和集成數(shù)據(jù)模型的需求,建立供水設(shè)備類(lèi)型,并進(jìn)一步確定每種設(shè)備類(lèi)型的屬性。對(duì)于集成數(shù)據(jù)模型而言,類(lèi)型的屬性結(jié)構(gòu)不僅需要考慮異構(gòu)數(shù)據(jù)中的相同概念,還需考慮數(shù)據(jù)源中的特殊屬性,以便更大程度兼容異構(gòu)數(shù)據(jù)源。上文提到的特性能夠很好地解決這一問(wèn)題。類(lèi)型通過(guò)特性間接決定其屬性結(jié)構(gòu),不直接持有屬性,屬性的管理由特性完成。

        閥門(mén)類(lèi)型-特性-屬性關(guān)系見(jiàn)圖1。閥門(mén)類(lèi)型被指定為點(diǎn)設(shè)施存儲(chǔ)特性,該閥門(mén)類(lèi)型還具有關(guān)斷特性和關(guān)閥影響2個(gè)標(biāo)識(shí)特性。同時(shí),普通特性記錄了該類(lèi)型公共數(shù)據(jù)屬性字段集合。數(shù)據(jù)類(lèi)型還可以派生子數(shù)據(jù)類(lèi)型,子數(shù)據(jù)類(lèi)型繼承了父類(lèi)型的所有特性。派生的子類(lèi)型只能添加普通特性和標(biāo)識(shí)特性,不能更改存儲(chǔ)特性。按照上述原則,本文設(shè)計(jì)了供水設(shè)備集成數(shù)據(jù)模型,該模型將作為目標(biāo)本體參與異構(gòu)源數(shù)據(jù)的集成。

        圖1 類(lèi)型-特性-屬性關(guān)系示意

        2.2 數(shù)據(jù)集成中映射關(guān)系的建立

        建立映射關(guān)系是為了將供水管網(wǎng)集成數(shù)據(jù)模型與不同的源數(shù)據(jù)進(jìn)行關(guān)聯(lián),消除集成數(shù)據(jù)模型與源數(shù)據(jù)的模式和實(shí)例異構(gòu)[10],其關(guān)鍵是概念之間相似度的計(jì)算。在研究相似度計(jì)算方法的文獻(xiàn)[11-13]中,按照不同的標(biāo)準(zhǔn),將相似度計(jì)算方法分為模式級(jí)、實(shí)例級(jí)、元素級(jí)和結(jié)構(gòu)級(jí)。本文主要考慮模式級(jí)和實(shí)例級(jí)的相似度計(jì)算算法,前者指利用本體中的模式信息來(lái)計(jì)算相似度,該計(jì)算方式主要是計(jì)算詞法層面的語(yǔ)義相似度[14];后者指利用一定量實(shí)例來(lái)進(jìn)行相似度的計(jì)算,該計(jì)算方式主要以數(shù)學(xué)聯(lián)合分布概率為基礎(chǔ)進(jìn)行相似度計(jì)算。每一種相似度在一定程度上反應(yīng)了本體概念間的關(guān)系,對(duì)映射關(guān)系的建立都有不同程度的影響,單獨(dú)使用一種相似度在一些場(chǎng)景亦能取得較為滿(mǎn)意的效果。如在文獻(xiàn)[15]中提供的數(shù)據(jù)中,使用基于實(shí)例的相似度計(jì)算方法可以取得較理想的匹配結(jié)果,但當(dāng)遇到語(yǔ)義上一致,但詞義不同的實(shí)例便難以勝任?;谏鲜鲈颍⒔Y(jié)合供水管網(wǎng)中異構(gòu)數(shù)據(jù)的特性,本文將應(yīng)用結(jié)合詞義、語(yǔ)義和實(shí)例的相似度算法進(jìn)行加權(quán)計(jì)算的綜合相似度計(jì)算方法。

        假設(shè)simw(A,B)、sime(A,B)、simc(A,B)分別表示本體O1中A概念與本體O2中B概念的詞義相似度、語(yǔ)義相似度和實(shí)例相似度,則綜合相似度的計(jì)算方法表示為

        sim(A,B)=α×simw(A,B)+β×sime(A,B)+

        λ×simc(A,B)

        (1)

        α+β+λ=1.0

        (2)

        min{simw(A,B),sime(A,B),

        simc(A,B)}≤sim(A,B)≤max{simw(A,B),

        sime(A,B),simc(A,B)}

        (3)

        式中,α、β、λ為權(quán)重值,依賴(lài)于經(jīng)驗(yàn)值,在實(shí)際應(yīng)用中,α、β、λ的值通過(guò)訓(xùn)練確定。在本體與源數(shù)據(jù)中選取1組訓(xùn)練樣本,計(jì)算得到的相似分量,變換α、β、λ的取值,得到更多的試驗(yàn)值,從結(jié)果中選取映射準(zhǔn)確率高的作為經(jīng)驗(yàn)值。

        本文從供水管網(wǎng)數(shù)據(jù)中選取了1組數(shù)據(jù)進(jìn)行綜合相似度的計(jì)算,計(jì)算結(jié)果見(jiàn)表1。其中,α、β、λ的值分別取0.3、0.5、0.2。

        通過(guò)綜合相似度計(jì)算得到的相似度矩陣,本體中一個(gè)概念可能具有多個(gè)相似度差別不大的另一本體的概念組,如“高程”對(duì)應(yīng)的“管頂高程”和“管底高程”相似度的值都大于0.7。因此,需要確定選擇具體哪個(gè)概念與之對(duì)應(yīng),從而建立本體概念間的映射關(guān)系。設(shè)定閾值T可以有效減少關(guān)聯(lián)概念的數(shù)量,當(dāng)2個(gè)概念的相似度小于T時(shí),便認(rèn)為概念無(wú)相關(guān)性;當(dāng)相似度大于T時(shí),則將被匹配概念作為1個(gè)候選概念。如在表1中,當(dāng)T取0.7時(shí),數(shù)據(jù)源本體管頂標(biāo)高、管底標(biāo)高對(duì)應(yīng)集成本體的候選概念皆為管底高程和管頂高程。

        本文選取了106個(gè)目標(biāo)概念和122個(gè)源概念,對(duì)兩者分別使用詞義、語(yǔ)義、實(shí)例和綜合相似度計(jì)算方法進(jìn)行匹配處理,并使用查準(zhǔn)率(Precision)、查全率(Recall)和F1-Measure作為評(píng)判匹配結(jié)果的有效性指標(biāo),評(píng)判指標(biāo)見(jiàn)表2。從表2可知,由于實(shí)例相似度算法僅就數(shù)值型的概念進(jìn)行匹配處理,故其計(jì)算結(jié)果相對(duì)其他算法準(zhǔn)確率稍低;而綜合相似度計(jì)算方法反應(yīng)了概念的多個(gè)方面的信息,其準(zhǔn)確率明顯高于其他相似度算法。

        表2 相似度計(jì)算算法結(jié)果評(píng)價(jià)

        本文中,映射關(guān)系的建立包含模式和數(shù)值映射關(guān)系2個(gè)方面。前者指建立集成數(shù)據(jù)模型和異構(gòu)源關(guān)于類(lèi)型和屬性字段之間的映射關(guān)系,后者指建立集成數(shù)據(jù)模型和異構(gòu)源屬性數(shù)值的映射關(guān)系。

        模式映射可將非標(biāo)準(zhǔn)化的數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)化的數(shù)據(jù),實(shí)現(xiàn)模式映射需要經(jīng)過(guò)3個(gè)步驟:類(lèi)型匹配→屬性字段匹配→數(shù)值匹配。類(lèi)型匹配通過(guò)字符相似度計(jì)算可以確定初步的映射關(guān)系;屬性字段匹配通過(guò)綜合相似度計(jì)算也可確定初步的映射關(guān)系,在初步映射關(guān)系的基礎(chǔ)上,通過(guò)人工干預(yù)確定最終的映射關(guān)系。在計(jì)算相似度之前,需經(jīng)過(guò)預(yù)定義字典過(guò)濾,將在預(yù)定義字典中有明確對(duì)應(yīng)關(guān)系的概念剔除,以減少計(jì)算量。模式映射過(guò)程如圖2所示。

        完成模式映射關(guān)系后,還需進(jìn)一步對(duì)數(shù)據(jù)值進(jìn)行匹配。本文僅就文本和數(shù)值類(lèi)型的屬性值進(jìn)行考慮。數(shù)值匹配處理流程見(jiàn)圖3。對(duì)屬性值進(jìn)行匹配的原因是存在實(shí)例異構(gòu),在創(chuàng)建集成本體時(shí),對(duì)字段進(jìn)行過(guò)值域約束(范圍約束、選項(xiàng)約束)或進(jìn)行了統(tǒng)一度量單位的約束等。文本類(lèi)型的數(shù)據(jù)值可能存在n∶1、1∶1的映射關(guān)系以及數(shù)值書(shū)寫(xiě)格式的統(tǒng)一,這部分的映射關(guān)系生成同樣需要進(jìn)行相似度的計(jì)算。

        圖2 模式映射處理流程

        圖3 數(shù)值匹配處理流程

        圖4 集成管網(wǎng)數(shù)據(jù)模板

        數(shù)值型的數(shù)據(jù)值僅考慮度量單位的統(tǒng)一,這部分主要通過(guò)元信息、均值來(lái)判別換算關(guān)系。

        3 異構(gòu)數(shù)據(jù)集成共享平臺(tái)應(yīng)用

        供水管網(wǎng)異構(gòu)數(shù)據(jù)集成與共享平臺(tái)是在供水集成數(shù)據(jù)模型和綜合相似度計(jì)算方法的支撐下,基于MapGIS SDK二次開(kāi)發(fā)的供水管網(wǎng)數(shù)據(jù)異構(gòu)的集成共享平臺(tái)。該平臺(tái)以特性為基本處理單元而開(kāi)發(fā)的特性工具集合,為上層應(yīng)用提供了一套完整的數(shù)據(jù)操作接口。特性工具降低了數(shù)據(jù)與功能的耦合性,提高了基于集成數(shù)據(jù)模型開(kāi)發(fā)的供水地理信息系統(tǒng)在異構(gòu)數(shù)據(jù)下的復(fù)用性和系統(tǒng)的擴(kuò)展性。平臺(tái)還提供了數(shù)據(jù)的統(tǒng)一發(fā)布,基于GML格式的數(shù)據(jù),可以實(shí)現(xiàn)不同系統(tǒng)或平臺(tái)間的數(shù)據(jù)共享。由于數(shù)據(jù)是已經(jīng)進(jìn)行過(guò)集成化處理的,因此使這類(lèi)數(shù)據(jù)的共享是具有相同語(yǔ)義和知識(shí)的共享。集成管網(wǎng)數(shù)據(jù)模板見(jiàn)圖4。管網(wǎng)拓?fù)涞慕y(tǒng)一語(yǔ)義表達(dá)見(jiàn)圖5。

        圖5 管網(wǎng)拓?fù)涞慕y(tǒng)一語(yǔ)義表達(dá)

        4 結(jié) 語(yǔ)

        本文針對(duì)不同供水管網(wǎng)存在異構(gòu)性和共享信息語(yǔ)義不一致問(wèn)題,對(duì)其中的關(guān)鍵技術(shù)進(jìn)行了探討,構(gòu)建了一個(gè)供水管網(wǎng)異構(gòu)數(shù)據(jù)集成共享平臺(tái)應(yīng)用實(shí)例,并使用該平臺(tái)先后對(duì)常州、桂林2個(gè)城市的供水管網(wǎng)數(shù)據(jù)進(jìn)行異構(gòu)集成,達(dá)到了預(yù)期效果。

        異構(gòu)數(shù)據(jù)集成共享平臺(tái)在一定程度上解決了供水管網(wǎng)數(shù)據(jù)語(yǔ)義一致的集成共享,特性的引入也可在一定程度上降低供水應(yīng)用系統(tǒng)的開(kāi)發(fā)周期,提高應(yīng)用功能的復(fù)用性,可供城市其他管網(wǎng)行業(yè)數(shù)據(jù)集成和共享提供參考。

        猜你喜歡
        語(yǔ)義概念
        Birdie Cup Coffee豐盛里概念店
        語(yǔ)言與語(yǔ)義
        幾樣概念店
        學(xué)習(xí)集合概念『四步走』
        聚焦集合的概念及應(yīng)用
        論間接正犯概念之消解
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        概念的限制
        “深+N季”組配的認(rèn)知語(yǔ)義分析
        亚洲黄片av在线免费观看| 欧美mv日韩mv国产网站| 精品国产福利在线观看网址2022| 一区二区丝袜美腿视频| 亚洲福利二区三区四区| 亚洲第一区二区精品三区在线| 亚洲成人黄色av在线观看| 亚洲一区二区在线观看av| 精品一区二区三区牛牛| 日日麻批免费40分钟无码| 日本不卡一区二区三区在线| 国产成人亚洲综合无码精品| 国产av一区二区内射| 寂寞人妻渴望被中出中文字幕| 伊人久久久精品区aaa片| 亚洲黄色免费网站| 久久五月精品中文字幕| 偷拍一区二区视频播放器| 免费无码一区二区三区蜜桃大 | 日日麻批免费40分钟无码| 无码精品国产va在线观看| 日日噜噜夜夜狠狠2021| av网页免费在线观看| 亚洲av成人精品日韩在线播放| 国产欧美VA欧美VA香蕉在| 日韩极品视频在线观看| 日本最新一区二区三区在线视频 | 男女av一区二区三区| 中国熟妇人妻xxxxx| 精品福利一区| 国产人妖伦理视频在线观看| 日本另类αv欧美另类aⅴ| 国内精品久久久久久无码不卡| 亚洲av综合色区久久精品天堂| 国产亚洲精品色婷婷97久久久| 国产精品久久久久久婷婷| 亚洲三级香港三级久久| 男人天堂插插综合搜索| 97色偷偷色噜噜狠狠爱网站| 岛国av无码免费无禁网站下载| 91青青草免费在线视频 |