亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種面向城市服務(wù)資源的知識圖譜系統(tǒng)架構(gòu)

        2019-04-03 01:44:12馬超溫秀秀田承東
        智能物聯(lián)技術(shù) 2019年2期
        關(guān)鍵詞:本體圖譜實體

        馬超,溫秀秀,田承東

        (中國電子科技集團公司信息科學(xué)研究院物聯(lián)網(wǎng)技術(shù)研究所,北京100086)

        0 引言

        建設(shè)智慧城市對實現(xiàn)城市可持續(xù)發(fā)展、引領(lǐng)信息技術(shù)應(yīng)用、提升城市綜合競爭力具有重要意義。隨著人工智能技術(shù)的不斷發(fā)展,智慧城市正逐步向人工智能城市轉(zhuǎn)變,智慧應(yīng)用不再局限于各行業(yè)內(nèi)部,而是向著多領(lǐng)域融合轉(zhuǎn)變。知識圖譜是實現(xiàn)城市多領(lǐng)域資源建模和描述的一種方法,是人工智能與智慧城市結(jié)合的重要一環(huán),因此研究面向城市服務(wù)資源的知識圖譜系統(tǒng)架構(gòu)具有重要意義。

        早在上個世紀70年代,專家系統(tǒng)(Expert Systems)作為人工智能的重要分支,是指利用知識和推理過程來解決那些借助人類專家知識才能得已解決的問題的計算機程序。專家系統(tǒng)一般由兩部分組成:知識庫與推理引擎,人類專家提供知識,再將這種顯式的知識映射并存儲到知識庫中用來推理。

        2012年,由谷歌最早提出知識圖譜的概念,將互聯(lián)網(wǎng)上的海量信息經(jīng)過知識抽取最終以知識三元組的形式表示,以圖的結(jié)構(gòu)進行存儲,實現(xiàn)了在大數(shù)據(jù)中智能化提取特征知識的功能。知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),用節(jié)點代表實體或者概念,用節(jié)點之間的邊代表實體或概念之間的各種語義關(guān)系。在知識圖譜的基礎(chǔ)上可以對數(shù)據(jù)進行分析、挖掘,還可以進行深度推理、智能決策等,知識圖譜是實現(xiàn)知識共享、互聯(lián)互通、系統(tǒng)智能的基礎(chǔ)。

        本文以“知識中心”等理論為發(fā)展背景,以提升網(wǎng)絡(luò)信息體系的智能能力產(chǎn)生為目的,研究面向城市服務(wù)資源領(lǐng)域的本體和知識圖譜的框架及構(gòu)建方法、知識圖譜管理系統(tǒng)的設(shè)計方案,為搭建城市服務(wù)資源知識圖譜原型系統(tǒng)提供技術(shù)基礎(chǔ)。

        1 知識圖譜概況

        知識圖譜是知識工程的一個分支,是知識表示的一種形式,其以語義網(wǎng)絡(luò)作為理論基礎(chǔ),并結(jié)合了機器學(xué)習、自然語言處理和知識推理等技術(shù),在大數(shù)據(jù)和人工智能的推動下受到了國內(nèi)外學(xué)者和企業(yè)界的廣泛關(guān)注。

        理解自然語言的關(guān)鍵是詞匯,雖然有電子詞典的存在,但機器仍無法很好地從中獲取詞匯含義。1985年,普林斯頓大學(xué)認識科學(xué)實驗室開始建立和維護名為WordNet的英語字典[1],為詞典信息和現(xiàn)代計算提供更加有效的結(jié)合。在WordNet中,名詞、動詞、形容詞以及副詞被按照認知上的同義詞分組,稱為synsets,每一個synset表征一個確定的概念。synset之間通過概念語義以及詞匯關(guān)系鏈接。在漢語中,類似的典型代表有《同義詞詞林》[2]及其擴展版、知網(wǎng)(HowNet)等,都是從語言學(xué)的角度,以概念為最基本的語義單元構(gòu)建起來的可以被計算機處理的漢語詞典。

        萬維網(wǎng)的出現(xiàn),為知識的獲取提供了更大的方便。1998年,萬維網(wǎng)之父蒂姆·伯納斯·李再次提出語義網(wǎng)(Semantic Web)的概念,以便讓計算機更好地獲取并使用知識[3-4]。不同于人工智能中訓(xùn)練機器使之擁有和人類一樣的認知能力,語義網(wǎng)直接向機器提供可直接用于程序處理的知識表示。語義網(wǎng)本身作為一個自上而下的設(shè)計體系,表示方法極為宏觀,導(dǎo)致發(fā)展不佳,學(xué)者們逐漸轉(zhuǎn)向數(shù)據(jù)本身。2006年,伯納斯·李提出鏈接數(shù)據(jù)(Linked Data)的概念,鼓勵大家將數(shù)據(jù)公開并遵循一定的原則將其發(fā)布在互聯(lián)網(wǎng)中,鏈接數(shù)據(jù)的最初設(shè)想是數(shù)據(jù)不僅僅在語義網(wǎng)中發(fā)布,同時需要建立起數(shù)據(jù)之間的鏈接從而形成一張巨大的鏈接數(shù)據(jù)網(wǎng)。其中,2007年開始的DBpedia項目,是目前已知的第一個大規(guī)模開放域鏈接數(shù)據(jù)網(wǎng)。

        為了提高搜索引擎的效率,知識圖譜于2012年5月17日由Google正式提出[5]。本質(zhì)上,知識圖譜旨在描述真實世界中存在的各種實體或概念及其關(guān)系,其構(gòu)成一張巨大的語義網(wǎng)絡(luò)圖,節(jié)點表示實體或概念,邊則由屬性或關(guān)系構(gòu)成。隨著人工智能的技術(shù)發(fā)展和應(yīng)用,知識圖譜作為關(guān)鍵技術(shù)之一,已被廣泛應(yīng)用于智能搜索、智能問答、個性化推薦、內(nèi)容分發(fā)等多個領(lǐng)域。

        根據(jù)覆蓋范圍,知識圖譜可分為開放域通用知識圖譜和垂直行業(yè)知識圖譜。開放域通用知識圖譜注重廣度,強調(diào)融合更多的實體,較垂直行業(yè)知識圖譜而言,其準確度不夠高。垂直行業(yè)知識圖譜通常需要依靠特定行業(yè)的數(shù)據(jù)來構(gòu)建,具有特定的行業(yè)意義。垂直行業(yè)知識圖譜中,實體的屬性與數(shù)據(jù)模式往往比較豐富,準確度也較高。從知識工程提出以來就有許多大規(guī)模、高質(zhì)量的知識庫和知識圖譜相繼創(chuàng)建,且其中多數(shù)免費向公眾開放,但以英文知識庫為主,包括WordNet、DBpedia、Yago、Wikidata[6]、XLore。相比國外,我國對于知識圖譜的研究起步較晚,但也取得了許多有價值的研究成果,并建立了一系列中文知識庫和知識圖譜,如CN-DB-pedia[13]、知網(wǎng)(英文名稱HowNet)。

        2 一種面向城市服務(wù)資源的知識圖譜構(gòu)建方法

        城市服務(wù)資源知識圖譜是有關(guān)城市服務(wù)資源的一個結(jié)構(gòu)化的語義知識庫,旨在描述城市服務(wù)資源領(lǐng)域的各種概念及其關(guān)系,以及現(xiàn)實世界中存在的各種城市服務(wù)資源實體及其屬性和關(guān)系。城市服務(wù)資源知識圖譜是實現(xiàn)城市服務(wù)信息體系知識互聯(lián)的關(guān)鍵技術(shù)和重要途徑,是面向城市服務(wù)資源領(lǐng)域的一項有益嘗試以及實現(xiàn)城市服務(wù)資源深度網(wǎng)絡(luò)化、高度智能化的有效支撐。

        本節(jié)將提出城市服務(wù)資源知識圖譜架構(gòu),以及基于構(gòu)架的城市服務(wù)資源知識圖譜管理系統(tǒng)設(shè)計。

        2.1 城市服務(wù)資源知識圖譜架構(gòu)

        知識圖譜的架構(gòu)包括知識圖譜自身的邏輯架構(gòu)及構(gòu)建知識圖譜的技術(shù)架構(gòu)。在邏輯架構(gòu)上,城市服務(wù)資源知識圖譜采用典型的數(shù)據(jù)層和模式層的雙層架構(gòu)。在知識圖譜數(shù)據(jù)層,知識以事實為單位,以“實體-關(guān)系-實體”或者“實體-屬性-屬性值”的三元組作為事實的基本表達方式,存儲在數(shù)據(jù)庫中的所有數(shù)據(jù)構(gòu)成一個實體關(guān)系網(wǎng)絡(luò),形成知識的“圖譜”。模式層在數(shù)據(jù)層之上,是知識圖譜的核心。在模式層存儲的是經(jīng)過提煉的知識,通常采用本體庫來管理知識圖譜的模式層,借助本體庫對公理、規(guī)則和約束條件的支持能力來規(guī)范實體、關(guān)系以及實體的類型和屬性等對象之間的聯(lián)系。本體庫在知識圖譜中的作用相當于知識庫的模具。

        城市服務(wù)資源知識圖譜的構(gòu)建技術(shù)架構(gòu)和流程如圖1所示,其中虛線框內(nèi)部分為知識圖譜的構(gòu)建過程,同時也是更新過程。知識圖譜的構(gòu)建從原始數(shù)據(jù)出發(fā),包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),采用一系列自動或半自動的技術(shù)手段,從原始數(shù)據(jù)中提取知識要素(即事實),并將其存入知識圖譜的數(shù)據(jù)層和模式層。知識圖譜的構(gòu)建是一個迭代更新的過程,根據(jù)知識獲取的邏輯,每一輪迭代包含三個階段:信息抽取、知識融合和知識加工。

        圖1 城市服務(wù)資源知識圖譜構(gòu)建技術(shù)架構(gòu)

        城市服務(wù)資源知識圖譜的構(gòu)建采用自頂向下和自底向上相結(jié)合的方法,以自頂向下為主,自底向上為輔。所謂自頂向下是指首先定義城市服務(wù)資源模式層,即城市服務(wù)資源本體,在定義本體的過程中,從最頂層的概念開始,逐步細化,形成結(jié)構(gòu)良好和具有層次關(guān)系的城市服務(wù)資源分類體系。在定義好數(shù)據(jù)模式之后,再添加城市服務(wù)資源實體,將本體實例化。自底向上的方法首先從城市服務(wù)資源的實體開始,在抽取實體的基礎(chǔ)上進行歸納組織,形成城市服務(wù)資源的底層概念,然后逐步向上抽象,形成上層概念。鑒于已經(jīng)建立了一個較完備的城市服務(wù)資源初級本體,因此以抽取實體三元組和采用自頂向下的構(gòu)建方法為主。本體的構(gòu)建也是一個逐步完善的過程,在實體的基礎(chǔ)上抽象出新的概念、屬性和關(guān)系,則可將其加入城市服務(wù)資源本體庫,對知識圖譜的模式層進行更新,實現(xiàn)自下向上的圖譜構(gòu)建。兩種方式獲得的知識數(shù)據(jù)都需要經(jīng)過共指消解、實體消歧、知識融合、評估和人工審核之后才可以加入城市服務(wù)資源知識圖譜。城市服務(wù)資源構(gòu)建的流程涉及的關(guān)鍵技術(shù)主要有信息抽取、知識融合、本體構(gòu)建、知識推理和知識評估。

        信息抽?。撼鞘蟹?wù)資源信息抽取是一種自動化地從半結(jié)構(gòu)化和無結(jié)構(gòu)數(shù)據(jù)中抽取實體、關(guān)系以及實體屬性等結(jié)構(gòu)化信息的技術(shù),分為實體抽取、關(guān)系抽取和屬性抽取。

        知識融合:碎片化知識缺乏層次性和邏輯性,采用自動化方法抽取到的知識包含大量的冗余和錯誤信息,而城市服務(wù)資源知識圖譜的構(gòu)建需要將從不同數(shù)據(jù)源得到的知識融合在一起。知識融合包含兩部分內(nèi)容:實體鏈接和知識合并。

        本體構(gòu)建:城市服務(wù)資源知識圖譜將采用人工與自動相結(jié)合的方法進行本體構(gòu)建。人工構(gòu)建方式準確率高,但是需要消耗較大的人力物力,而且周期較長。為彌補人工構(gòu)建的不足,同時采用計算機輔助,以數(shù)據(jù)驅(qū)動的方式自動構(gòu)建,然后采用算法評估和人工審核相結(jié)合的方式加以修正和確認。

        知識推理:城市服務(wù)資源知識推理是指從知識庫中已有的實體關(guān)系數(shù)據(jù)出發(fā),經(jīng)過計算機推理,建立實體間的新關(guān)聯(lián),從而擴展和豐富知識網(wǎng)絡(luò)。知識推理是知識圖譜構(gòu)建的重要手段和關(guān)鍵環(huán)節(jié),通過知識推理,能夠從現(xiàn)有知識中發(fā)現(xiàn)新的知識。

        知識評估:城市服務(wù)資源知識評估也就是質(zhì)量評估,是城市服務(wù)資源知識圖譜構(gòu)建技術(shù)的重要組成部分。受現(xiàn)有技術(shù)水平的限制,采用開放域信息抽取技術(shù)得到的知識元素有可能存在錯誤,如實體識別錯誤、關(guān)系抽取錯誤等,經(jīng)過知識推理得到的知識的質(zhì)量同樣也沒有保障,因此在將其加入知識圖譜之前一定要有質(zhì)量評估的過程。另一方面,第三方知識庫的質(zhì)量也存在差異,數(shù)據(jù)間的沖突日益增多,對其進行質(zhì)量評估,對于全局知識圖譜的構(gòu)建具有重要作用。引入質(zhì)量評估的意義在于:可以對知識的可信度進行量化,通過舍棄置信度較低的知識或者對置信度較低的知識進行修正從而保障知識圖譜的質(zhì)量。

        圖2 城市服務(wù)資源知識圖譜系統(tǒng)功能構(gòu)架圖

        2.2 城市服務(wù)資源知識圖譜系統(tǒng)設(shè)計

        城市服務(wù)資源知識圖譜系統(tǒng)是一個方便用戶對知識圖譜數(shù)據(jù)進行編輯、查看、管理和控制的工具。該工具提供友好的界面支持知識圖譜后臺數(shù)據(jù)與用戶的交互,支持知識圖譜內(nèi)部數(shù)據(jù)的存儲、備份、更新與其他變更操作,支持知識圖譜的版本管理、用戶權(quán)限管理、并發(fā)操作等,如圖2所示。

        城市服務(wù)資源知識圖譜管理系統(tǒng)的主要功能有:

        (1)后臺管理

        后臺管理主要有知識存儲、數(shù)據(jù)備份、版本控制、導(dǎo)入導(dǎo)出、用戶與權(quán)限管理等功能。為支持城市服務(wù)資源知識圖譜高并發(fā)、高速度的查詢及編輯操作,必須選用合理的數(shù)據(jù)庫對城市服務(wù)資源知識圖譜進行存儲。由于知識圖譜中概念、實例等關(guān)聯(lián)關(guān)系復(fù)雜,從數(shù)據(jù)結(jié)構(gòu)的角度觀察,知識圖譜中的大量節(jié)點組成一個網(wǎng)絡(luò),因此選擇圖數(shù)據(jù)庫作為知識圖譜的存儲工具。城市服務(wù)資源知識圖譜管理系統(tǒng)支持后臺的數(shù)據(jù)庫操作,支持知識圖譜數(shù)據(jù)的自動存儲,用戶通過前端頁面即可對數(shù)據(jù)庫進行操作。數(shù)據(jù)備份是保障城市服務(wù)資源知識圖譜安全性的重要措施,主要操作包括自動地定期對城市服務(wù)資源知識圖譜的數(shù)據(jù)進行備份和在發(fā)生系統(tǒng)故障或誤操作時對數(shù)據(jù)進行恢復(fù)等。系統(tǒng)支持以文件格式對城市服務(wù)資源知識圖譜數(shù)據(jù)進行批量導(dǎo)入,同時也支持對知識圖譜數(shù)據(jù)以某些特定文件格式進行導(dǎo)出。

        (2)知識校驗

        知識校驗主要有一致性檢測、發(fā)送校驗信息、數(shù)據(jù)更新等功能。為保障城市服務(wù)資源知識圖譜的可靠性,任何對知識圖譜數(shù)據(jù)進行的編輯、改動都需要經(jīng)過校驗員的人工審核和批準之后才可以完成對后臺數(shù)據(jù)庫的變更。城市服務(wù)資源知識圖譜管理系統(tǒng)將用戶的編輯操作自動緩存并上傳消息給校驗員,校驗員對操作進行審核后作出批準或駁回的反饋,如批準則系統(tǒng)自動將編輯操作作用于后臺數(shù)據(jù)庫,完成對知識圖譜數(shù)據(jù)的更改。

        (3)知識編輯

        知識編輯主要有概念編輯、實體編輯、關(guān)系編輯和屬性編輯四類編輯功能。知識編輯指用戶可通過系統(tǒng)平臺界面對后臺數(shù)據(jù)庫進行的操作,主要是對城市服務(wù)資源知識圖譜數(shù)據(jù)進行的基本編輯操作,包括概念、實體、屬性和關(guān)系的錄入、刪除、修改和保存等。

        (4)服務(wù)

        知識圖譜的服務(wù)可以分為圖譜的可視化、數(shù)據(jù)統(tǒng)計和數(shù)據(jù)查找三種。城市服務(wù)資源知識圖譜可視化主要提供數(shù)據(jù)展示功能,同時也是數(shù)據(jù)分析和編輯的輔助工具。后臺數(shù)據(jù)并不直觀,可視化模塊將提供圖形化界面直觀展示知識圖譜中的概念、實體及其關(guān)聯(lián)關(guān)系和屬性,用戶可通過鼠標拖拽等操作對圖形進行移動、放大、縮小和網(wǎng)絡(luò)層級展開等操作,同時可視化界面還提供數(shù)據(jù)統(tǒng)計功能,會在頁面適當位置標明知識圖譜中包含的概念數(shù)量、實體數(shù)量和關(guān)系數(shù)量等統(tǒng)計信息。城市服務(wù)資源知識圖譜中包含了大量的數(shù)據(jù),通過查找功能可快速定位到用戶的興趣點。城市服務(wù)資源知識圖譜管理系統(tǒng)通過前端界面連接后臺數(shù)據(jù)庫的查找功能,用戶在搜索框內(nèi)輸入查找關(guān)鍵字,系統(tǒng)會自動調(diào)用數(shù)據(jù)庫的查詢語句搜索與關(guān)鍵字相關(guān)的信息,并將返回結(jié)果展示在前端頁面。

        3 結(jié)語

        通過對城市服務(wù)資源知識圖譜相關(guān)技術(shù)進行研究,本課題提出了城市服務(wù)資源本體框架、城市服務(wù)資源知識圖譜架構(gòu)及其構(gòu)建方法、城市服務(wù)資源知識圖譜的更新策略及城市服務(wù)資源知識圖譜管理系統(tǒng)的需求分析。

        城市服務(wù)資源知識圖譜包含模式層和數(shù)據(jù)層兩層結(jié)構(gòu),其構(gòu)建可采用自底向上和自頂向下相結(jié)合的方法,一方面以本體為基礎(chǔ),對其進行實例化,完成從模式層到數(shù)據(jù)層的構(gòu)建;另一方面從數(shù)據(jù)源中抽取實體信息,對其進行歸納抽象,完成從數(shù)據(jù)層到模式層的構(gòu)建;城市服務(wù)資源知識圖譜系統(tǒng)應(yīng)以方便用戶對知識圖譜的編輯、查看、管理和控制為出發(fā)點,實現(xiàn)后臺管理、知識校驗、知識編輯和服務(wù)功能。本系統(tǒng)可以為智慧城市管理系統(tǒng)的建設(shè)提供借鑒。

        猜你喜歡
        本體圖譜實體
        Abstracts and Key Words
        繪一張成長圖譜
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        前海自貿(mào)區(qū):金融服務(wù)實體
        中國外匯(2019年18期)2019-11-25 01:41:54
        實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
        補腎強身片UPLC指紋圖譜
        中成藥(2017年3期)2017-05-17 06:09:01
        兩會進行時:緊扣實體經(jīng)濟“釘釘子”
        振興實體經(jīng)濟地方如何“釘釘子”
        主動對接你思維的知識圖譜
        《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
        亚洲第一页综合av免费在线观看 | 性视频毛茸茸女性一区二区| 国产一区二区三区特区| 一本色道久久亚洲av红楼| 真实夫妻露脸爱视频九色网| 精品综合久久久久久888蜜芽| 亚洲人精品亚洲人成在线| 亚洲精品无码不卡av| 亚洲免费天堂| 中文字幕日本韩国精品免费观看| 免费人成网在线观看品观网| 日本一区二区三区视频免费在线 | 国产白嫩护士被弄高潮| 亚洲成a人片在线观看无码| 婷婷九月丁香| 极品少妇一区二区三区四区| 狂插美女流出白浆视频在线观看| 极品少妇xxxx精品少妇偷拍| 人妻少妇乱子伦精品| 拍摄av现场失控高潮数次| 国产原创精品视频| 白白在线免费观看视频| 久久久精品国产性黑人| 国产熟女内射oooo| 亚洲福利视频一区| 成人免费毛片在线播放| 不卡一本av天堂专区| 成年女人a级毛片免费观看| 熟妇高潮一区二区三区| 一本一本久久a久久精品| 在线天堂中文一区二区三区| 亚洲黄片av在线免费观看| 成人大片免费视频播放一级| 夜夜爽妓女8888888视频| 色偷偷久久一区二区三区| 国产一区二区牛影视| 一区二区三区精彩视频在线观看 | 国产三级在线观看性色av| 久久久精品国产亚洲av网麻豆| 中文字幕无码中文字幕有码| 精品水蜜桃久久久久久久|