亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向智能搜索的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)建模*

        2014-02-28 06:12:56許洪波賈巖濤程學(xué)旗
        電信科學(xué) 2014年10期
        關(guān)鍵詞:算子關(guān)聯(lián)語(yǔ)義

        劉 劍,許洪波,賈巖濤,程學(xué)旗

        (1.中國(guó)科學(xué)院計(jì)算技術(shù)研究所網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點(diǎn)實(shí)驗(yàn)室 北京100190;2.中國(guó)科學(xué)院大學(xué) 北京100190;3.解放軍外國(guó)語(yǔ)學(xué)院語(yǔ)言工程系 洛陽(yáng)471003)

        1 引言

        近年來(lái),隨著移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展,傳統(tǒng)基于個(gè)人電腦的上網(wǎng)方式正在加速向基于智能移動(dòng)終端的方式轉(zhuǎn)變,移動(dòng)互聯(lián)網(wǎng)已經(jīng)成為人們獲取信息的主要途徑。來(lái)自中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)的報(bào)告顯示[1],截至2013年12月,中國(guó)搜索引擎用戶(hù)規(guī)模達(dá)到4.9億戶(hù),手機(jī)搜索網(wǎng)民數(shù)達(dá)到3.65億人,移動(dòng)式搜索成為不斷興起的新型應(yīng)用之一。與此同時(shí),網(wǎng)絡(luò)空間(cyberspace)中各類(lèi)應(yīng)用的層出不窮引發(fā)了數(shù)據(jù)規(guī)模的爆炸式增長(zhǎng),形成了網(wǎng)絡(luò)空間的大數(shù)據(jù)[2]。隨著互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長(zhǎng)和網(wǎng)民獲取信息需求的不斷增強(qiáng),傳統(tǒng)的“關(guān)鍵詞”搜索局限性逐漸暴露,基于互聯(lián)網(wǎng)的海量搜索在移動(dòng)搜索領(lǐng)域已經(jīng)難以滿(mǎn)足用戶(hù)需求,用戶(hù)對(duì)于搜索結(jié)果的直接性要求體現(xiàn)得很明顯,精準(zhǔn)信息才是移動(dòng)式搜索用戶(hù)最想要的。在整合海量互聯(lián)網(wǎng)碎片化信息的基礎(chǔ)上,如何基于用戶(hù)的片段輸入準(zhǔn)確理解用戶(hù)搜索意圖,然后從海量顯性和隱性知識(shí)資源中按照人們需求,有針對(duì)性地提煉知識(shí)內(nèi)容或問(wèn)題解決方案,從而以直接給出可能答案或者更為豐富語(yǔ)義關(guān)聯(lián)信息的形式返回給用戶(hù),這是移動(dòng)搜索所面臨的巨大挑戰(zhàn)。

        傳統(tǒng)Web資源中的語(yǔ)義信息以自由文本的方式存在,缺乏機(jī)器可理解的語(yǔ)義,搜索引擎難以自動(dòng)有效地整合這些數(shù)據(jù),同時(shí)資源間的語(yǔ)義關(guān)系以一種隱含的方式存在,這些語(yǔ)義信息由于缺乏明確的描述而丟失。因此,對(duì)于搜索引擎而言,準(zhǔn)確理解數(shù)據(jù)符號(hào)背后所包含的語(yǔ)義信息變得至關(guān)重要。為了能夠?qū)⑺阉鹘Y(jié)果準(zhǔn)確地傳遞給用戶(hù),需要引入語(yǔ)義技術(shù),對(duì)搜索結(jié)果進(jìn)行優(yōu)化計(jì)算,從而理解用戶(hù)的搜索意圖。為了解決語(yǔ)義缺失問(wèn)題,互聯(lián)網(wǎng)創(chuàng)始人Lee T B在XML2000國(guó)際會(huì)議上正式提出語(yǔ)義Web的體系框架[3],希望使網(wǎng)絡(luò)中的信息具有語(yǔ)義,以便計(jì)算機(jī)能夠自動(dòng)地處理和理解數(shù)據(jù)。語(yǔ)義Web中“語(yǔ)義”的核心就是知識(shí)共享,知識(shí)共享實(shí)質(zhì)上是基于語(yǔ)義技術(shù)的共享,而基于語(yǔ)義技術(shù)的智能搜索使得搜索引擎不再拘泥于用戶(hù)所輸入請(qǐng)求語(yǔ)句的字面本身,而是透過(guò)現(xiàn)象看本質(zhì),準(zhǔn)確地捕捉到用戶(hù)所輸入語(yǔ)句后面的真正意圖,并以此進(jìn)行搜索,從而更準(zhǔn)確地向用戶(hù)返回最符合其需求的搜索結(jié)果。

        在2013年5月 的Google I/O大會(huì) 上,Google的Amit Singhal提出了未來(lái)搜索引擎的設(shè)想:搜索引擎的3個(gè)主要功能需要改進(jìn),搜索將需要答案、對(duì)話、預(yù)測(cè)。未來(lái)的搜索引擎需要更智能地為用戶(hù)服務(wù),這一切離不開(kāi)富含語(yǔ)義信息的知識(shí)庫(kù)作為基礎(chǔ)支撐。語(yǔ)義Web希望賦予互聯(lián)網(wǎng)上所有資源唯一的標(biāo)識(shí),以一種明確、形式化的方式描述信息資源,從而在資源之間建立起機(jī)器可以處理的各類(lèi)語(yǔ)義關(guān)聯(lián),最終將萬(wàn)維網(wǎng)中現(xiàn)存的信息發(fā)展成一個(gè)巨大的全球語(yǔ)義知識(shí)庫(kù)[4]。但是,面對(duì)海量的數(shù)據(jù)資源、豐富的文檔類(lèi)型、形態(tài)各異的數(shù)據(jù)格式,數(shù)據(jù)資源的耦合度較低,也缺乏統(tǒng)一的管理,難以形成統(tǒng)一的語(yǔ)義知識(shí)庫(kù)。因此,基于現(xiàn)有的互聯(lián)網(wǎng)數(shù)據(jù)資源,構(gòu)建大型的語(yǔ)義知識(shí)庫(kù),為智能搜索提供語(yǔ)義知識(shí)支持成為切實(shí)可行的方案。本文面向開(kāi)放的互聯(lián)網(wǎng)數(shù)據(jù)資源,結(jié)合現(xiàn)有技術(shù)應(yīng)用,提出以超圖(hyper-graph)理 論 為 基 礎(chǔ) 的 動(dòng) 態(tài) 知 識(shí) 網(wǎng) 絡(luò)(dynamic knowledge network,DKN)建模方式,從模型層面闡述了“知識(shí)+計(jì)算→智能”的智能搜索模式,通過(guò)計(jì)算算子實(shí)現(xiàn)基于知識(shí)的計(jì)算,從而對(duì)面向語(yǔ)義的智能搜索提供理論支持和模型支撐。

        本文首先結(jié)合信息技術(shù)的發(fā)展介紹了互聯(lián)網(wǎng)搜索技術(shù)的現(xiàn)狀,分析了基于語(yǔ)義技術(shù)進(jìn)行智能搜索的發(fā)展前景。在此基礎(chǔ)上,提出以超圖理論為基礎(chǔ)、以計(jì)算算子為技術(shù)支撐,進(jìn)行世界知識(shí)建模的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)建模方案,闡述了該模型的理論基礎(chǔ)、結(jié)構(gòu)模式、系統(tǒng)模型及其特點(diǎn)以及基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)支撐智能搜索的基本結(jié)構(gòu)框架,最后,對(duì)今后研究工作中所面臨的主要問(wèn)題和挑戰(zhàn)進(jìn)行了展望。

        2 研究現(xiàn)狀

        隨著計(jì)算機(jī)與通信技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)上的信息呈現(xiàn)指數(shù)型增長(zhǎng),在互聯(lián)網(wǎng)信息越來(lái)越豐富、用戶(hù)使用方式也越來(lái)越多變的同時(shí),龐大并且關(guān)聯(lián)的信息讓大部分用戶(hù)感到無(wú)所適從,搜索的價(jià)值也就越來(lái)越明顯。面對(duì)海量信息,基于分類(lèi)目錄和關(guān)鍵詞的搜索方式越來(lái)越難以適應(yīng)用戶(hù)的搜索需求,迫切需要將檢索方式從基于詞層面提高到基于語(yǔ)義層面,實(shí)現(xiàn)基于語(yǔ)義理解的智能搜索。智能搜索不僅要求提升檢索技術(shù),還向著信息服務(wù)的智能化、個(gè)性化、可互動(dòng)的方向發(fā)展,因此,需要實(shí)現(xiàn)查詢(xún)請(qǐng)求和目標(biāo)資源的語(yǔ)義理解。本體作為知識(shí)的承載者被信息科學(xué)領(lǐng)域引入,并作為語(yǔ)義Web的核心技術(shù),對(duì)網(wǎng)絡(luò)信息資源進(jìn)行語(yǔ)義表達(dá)和標(biāo)注。根據(jù)本體技術(shù)在搜索引擎中的作用,將目前的智能搜索劃分為3類(lèi)[5],具體介紹如下。

        ·基于傳統(tǒng)搜索的增強(qiáng)型搜索:這一類(lèi)搜索的核心還是傳統(tǒng)的搜索引擎,通過(guò)本體技術(shù)對(duì)用戶(hù)查詢(xún)?cè)~的處理來(lái)提高搜索效果,如IBM與蘋(píng)果公司等合作開(kāi)發(fā)的OntoSeek系統(tǒng)[6]、美國(guó)斯坦福大學(xué)與IBM等研究機(jī)構(gòu)聯(lián)合開(kāi)發(fā)的Tap系統(tǒng)[7]等,還有研究將wordnet作為查詢(xún)擴(kuò)展和約束,以改善搜索的效果[8]。

        ·基于本體推理的知識(shí)型搜索:這一類(lèi)搜索是基于構(gòu)建的本體知識(shí)庫(kù),通過(guò)本體推理技術(shù)實(shí)現(xiàn)知識(shí)的自動(dòng)發(fā)現(xiàn)和關(guān)聯(lián),如美國(guó)馬里蘭大學(xué)開(kāi)發(fā)的SHOE系統(tǒng)[9]、上海交通大學(xué)提出的SPARK[10]、清華大學(xué)提出的細(xì)粒度語(yǔ)義網(wǎng)絡(luò)檢索模型[11]等。

        ·其他類(lèi)型的搜索:還有一些其他類(lèi)型的搜索模型,如美國(guó)華盛頓大學(xué)開(kāi)發(fā)的KnowItAll系統(tǒng)[12]、華中科技大學(xué)提出的應(yīng)用在安全訪問(wèn)控制領(lǐng)域的搜索模型[13]、上海交通大學(xué)與香港科技大學(xué)共同提出的一種增強(qiáng)的語(yǔ)義搜索模型[14]等。特別值得一提的是,Wolfram在2009年發(fā)布了Wolfram|Alpha系統(tǒng),該系統(tǒng)一經(jīng)發(fā)布就引起很大的反響,甚至有人認(rèn)為它會(huì)取代Google的搜索霸主地位。

        近年來(lái),隨著Linking Open Data等項(xiàng)目的全面展開(kāi),語(yǔ)義數(shù)據(jù)源的數(shù)量激增?;ヂ?lián)網(wǎng)正從僅包含網(wǎng)頁(yè)與網(wǎng)頁(yè)間超鏈接的文檔萬(wàn)維網(wǎng)(document Web)轉(zhuǎn)變?yōu)榘枋龈鞣N實(shí)體與實(shí)體之間豐富關(guān)聯(lián)的數(shù)據(jù)萬(wàn)維網(wǎng)(data Web)。在此背景下,谷歌、微軟、百度和搜狗等搜索引擎公司紛紛以此為基礎(chǔ)構(gòu)建知識(shí)圖譜,分別為Knowledge Graph、Probase、知心和知立方,以此來(lái)改進(jìn)搜索質(zhì)量,從而拉開(kāi)了智能搜索的序幕。

        3 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)建模

        網(wǎng)絡(luò)時(shí)代人們?cè)谔接憯?shù)據(jù)、信息、知識(shí)之間的相互關(guān)系時(shí),認(rèn)識(shí)到數(shù)據(jù)是事物屬性及其相互關(guān)系等的抽象表示,信息則是有目的、有意義、有用途的數(shù)據(jù),而知識(shí)是通過(guò)對(duì)信息進(jìn)行深度加工,經(jīng)過(guò)邏輯或非邏輯思維,認(rèn)識(shí)事物本質(zhì)而形成的經(jīng)驗(yàn)與結(jié)論[15]。互聯(lián)網(wǎng)蘊(yùn)含著豐富的知識(shí)資源,不論是信息直接所包含的知識(shí)還是信息背后所隱含的知識(shí),都反映在網(wǎng)絡(luò)中。維娜·艾莉[16]曾經(jīng)指出,“我們可以把自己的個(gè)人知識(shí)看成一張認(rèn)識(shí)的‘網(wǎng)’,很多想法、感覺(jué)、思想、概念和信仰都在這里交織在一起”。因此,可以從知識(shí)的這種網(wǎng)狀結(jié)構(gòu)特征得到啟發(fā),互聯(lián)網(wǎng)中也包含著一張巨大的知識(shí)網(wǎng)絡(luò),經(jīng)過(guò)數(shù)據(jù)的采集和清洗、信息的提煉和抽取、知識(shí)的描述和集成,最終可以利用一個(gè)開(kāi)放的知識(shí)網(wǎng)絡(luò)將其呈現(xiàn)出來(lái)。基于這一思想,本文提出“知識(shí)+計(jì)算→智能”的智能搜索模式,如圖1所示。

        其基本思想是:基于互聯(lián)網(wǎng)的各類(lèi)數(shù)據(jù)資源,構(gòu)建動(dòng)態(tài)知識(shí)網(wǎng)絡(luò),以此為基礎(chǔ),結(jié)合定義好的各類(lèi)計(jì)算算子的靈活組合,響應(yīng)用戶(hù)需求,實(shí)現(xiàn)對(duì)用戶(hù)真實(shí)查詢(xún)意圖的語(yǔ)義理解和問(wèn)題解答,從而實(shí)現(xiàn)通過(guò)一個(gè)事實(shí)知識(shí)庫(kù)和一系列計(jì)算算子得到一個(gè)可計(jì)算的網(wǎng)絡(luò)世界的構(gòu)想。

        3.1 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的理論基礎(chǔ)

        關(guān)于“知識(shí)網(wǎng)絡(luò)”這個(gè)概念,最早是由瑞典工業(yè)界在20世紀(jì)90年代提出來(lái)的[17],不同時(shí)代、不同學(xué)科和不同領(lǐng)域的學(xué)者,對(duì)“知識(shí)網(wǎng)絡(luò)”概念的內(nèi)涵和外延有著不同的認(rèn)識(shí)[18]。王眾托院士通過(guò)對(duì)無(wú)處不在的網(wǎng)絡(luò)社會(huì)的分析[15],認(rèn)為一個(gè)知識(shí)網(wǎng)絡(luò)應(yīng)該有3個(gè)層次:技術(shù)層面的技術(shù)網(wǎng)絡(luò)、知識(shí)資源內(nèi)部聯(lián)系的知識(shí)網(wǎng)絡(luò)、知識(shí)在人際間傳播的人際關(guān)系網(wǎng)絡(luò)。依據(jù)此理論,本文主要研究知識(shí)資源自身存在內(nèi)在關(guān)聯(lián)的知識(shí)網(wǎng)絡(luò)。知識(shí)網(wǎng)絡(luò)目前還沒(méi)有明確的定義,它是一個(gè)集合概念,指的是知識(shí)的空間結(jié)構(gòu)集合,即它是由知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)所構(gòu)成的集合。其中,知識(shí)節(jié)點(diǎn)(以下簡(jiǎn)稱(chēng)節(jié)點(diǎn))一般代表知識(shí)單元的存儲(chǔ)單位,由概念或者事物組成;知識(shí)關(guān)聯(lián)(以下簡(jiǎn)稱(chēng)邊)可分為內(nèi)部關(guān)聯(lián)和外部關(guān)聯(lián)。內(nèi)部關(guān)聯(lián)構(gòu)成知識(shí)個(gè)體,表達(dá)知識(shí)的內(nèi)涵聯(lián)系,外部關(guān)聯(lián)是知識(shí)個(gè)體之間的外延聯(lián)系,構(gòu)成知識(shí)網(wǎng)絡(luò)的各種鏈接關(guān)系。因此,知識(shí)網(wǎng)絡(luò)是由節(jié)點(diǎn)和邊構(gòu)成的網(wǎng)狀結(jié)構(gòu),這種網(wǎng)狀結(jié)構(gòu)的表現(xiàn)形式多種多樣,有樹(shù)型結(jié)構(gòu)、星狀結(jié)構(gòu)、環(huán)型結(jié)構(gòu)、單向關(guān)系網(wǎng)絡(luò)、多向交叉復(fù)合關(guān)系網(wǎng)絡(luò)等。

        典型的知識(shí)網(wǎng)絡(luò)主要考慮知識(shí)節(jié)點(diǎn)之間的二元關(guān)聯(lián),即兩個(gè)知識(shí)節(jié)點(diǎn)之間的關(guān)聯(lián)。通常,事物之間的關(guān)聯(lián)不僅僅是單一和單向的簡(jiǎn)單關(guān)系,而是一個(gè)復(fù)雜和多向的網(wǎng)絡(luò)。鑒于網(wǎng)絡(luò)世界中知識(shí)節(jié)點(diǎn)之間關(guān)聯(lián)的復(fù)雜性,一般的二元網(wǎng)絡(luò)圖難以完全刻畫(huà)網(wǎng)絡(luò)世界中知識(shí)的特征,因此,出現(xiàn)了超越一般網(wǎng)絡(luò)的網(wǎng)絡(luò)系統(tǒng)問(wèn)題。本文研究的知識(shí)網(wǎng)絡(luò)規(guī)模巨大、連接復(fù)雜,知識(shí)節(jié)點(diǎn)具有異質(zhì)性,可以稱(chēng)為超網(wǎng)絡(luò)(hyper-network),本文用超圖來(lái)定義該類(lèi)超網(wǎng)絡(luò)[19]。超圖這一概念是Berge在1970年提出的[20],超圖不同于一般圖論中的無(wú)向或有向圖,后者的每一個(gè)邊只連接兩個(gè)節(jié)點(diǎn),而超圖中的邊可以連接兩個(gè)以上的節(jié)點(diǎn),稱(chēng)為超邊。因此,本文提出的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的模型是用超圖表示的超網(wǎng)絡(luò)。下面給出超圖在數(shù)學(xué)上的嚴(yán)格定義,見(jiàn)定義1。

        定義1設(shè)V={v1,v2,…,vn}是一個(gè)有限集,若滿(mǎn)足以下條 件,則稱(chēng)二元關(guān)系H=(E,V)為超圖。V={v1,v2,…,vn}是超圖的頂點(diǎn)集,E={e1,e2,…,en}是超圖的邊集,集合ei={vi1,vi2,…,vij}(i=1,2,…,m)為超圖的邊。如果在超圖的邊集中定義了方向,那么超圖就是有向超圖;反之,則是無(wú)向超圖。

        圖1 智能搜索模式的設(shè)想

        定義2(超路徑)超圖H中的頂點(diǎn)和超邊交錯(cuò)序列{v1,E1,v2,E2,…,Eq,vq+1}稱(chēng)為具有長(zhǎng)度為q的超路徑,若滿(mǎn)足以下條件:

        ·{v1,v2,…,vq+1}在超圖H中彼此不同;

        ·{E1,E2,…,Eq}在超圖H中彼此不同;

        ·vk,vk+1∈Ek,k=1,2,…,q。

        同時(shí)q≠1且vq+1=v1,則這一條超路徑稱(chēng)為長(zhǎng)度為q的超回路。

        超圖是對(duì)圖的一種擴(kuò)展,其在描述多個(gè)節(jié)點(diǎn)之間擁有復(fù)雜多元關(guān)系的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)時(shí),具有極大的優(yōu)勢(shì)。比如有8個(gè)知識(shí)節(jié)點(diǎn)V={v1,v2,v3,v4,v5,v6,v7,v8},構(gòu)成4個(gè)多元關(guān)系E={e1,e2,e3,e4},其中,e1={v1,v2,v4},e2={v2,v3,v4},e3={v4,v5,v8},e4={v5,v6,v7,v8},用超邊表示多元關(guān)系,可以得到如圖2所示的超圖。

        圖2 超圖表示的多元關(guān)系

        3.2 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的系統(tǒng)建模方案

        3.2.1 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)模式

        動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)是對(duì)互聯(lián)網(wǎng)域空間知識(shí)的描述,是表示知識(shí)節(jié)點(diǎn)及節(jié)點(diǎn)間相互關(guān)聯(lián)的復(fù)雜網(wǎng)絡(luò)系統(tǒng)。本文基于超圖理論對(duì)動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)進(jìn)行建模,拓展了普通圖中的節(jié)點(diǎn)和關(guān)系的類(lèi)型,能夠更加靈活地實(shí)現(xiàn)知識(shí)的概念化描述。為了實(shí)現(xiàn)知識(shí)的語(yǔ)義表達(dá),需要從結(jié)構(gòu)上對(duì)其模式進(jìn)行分析,解釋知識(shí)網(wǎng)絡(luò)的模式是如何由一些簡(jiǎn)單的子模式(模式基元)組合而成的。表1為動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)子模式示例。

        通過(guò)對(duì)節(jié)點(diǎn)和關(guān)系描述的拓展,動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)能夠描述更加復(fù)雜的結(jié)構(gòu),也使得對(duì)子模式的提取具有更加豐富的語(yǔ)義信息。結(jié)合超點(diǎn)和超邊子模式,還可以衍生更加抽象和復(fù)雜的子模式。在一些應(yīng)用中,通過(guò)這些子模式進(jìn)行動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的分解和縮減可以簡(jiǎn)化結(jié)構(gòu)的復(fù)雜性,從而在更高層次上分析網(wǎng)絡(luò)結(jié)構(gòu)的特性。

        3.2.2 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的系統(tǒng)模型

        面向開(kāi)放網(wǎng)絡(luò)數(shù)據(jù)環(huán)境,本文結(jié)合相關(guān)研究[21],提出動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的系統(tǒng)模型,針對(duì)海量數(shù)據(jù)中知識(shí)的各種特征表現(xiàn)和復(fù)雜關(guān)聯(lián)進(jìn)行語(yǔ)義知識(shí)表達(dá)和操作。動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的系統(tǒng)模型使用一個(gè)七元組表示,即DKN=(V,E,A,Val,F,G,O),其中,V是知識(shí)節(jié)點(diǎn)的非空有限集合,E是知識(shí)關(guān)聯(lián)的非空有限集合,A是知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)屬性的非空有限集合,Val是屬性的值域集,F(xiàn)是知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)上的屬性值映射函數(shù)集,G是知識(shí)節(jié)點(diǎn)上的關(guān)聯(lián)映射函數(shù)集,O是針對(duì)知識(shí)網(wǎng)絡(luò)的各類(lèi)操作,即計(jì)算算子的集合。下面分別對(duì)該模型的組成元素進(jìn)行介紹。

        (1)知識(shí)節(jié)點(diǎn)V

        知識(shí)節(jié)點(diǎn)由在認(rèn)識(shí)上具有獨(dú)立性的知識(shí)元素構(gòu)成,具有層次性,其最小粒度可以稱(chēng)為知識(shí)元,是獨(dú)立不可再分的知識(shí)元素,如人名、城市名等。知識(shí)元是最小的知識(shí)節(jié)點(diǎn),多個(gè)知識(shí)元通過(guò)知識(shí)關(guān)聯(lián)可以構(gòu)成更大的知識(shí)節(jié)點(diǎn),知識(shí)節(jié)點(diǎn)的集合可以構(gòu)成知識(shí)體系。對(duì)于V={v1,v2,…,vn},知識(shí)節(jié)點(diǎn)vi代表一個(gè)簡(jiǎn)單或者復(fù)雜的事物或概念。

        (2)知識(shí)關(guān)聯(lián)E

        知識(shí)關(guān)聯(lián)是構(gòu)成動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的知識(shí)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系,這種關(guān)聯(lián)表現(xiàn)為以一種拓?fù)湫问酱嬖诘木W(wǎng)絡(luò)結(jié)構(gòu),其網(wǎng)絡(luò)性體現(xiàn)在知識(shí)因?yàn)楸旧淼哪撤N聯(lián)系而相互聚集形成網(wǎng)絡(luò)。E={e1,e2,…,en}是帶有標(biāo)簽的有向超邊和無(wú)向超邊的集合,超邊ei代表一個(gè)簡(jiǎn)單或者復(fù)雜的知識(shí)關(guān)聯(lián),其最小粒度是獨(dú)立不可再分的關(guān)聯(lián)關(guān)系。有向超邊ei=<(ri),(λi)>是一個(gè)序偶,ri是ei中輸入變量的集合,λi是ei中輸出變量的集合;無(wú)向超邊ei={v1,v2,…,vm}是一個(gè)多元無(wú)向邊集合。通常有3種基本的知識(shí)關(guān)聯(lián)類(lèi)型:同一性關(guān)聯(lián),知識(shí)節(jié)點(diǎn)間具有某種共同性質(zhì)形成的關(guān)聯(lián),主要表現(xiàn)為知識(shí)節(jié)點(diǎn)間的繼承性,知識(shí)節(jié)點(diǎn)的等同性是同一關(guān)聯(lián)的特殊表現(xiàn);隸屬性關(guān)聯(lián),構(gòu)成知識(shí)節(jié)點(diǎn)的單個(gè)知識(shí)元或者知識(shí)元集合隸屬某個(gè)概念、類(lèi)別和范疇的邏輯關(guān)系,主要表現(xiàn)為知識(shí)節(jié)點(diǎn)間的屬性關(guān)系、分類(lèi)關(guān)系、包含關(guān)系等;相關(guān)性關(guān)聯(lián),是在同一性關(guān)聯(lián)、隸屬性關(guān)聯(lián)之外的,知識(shí)節(jié)點(diǎn)間大多具有的相互依存、相互作用的關(guān)聯(lián),主要表現(xiàn)為工作、家庭、應(yīng)用、影響等各種關(guān)系,這種關(guān)系不是嚴(yán)格固定的,其數(shù)量關(guān)系也是不完全確定的,它使得知識(shí)節(jié)點(diǎn)間在橫向上形成關(guān)聯(lián)網(wǎng)絡(luò)。

        表1 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)子模式示例

        (3)屬性A、屬性的值域集Val、屬性值映射函數(shù)F

        一個(gè)具體的事物或者概念總是通過(guò)一些性質(zhì)加以描述和區(qū)分,屬性用來(lái)描述知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)自身的性質(zhì)和特征。具體又可以將屬性分為數(shù)值型屬性和對(duì)象型屬性?xún)纱箢?lèi)。A=AV∪AE,其中,AV是知識(shí)節(jié)點(diǎn)屬性集,AE是知識(shí)關(guān)聯(lián)屬性集。Val=ValV∪ValE,是知識(shí)節(jié)點(diǎn)屬性和知識(shí)關(guān)聯(lián)屬性的值域集合。F=FV∪FE,是知識(shí)節(jié)點(diǎn)、知識(shí)關(guān)聯(lián)與各自屬性值的映射函數(shù),其中,F(xiàn)V:V×AV→ValV,F(xiàn)E:E×AE→ValE。比如V={v1,v2,v3}代表3個(gè)企業(yè),組成的商業(yè)合作可以用一條超邊e1={v1,v2,v3}來(lái)描述,其中AV包含“公司名稱(chēng)”、“成立時(shí)間”、“年?duì)I業(yè)額”等企業(yè)的屬性,AE包含該商業(yè)合作的屬性,如“組建時(shí)間”、“合作模式”等,屬性取值ValV包括 “中遠(yuǎn)集運(yùn)”、“中海集運(yùn)”、“中國(guó)外運(yùn)”等,ValE包括“2014年5月”和“合作經(jīng)營(yíng)”等。在動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)系統(tǒng)中,不同屬性的對(duì)應(yīng)取值及取值約束通過(guò)F來(lái)確定,如F(組建時(shí)間)→Date(2014年5月)。另外,利用屬性值映射函數(shù)還可以實(shí)現(xiàn)節(jié)點(diǎn)間基于屬性的聚類(lèi)。

        (4)知識(shí)關(guān)聯(lián)映射函數(shù)G

        動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)中各個(gè)知識(shí)節(jié)點(diǎn)按照需要的因素、層次、結(jié)構(gòu)和功能等構(gòu)成結(jié)構(gòu)化的知識(shí)網(wǎng)絡(luò)系統(tǒng),這種結(jié)構(gòu)化的過(guò)程需要將知識(shí)節(jié)點(diǎn)通過(guò)某些方式關(guān)聯(lián)起來(lái),即知識(shí)關(guān)聯(lián)映射。G是V上的關(guān)聯(lián)函數(shù)集合,G={g|g(v)=e},表示事物之間的不同關(guān)聯(lián)類(lèi)型。當(dāng)然,也可以理解為G是超邊構(gòu)造函數(shù),反映了知識(shí)節(jié)點(diǎn)間超邊的構(gòu)造關(guān)系。構(gòu)建知識(shí)節(jié)點(diǎn)間的知識(shí)關(guān)聯(lián)是建立動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的關(guān)鍵環(huán)節(jié),G決定了哪些知識(shí)節(jié)點(diǎn)在同一個(gè)知識(shí)關(guān)聯(lián)中以及知識(shí)關(guān)聯(lián)是如何劃分的。根據(jù)知識(shí)節(jié)點(diǎn)間關(guān)聯(lián)類(lèi)型是否明確,可以有兩種構(gòu)建方式:對(duì)于可以預(yù)定義的關(guān)聯(lián)模式,采用先知識(shí)關(guān)聯(lián)后知識(shí)節(jié)點(diǎn)的構(gòu)建方式,即先確定動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的關(guān)聯(lián)模式,描述為超邊,然后在知識(shí)節(jié)點(diǎn)集中搜索符合各關(guān)聯(lián)模式的知識(shí)節(jié)點(diǎn)對(duì);對(duì)于關(guān)聯(lián)模式比較模糊的情況,可以通過(guò)對(duì)知識(shí)節(jié)點(diǎn)進(jìn)行信息抽取,尋找它們之間的關(guān)聯(lián)模式,常用聚類(lèi)、頻繁項(xiàng)集挖掘等方法。

        (5)計(jì)算算子O

        計(jì)算算子主要針對(duì)知識(shí)網(wǎng)絡(luò)完成各類(lèi)運(yùn)算操作,如同普通運(yùn)算符號(hào)作用于數(shù)后,可以得到新的數(shù),一個(gè)算子作用于一個(gè)輸入后,可以實(shí)現(xiàn)從一個(gè)知識(shí)網(wǎng)絡(luò)空間到另一個(gè)知識(shí)網(wǎng)絡(luò)空間(或它自身)的映射。根據(jù)實(shí)際需求,將算子分為兩大類(lèi):一是實(shí)現(xiàn)動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)內(nèi)部元素動(dòng)態(tài)構(gòu)造的構(gòu)建類(lèi)算子,二是提供外部服務(wù)的應(yīng)用類(lèi)算子?;谕獠啃畔⑤斎氲挠?jì)算算子模型如圖3所示。

        結(jié)合新信息的輸入,計(jì)算算子封裝一些針對(duì)動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)常用操作的靈活組合,從而實(shí)現(xiàn)基于計(jì)算算子的運(yùn)算。表2給出了一些針對(duì)動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的常用算子示例。

        3.2.3 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)模型的特點(diǎn)

        本文通過(guò)對(duì)網(wǎng)絡(luò)世界知識(shí)進(jìn)行建模,提出基于超圖理論的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)系統(tǒng)模型,該模型具有以下幾個(gè)方面的特點(diǎn)。

        (1)可以描述復(fù)雜知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)

        動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)模型中允許定義復(fù)雜知識(shí)節(jié)點(diǎn),知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)在一定程度上可以相互轉(zhuǎn)化,因此,復(fù)雜知識(shí)節(jié)點(diǎn)可以是多個(gè)知識(shí)節(jié)點(diǎn)、知識(shí)關(guān)聯(lián)的集合。知識(shí)關(guān)聯(lián)復(fù)雜多樣,既有二元關(guān)聯(lián),又有多元關(guān)聯(lián)。既有明確定義的關(guān)聯(lián)類(lèi)型,又有難以明確描述的關(guān)聯(lián)類(lèi)型,因此具有很強(qiáng)的知識(shí)描述能力,其完整形態(tài)是一個(gè)多元、異構(gòu)、立體的超網(wǎng)絡(luò)。

        (2)結(jié)構(gòu)開(kāi)放、靈活,可擴(kuò)展性強(qiáng)

        動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)模型描述的知識(shí)是可擴(kuò)展的,可動(dòng)態(tài)感知數(shù)據(jù)的變化,同時(shí)具有時(shí)效性,隨著新信息的加入而動(dòng)態(tài)更新。另外,模型中允許定義新的知識(shí)關(guān)聯(lián),通過(guò)關(guān)聯(lián)結(jié)構(gòu)的可變實(shí)現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)的靈活性,同時(shí)對(duì)未知關(guān)聯(lián)類(lèi)型的包容性使得面對(duì)不確定的環(huán)境時(shí),網(wǎng)絡(luò)結(jié)構(gòu)也可以隨著信息的交互而發(fā)生演化。

        圖3 計(jì)算算子模型

        表2 動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的常用算子示例

        (3)具有處理不確定、不精確信息的能力

        動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)模型是基于超圖理論的,而超圖中的集合理論是其核心,因此,基于集合的表達(dá)方式適合描述非明確定義的關(guān)系和規(guī)則。對(duì)于難以被明確定義和精確描述的知識(shí)關(guān)聯(lián),該模型采用無(wú)向超邊進(jìn)行描述,同時(shí),模型中定義的計(jì)算算子可以實(shí)現(xiàn)對(duì)知識(shí)網(wǎng)絡(luò)的各類(lèi)操作,使得能夠利用圖理論來(lái)處理網(wǎng)絡(luò)環(huán)境下不確定、不精確的信息。

        (4)具有較強(qiáng)的可計(jì)算性

        基于圖理論,動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)模型中定義了多種類(lèi)型的圖操作,通過(guò)這些圖操作的靈活組合,計(jì)算算子可以實(shí)現(xiàn)動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)構(gòu)建和應(yīng)用過(guò)程中的模式識(shí)別、路徑分析、子模式構(gòu)建等各種計(jì)算功能。另外,在特定的應(yīng)用需求驅(qū)動(dòng)下,基于一定的規(guī)則和約束條件,還可以進(jìn)行知識(shí)的推理計(jì)算。

        圖4 基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的智能搜索框架

        4 基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的智能搜索

        新一代的智能搜索致力于建立一個(gè)智能化、個(gè)性化和互動(dòng)的搜索模式,這就需要實(shí)現(xiàn)對(duì)查詢(xún)請(qǐng)求的語(yǔ)義理解和對(duì)目標(biāo)文檔的語(yǔ)義理解,而語(yǔ)義理解是建立在語(yǔ)義知識(shí)庫(kù)基礎(chǔ)之上的。本文提出動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的系統(tǒng)建模方法,通過(guò)構(gòu)建動(dòng)態(tài)知識(shí)網(wǎng)絡(luò),提高搜索引擎的語(yǔ)義理解能力,從而達(dá)到智能搜索的目標(biāo)。基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的智能搜索框架如圖4所示。

        其基本思想是:充分利用現(xiàn)有各類(lèi)數(shù)據(jù)資源,基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)系統(tǒng)模型,結(jié)合機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等技術(shù),構(gòu)建動(dòng)態(tài)知識(shí)網(wǎng)絡(luò),并以此為語(yǔ)義基礎(chǔ),支持基于語(yǔ)義理解的智能搜索。動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)對(duì)智能檢索的語(yǔ)義支持通常包含以下兩個(gè)方面。

        (1)語(yǔ)義的擴(kuò)展與優(yōu)化

        用戶(hù)以自然語(yǔ)言輸入查詢(xún),系統(tǒng)基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)進(jìn)行語(yǔ)義分析,需要理解用戶(hù)提交關(guān)鍵詞搜索背后的真正意圖,主要包括分類(lèi)、屬性、同義等語(yǔ)義關(guān)系的提取、歧義消解等,從而豐富查詢(xún)的語(yǔ)義信息。同時(shí),在語(yǔ)義理解的基礎(chǔ)上,對(duì)數(shù)據(jù)資源進(jìn)行整合處理,獲取真正符合語(yǔ)義的信息資源。

        (2)語(yǔ)義的推理與計(jì)算

        基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò),對(duì)用戶(hù)查詢(xún)的關(guān)鍵詞進(jìn)行概念化或者實(shí)例化處理、相似性計(jì)算等,從而在更高層次或者更細(xì)粒度上建立語(yǔ)義關(guān)聯(lián)。同時(shí),根據(jù)動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)的推理規(guī)則,進(jìn)一步拓展語(yǔ)義的關(guān)聯(lián)和約束。

        5 結(jié)束語(yǔ)

        本文通過(guò)對(duì)現(xiàn)有信息檢索和語(yǔ)義處理技術(shù)的介紹,分析了基于語(yǔ)義技術(shù)進(jìn)行智能搜索的發(fā)展前景?;诖?,提出以超圖理論為基礎(chǔ)、以計(jì)算算子為技術(shù)支撐進(jìn)行網(wǎng)絡(luò)世界知識(shí)建模的動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)建模方法,并詳細(xì)闡述了該模型的理論基礎(chǔ)、結(jié)構(gòu)模式、系統(tǒng)模型及其特點(diǎn),最后給出了基于動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)支撐智能搜索的基本結(jié)構(gòu)框架,為基于語(yǔ)義的智能搜索應(yīng)用提供了有效的模型和方法支持。盡管目前已經(jīng)進(jìn)行了一些探索性的研究工作,但未來(lái)的工作仍然面臨兩個(gè)重要挑戰(zhàn):動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)系統(tǒng)模型的完善;動(dòng)態(tài)知識(shí)網(wǎng)絡(luò)支撐的智能檢索應(yīng)用。

        1 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心.2013年中國(guó)搜索引擎市場(chǎng)研究報(bào)告,2013

        2 李國(guó)杰,程學(xué)旗.大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考.中國(guó)科學(xué)院院刊,2012,27(6):647~657

        3 Lee T B.Semantic web on XML.http://www.w3.org/2000/talks/1206-xml2k-tbl,2014

        4 王本年,高陽(yáng),陳世福等.Web智能研究現(xiàn)狀與發(fā)展趨勢(shì).計(jì)算機(jī)研究與發(fā)展,2005,42(5):721~727

        5 文坤梅,盧正鼎,孫小林等.語(yǔ)義搜索研究綜述.計(jì)算機(jī)科學(xué),2008,35(5):1~4

        6 Guarino N.Ontoseek:content-based access to the web.IEEE Intelligent Systems,1999,5(6):70~80

        7 Guha R,McCool R.TAP:a semantic web test-bed.Journal of Web Semantics,2003,1(1):81~87

        8 Kruse P M,Naujoks A,Roesner D,et al.Clever search:a wordnet based wrapper for internet search engines.Proceedings of the 2nd GermaNet Workshop,Bonn,Germany,2005:367~380

        9 Heflin J,Hendler J.Searching the web with shoe.Proceedings of AAAI-2000 Workshop on AI for Web Search,Austin,Texas,2000:450~455

        10 周琦.基于關(guān)鍵詞的語(yǔ)義搜索.上海交通大學(xué)碩士學(xué)位論文,2009

        11 吳剛,唐杰,李涓子等.細(xì)粒度語(yǔ)義網(wǎng)檢索.清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,45(1):1865~1872

        12 Cafarella M J,Downey D,Soderland S,et al.KnowItAll:fast,scalable information extraction from the web.Proceedings of the Conference on Empirical Methods in Natural Language Processing,Vancouver B C,Canada,2005:563~570

        13 文坤梅.基于本體知識(shí)庫(kù)推理的語(yǔ)義搜索研究.華中科技大學(xué)博士學(xué)位論文,2007

        14 Zhang L,Yu Y,Zhou J,et al.An enhanced model for searching in semantic portals.Proceedings of the International Conference on World Wide Web,Chiba,Japan,2005:453~462

        15 王眾托.無(wú)處不在的網(wǎng)絡(luò)社會(huì)中的知識(shí)網(wǎng)絡(luò).信息系統(tǒng)學(xué)報(bào),2007,1(1):1~7

        16 趙蓉英.論知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu).圖書(shū)情報(bào)工作,2007,51(9):6~10

        17 田占偉,張慶普,劉臣.語(yǔ)義知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)分析與構(gòu)建.情報(bào)理論與實(shí)踐,2011,34(10):113~118

        18 劉向,馬費(fèi)成,王曉光.知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)及過(guò)程模型.系統(tǒng)工程理論與實(shí)踐,2013,33(7):1836~1844

        19 王志平,王眾托.超網(wǎng)絡(luò)理論及其應(yīng)用.北京:科學(xué)出版社,2008

        20 王眾托.關(guān)于超網(wǎng)絡(luò)的一點(diǎn)思考.上海理工大學(xué)學(xué)報(bào),2011,33(3):229~237

        21 吳穎敏.市場(chǎng)機(jī)遇發(fā)現(xiàn)的超圖支持方法研究.華中科技大學(xué)博士學(xué)位論文,2009

        猜你喜歡
        算子關(guān)聯(lián)語(yǔ)義
        擬微分算子在Hp(ω)上的有界性
        各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應(yīng)用
        語(yǔ)言與語(yǔ)義
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        一類(lèi)Markov模算子半群與相應(yīng)的算子值Dirichlet型刻畫(huà)
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        Roper-Suffridge延拓算子與Loewner鏈
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        亚洲人成人无码www| 久久亚洲伊人| 亚洲天天综合色制服丝袜在线| 久久迷青品着产亚洲av网站| 日韩av一区二区不卡在线| 色婷婷av一区二区三区久久| 成人午夜特黄aaaaa片男男| 久久久久亚洲av无码专区导航| 三级国产女主播在线观看| 亚洲美女主播一区二区| 亚洲精品一区二区在线免费观看| 久久精品99国产精品日本| 日韩人妻无码精品久久免费一 | 国产一区二区三区视频了| av免费资源在线观看| 国产精品永久在线观看| 男人j进女人j啪啪无遮挡| 中文字幕一区二区人妻出轨| 亚洲日本在线中文字幕| 亚洲不卡免费观看av一区二区| 国产成人亚洲综合| 少妇做爰免费视频网站| 欧美日韩中文亚洲另类春色| 黄片午夜免费观看视频国产| 熟女一区二区中文字幕| 中国老熟妇506070| 丰满爆乳一区二区三区| 天堂av无码大芭蕉伊人av孕妇黑人 | 男女啪啪免费体验区| 亚洲欧美日韩国产综合专区| 五月综合丁香婷婷久久| 五月激情综合婷婷六月久久| 99热这里有精品| 国产精品三级一区二区按摩| 亚洲精品一区二区三区av| 中文字幕精品亚洲字幕| 18禁黄网站禁片免费观看女女| 免费夜色污私人影院在线观看| 国产视频精品一区白白色| 国产精品熟女少妇不卡| 国内最真实的xxxx人伦|