毛淑賢 朱桂鳳
摘 要:語義網(wǎng)格使互聯(lián)網(wǎng)上日益膨脹的信息資源實(shí)現(xiàn)共享,通過協(xié)同工作和共享能力,為用戶提供功能強(qiáng)大的一站式服務(wù)。為了更加清楚地認(rèn)識(shí)語義網(wǎng)格作為一種新的資源管理技術(shù)的應(yīng)用歸納整理了語義網(wǎng)格的相關(guān)研究內(nèi)容。通過分析目前在語義網(wǎng)格已取得的研究成果,介紹語義網(wǎng)格的基本概念,梳理語義網(wǎng)格的核心技術(shù),分析語義網(wǎng)格的框架及其研究內(nèi)容,初步分析得出語義網(wǎng)格技術(shù)的發(fā)展趨勢(shì)。
關(guān)鍵詞:網(wǎng)格計(jì)算;語義網(wǎng)格;Web服務(wù);資源管理
中圖分類號(hào):TP393
0 引 言
資源的有效管理是計(jì)算機(jī)和網(wǎng)絡(luò)有效工作的基礎(chǔ)。建立適用于互聯(lián)網(wǎng)環(huán)境的語義數(shù)據(jù)模型,實(shí)現(xiàn)有效信息、知識(shí)的服務(wù)共享和管理的一條重要途徑,語義網(wǎng)格是面向語義的智能互聯(lián)應(yīng)用環(huán)境,它需要建立一套新的理論和方法實(shí)現(xiàn)對(duì)地理分布不同的各種網(wǎng)絡(luò)資源進(jìn)行規(guī)范和靈活的組織,實(shí)現(xiàn)網(wǎng)絡(luò)資源的有效共享和智能利用。
語義網(wǎng)格是在Web技術(shù)和網(wǎng)格計(jì)算技術(shù)發(fā)展的基礎(chǔ)上發(fā)展而來的,具備智能性、協(xié)作性和可靠性等特點(diǎn),使其逐步成為網(wǎng)格研究的一個(gè)新興熱點(diǎn)。國外已經(jīng)開展了多項(xiàng)關(guān)于語義網(wǎng)格的項(xiàng)目研究工作,已建立了100余個(gè)試驗(yàn)項(xiàng)目,如myGrid,WSMO,GEODISE,DartGrid等。近年來,我國也非常重視這方面的研究工作,國內(nèi)的中國科院計(jì)算所、清華大學(xué)、國防科技大學(xué)等研究單位也對(duì)語義網(wǎng)格和網(wǎng)格計(jì)算開展了大量研究工作,相關(guān)課題進(jìn)行開展并取得一定的研究成果。語義網(wǎng)格的諸多優(yōu)勢(shì)使其具備廣闊的發(fā)展前景,相關(guān)研究成果必將推動(dòng)網(wǎng)格、互聯(lián)網(wǎng)等技術(shù)的迅速發(fā)展。
1 語義網(wǎng)格的基本概念
2001年,David De Roure等人首次使用了語義網(wǎng)格(Semantic Grid)概念,將未來e[CD*2]Science的基礎(chǔ)研究稱為語義網(wǎng)格。語義網(wǎng)格被描述為一個(gè)支持全球范圍內(nèi),靈活協(xié)作與計(jì)算的高度自動(dòng)化開放系統(tǒng)。語義網(wǎng)格概念的提出結(jié)合了語義 Web、 網(wǎng)格和 Web服務(wù)的優(yōu)點(diǎn)并彌補(bǔ)了彼此的不足。全球網(wǎng)格論壇成立了語義網(wǎng)格研究組來提供對(duì)語義網(wǎng)格的支持,研究把語義網(wǎng)技術(shù)應(yīng)用到網(wǎng)格問題中,把語義網(wǎng)格定義為當(dāng)前網(wǎng)格的延伸,因?yàn)樾畔⒑头?wù)有了清晰明了的含義,人與計(jì)算機(jī)能夠更好地合作[3]。在該定義里,著重描述信息和服務(wù)的概念,也基本上規(guī)劃了語義網(wǎng)格的發(fā)展方向,是以信息和服務(wù)為主體,人和計(jì)算機(jī)更好的合作,不僅作為途徑,也是語義網(wǎng)格發(fā)展的中間產(chǎn)物。計(jì)算機(jī)只有具有更高的靈活性和協(xié)作性,才能更快地實(shí)現(xiàn)與人的無縫合作,達(dá)到信息服務(wù)目的。由于語義網(wǎng)格是一個(gè)基于網(wǎng)格技術(shù)和語義網(wǎng)發(fā)展起來的,針對(duì)的描述對(duì)象領(lǐng)域范圍很大,包括對(duì)象、服務(wù)、過程、資源、能力等。
從根本上看,語義網(wǎng)格實(shí)現(xiàn)了網(wǎng)格和語義網(wǎng)融合的優(yōu)勢(shì)。當(dāng)前網(wǎng)格缺乏機(jī)器可讀可理解的數(shù)據(jù)語義,缺乏人和機(jī)器的合作支撐,機(jī)器難以處理異構(gòu)資源,難以聯(lián)合、再利用信息,難以靈活協(xié)作、高度易用和無縫自動(dòng)化,難以根據(jù)用戶的需求自動(dòng)地生產(chǎn)知識(shí)。而語義網(wǎng)雖然實(shí)現(xiàn)了計(jì)算機(jī)可理解的數(shù)據(jù)語義問題,但難以實(shí)現(xiàn)互聯(lián)網(wǎng)上各種資源(包括硬件和軟件資源)的共享,難以滿足日益增長的計(jì)算需求。
圖1表明了Web、網(wǎng)格、語義網(wǎng)和語義網(wǎng)格的關(guān)系[4],橫軸用數(shù)據(jù)和計(jì)算能力表示網(wǎng)格的發(fā)展方向,縱軸用互操作性能表示語義網(wǎng)的發(fā)展方向。可以認(rèn)為,Web是網(wǎng)格的基礎(chǔ),Web加上數(shù)據(jù)和計(jì)算能力,則可逐步發(fā)展為網(wǎng)格;另一方面,Web(或網(wǎng)格)加上語義能力(豐富的互操作性)即可實(shí)現(xiàn)語義Web。語義網(wǎng)格則是Web結(jié)合計(jì)算和語義能力的最終產(chǎn)物。所以,它具備語義Web和網(wǎng)格的優(yōu)點(diǎn),實(shí)現(xiàn)二者的結(jié)合應(yīng)用。
2 語義網(wǎng)格的核心技術(shù)
語義網(wǎng)格的關(guān)鍵之處是把作為一個(gè)分布式數(shù)據(jù)存儲(chǔ)的Web的當(dāng)前結(jié)構(gòu),轉(zhuǎn)化成可以被基于計(jì)算機(jī)實(shí)體理解的信息存儲(chǔ)結(jié)構(gòu)。這里從互聯(lián)網(wǎng)的自然特性、人類社會(huì)對(duì)互聯(lián)網(wǎng)應(yīng)用的需求、信息科學(xué)和互聯(lián)網(wǎng)本身的進(jìn)化需求所產(chǎn)生的科學(xué)問題出發(fā),介紹新一代互聯(lián)網(wǎng)應(yīng)用平臺(tái)的關(guān)鍵理論和技術(shù)[3,5[CD*2]8]。
(1) 元數(shù)據(jù)。
元數(shù)據(jù)是用于描述數(shù)據(jù)的數(shù)據(jù),包含語義和它所涉及數(shù)據(jù)的解釋,是對(duì)語義網(wǎng)格上信息的┮恢知描述方式。這種描述方式使得信息變成計(jì)算機(jī)可以理解的信息。為了把數(shù)據(jù)轉(zhuǎn)換為信息,元數(shù)據(jù)必須加入到上下文環(huán)境中。元數(shù)據(jù)和本體對(duì)語義web的發(fā)展是關(guān)鍵的。語義網(wǎng)格使用元數(shù)據(jù)來描述網(wǎng)格中的信息。將信息轉(zhuǎn)化為一些更有意義的東西,而不只是一個(gè)數(shù)據(jù)集合,這意味著需要正確理解數(shù)據(jù)的內(nèi)容、格式和重要性。語義Web就遵循這種模型,即提供其他一些元數(shù)據(jù)來幫助描述在Web頁面上顯示的信息,這樣瀏覽器、應(yīng)用程序和用戶就能夠更好地決定如何處理數(shù)據(jù)。
(2) 本體和本體庫。
本體是一個(gè)概念性的描述,共享概念模型的形式化規(guī)范說明,目標(biāo)是獲取、描述和表示相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯間相互關(guān)系的明確定義。本體也是一個(gè)概念性的規(guī)范,該規(guī)范的本質(zhì)是在知識(shí)和Web工程的上下文空間中通過語義含義提供一個(gè)清晰的表達(dá)。與模式語言形成對(duì)比,例如XML模式,本體試圖用原始的知識(shí)表述捕獲研究領(lǐng)域的語義,使得計(jì)算機(jī)能完全或部分理解一個(gè)領(lǐng)域中的概念之間的關(guān)系。本體為域提供┮桓霆通用詞匯,并定義屬于的含義和它們之間的關(guān)系。本體指的是對(duì)一些感興趣領(lǐng)域的┮桓霆共享理解,經(jīng)常被構(gòu)思為一個(gè)類(概念)、關(guān)系、功能、原理和實(shí)例的集合。在本體中的概念通常用分類法組織。
本體庫的概念對(duì)于取得表達(dá)能力是很必要的,在用知識(shí)進(jìn)行建模和推理的過程中需要這種能力??偟膩碚f,一個(gè)本體庫決定了術(shù)語的外延和它們之間的關(guān)系。本體庫的好處是改進(jìn)了在系統(tǒng)之間的通信,這些系統(tǒng)可以是機(jī)器、用戶或者組織。它們的目標(biāo)就是建立一個(gè)一致的,可能是規(guī)范的模型。本體庫的另外一個(gè)好處是可互操作性,一個(gè)本體庫可以作為一種國際語,它可以推動(dòng)內(nèi)容的重用,確保給出一個(gè)清晰的規(guī)范來表達(dá)內(nèi)容或者服務(wù)是關(guān)于什么的,增加內(nèi)容和服務(wù)被成功集成的機(jī)會(huì)。可以說,本體庫提供了內(nèi)容的通信、集成和共享的基礎(chǔ)。但是它們還可以提供更多的便利,它可以通過去除模糊性和指出相關(guān)術(shù)語,或者通過建立從頁面得到的信息與其他信息建立聯(lián)系,來改進(jìn)搜索準(zhǔn)確性。還有,互聯(lián)網(wǎng)推理系統(tǒng)開始出現(xiàn),它可以通過從現(xiàn)有的信息中抽取和產(chǎn)生注釋來開發(fā)本體庫。
(3) Web 服務(wù)。
開放性網(wǎng)格服務(wù)架構(gòu)(Open Grid Services Architecture,OGSA)以網(wǎng)格服務(wù)為中心的架構(gòu),非常有利于構(gòu)建語義網(wǎng)格環(huán)境。在OGSA網(wǎng)格體系結(jié)構(gòu)中,由于網(wǎng)格環(huán)境中所有的組件都是虛擬的,因此通過提供一組相對(duì)統(tǒng)一的核心接口,所有的網(wǎng)格服務(wù)都基于這些接口實(shí)現(xiàn),就可以很容易構(gòu)造出具有層次結(jié)構(gòu)的、更高級(jí)別的服務(wù)。
(4) 語義Web服務(wù)。
現(xiàn)有的Web服務(wù)圍繞著UDDI,WSDL和SOAP,提供了有限的機(jī)制來實(shí)現(xiàn)服務(wù)的發(fā)現(xiàn)、配置、組合和自動(dòng)協(xié)商,這對(duì)服務(wù)的調(diào)用來說抽象層次較低。語義服務(wù)的目標(biāo)是通過提升服務(wù)的描述,來指明服務(wù)的能力和任務(wù)完成的特性,使得在同一語義空間下的服務(wù)更容易整合。
(5) 管理資源。
規(guī)范組織是管理資源的有效方法,但互聯(lián)網(wǎng)應(yīng)用要求自組織性。因此,如何諧調(diào)規(guī)范性和自組織性是互聯(lián)網(wǎng)時(shí)代資源組織的關(guān)鍵問題。通過定義一套語義空間的范式來規(guī)范重構(gòu)各種網(wǎng)絡(luò)資源并與對(duì)等網(wǎng)絡(luò)技術(shù)相結(jié)合,使動(dòng)態(tài)網(wǎng)絡(luò)環(huán)境下的無序資源規(guī)范化,使資源操作準(zhǔn)確、方便,以實(shí)現(xiàn)有效的資源共享。
(6) 語義互聯(lián)。
如何實(shí)現(xiàn)分布在全球的各種網(wǎng)絡(luò)資源在語義層上互聯(lián),消除資源語義孤島。通過簡潔的方式從資源空間映射到語義空間,實(shí)現(xiàn)異構(gòu)資源在語義層的互聯(lián),通過與資源空間模型相結(jié)合,形成單一語義映像,使得各種資源在簡潔的語義空間中得到統(tǒng)一和互聯(lián)。
3 語義網(wǎng)格的框架
現(xiàn)在,隨著Internet的發(fā)展,Web網(wǎng)頁的快速膨脹,面對(duì)越來越多的信息,人們無法通過互聯(lián)網(wǎng)來獲得最有效的資源或者無法獲得資源,或者被過多的引用占用。作為解決這一問題的語義網(wǎng)格,它被描述為┮恢知開放的、面向服務(wù)的體系結(jié)構(gòu)。從面向服務(wù)的觀點(diǎn)來看,語義網(wǎng)格可劃分為4個(gè)服務(wù)層次:基本服務(wù)、數(shù)據(jù)服務(wù)、信息服務(wù)和知識(shí)服務(wù)。其中,基礎(chǔ)服務(wù)主要涉及到分布式資源的共享,包括對(duì)資源的分配、配置和重組等;數(shù)據(jù)服務(wù)主要針對(duì)共享資源計(jì)算和分析,這個(gè)層次提供的服務(wù)與數(shù)據(jù)存儲(chǔ)、元數(shù)據(jù)管理、數(shù)據(jù)復(fù)制和數(shù)據(jù)傳輸有關(guān);信息服務(wù)允許同意訪問各種各樣的信息源,并且提供運(yùn)行在分布式計(jì)算資源上的通用服務(wù);知識(shí)服務(wù)集中在知識(shí)表述和抽取上,支持用戶能隨時(shí)表述和存儲(chǔ)它生成的有用的知識(shí),并能方便地從分布在互聯(lián)網(wǎng)上的知識(shí)倉庫中獲取摘要的知識(shí),來解決遇到的問題。隨著因特網(wǎng)用戶的增多,互聯(lián)網(wǎng)上的知識(shí)資源能夠迅速積累并發(fā)展為整個(gè)互聯(lián)網(wǎng)團(tuán)體可以通用的知識(shí)財(cái)產(chǎn)。在語義網(wǎng)格中,知識(shí)層的目標(biāo)就是作為一個(gè)支持科學(xué)知識(shí)的管理和應(yīng)用程序的基礎(chǔ)設(shè)施,達(dá)到特定的目的和目標(biāo)??偟膩碚f,每個(gè)層次都是想要提供適應(yīng)不同應(yīng)用的服務(wù)。
更深層次的劃分,語義網(wǎng)格框架的表示如圖3所示。隨著網(wǎng)格的發(fā)展和語義網(wǎng)格概念的提出,語義網(wǎng)技術(shù)不僅在知識(shí)層起作用,而且滲透到整個(gè)語義網(wǎng)格架構(gòu)中。語義網(wǎng)格以O(shè)GSA和WSRF(Web Services Resource Framework,Web 服務(wù)資源框架)為基礎(chǔ),采用面向服務(wù)的結(jié)構(gòu),提供基本網(wǎng)格服務(wù),語義網(wǎng)格服務(wù),包括以此為基礎(chǔ)的知識(shí)網(wǎng)格,提供高級(jí)網(wǎng)格應(yīng)用的接口。語義網(wǎng)格服務(wù)可提供知識(shí)服務(wù),基于知識(shí)的信息服務(wù),基于知識(shí)的數(shù)據(jù)計(jì)算服務(wù)。語義網(wǎng)格提供了更高級(jí)的知識(shí)共享和管理平臺(tái),使數(shù)據(jù)挖掘、文本挖掘等變得更為容易。語義網(wǎng)格在網(wǎng)格中間件和知識(shí)網(wǎng)格,高級(jí)網(wǎng)格應(yīng)用間實(shí)現(xiàn)了機(jī)器的語義理解,為整個(gè)網(wǎng)格系統(tǒng)的語義互聯(lián)提供了強(qiáng)有力的支撐。語義網(wǎng)格不僅能提供數(shù)據(jù)計(jì)算服務(wù)和信息服務(wù),而且引入知識(shí)層處理,提供知識(shí)的獲取、使用、檢索、發(fā)布等知識(shí)服務(wù),體現(xiàn)了下一代網(wǎng)格的特點(diǎn)。
4 語義網(wǎng)格的研究內(nèi)容
語義網(wǎng)格的研究重點(diǎn)是用語義和知識(shí)工程的方法來解決目前網(wǎng)格平臺(tái)建設(shè)和應(yīng)用中存在的各種問題。其研究內(nèi)容可以概括為以下幾個(gè)方面:
(1) 知識(shí)模型。
知識(shí)模型將描述系統(tǒng)的知識(shí)和推理需求,包括領(lǐng)域知識(shí)、推理知識(shí)和任務(wù)知識(shí)。研究元數(shù)據(jù),目前的元數(shù)據(jù)設(shè)施已經(jīng)以RDF的形式存在,┙一步工作研究支持本體設(shè)計(jì)和運(yùn)用的方法和工具,注釋工具和方法;研究本體語言的邏輯框架;研究語義網(wǎng)格環(huán)境下表示本體的恰當(dāng)?shù)慕TZ集,以及基于本體的推理機(jī)制;研究語義網(wǎng)格本體語言及其語義框架。
(2) 通信模型。
通信模型主要描述系統(tǒng)之間或系統(tǒng)與用戶之間的需求和接口。
(3) 知識(shí)獲取。
研究適合海量、異構(gòu)、不完全、半結(jié)構(gòu)化數(shù)據(jù)挖掘的有效方法和算法;研究基于語義網(wǎng)格本體的知識(shí)發(fā)現(xiàn)理論和算法,在核心本體的支持下有效地把信息轉(zhuǎn)化為知識(shí),識(shí)別與理解網(wǎng)格信息;研究網(wǎng)格信息自動(dòng)分類、摘要和領(lǐng)域本體自動(dòng)、半自動(dòng)生成等技術(shù)。
(4) 知識(shí)組織。
研究內(nèi)容的可視化技術(shù)和方法,如何通過概念語義空間進(jìn)行知識(shí)組織,以期獲得快速檢索和高的查準(zhǔn)率。
(5) 服務(wù)管理。
面向用戶服務(wù)的模式和協(xié)議,研究網(wǎng)格服務(wù)的發(fā)布、發(fā)現(xiàn)和服務(wù)路由機(jī)制和算法,尤其是滿足服務(wù)質(zhì)量要求的網(wǎng)格服務(wù)的發(fā)布、發(fā)現(xiàn)和服務(wù)路由機(jī)制和算法。
5 語義網(wǎng)格的未來
語義網(wǎng)格不僅要融合語義網(wǎng)、Web服務(wù)和網(wǎng)格┤者的技術(shù),而且自身還要進(jìn)一步發(fā)展,所以,現(xiàn)在還處于不斷發(fā)展中,有很多地方需要改善和完善。主要有分布式資源內(nèi)容收集,各種媒體內(nèi)容及格式的引用和轉(zhuǎn)化;對(duì)資源的計(jì)算、分享方式的智能化方法以及提高數(shù)據(jù)交換速度擴(kuò)展;計(jì)算機(jī)通用服務(wù)安全信任流程、方法和技術(shù)的問題;使用內(nèi)容的數(shù)字產(chǎn)權(quán)管理問題;語義多元化的體系結(jié)構(gòu)與網(wǎng)格技術(shù)的融合;設(shè)計(jì)與設(shè)置問題,所有用戶都應(yīng)易于使用從設(shè)計(jì)、發(fā)展、配置、運(yùn)作、維持到重復(fù)利用整個(gè)生命周期的網(wǎng)格基礎(chǔ)架構(gòu)和應(yīng)用。
6 結(jié) 語
語義網(wǎng)格致力于建立一種基于網(wǎng)格、語義網(wǎng)和Web服務(wù)多種技術(shù)的環(huán)境,它融合三者的優(yōu)點(diǎn),避免┤者各自獨(dú)立發(fā)展的限制。把信息共享和服務(wù)作為發(fā)展方向使其成為網(wǎng)格研究的熱點(diǎn),它的研究必將進(jìn)一步推動(dòng)網(wǎng)格、互聯(lián)網(wǎng)的發(fā)展以及其他領(lǐng)域,如生命科學(xué)和智能交通系統(tǒng),城市交通指揮系統(tǒng)等的應(yīng)用[12]。語義網(wǎng)格體現(xiàn)了多種技術(shù)融合的趨勢(shì),表明了下一代網(wǎng)格的發(fā)展方向應(yīng)該是為所有人服務(wù)的一種網(wǎng)格。從目前的現(xiàn)狀來看,語義網(wǎng)格已成為網(wǎng)格研究的一個(gè)熱點(diǎn),它使全球的網(wǎng)絡(luò)資源在語義上進(jìn)行連通,更好的為經(jīng)濟(jì)、科技、能源、社會(huì)保障等眾多領(lǐng)域服務(wù)。
參 考 文 獻(xiàn)
[1]諸葛海.語義網(wǎng)格的基礎(chǔ)理論、模型與方法研究進(jìn)展[J].中國基礎(chǔ)科學(xué),2007(6):27[CD*2]29.[LL]
[2]http://www.semanticgird.org/v1.9/semagid.pdf.2004.
[3]http://www.semanticgrid.org,20080405.
[4]李明生.語義網(wǎng)格:語義網(wǎng)技術(shù)和網(wǎng)格的結(jié)合[J].情報(bào)技術(shù),2005(10):46[CD*2]48.
[5]Zhuge H,Shi X.Toward the Eco[CD*2]grid:A Harmoniously 〦volved Interconnection Environment[J].Communications of the ACM,2004,47(9):79[CD*2]83.
[6]Zhuge H.Semantic Grid:Scientific Issues,Infrastructure and Methodology[J].Communications of the ACM,2005,48 (4):117[CD*2]119.
[7]Zhuge H.The Future Interconnection Environment[J].IEEE Computer,2005,38 (4):27[CD*2]33.
[8]Zhuge H.Autonomous Semantic Link Net Working Model for the Knowledge Grid[J].Concurrency and Computation:Practice and Experience,2007,7 (19):1 065[CD*2]1 085.
[9]黃運(yùn)濤,丁穎.語義網(wǎng)格核心技術(shù)及其應(yīng)用研究[J].福建電腦,2007(12):27[CD*2]28.
[10]http://www.globus.org/research/papers/ogsa.pdf,20020622.
[11]http://www.Semanticgrid.org/documents/semgrid2004/semgrid2004.html,20080905.
[12]吳朝暉,陳華鈞.語義網(wǎng)格:模型、方法與應(yīng)用[M].杭州:浙江大學(xué)出版社,2008.
作者簡介 毛淑賢 女,1968年出生,廣東人,工程師。研究方向?yàn)橛?jì)算機(jī)硬件和軟件設(shè)計(jì)。