[摘 要]語義網(wǎng)絡(luò)和網(wǎng)格技術(shù)在數(shù)字圖書館建設(shè)中的重要性已被業(yè)界所關(guān)注。語義網(wǎng)絡(luò)應(yīng)用于數(shù)字圖書館建設(shè)可以對其資源進(jìn)行基于語義的標(biāo)注,提供基于語義的資源瀏覽與檢索;網(wǎng)格技術(shù)應(yīng)用于數(shù)字圖書館建設(shè)可以整合分布、異構(gòu)、自治的數(shù)字資源,獲得資源透明調(diào)用的能力。
[關(guān)鍵詞]服務(wù)整合;語義網(wǎng)絡(luò)環(huán)境;數(shù)字圖書館
DOI:10.3969/j.issn.1008-0821.2010.08.013
[中圖分類號]G250.76 [文獻(xiàn)標(biāo)識碼]A [文章編號]1008-0821(2010)08-0052-03
Semantic Grid Environment to Integrate Digital Library ServicesLi Jingyun
(Library,Maoming University,Maoming 525000,China)
[Abstract]The semantic web and grid technology in the digital library construction has been the importance of the concerns of the industry.Semantic network can be used in the construction of digital library resources based on their semantic annotation,semantic-based browsing and retrieval of resources;Grid used in the construction of digital libraries can be integrated distributed,heterogeneous,autonomous digital resources,and transarent access to resources the ability to call.
[Keywords]service integration;semantic network environment;digital library
在語義網(wǎng)格的環(huán)境下,關(guān)于數(shù)字化圖書館的服務(wù)整合,要求能夠自動其發(fā)現(xiàn)語義的網(wǎng)格中所包含一系列的服務(wù),并且能對它按照其用戶的需求進(jìn)行組合。服務(wù)組合就是把現(xiàn)有的基本服務(wù)聯(lián)合起來提供具有附加價值的新功能。服務(wù)組合分為靜態(tài)服務(wù)組合和動態(tài)服務(wù)組合。靜態(tài)的服務(wù)組合在組合服務(wù)設(shè)計時即預(yù)先定義參與其中的服務(wù)而不會再有所改變(除非手工修改),因而無法滿足語義網(wǎng)格環(huán)境動態(tài)變化的需求。而動態(tài)的服務(wù)組合是在執(zhí)行時才根據(jù)一定的優(yōu)選規(guī)則選定參與服務(wù)組合的服務(wù),因而在任何時刻都可以保證所選中的參與服務(wù)是最優(yōu)的,如此則可以較好地滿足前述要求。
要實現(xiàn)動態(tài)服務(wù)組合,必須經(jīng)過3個步驟:第一,以某種合適的語言定義組合服務(wù)模板;第二是對模板中定義的每個服務(wù)原型要自動發(fā)現(xiàn)、匹配、選擇優(yōu)選的服務(wù)來具體實現(xiàn)其功能,最終得到實例化的可執(zhí)行組合服務(wù);最后一步是執(zhí)行前一步得到的實例化組合服務(wù)。上述3個步驟中的第二步,即自動的服務(wù)發(fā)現(xiàn)、匹配及選擇是動態(tài)服務(wù)組合的關(guān)鍵。然而,若沒有語義的支持,自動的服務(wù)發(fā)現(xiàn)、選擇、匹配要獲得較高的匹配成功率是比較困難的。因此,基于語義的服務(wù)發(fā)現(xiàn)是實現(xiàn)服務(wù)組合的基本要求。通過定義服務(wù)發(fā)布者和請求者共同遵守的本體和服務(wù)接口的語義描述,達(dá)到服務(wù)發(fā)布者和請求者可以實現(xiàn)語義層次的匹配,從而為服務(wù)與服務(wù)之間的自動組合和協(xié)作奠定了基礎(chǔ),使得動態(tài)地利用網(wǎng)絡(luò)中的資源,即時組合出新的應(yīng)用成為可能?;谡Z義來實現(xiàn)語義網(wǎng)格環(huán)境下數(shù)字圖書館服務(wù)整合的一個最顯著的優(yōu)勢就是在于它能夠在可接受的資源和時間的限制下,能夠自動的操作和推理好,人為參與極大地減少了。用以方便服務(wù)的服務(wù)OWL-S標(biāo)記任務(wù)的自治操作,其中包括了自動化服務(wù)的發(fā)現(xiàn)、互操作、執(zhí)行、執(zhí)行監(jiān)控以及合成。
1 自動數(shù)字圖書館語義網(wǎng)格服務(wù)發(fā)現(xiàn)模型
自動的語義網(wǎng)格服務(wù)發(fā)現(xiàn)能夠?qū)崿F(xiàn)語義網(wǎng)格服務(wù)的自動定位。通過OWL-S的服務(wù)標(biāo)識,用于服務(wù)發(fā)現(xiàn)的信息能夠以計算機(jī)可解釋的語義標(biāo)簽的形式給出,一個服務(wù)注冊處或者基于Ontology的搜索引擎能夠被用于自動定位服務(wù)。
1.1 自動語義網(wǎng)格服務(wù)發(fā)現(xiàn)思路
基于功能服務(wù)的發(fā)現(xiàn)要實現(xiàn),缺乏了的共同語義造成的語義沖突問題解釋必須首先解決;其次,應(yīng)考慮把語義信息添加Web 服務(wù)使用的戶獲得的服務(wù)功能信息。因此就需要采用本體庫,統(tǒng)一的表現(xiàn)形式和描述就能被領(lǐng)域信息所提供。同時,能利用OWL-S對其服務(wù)來進(jìn)行語義描述;就能使所有用戶了解其所服務(wù)的功能和細(xì)節(jié),以便加強(qiáng)機(jī)器理解服務(wù)描述信息。而服務(wù)發(fā)現(xiàn)的基本思路是:當(dāng)一個服務(wù)請求提交之后,首先將請求服務(wù)的輸出和已發(fā)布服務(wù)的輸出進(jìn)行基于概念相似度計算的匹配;在找到輸出合適的已發(fā)布服務(wù)之后,再進(jìn)行請求服務(wù)的輸入和該發(fā)布服務(wù)的輸入的比較,最后得到匹配結(jié)果。如圖1所示。
圖1 服務(wù)發(fā)現(xiàn)的基本思路
服務(wù)請求者和服務(wù)發(fā)布者都用OWL-S作為描述語言,對服務(wù)的輸入和輸出等參數(shù)用領(lǐng)域本體進(jìn)行描述。服務(wù)解析模塊加載請求服務(wù)和發(fā)布服務(wù),并解析出輸入和輸出等描述服務(wù)的參數(shù)信息。相似度計算模塊計算任意兩個概念之間的語義相似度,得到服務(wù)參數(shù)概念相似度矩陣。服務(wù)匹配模塊計算請求服務(wù)和發(fā)布服務(wù)之間的匹配程度,最后得到輸出結(jié)果。
2 語義網(wǎng)格服務(wù)自動發(fā)現(xiàn)的模型結(jié)構(gòu)
要自動完成服務(wù)發(fā)現(xiàn)就必須要OWL-S所提供發(fā)布的服務(wù)屬性和能力方面的廣告。請求描述以及廣告描述它們之間的匹配問題就是服務(wù)發(fā)現(xiàn)實質(zhì),而目前采用的關(guān)鍵字所匹配的方式就缺乏了對用戶查詢的請求中的對有用信息的處理和提取,不能較好地描述給用戶查詢請求中所需要服務(wù)的能力;同時,服務(wù)請求者也無法從其廣告描述之中獲悉服務(wù)功能的信息;所以,需要構(gòu)造以查詢處理器的方式來抽取其查詢請求中服務(wù)特征的信息而形成的標(biāo)準(zhǔn)語義請求來進(jìn)行描述,同時也需要對建立發(fā)現(xiàn)的引擎實現(xiàn)針對服務(wù)功能的信息語義的匹配,進(jìn)而來提高服務(wù)查準(zhǔn)率。如圖2所示基于本體Web服務(wù)的發(fā)現(xiàn)模型。
(1)查詢處理器:接受用戶輸入的查詢請求,根據(jù)本體庫對用戶的查詢信息進(jìn)行標(biāo)準(zhǔn)化和過濾,保留應(yīng)用于查找的條件和約束信息,形成新的用戶查詢描述。圖2 服務(wù)發(fā)現(xiàn)模型結(jié)構(gòu)
該模塊就能夠?qū)崿F(xiàn)從用戶的查詢和請求中抽取出一些滿足其需求服務(wù)的功能信息,并且能形成標(biāo)準(zhǔn)及無語義沖突查詢的描述,這樣就使得服務(wù)請求經(jīng)過映射后的描述就更能精確表達(dá)出用戶們所需的服務(wù)及信息。
(2)領(lǐng)域本體庫:存儲特定領(lǐng)域內(nèi)的知識庫、知識關(guān)系。建立特定的領(lǐng)域本體,使本領(lǐng)域內(nèi)的用戶形成共同的語義理解。
(3)發(fā)現(xiàn)引擎:該模塊包含廣告數(shù)據(jù)庫與匹配引擎兩個組件。匹配引擎利用基于語義的匹配算法對由查詢處理器產(chǎn)生的查詢描述與服務(wù)提供者廣告描述進(jìn)行匹配,并結(jié)合建立在本體上的推理系統(tǒng)進(jìn)行邏輯推理。廣告數(shù)據(jù)庫用來存儲服務(wù)提供者的服務(wù)描述信息,該服務(wù)描述信息是由OWL-S描述語言所描述的,能夠增加對服務(wù)功能的語義描述。該發(fā)現(xiàn)引擎建立在語義基礎(chǔ)上的匹配,因此能大大提高服務(wù)的查準(zhǔn)率。
1.3 語義網(wǎng)格環(huán)境下數(shù)字圖書館服務(wù)發(fā)現(xiàn)模型
語義網(wǎng)格是一個高度自動化的開放環(huán)境,在這種環(huán)境下,便于用戶發(fā)現(xiàn)服務(wù)是至關(guān)重要的。匹配的概念在服務(wù)的語義發(fā)現(xiàn)里是十分重要的,匹配就是將請求者要求服務(wù)的特征同廣告服務(wù)的特征進(jìn)行比對的過程。在語義網(wǎng)格環(huán)境下的數(shù)字圖書館中,應(yīng)該通過語義發(fā)現(xiàn)網(wǎng)格服務(wù),因此筆者認(rèn)為,語義網(wǎng)格環(huán)境下數(shù)字圖書館的服務(wù)發(fā)現(xiàn)應(yīng)該首先比較服務(wù)請求的功能性,然后再比較輸入輸出。根據(jù)這種思路,所構(gòu)建的服務(wù)發(fā)現(xiàn)匹配模型如圖3所示。發(fā)布IO比較功能比較。
圖3 服務(wù)發(fā)現(xiàn)匹配模型
圖3中給出創(chuàng)建服務(wù)廣告、進(jìn)行服務(wù)發(fā)現(xiàn)所必需的組成部分。服務(wù)提供者用WSDL文件(網(wǎng)絡(luò)服務(wù)的描述語言)描述服務(wù)的特征,OWL-S編輯器中的“WSDL2OWLS”轉(zhuǎn)換工具可以把它轉(zhuǎn)換成OWL-S描述。OWLS對網(wǎng)格服務(wù)進(jìn)行語義描述,可使用任何一種推理機(jī),比如Algernon推理機(jī)來進(jìn)行查詢,查詢得到的信息同服務(wù)請求進(jìn)行匹配。匹配系統(tǒng)應(yīng)用了本體的概念對服務(wù)請求和服務(wù)廣告的功能性、輸入、輸出(FOI)進(jìn)行比較,確定FOI的相似性。網(wǎng)絡(luò)本體語言(OWL)使我們能夠?qū)Ω拍钸M(jìn)行描述,從而復(fù)雜的概念可以從涵義上分解為簡單的概念。使用斯坦福大學(xué)開發(fā)的OWL編輯器Protégé,可以較輕松地將本體建立起來。再通過推理機(jī)采用適當(dāng)?shù)耐评硪?guī)則就可以確定本體中兩個不同概念間語義的相似性。這種模型利用推理機(jī)與本體知識基礎(chǔ)相結(jié)合,檢索語義信息。由功能本體(功能本體:指語義描述所有可能的功能性的本體,本體中的概念及子概念代表功能性,每個概念(子概念)的名稱代表一個固定的行為語義)確定服務(wù)請求和服務(wù)廣告功能上的語義相似性;領(lǐng)域本體(領(lǐng)域本體是指語義描述函數(shù)輸入變量和輸出變量所有可能的數(shù)據(jù)類型的本體,本體中每個概念及子概念代表一個數(shù)據(jù)類型)確定輸入和輸出的相似性。由預(yù)先設(shè)定的算法執(zhí)行匹配,確定服務(wù)廣告FOI和請求FOI的相似程度。算法將基于相似性,返回與服務(wù)申請較為相關(guān)的服務(wù)。
2 動態(tài)服務(wù)組合體系結(jié)構(gòu)
動態(tài)服務(wù)組合包括調(diào)用自動服務(wù)、組裝和互操作的自動服務(wù)。而且自動服務(wù)的調(diào)用需要實體自動執(zhí)行和通過程序或者經(jīng)過語義標(biāo)識的一個服務(wù)。在對服務(wù)的執(zhí)行上可以將其看作是一系列函數(shù)的調(diào)用集合。自動服務(wù)的互操作和組裝主要指的是:給出了高層的一個目標(biāo)描述后,其對于某個任務(wù)來說,對其所需的服務(wù)來進(jìn)行組裝、自動選擇和互操作。在通過OWL-S,組合服務(wù)和選擇所用于的信息將被編碼在服務(wù)器上。OWL-S要提供單個服務(wù)來進(jìn)行選擇的組合順序和先決條件。由五層組成服務(wù)的組合:傳輸層,X消息層,實現(xiàn)層,ML服務(wù)描述層,服務(wù)發(fā)布、查找、組合層。XML消息層,傳輸層,傳統(tǒng)web的服務(wù)服務(wù)協(xié)議能與描述層相一致。查找、服務(wù)發(fā)布、組合層采用OWL-S框架,如圖4所示。
服務(wù)組合
OWL-S Service Model服務(wù)查找發(fā)布
OWL-S Service Profile實現(xiàn)層:OWL-S Grouding服務(wù)描述層:WSDLXML消息層:SOAP傳輸層:HTTP,SMTP,F(xiàn)TP…圖4 服務(wù)組合的體系結(jié)構(gòu)
ServiceGrouding就指定如何來訪問服務(wù)細(xì)節(jié)。其主要包括了消息和協(xié)議的序列化、格式、定位和傳輸?shù)?。因此一個ServiceGrounding看作可以是具體實現(xiàn)和從服務(wù)描述元素抽象的定義的一個映射,一個原子的過程輸入和輸出就是其最主要的。在OWL-S中,都認(rèn)為ServiceModel和ServiceProfile是抽象表達(dá),僅有ServiceGrounding是其具體的實現(xiàn)層次規(guī)范。而ServiceProfile就提供了來描述服務(wù)的一個方式就是服務(wù)請求者所需的服務(wù)和提供者提供的服務(wù)。ServiceProfile的表達(dá)形式?jīng)]有限定服務(wù),相反,特定的服務(wù)可以通過OWL的子類來描述。OWL-S為其提供了一個可能的表達(dá)Profile類的服務(wù)。而Profile將服務(wù)描述成為了一個3種類型信息所具有具有的功能:提供了該服務(wù)的是哪個組織,功能是什么等。服務(wù)在要執(zhí)行時將會發(fā)生什么被ServiceModel所描述。對于非普通的那些服務(wù)(即一些組合的服務(wù)),可能被一個Agent對該描述依照以下4種方式使用:①描述用于完成一個任務(wù)是由多個組合服務(wù)服務(wù)所給出的;②進(jìn)行深層次的分析:對于該服務(wù)是否符合要求;③在服務(wù)制定階段,要完成參與者多個之間的協(xié)同;④一個服務(wù)執(zhí)行的監(jiān)控。
3 動態(tài)服務(wù)
組合模型及服務(wù)組合模塊的組成:即服務(wù)組合引擎和推理引擎兩部分。提供匹配服務(wù)能力并推理的引擎存儲服務(wù)語義描述信息;服務(wù)組合引擎處理組合服務(wù)的解析,執(zhí)行和管理,如圖5所示。
圖5 動態(tài)服務(wù)組合模型結(jié)構(gòu)
3.1 服務(wù)匹配引擎
服務(wù)匹配引擎由OWL-S/UDDI的轉(zhuǎn)換器和OWL-S匹配引擎組成。服務(wù)匹配引擎生成組合服務(wù)的工作流程如圖6所示。
當(dāng)服務(wù)請求者發(fā)出請求(包括服務(wù)功能描述和可以提供的輸入以及期望的輸出),則服務(wù)組合應(yīng)用接口將該請求轉(zhuǎn)換成Service Profile形式,再將其交給匹配引擎。然后匹配引擎利用OWL推理機(jī)對功能描述進(jìn)行基于OWL-S Ontology庫和服務(wù)描述庫的靈活匹配,得到一組滿足條件的組合服務(wù)。這種匹配不是簡單的基于關(guān)鍵字方式,而是基于語義約束的模糊匹配。接著再使用匹配引擎逐個檢查找到的服務(wù)的輸入是否是請求者所提供的輸入的子集和其輸出是否包含請求者所期望的輸出;這樣匹配率最高的服務(wù)就是服務(wù)發(fā)現(xiàn)的目標(biāo)。
3.2 合成服務(wù)執(zhí)行引擎
組合服務(wù)執(zhí)行的引擎是負(fù)責(zé)組合服務(wù)所執(zhí)行中的運行控制,它為組合服務(wù)的實例一些提供運行的環(huán)境,其中包括進(jìn)行解釋組合服務(wù)定義,組合服務(wù)實例的創(chuàng)建,并且要控制實例的掛起、激活、終止、恢復(fù)等狀態(tài),引導(dǎo)實例中的活動進(jìn)行,并且要負(fù)責(zé)將外部服務(wù)激活等。為了實現(xiàn)動態(tài)組合的服務(wù)機(jī)制,引擎還需要提供動態(tài)的訪問注冊庫服務(wù)的功能。該引擎主要包括以下4個模塊:①服務(wù)解析模塊。②服務(wù)執(zhí)行模塊。③系統(tǒng)監(jiān)控模塊。④安全管理模塊。
參考文獻(xiàn)
[1]楊曉航,張曉林.語義空間系統(tǒng):語義Web技術(shù)的新應(yīng)用——基于語義整合Web資源與服務(wù)[J].情報雜志,2006,(2):7-11.
[2]賀亞鋒,張穎.Web資源虛擬圖書館研究[J].大學(xué)圖書館學(xué)報,2000,(5):31-34.
[3]畢強(qiáng),牟冬梅.語義網(wǎng)格環(huán)境下數(shù)字圖書館知識組織研究[J].圖書情報工作,2006,(6):28-33.
[4]Hamid Saeed,Abdus Satter Chaudry.Potential of Bibliographic Tools to Organize Knowledge on the Internet:The Use of Dewey Decimal Classification Scheme for Organizing Web-based Information resources[J].Knowledge Organization,2001,28(1).