辛明海,潘孝銘
(華僑大學計算機科學與技術學院,福建泉州362021)
多層次語義網的改進Web服務檢索技術
辛明海,潘孝銘
(華僑大學計算機科學與技術學院,福建泉州362021)
利用語義Web服務中的標準OWL-S,提出多層次語義Web服務檢索技術.與目前關鍵字或分類的查詢方法相比,多層次語義Web服務檢索技術具有更多的判斷依據,并增加Web服務在搜尋時的準確率及可用性.模型包括服務名稱分析、概念描述及輸出-輸出參數相似性分析、服務質量分析3個階段.實驗結果表明,與傳統(tǒng)的基于關鍵字的檢索方式相比,采用多層次語義擴展檢索的查準率平均值上升0.25,查全率平均值上升0.24,但執(zhí)行效率降低3.2%.
語義擴展檢索;Web服務;多層次;相似度
隨著Web服務的迅速發(fā)展,在Web服務儲存庫[1]中可獲取的Web服務數量也隨之快速增加.因此,在服務檢索時單純以關鍵字搜尋想要的服務,會對服務的自動組合造成很大的困難.Web服務架構面臨著安全、組合、語義等一些難以解決的問題[2].結合語義網的語義Web服務是使用計算機能解釋的語言,描述Web服務的能力及內容,并改進現在的工作質量,包括服務發(fā)現、監(jiān)視、回復等.語義Web服務技術抽象的架構和所使用的協(xié)議,能夠解決5種語義Web服務代理人的需求:包括動態(tài)服務發(fā)現、服務協(xié)調、服務規(guī)范和管理、社群支持服務、服務質量[3].服務請求者如何才能準確、有效地找到想要的服務,已經成為重要的研究課題.用戶在Web服務注冊中心搜尋服務,其運作機制一般有兩種方式,一種是以Web界面的方式,另一種是以離線網絡統(tǒng)一描述、發(fā)現和集成協(xié)議(UDD I)的方式.目前,研究語義Web服務的發(fā)掘、搜尋或匹配方法,主要都是以OWL(Web Ontology Language)與Service結合的OWL-S作為標準文件[4-8].本文提出一種多層次語義Web服務搜尋機制,以增加Web服務在搜尋時的準確率及可用性.
圖1 服務搜尋流程圖Fig.1 Web services search flow diagram
改進文[9]提出的多層次語義的改進網絡匹配方式,將Web服務搜尋機制分為4個步驟.即比對服務名稱、服務概念描述內容的相似性分析、輸出與輸入參數的相似性分析和服務質量分析.服務需求者的需求先利用OWL-S編輯器轉換成OWL-S文件檔,或將服務儲存庫中待匹配的WSDL文件,利用套件CODE[10]換成OWL-S文件,其流程如圖1所示.
(1)比對服務名稱.比對服務名稱及分析概念內容描述的相似性是第1階段,它可以先篩選掉一些不相關的服務,減少后續(xù)的匹配的文件,減少花費時間;匹配后再對服務質量分析,可作為選擇的參考依據.
為服務名稱的命名時,經常不是單一字詞,如有“GetLocalTime”,“Lookup Zipcode”這類的復合名詞.因此,分析前需分解,將有意義的字詞用大寫開頭及底線“_”相連,拆解完后,再繼續(xù)下一步.
使用者輸入關鍵字的搜尋方式,可利用近似字符串比對演算法,將服務儲存庫中的服務名稱與使用者的輸入做比對.近似字符串比對,可以容忍如下3種類型的錯誤:(1)置換型錯誤,如computer變?yōu)閏imputer;(2)遺漏型錯誤,如computer變?yōu)閏oputer;(3)重復型錯誤,如computer變?yōu)閏omputer.
因此,使用近似定串比對演算法為編輯距離,對于3種錯誤類型各視為相差一個距離.此計算方式會因單詞長短的不同而有所誤差,故3種情況的總發(fā)生率不能大于0.2.利用字串相近的方式可增加搜尋彈性,避免因輸入時的小錯誤而搜尋不到服務.
圖2 知識本體的層次架構Fig.2 Hierarchical structure of ontology
知識本體的層次架構,如圖2所示.從圖2可看出,在名稱相似度計算部分,對于知識本體而言,階層越低,相似性越高.因此,對于層級越低的節(jié)點,計算相似度時,將其權重值提高.即其中:S(A,B)為兩節(jié)點的相似度;d(P(A,B))為A,B兩節(jié)點的共同父節(jié)點轎車到根部的距離;d(A,B)表示A,B間的最短路經,加1的目的在避免A,B是相同節(jié)點時分母為0.
當分析服務名稱完成后,將服務儲存庫中的服務分成兩類.較具有相關性名稱的服務放入第2階段的流程,以分析其概念描述及輸出參數之相似性;如果使用者僅以關鍵字查詢方式搜尋服務,則可至第3階段做服務質量分析.
(2)服務概念描述的相似性分析.它是第2階段的第1個步驟,利用文[6]提出的向量空間模型,依其步驟計算各服務之概念相似性,其值為Simp rofile.
(3)輸出與輸入參數相似性分析.它是第2階段的第2個步驟.在參數相似性分析部分,可利用設定字詞的權重wi(d)的計算式,交叉計算需求與儲存庫中服務的輸入與輸出參數的相似性.有
其中:wi(d)為字詞i在文件d中的加權值;fi(d)為文件d中每個字詞i出現頻率;N為文件總數;di為包含有字詞i的文件數量.
設需求的輸入參數以RIN表示、輸出參數以ROUT表示,儲存庫中服務的輸入參數以AIN表示、輸出參數以AOUT表示,分別計算其相似度,有
若SIN-OUT計算結果相似,則先將其剔除,表示兩服務工作內容正好相反;然后,計算參數的相似度,有
第2階段完成后,會產生服務集合S2.集合中,服務相似度Ss的計算方式為
(4)服務質量分析.前兩階段的相似性分析過程可以視為完整的搜尋步驟.加入服務質量(QoS)分析[11]的目的是,候選服務在做選擇的參考排序,或是當首選服務執(zhí)行失敗時,可立即找到替代服務.
在服務質量分析項目中,參考一般關于Web服務質量的QoS指標,分別定義如下7個QoS指標.
(1)回應時間.服務完成所需時間.
(2)承載量.服務可同時接受的請求數量.
(3)可用性.表示服務是否已準備就緒能直接使用.
(4)正確性.表示一段時間內的錯誤率.
(5)正確性.表示一段時間內的錯誤率.
(6)成本.服務所需的價錢.
(7)安全性.表示定義服務是否提供機密性、完整性、可驗證性的機制.
服務請求者可以彈性選擇其所關注的項目,并設定其允許極值,比如服務回應時間在多少時間內等.最后,所列出的服務集合即為候選服務,使用者可從中選取適合的服務.列出清單的目的在于,服務請求可依據此清單彈性選擇所要的服務,也可用于Web服務的自動化組合.
采用Web服務儲存庫“XM ethod”(http://www.xmethods.net),“Web Service List”(http:// www.webservicelist.com/),取得旅游相關的WSDL文件,包含訂票、天氣、購物、匯率等服務,以及一些不相關的服務文件,如密鑰管理、檔案處理等.
首先,使用CODE[10]將WSDL格式的文件轉為OWL-S格式,作為實驗模擬服務儲存庫中的服務.
然后,在搜尋流程第二階段使用的w,x,y,z等4個參數.將使用不同的權重比例測試搜尋結果的準確率,從而選出最適合計算的公式.準確率的判斷方式以查全率(ηR)及查準率(ηP)參照[12].其中:查全率為候選服務清單中相關服務的數量與服務儲存庫中所有相關服務數量的比值;查準率為候選服務清單中相關服務的數量與候選服務清單中的服務數量的比值.
在第3階段的服務質量分析部分,特別是在目前OWL-S標準格式中,并沒有服務質量的相關標簽.因此,在編輯OWL-S文件時,需再增加QoS指標標簽.
采用關鍵字檢索與Web服務檢索的效果對比,如表1所示.從表1可知,3種搜索引擎采用關鍵字檢索的查準率平均值為0.30,而采用多層次語義擴展檢索的查準率平均值為0.55,提高了0.25. Google搜索引擎的關鍵字檢索的查準率為0.34,表明其對中文的分詞并不理想,經多層語義擴展后,其查準率上升到0.58,檢索性能顯著提升.
表1 檢索方式的效果對比Tab.1 Results comparison of retrievalmethods
從表1的查全率數值可知,通過語義擴展可以檢索到關鍵字并不匹配但確為用戶所需的服務,甚至是組合服務,起查全率平均值上升0.24,相比于關鍵字匹配方式有顯著的提高.
采用多層次語義擴展檢索做服務搜尋時,需要執(zhí)行更多的步驟,因此系統(tǒng)的執(zhí)行效率會降低.實驗結果表明,相比于傳統(tǒng)的基于關鍵字的檢索方式,使用多層次語義擴展檢索的執(zhí)行效率要降低3.2%.
分為3個階段的多層次語義Web服務搜尋機制,相比較于目前關鍵字或分類的查詢方法,多了更多的判斷依據.第1階段的服務名稱分析,可視為前置的篩選流程,可以大量減少后續(xù)階段所需匹配的文件數量,因此能夠節(jié)省不少時間.并且,該階段的搜尋方式,相對于只用關鍵字搜尋的服務請求者而言,仍然比傳統(tǒng)搜尋方式更能找到所需要的服務.
語義相似性比對更切合服務請求者的需求,增加搜尋到所需要服務的機會;而增加服務質量的分析,除了讓服務請求者可以多一項參考依據外,也避免搜尋到不能真正執(zhí)行的服務.
后繼的研究重點是,考慮此搜尋機制在服務自動化組合時產生的問題,以及服務質量指標的正確性等問題.同時,進一步提高執(zhí)行效率,把該搜尋機制擴展應用于如文[13]的軟構件檢索.
[1] SABOU M,PAN J.Towards semantically enhanced web service reposito ries[J].Web Semantics:Science,Servicesand Agentson the World Wide Web,2007,5(2):142-150.
[2] WANG Hong-bing,HUANG J Z,QU Yu-zhong,et al.Web services:Problems and future directions[J].Web Semantics:Science,Services and Agents on the World Wide Web,2004,1(3):309-320.
[3] BURSTEIN M,BUSSLER C,ZAREMBA M,et al.A semantic Web services architecture[J].IEEE Internet Computing,2005,9(5):72-81.
[4] 陳錦源.基于語義的Web服務發(fā)現機制研究[J].計算機與現代化,2007(7):34-37.
[5] M ILLER G A.Wo rdNet:A lexical database fo r English[J].Communications of the ACM,1995,38(11):39-41.
[6] ELHAM P,JAFAR H,SOHEIL Y H.Semantic composability measure for semantic web services[C]∥First Asia International Conference on Modelling&Simulation.Phuket:[s.n.],2007:88-93.
[7] PAOLUCCIM,KAWAMURA T,PA YNE T R,et al.Semantic matching of web services capabilities[C]∥Proceedings of the 1st International Semantic Web Conference.Sardinia:[s.n.],2002:333-347.
[8] SU Xiao-meng,GULLA J A.Semantic enrichment for ontology mapping[C]∥Proceeding of the 9th International Conference on App licationsof Natural Language to Info rmation System.Heidelberg:Sp ringer-Verla,2004:217-228.
[9] 仲梅,宋順林.一種語義Web服務的多層次匹配方法[J].計算機應用,2007,27(1):199-201,204.
[10] SRIN IVASAN N,PAOLUCCIM,SYCARA K.Semantic Web service discover in the OWL-S IDE[C]∥Proceedings of the 39th Annual Hawaii International Conferenceon System Sciences.Washington D C:IEEEComputer Society,2006:109.
[11] XIN Dong,ALON H,MADAHAVAN J,et al.Similarity search fo r web services[C]∥Proceedingsof the Thirtieth International Conference on Very Large Data Bases.Toronto:VLDB Endowment,2004:372-383.
[12] SAL TON G,MCGILL M J.Introduction to modern information retrieval[M].New York:M cGraw Hill Book Co, 1983.
[13] 余金山.利用XML,Tamino和CORBA的軟構件管理與檢索技術[J].華僑大學學報:自然科學版,2008,29(4): 518-522.
Im proving of Web Services Retrieval Techn ique by Using M ulti-Layer Seman tic Web
XIN M ing-hai,PAN Xiao-ming
(College of Computer Science and Technology,Huaqiao University,Quanzhou 362021,China)
M ulti-level semantic web service retrieval technique was p roposed by using the usual standard OWL-S in the semantic web service.Compared w ith the method simp ly using keywords o r classified mechanism,multi-level semantic web service retrieval technique p rovidesmo re judgment and imp roves the p recision and usability w hen searching fo r Web Services.The model includes 3 phase:service name analysis,concep t describing and input-output parameter similar analysis,service quality analysis.Experimental results show that compared w ith traditional search way based on keywo rds, using multi-level semantic expansion retrievalmethod leads the p recision ratio average to rise by 0.25,recall level average to rise by 0.24,but carry out efficiency to reduce by 3.2%.
semantic expanded retrieval;Web service;multi-level;similarity
TP 391.3
A
(責任編輯:黃仲一 英文審校:吳逢鐵)
1000-5013(2010)05-0530-04
2010-01-11
辛明海(1976-),男,講師,主要從事軟件工程、模式識別和人工智能的研究.E-mail:minghai_xin@seu. edu.cn.
福建省自然科學基金資助項目(A 0810013);華僑大學科研基金資助項目(04BS313,06HZR29);泉州市科技計劃項目(2009-0032)