何 偉,李 霜
(1.懷化學(xué)院 數(shù)學(xué)與應(yīng)用數(shù)學(xué)系,湖南 懷化 418008;2.懷化學(xué)院 音樂系,湖南 懷化 418008)
Nielsen 認(rèn)為可用性并不是用戶界面的一個單維屬性,它具有多種成分,包括:可學(xué)習(xí)性、效率、可記憶性、低出錯和滿意度[1].Nielsen 還認(rèn)為一個產(chǎn)品要有較高的可用性,該產(chǎn)品必須在每個構(gòu)成要素上都要滿足一個很好的水平[1].可用性是一個質(zhì)量指標(biāo),它從用戶角度衡量產(chǎn)品是否有效、易學(xué)、高效、少錯和令用戶滿意[2].Web可用性在服務(wù)于公眾的Web 應(yīng)用中十分重要,指導(dǎo)著Web的發(fā)展,是提升Web 應(yīng)用能力的手段之一.傳統(tǒng)對Web可用性評估的方法一般都采取人工方式進行,通過邀請用戶模擬完成體驗任務(wù),由專家對用戶完成任務(wù)的操作過程進行可用性評估.這類評估方法存在的缺陷,一方面可用性評估都是主觀進行的,由專家打分方式完成,可信度完全取決于專家的經(jīng)驗;另一方面邀請的參與體驗的用戶并不具備全體性,因此可用性評估結(jié)果依賴于參與用戶的典型性.
隨著語義技術(shù)以及本體研究的迅速發(fā)展,Web2.0的出現(xiàn),Moraga[3]等人將本體作為Web 站點的語義基礎(chǔ),提出了分層的Web 站點模型,用以指導(dǎo)Web 站點開發(fā),提高Web的應(yīng)用能力和利用價值.因此,利用本體從語義角度對Web可用性進行評估已不再成為困難.使用本體評估Web可用性一方面可以減少參與體驗用戶以及專家的勞動力,節(jié)約成本;另一方面可從Web 內(nèi)容出發(fā),轉(zhuǎn)換視角對可用性進行評估,彌補專家評估主觀判斷的不足,進一步改善Web的使用情況.基于此考慮,本文提出了一個在本體模式下對Web可用性進行評估的框架,該框架可從Web的物理和內(nèi)容兩個方面對其進行評估,給出了針對可用性評估框架的Web 內(nèi)容可用性評估方法,結(jié)果證明本文方法對Web 內(nèi)容可用性評估有較好的效果.
國外對可用性評估研究在初步階段大部分都是圍繞著可用性評估指標(biāo)構(gòu)建來進行研究的.微軟可用性指南(Microsoft Usability Guide MUG)就是最典型的一個代表,它是一個至今為止用戶較為認(rèn)可的通用的可用性評估指標(biāo)體系.該評估指標(biāo)主要圍繞內(nèi)容、易使用性、促銷、定制服務(wù)、情感因素5個一級指標(biāo),每個一級指標(biāo)被分解成若干二級指標(biāo),共二十幾個二級指標(biāo),形成一套完整的指標(biāo)體系,用于評估Web 網(wǎng)站的可用性;此外,影響較大的可用性評估指南準(zhǔn)則還包括:Nielsen (1996,1999)提出的用于指導(dǎo)網(wǎng)站設(shè)計的十大準(zhǔn)則[4,6];Spool 與Scanlon (1997)共同建議的為網(wǎng)站設(shè)計制定的可用性準(zhǔn)則[7];Lynch和Horton(1999)的網(wǎng)站風(fēng)格指引[8],Rosenfeld 與Morville的網(wǎng)站信息架構(gòu)[5],以及國際人因機構(gòu)(HFI)提出的可用性原則.在這些指標(biāo)研究的基礎(chǔ)上,國外學(xué)者紛紛提出或改進了許多不同的準(zhǔn)則與指標(biāo).在這些不同類型的網(wǎng)站和不同Internet 發(fā)展階段中提出的評估準(zhǔn)則基礎(chǔ)上,衍生出了大量的可用性評估指標(biāo),如Nielsen(1999)的用于對Web可用性進行評估的24個指標(biāo)[6];Huang和Chao (2001)等人在總結(jié)了18個網(wǎng)站可用性問題指標(biāo)基礎(chǔ)上,對33個政府Web 網(wǎng)站進行評估,提出了7條有建設(shè)性的改進建議[9];Menno和Leo(2006)使用情景評估法對15個政府Web 網(wǎng)站進行了可用性評估,結(jié)果顯示這些網(wǎng)站存在著人機交互界面以及網(wǎng)站導(dǎo)航的問題[10];Morrison 等人(1999)通過分級啟發(fā)式指標(biāo)方式評估了酒店網(wǎng)站的有效性[11];Leporini和Paterno (2003)在Web 有效性、效率以及滿意程度方面設(shè)計了用于改善Web可用性的16個評估指標(biāo)[12].
國內(nèi)對Web可用性評估的研究起步較晚,初始階段大部分借助國外的英文指標(biāo)翻譯成中文指標(biāo)來對Web可用性進行評估.隨著可用性評估在國內(nèi)的興起,許多國內(nèi)學(xué)者紛紛探索符合中國國情的Web可用性評估方法.劉愛華(2008)通過對高校圖書館網(wǎng)站的可用性進行分析后,從用戶角度入手給出了用于對高校圖書館網(wǎng)站進行可用性評估的指標(biāo)體系,嘗試進一步改善高校圖書館網(wǎng)站的設(shè)計、內(nèi)容和服務(wù)功能[13].鄢沛(2010)等人提出了基于UCD 理論和可用性工程原理的Web可用性設(shè)計方法,該方法可作為Web 設(shè)計人員設(shè)計和提高Web可用性的設(shè)計指南[14].蔡屏(2011)以信息構(gòu)建與可用性之間的關(guān)聯(lián)為理論基礎(chǔ),采用可用性測試方法測評高校圖書館網(wǎng)站信息構(gòu)建的可用性,并總結(jié)了一些對我國采用可用性測試方法的高校圖書館具有參考價值的建議[15].劉業(yè)政(2013)等人根據(jù)掃描路徑理論,使用視線跟蹤法提出了新穎實用的基于圖上隨機游動模型的Web頁面布局可用性評價方法,并以淘寶商城和阿里巴巴的商品展示頁面為例對其使用過程與效果進行驗證,說明模型的可行性與方法的有效性[16].白志斌(2013)等人設(shè)計了一個基于大量用戶行為數(shù)據(jù)的面向Web 系統(tǒng)的可用性自動化評估系統(tǒng),該系統(tǒng)通過自動化匹配大量用戶行為數(shù)據(jù)發(fā)現(xiàn)不一致的任務(wù)進而發(fā)現(xiàn)Web 系統(tǒng)可用性問題,為進一步改進Web 系統(tǒng)提供參考[17].
圖1 Web可用性評估框架
引發(fā)Web可用性問題的原因主要有物理和內(nèi)容兩個方面.物理方面主要指鏈接、網(wǎng)站結(jié)構(gòu)、網(wǎng)頁布局等,在評估技術(shù)上主要通過對網(wǎng)站結(jié)構(gòu)的測試或?qū)Y(jié)構(gòu)的可視化表示、訪問日志的分析等方面來獲取相關(guān)信息加以評判;而內(nèi)容方面則指是在頁面內(nèi)容的含義傳達上,從語義角度對內(nèi)容的組織,表現(xiàn)在Web 主題和網(wǎng)頁內(nèi)容是否相符等.由于內(nèi)容表達了設(shè)計者的目的,在其可用性的評估上通常都由參與者實際操作,然后再加以主觀評價,具有較強的個人主觀意愿.因此,本文著重討論Web 內(nèi)容可用性評估,從本體數(shù)據(jù)挖掘角度出發(fā),設(shè)計了一個本體模式下自動或半自動對Web可用性進行評估的框架,如圖1所示.
該框架具體描述為:首先輸入Web URL 地址,頁面URL 地址寄存器記錄并保存網(wǎng)頁間鏈接關(guān)系;其次利用自然語言處理技術(shù)如分詞、詞性標(biāo)注等對獲取的當(dāng)前網(wǎng)頁進行網(wǎng)頁預(yù)處理,抽取當(dāng)前網(wǎng)頁的主題概念,獲得Web 內(nèi)容語義信息;然后根據(jù)網(wǎng)頁間的鏈接關(guān)系以及抽取得到的頁面內(nèi)容語義關(guān)系,構(gòu)建網(wǎng)站的內(nèi)容本體,并將網(wǎng)站內(nèi)容本體與領(lǐng)域標(biāo)準(zhǔn)本體進行對比計算分析,對網(wǎng)站內(nèi)容本體作出定量評估,從而達到對Web 內(nèi)容可用性評估的目的;因為定量的指標(biāo)體系不能完全的合理的評價一個Web 網(wǎng)站,需要借助相關(guān)人員收集網(wǎng)站的其它性能數(shù)據(jù),依據(jù)主觀評估體系指標(biāo)作出定性評估,最后得出整個Web 網(wǎng)站的評估結(jié)果.
Web 內(nèi)容可用性評估的基礎(chǔ)是理清Web 內(nèi)容間語義關(guān)系,建立以內(nèi)容語義關(guān)系為基礎(chǔ)的可用性評估模型.因此,需對待評估的Web 網(wǎng)站進行預(yù)處理,對網(wǎng)頁進行語義提取,構(gòu)建網(wǎng)站內(nèi)容本體,獲取用于代表網(wǎng)站內(nèi)容的信息,為進行Web 內(nèi)容可用性評估提供基礎(chǔ)條件.
本文提出的網(wǎng)站內(nèi)容本體的構(gòu)建思路是:首先,從預(yù)處理的頁面中抽取描述頁面內(nèi)容的信息,存儲在文本文件中,用統(tǒng)計分詞方法對文本進行處理并提取特征詞,再利用特征詞的共現(xiàn)完成特征詞拼接處理,并將這些特征詞作為本體概念的候選詞,用于描述各頁面的內(nèi)容;其次,利用基于字面相似的等級關(guān)系識別以及基于聚類的等級關(guān)系識別構(gòu)建頁面內(nèi)容概念樹;最后,使用概念歸一化對概念樹進行修剪和轉(zhuǎn)換,構(gòu)建網(wǎng)站內(nèi)容本體.具體過程如下.
3.1.1 特征詞提取
將從頁面中抽取出的描述頁面內(nèi)容的文本進行分詞、去除停用詞、詞性和位置標(biāo)注等處理,然后結(jié)合詞語在文本中的位置、詞長和詞性等因素,利用TF-IDF 計算詞語的特征權(quán)值,計算方法如公式 (1)所示,最后根據(jù)權(quán)值的大小,獲取描述文本主題的特征詞集合.
其中,α和β是兩個可調(diào)節(jié)參數(shù),且α+β=1,α 0.5,β 0.5,Loci表示詞語wi位置的權(quán)重,Posi表示詞語wi的詞性權(quán)重,Leni表示詞語wi的詞長權(quán)重.
3.1.2 候選特征詞拼接
在分詞過程中,由于切分粒度較小,一些經(jīng)常出現(xiàn)的詞組短語常常被切分開.為了更好的發(fā)掘領(lǐng)域概念和知識,需要將經(jīng)常共同出現(xiàn)的詞語拼接在一起.本文根據(jù)候選特征詞在文本中出現(xiàn)的位置,計算特征詞間的共現(xiàn)度,計算方法如公式(2)所示,然后設(shè)定相應(yīng)的閾值來判斷特征詞是否需要拼接.
fx、fy分別是詞x、y 在文本中出現(xiàn)的頻率.fxy是詞xy 在文本中出現(xiàn)的頻率;fyx是詞yx 在文本中出現(xiàn)的頻率.
3.1.3 內(nèi)容概念樹的構(gòu)建
將拼接完成的特征詞集進行同義詞合并,并識別特征詞間的等級關(guān)系,構(gòu)建內(nèi)容概念樹.本文主要利用基于字面相似的等級關(guān)系識別和基于詞聚類算法的等級關(guān)系識別相結(jié)合的方法來找出候選特征詞集的上位概念,并實現(xiàn)等級關(guān)系的構(gòu)建.其中,基于字面相似的等級關(guān)系識別是根據(jù)字面相似度的結(jié)果來進行的,如果兩個詞包含相同的詞素,且該詞素位于詞語的后方,則包含字?jǐn)?shù)少的詞作為包含字?jǐn)?shù)多的詞的上位詞;而詞聚類的方法則是根據(jù)特征詞間的統(tǒng)計或語義關(guān)系,將不同的特征詞聚成一類,識別出被聚類的特征詞的上位概念.通過上下位概念生成特征詞間的等級語義關(guān)系.
具體構(gòu)建過程為:①首先使用基于字面相似的方法將特征詞集T 中的包含相同詞素(其中詞素的詞個數(shù)≥2)的特征詞進行等級關(guān)系組合,生成等級概念樹CT,同時刪除T 中被組合的特征詞,并將概念樹CT放入特征詞集T;②重復(fù)進行①操作,直至沒有字面相似的特征詞為止;③最后使用基于詞聚類的方法將特征詞集T 進行詞聚類,直到生成一棵完整的概念樹為止,概念樹構(gòu)造過程完成.
3.1.4 內(nèi)容本體的生成
若本體不做推理運算的話,則上述構(gòu)建的內(nèi)容概念樹在一定程度上類似于本體.而本文的本體只是作為一種展示網(wǎng)站內(nèi)容的手段,并用其來對Web 內(nèi)容的可用性進行評估.因此將內(nèi)容概念樹進行剪枝處理后,可作為本體使用.本文將使用概念歸一化對概念樹進行修剪和轉(zhuǎn)換,生成內(nèi)容本體.
修剪轉(zhuǎn)換原則為:
原則1:若概念樹中某個結(jié)點只有一個特征詞組成,則由該詞表示結(jié)點概念,等同于本體概念;
原則2:若概念樹中某個結(jié)點由多個特征詞組成,且這些特征詞是同義詞,則選擇其中詞頻最高的一個詞作為結(jié)點概念,等同于本體概念,其余特征詞作為該本體概念的同義屬性;
原則3:若概念樹中兩個結(jié)點A,B 間有邊直接相連,則將該條邊轉(zhuǎn)換成本體的上下位關(guān)系,其中概念樹中的上層結(jié)點概念等同于本體的上位概念,下層結(jié)點概念等同于本體的下位概念.
本文采用將構(gòu)建的頁面內(nèi)容本體與已有的領(lǐng)域標(biāo)準(zhǔn)本體進行對比計算在深度和廣度指標(biāo)下進行Web 內(nèi)容可用性的評估.深度主要用于評估網(wǎng)站內(nèi)容的主題覆蓋度,廣度則實現(xiàn)網(wǎng)站內(nèi)容覆蓋度的評估.
3.2.1 深度
本文使用內(nèi)容本體的類目深度在領(lǐng)域標(biāo)準(zhǔn)本體類目深度中所占的比率來評估Web 內(nèi)容在主題層次上的可用性,反映網(wǎng)站覆蓋所屬領(lǐng)域的主題比率.計算方式如公式(3)所示.從深度上可分析和建議該網(wǎng)站可添加哪些主題,以完善網(wǎng)站的主題信息,更進一步的滿足用戶的需求.
其中,CO表示內(nèi)容本體,SO表示領(lǐng)域標(biāo)準(zhǔn)本體,Topic(SO)代表SO的主題類目,| Topic(SO)|表示SO的類目數(shù).
3.2.2 廣度
廣度用來分析內(nèi)容本體所含的概念信息在領(lǐng)域標(biāo)準(zhǔn)本體中所占的比重,主要評估Web 內(nèi)容在內(nèi)容信息上的可用性.它反映網(wǎng)站內(nèi)容覆蓋所屬領(lǐng)域的比率.計算方式如公式(4)所示.從廣度上可分析網(wǎng)站內(nèi)容在所屬領(lǐng)域中是否缺失或者內(nèi)容表述錯誤,以進一步完善網(wǎng)站的內(nèi)容.
其中,CO表示內(nèi)容本體,SO表示領(lǐng)域標(biāo)準(zhǔn)本體,Concept(SO)代表SO的概念,| Concept(SO)|表示SO的概念數(shù).
為了驗證本文提出的本體模式下Web可用性評估框架對Web 內(nèi)容可用性的評估有效性,選取教育部網(wǎng)站——信息公開目錄下與教育相關(guān)的頁面進行Web 內(nèi)容可用性評估.該欄目截止2015年3月31日,共有3 278個頁面,內(nèi)容涉及教育的各方面.使用《電子政務(wù)主題詞表》[18]中“教育”部分充當(dāng)領(lǐng)域標(biāo)準(zhǔn)本體,作為內(nèi)容本體的比較對象.
采用本文提出的網(wǎng)站內(nèi)容本體構(gòu)建方式,對3 278個頁面進行處理,構(gòu)建了一個內(nèi)容本體,該本體包含4 000多個概念.使用深度和廣度對該內(nèi)容本體進行評價,結(jié)果如表1所示.
表1 內(nèi)容本體與領(lǐng)域標(biāo)準(zhǔn)本體的對比
根據(jù)表1,從深度上分析,內(nèi)容本體的深度達到了0.896,由Web頁面內(nèi)容構(gòu)造的內(nèi)容本體包含26個類目,這些類目都存在于“教育”領(lǐng)域標(biāo)準(zhǔn)本體中.進一步對比領(lǐng)域標(biāo)準(zhǔn)本體可知,內(nèi)容本體缺少了“婚前教育”、“職責(zé)教育”、“干部教育”等3個類目,這可能是由于教育部網(wǎng)站大部分關(guān)注的是比較常見的教育類型.“婚前教育”可能經(jīng)常出現(xiàn)在一些有關(guān)婚育的網(wǎng)站中,在教育部網(wǎng)站“教育”類別下基本上不怎么使用;而“職責(zé)教育”、“干部教育”更是兩個比較專的詞匯,使用范圍更窄.從廣度上分析,內(nèi)容本體中有5 118個概念存在于領(lǐng)域標(biāo)準(zhǔn)本體中,覆蓋度達到了91%,這說明教育部網(wǎng)站信息公開目錄下與教育相關(guān)的頁面涵蓋了大部分的教育內(nèi)容,在內(nèi)容可用性上是一個比較高的分值,其缺少的部分可能是由于少了“婚前教育”、“職責(zé)教育”、“干部教育”3個類別而造成的內(nèi)容損失.構(gòu)建的內(nèi)容本體中剩下的179個概念并不在標(biāo)準(zhǔn)本體中,但它們也是一些與教育相關(guān)的概念,因此,可作為標(biāo)準(zhǔn)本體的詞匯的補充.
隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,個人設(shè)計和開發(fā)Web不再是令人生畏.面對每天成指數(shù)級增長的網(wǎng)頁,如何吸引用戶選擇瀏覽自己的網(wǎng)站,是Web 設(shè)計者面臨的一個問題.Web可用性能指導(dǎo)和幫助設(shè)計者改進和完善Web 設(shè)計.基于此,本文提出了一個本體模式下Web可用性評估框架,并在該框架下,設(shè)計了一種構(gòu)建Web 內(nèi)容本體的方法,將該內(nèi)容本體與領(lǐng)域標(biāo)準(zhǔn)本體進行比較,從深度和廣度上對Web 內(nèi)容的可用性進行評估,并進行了實證分析.但對于網(wǎng)站的可用性進行評估是一項復(fù)雜而龐大的工作,不能一蹴而就.對Web 物理可用性的評估,本文并沒有較深入的討論,這需要在以后的工作中繼續(xù)討論.
[1]Jakob Nielsen.Usability Engineering[M].Boston:Academic Press,1993.
[2]What is usability?[EB/OL].http://www.usabilityfirst.com/.
[3]MaAngeles Moraga,Coral Calero,Mario Piattini.Ontology Driven Definition of a Usability Model for Second Generation Portals[C].Proceedings of ICWE'06,2006(6):110-112.
[4]J.Nielsen,J.M.Faber.Improving System Usability Through Parallel Design[J].IEEE Computer.1996,29(2):29-35.
[5]L.Rosenfeld,P.Morville.Information Architecture for the World Wide Web[M].Sebastopol:O'Reilly &Associates,1998.
[6]J.Nielsen.User Interface Directions for the WEB[J].Communications of the ACM.1999 (1):65-72.
[7]Jared,M.Spool,Will Schroeder,Tara Scanlon,et.WEB Site Usability:A Designer's Guide[M].MA:User Interface Engineering,1997.
[8]Patrick J.Lynch and Sarah Horton.WEB Style Guide:Basic Design Principles for Creating WEB Sites[M].London:Yale University Press,1999.
[9]Chaomeng James Huang,Mei-Hui Chao.Managing WWW in Public Administration:Uses and Misuses[J].Government Information Quarterly,2001 (18):357-373.
[10]Menno de Jong,Leo Lentz,Scenario.Evaluation of Municipal WEB Sites:Development and Use of an Expert-focused Evaluation Tool[J].Government Information Quarterly,2006 (23):191-206.
[11]A.M.Morrison,S.TAYLOR,A.J.Morrison,A.D.Morrison.Marketing Small Hotels on the World Wide Web[J].Information Technology and Tourism,1999,2 (2):97-113.
[12]B.Leporini,F(xiàn).Paterno.Criteria for Usability of Accessible WEB Sites[C].7th ERCIM International Workshop on User Interfaces for All.Revised Papers.2003:43-55.
[13]劉愛華.高校圖書館網(wǎng)站可用性評價研究[J].圖書館學(xué)研究,2008 (2):36-44.
[14]鄢沛,郭皎,應(yīng)宏.Web可用性設(shè)計方法研究[J].重慶三峽學(xué)院學(xué)報,2010,26 (3):72-75.
[15]蔡屏.高校圖書館網(wǎng)站信息構(gòu)建的可用性評價研究——以開普敦大學(xué)圖書館為例[J].情報雜志,2011,30 (5):169-173.
[16]劉業(yè)政,葉俊杰,蔣瑋,徐俊芬.基于圖上隨機游動的Web頁面布局可用性評價[J].管理科學(xué)學(xué)報,2013,16 (9):75-81.
[17]白志斌,楊達,李娟.Web 系統(tǒng)可用性自動化評估系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2013,34(10):3649-3653.
[18]《電子政務(wù)主題詞表》編制與應(yīng)用系統(tǒng)課題組.綜合電子政務(wù)主題詞(試用版).北京:科學(xué)技術(shù)文獻出版社,2005.