基金項目:廣東圖書館學(xué)科研課題(項目編號:GDTK1211)。
作者簡介:蔡焰(1976-),女,技術(shù)部主任,副研究館員,碩士,研究方向:數(shù)據(jù)庫技術(shù)及網(wǎng)絡(luò)信息技術(shù)?!ば畔⒆稍兣c服務(wù)·
〔摘要〕本文主要介紹了基于網(wǎng)絡(luò)環(huán)境和基于圖書館的自主學(xué)習(xí)平臺建設(shè)方法,采用Web30中的語義網(wǎng)、概念圖相關(guān)理論與技術(shù),將語義網(wǎng)技術(shù)與概念圖理論應(yīng)用到數(shù)字圖書館中實現(xiàn)圖書館資源整合、個性化圖書推薦與個性化導(dǎo)航等自主學(xué)習(xí)平臺中,該個性化自主學(xué)習(xí)平臺包括個性化處理模塊、信息資源整合處理模塊、語義分析處理模塊、查詢模塊,為提高圖書館有效利用信息資源與提高讀者自主學(xué)習(xí)提供一種可行性解決方案。
〔關(guān)鍵詞〕Web30技術(shù);語義網(wǎng);概念圖;圖書館;個性化
DOI:10.3969/j.issn.1008-0821.2014.03.019
〔中圖分類號〕G2586〔文獻標(biāo)識碼〕A〔文章編號〕1008-0821(2014)03-0082-05
Autonomous Learning Platform Construction Research in University
Library Under the Environment of Web30 TechnologyCai Yan
(Library,Shaoguan University of Guangdong,Shaoguan 512005,China)
〔Abstract〕Web30 design was mainly analysing of the semantic web technology,combined with the theory of concept map used in digital library management,built the model of autonomous learning platform for digital library framework based on Web30.In the model,the semantic web technology and concept map to digital library personalized autonomous learning in the platform,the personalized autonomous learning platform included personalized processing module,information resources integration processing module,semantic analysis and processing module,query module,to improve the effective utilization of library information resources and improve the reader provided a feasible solution of independent learning.
〔Keywords〕Web30 technology;semantic web;concept map;library;personalized
1高校圖書館信息服務(wù)平臺存在的問題
隨著互聯(lián)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,人類已經(jīng)進入了信息化時代,互聯(lián)網(wǎng)已經(jīng)深深地影響著人們的生活,數(shù)字圖書館就是在網(wǎng)絡(luò)技術(shù)快速發(fā)展的環(huán)境下產(chǎn)生。隨著數(shù)字化圖書普及,讀者很快被浩瀚的信息內(nèi)容包圍著,如何在這些信息中提取出對自己有用的信息成了許多讀者最為關(guān)心的問題。而目前基于Web10或者Web20構(gòu)建的高校圖書館自主學(xué)習(xí)平臺雖然基于高校圖書館作為學(xué)習(xí)資源進行構(gòu)建,但無法實現(xiàn)不同信息間地來回跳轉(zhuǎn),其信息搜索返回結(jié)果都是大量無關(guān)的信息。因此,在面對數(shù)字圖書館中的海量數(shù)據(jù)時,如何科學(xué)地組織讀者所需要的信息,如何提高Internet、Database推送服務(wù)能力與獲取最新消息方法是擺在人們面前的挑戰(zhàn)性難題[1]。
而作為以用戶為中心的Web30改變了傳統(tǒng)人們獲取信息的方式[2],從以前的大范圍信息獲取開始轉(zhuǎn)變?yōu)閭€性化信息獲取,通過對用戶檢索行為與偏好的匯總以及用戶對檢索結(jié)果的認可度構(gòu)建以用戶為中心的個人知識庫,通過該知識庫實現(xiàn)信息主動推送、個性化服務(wù)等信息,這也是Web30的核心。
2Web技術(shù)概覽
21網(wǎng)絡(luò)環(huán)境下的自主學(xué)習(xí)
自主學(xué)習(xí)的定義是指在進行學(xué)習(xí)活動之前能預(yù)先確定課程學(xué)習(xí)目標(biāo),課程學(xué)習(xí)中又能對學(xué)習(xí)進程跟蹤處理并做出自我反饋,課程學(xué)習(xí)完畢還能進行自我檢查與評價的過程,是一種脫離教師、脫離課程的主動性學(xué)習(xí)過程。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,自主學(xué)習(xí)出現(xiàn)了基于網(wǎng)絡(luò)的自主學(xué)習(xí)形態(tài),出現(xiàn)了由主體、客體、群體和網(wǎng)絡(luò)環(huán)境組成的網(wǎng)絡(luò)自主學(xué)習(xí)平臺。通過基于網(wǎng)絡(luò)交互界面進行自主交互學(xué)習(xí),充分利用網(wǎng)絡(luò)資源中的文本、音頻、視頻等學(xué)習(xí)資源,通過在網(wǎng)絡(luò)交互環(huán)境下的群體知識共享與相互交流方式,打破學(xué)習(xí)的時間、空間、身份等限制。而圖書館作為學(xué)習(xí)資源集中地逐步成了自主學(xué)習(xí)平臺的核心,充分利用圖書館中的學(xué)習(xí)資源,配合網(wǎng)絡(luò)自主學(xué)習(xí)平臺中的適應(yīng)性內(nèi)容呈現(xiàn)、個性化學(xué)習(xí)過程監(jiān)控、參與式信息交互、績效多元化評價等優(yōu)點實現(xiàn)自主學(xué)習(xí)的最大化成效。
與此同時,在數(shù)字化圖書館方面,用戶已經(jīng)從單向接受服務(wù)轉(zhuǎn)為接受與參與圖書館服務(wù)中,數(shù)字化圖書館服務(wù)也由單純的提供數(shù)字圖書逐步轉(zhuǎn)向以用戶為中心的服務(wù)。在Web30時代,在技術(shù)的智能化、人性化、交互性方面有了更進一步,實現(xiàn)智能化人與機器間的交流,通過自然語言的檢索就可以快速定位用戶需要的信息[3]。Web30的核心技術(shù)是語義網(wǎng)技術(shù),通過該技術(shù)可以進行信息的智能化過濾與篩選、使信息檢索更加便捷。
22語義網(wǎng)本體研究
圖1語義網(wǎng)的層次結(jié)構(gòu)[3]
Web30的核心就是基于網(wǎng)絡(luò)語義的研究而展開,通過在WWW文檔中加入機器能識別的網(wǎng)絡(luò)語義實現(xiàn)Internet信息交互。語義網(wǎng)的層次結(jié)構(gòu)如圖1所示,其語義網(wǎng)總共由Unicode+URI、XML+NS+xmlchema、RDF+rdfchema+本體詞匯表、邏輯、證明、信任、數(shù)字簽名、字描述文檔、數(shù)據(jù)、規(guī)則組成。URI和Unicode編碼層主要是用于網(wǎng)絡(luò)資源標(biāo)示與統(tǒng)一信息編碼格式以實現(xiàn)信息系統(tǒng)的跨平臺性;XML+NS+xmlchema主要負責(zé)數(shù)據(jù)包封裝與數(shù)據(jù)包解析,XML主要是負責(zé)數(shù)據(jù)內(nèi)容封裝格式統(tǒng)一為XML的結(jié)構(gòu)定義,實現(xiàn)文檔結(jié)構(gòu)與文檔表現(xiàn)形式的分離[4],如圖書信息描述的文檔結(jié)構(gòu)方法為:
public book RegexExample {
?public static void main(String[] args) {
?String str=″aaabc efg ABC″;
?String regEx=″aaa|fff″;
endprint
?Pattern p=Pattern.compile(regEx);∥編譯成模式
?Matcher m=p.matcher(str);∥創(chuàng)建一個匹配器
?boolean rs=m.find();
?if(rs) {
?System.out.println(″include!!!″);
?}
?else {
?System.out.println(″no include!!!″);
?}
?}
NS主要負責(zé)URI索引標(biāo)識與文檔元素及屬性合規(guī)性校驗,xmlchema則主要進行XML文檔服務(wù)的解析與封裝,并在進行解析與翻轉(zhuǎn)過程中提供數(shù)據(jù)與格式校驗;在RDF+rdfchema中,采用RDF中的三元組描述信息資源以及資源間關(guān)系,RDF Schema則提供復(fù)雜詞匯的建模[5];本體層主要提供了一種描述應(yīng)用領(lǐng)域的知識與描述各類資源間關(guān)系的語義,是RDFS的一種擴展;層級結(jié)構(gòu)中的邏輯層、證明層、信任層則分別為推理規(guī)則提供邏輯分析、準(zhǔn)確性分析、結(jié)論可靠性保證、輸出可靠性分析、判斷功能;數(shù)字簽名與加密主要負責(zé)使用數(shù)字簽名識別計算機信息來源是否可信任的判斷。
語義網(wǎng)的核心是本體論,通過該本體論實現(xiàn)客觀事物的系統(tǒng)描述[6],它主要是由類、關(guān)系、函數(shù)、公理、實例5個基本元素組成,同時在語義Web信息資源描述中,除了以上幾個元素外還需要有資源信息語義標(biāo)注和語義擴展元素。因此在研究WEB語義中必須做好本體系統(tǒng)的構(gòu)建,其構(gòu)建原則必須滿足[7]:明確性與客觀性、完整性、一致性、可擴展性、最少約束性。
3圖書館自主學(xué)習(xí)平臺建設(shè)
31傳統(tǒng)學(xué)習(xí)平臺建設(shè)
語義網(wǎng)與圖書館兩者是不同事物,但兩者間具有相似的一面,都具有大量信息與信息資源合作的需要。某種意義上來說,在數(shù)字圖書館中引入語義網(wǎng)概念可以有效推動圖書館的發(fā)展。
在傳統(tǒng)學(xué)習(xí)平臺建設(shè)中,圖書館文獻資料檢索的條件基本采用關(guān)鍵字檢索,其文獻資料中的文件之間沒有任何的關(guān)聯(lián)關(guān)系,通過依靠關(guān)鍵字簡單的在數(shù)據(jù)庫中查詢其漏查率比較高。只是通過計算機簡單地進行語法匹配,然后把檢索結(jié)果又以簡單排序方式顯示給用戶,其輸出結(jié)果真實相關(guān)度非常低,根本無法滿足檢索用戶實際需求,這種方法還需要進行二次檢索才能提高其檢索率[8]。其傳統(tǒng)數(shù)據(jù)庫檢索流程如圖2所示。
圖2傳統(tǒng)學(xué)習(xí)平臺建設(shè)信息檢索模型
32基于Web30學(xué)習(xí)平臺建設(shè)
比起傳統(tǒng)學(xué)習(xí)平臺建設(shè),基于Web30學(xué)習(xí)平臺加強了圖書館文獻資料檢索效率,在Web30技術(shù)中,其數(shù)據(jù)檢索方法是基于語義知識進行檢索,通過語義級別的表達實現(xiàn)理解讀者意圖,最終實現(xiàn)良好的人機交互。本文在對Web語義網(wǎng)、概念圖、Onotlogy信息檢索等理論基礎(chǔ)上構(gòu)建基于Web30高校數(shù)字圖書館自主學(xué)習(xí)平臺模型。其基于語義知識檢索框架模型結(jié)構(gòu)如圖3所示。
圖3基于語義知識檢索模型
基于語義知識檢索的自主學(xué)習(xí)是通過對用戶登錄后個人信息、個性偏好、所使用過的關(guān)鍵詞、信息瀏覽記錄等信息進行長期記錄與跟蹤,并對該記錄進行自動化分析總結(jié),從而在信息檢索時基于用戶個性偏好來提供信息。在對讀者興趣模型創(chuàng)建與維護中可以采用概念層次模型,并通過計算文檔相似度來實現(xiàn)相似度計算,同時將語義網(wǎng)中的節(jié)點由(Ej,Wj)分別表達節(jié)點中的特征詞與權(quán)重,然后采用文檔相似度計算公式進行文檔相似度檢索。通過相似度計算來構(gòu)建讀者模型中的興趣愛好,其具體流程是:首先用戶登錄并輸入信息,然后系統(tǒng)自動與個性偏好庫進行匹配,若匹配正確則接著在讀者模型中進行匹配,并將最后檢索結(jié)果展示給用戶,同時讀者可以對反饋結(jié)構(gòu)進行滿意度評議,并把評議結(jié)果記錄更新到個性模型中。若不匹配個性庫則對讀者以前的行為記錄進行匹配,若對歷史記錄匹配正確則直接輸出檢索結(jié)果,若不匹配則作為用戶新的查詢更新模型[10]。
33基于Web30學(xué)習(xí)平臺功能結(jié)構(gòu)
基于語義網(wǎng)技術(shù)的圖書館自主學(xué)習(xí)平臺(如圖4)總共有三大模塊:讀者自主學(xué)習(xí)管理、輔助學(xué)習(xí)管理、圖書館資源管理,讀者自主學(xué)習(xí)管理主要是指讀者個人信息管理模塊,其內(nèi)容包括在線考試、個人信息管理、信息訂閱與收藏、學(xué)習(xí)計劃、學(xué)習(xí)筆記、協(xié)作學(xué)習(xí)、討論交流;輔助學(xué)習(xí)管理主要是輔助與指導(dǎo)模塊,其內(nèi)容包括FAQ、表單查詢、實時咨詢、教師博客、遠程助教系統(tǒng)、課程專業(yè)頻道、網(wǎng)絡(luò)課程、在線課堂;圖書館資源管理模塊包括讀者行為記錄管理、圖書信息資源整合、語義分析處理、個性化檢索與導(dǎo)航。在圖書館資源管理中通過自主學(xué)習(xí)平臺收集與記錄用戶學(xué)習(xí)行為并存入讀者行為庫中,當(dāng)用戶在圖書資源管理模塊時系統(tǒng)將結(jié)合讀者行為庫進行信息資源呈現(xiàn)。這種新的模式比起傳統(tǒng)圖書館資源管理與檢索更能有效利用高校圖書館資源。
331讀者自主學(xué)習(xí)管理
讀者自主學(xué)習(xí)管理主要功能有在線考試、個人信息、信息推薦與收藏、學(xué)習(xí)計劃、學(xué)習(xí)筆記、學(xué)習(xí)過程監(jiān)控、討論交流。這個模塊主要是學(xué)生管理個人信息、掌握學(xué)習(xí)進度、與其他學(xué)生協(xié)作交流之用,還可以通過信息訂閱實現(xiàn)信息推送功能。學(xué)生最終可以通過多種方式完成自主學(xué)習(xí),并記錄其學(xué)習(xí)情況,還可以根據(jù)課程策略完成對學(xué)生學(xué)習(xí)定量評價。
對于讀者自主學(xué)習(xí)管理中的學(xué)習(xí)過程監(jiān)控模塊,它主要是負責(zé)用戶學(xué)習(xí)進度、用戶交互信息、讀者學(xué)習(xí)狀態(tài)變化采集,然后把采集信息寫入到讀者行為庫中,根據(jù)用戶學(xué)習(xí)過程記錄實現(xiàn)系統(tǒng)適應(yīng)性內(nèi)容呈現(xiàn),如信息推薦模塊的信息呈現(xiàn),并指導(dǎo)讀者下一步學(xué)習(xí)操作行為,形成新的學(xué)習(xí)計劃管理。
對于在線考試模塊主要是根據(jù)用戶學(xué)習(xí)過程監(jiān)控采集到的數(shù)據(jù)進行針對性在線測試,其測試內(nèi)容根據(jù)用戶學(xué)習(xí)行為庫中的學(xué)習(xí)記錄變化而變化,最終實現(xiàn)鞏固學(xué)習(xí)結(jié)果的目的。
332輔助學(xué)習(xí)管理
輔助學(xué)習(xí)管理主要用于學(xué)生自主學(xué)習(xí)評價管理之用,模塊支持互聯(lián)網(wǎng)協(xié)作學(xué)習(xí)與遠程輔助學(xué)習(xí)管理,功能上包圖4圖書館自主學(xué)習(xí)邏輯結(jié)構(gòu)
括FAQ,表單咨詢、實時咨詢、教師博客、遠程助教系統(tǒng)、課程專業(yè)頻道、網(wǎng)絡(luò)課程、在線課堂。實時咨詢以及常見問/答(FAQ),Web表單與E-mail咨詢等服務(wù)方式,學(xué)生可以根據(jù)自己的需要選擇不同的咨詢方式。實時互動咨詢采用同步、實時交流技術(shù)來模擬面對面參考服務(wù)的問詢環(huán)境,彌補E-mail咨詢中的不足。系統(tǒng)不僅提供文字交互功能,還提供同步瀏覽服務(wù),利用這種功能,咨詢員可以邊演示邊回答讀者的提問,這與傳統(tǒng)的參考咨詢服務(wù)極為近似,館員和讀者之間可以同步信息交流和共享網(wǎng)絡(luò)信息,共同瀏覽多種格式的文件,滿足遠程教學(xué)和輔助教學(xué)的需要。網(wǎng)頁同步瀏覽功能可以大大提高讀者服務(wù)的效率和質(zhì)量。在線課堂以類似于視頻直播和在線點播的方式實現(xiàn)通過網(wǎng)絡(luò)觀摩遠程課堂的功能。
在輔助學(xué)習(xí)管理中的FAQ主要是進行學(xué)習(xí)效果評價,系統(tǒng)采用多元智能相關(guān)理論構(gòu)建自主學(xué)習(xí)質(zhì)量評價,對該模塊讀者可以自由修正,實現(xiàn)自主學(xué)習(xí)平臺對學(xué)習(xí)者的學(xué)習(xí)過程實施動態(tài)評價,為學(xué)習(xí)過程監(jiān)控模塊提供控制反饋信息,其評測模型如表1所示。
333圖書館資源管理
圖書館資源管理主要是學(xué)習(xí)資源管理,功能上包括讀者行為庫管理、圖書信息資源整合管理、語義分析處理管理、圖書信息檢索與導(dǎo)航管理,為自主學(xué)習(xí)平臺提供所需表1學(xué)習(xí)評價模型
評價類別形式自評子系統(tǒng)自我評價網(wǎng)絡(luò)筆記,博客,總結(jié)反思他評子系統(tǒng)終結(jié)性評價單元測試,課程測試形成性評價登錄統(tǒng)計,頁面停留時間,共享知識點擊率,學(xué)習(xí)社區(qū)交互統(tǒng)計群體評價學(xué)伴評價,作品集,問題解決
endprint
要的各種教學(xué)資源,其資源信息包括教材庫、習(xí)題庫、案例庫、視頻庫、圖片庫、素材庫等,同時該模塊支持多用戶集中管理、圖書信息檢索與導(dǎo)航等,模塊是自主學(xué)習(xí)平臺的核心,其資源檢索模型就是基于Web30技術(shù)而實現(xiàn),其優(yōu)越性是傳統(tǒng)資源檢索無法比擬的。
讀者行為庫主要由讀者行為記錄、讀者知識網(wǎng)絡(luò)兩個模塊構(gòu)成,主要用于記錄學(xué)生自主學(xué)習(xí)過程中圖書信息檢索、自主學(xué)習(xí)過程跟蹤,為讀者提供圖書推薦等功能。
圖書信息資源整合處理模塊主要是指通過信息資源合理的機構(gòu)化組織提高信息檢索效率。通過成熟的圖書分類體系、主題詞表達工具以及Web30中的語義網(wǎng)(XML、RDFS、OWL)、概念圖等技術(shù)詳細描述圖書館中的信息概念,并創(chuàng)建本體模型與本體知識庫。其本體構(gòu)建過程中,首先對圖書館信息資源元數(shù)據(jù)信息進行數(shù)據(jù)挖掘,通過數(shù)字圖書館中成熟的元數(shù)據(jù)(MARC、DC等)與XML文檔來組織與整合讀者偏好元數(shù)據(jù)信息。其具體過程是[11]:首先對圖書館資源整合,實現(xiàn)信息資源結(jié)構(gòu)化和統(tǒng)一格式存儲,接著通過(MARC、DC)元數(shù)據(jù)標(biāo)準(zhǔn)進一步規(guī)范文檔,并進行有效元數(shù)據(jù)挖掘,將挖掘出的有效元數(shù)據(jù)通過XML重新組織,并存入元數(shù)據(jù)庫中。XML很好地進行了文檔信息的結(jié)構(gòu)化,實現(xiàn)了本地類層次關(guān)系描述。
語義分析處理模塊主要負責(zé)本體知識庫創(chuàng)建,并將本體映射為概念圖。本體通過三元組進行事務(wù)屬性與關(guān)系描述,它是一種特殊概念圖,由此可以通過概念圖的方式來描述事物本體,并在語言分析處理模塊進語義級別的搜索。例如:若讀者喜歡大氣科學(xué)類期刊,就可以直接用自然語言“大氣科學(xué)的期刊種數(shù)有多少”進行信息檢索,語義分析處理模塊通過表達式抽取關(guān)鍵詞、詞性標(biāo)注、句法分析、概念識別等操作抽取檢索式中的詞語,并轉(zhuǎn)換為概念圖模型。在對讀者信息進行抽詞處理時,通過現(xiàn)有抽詞工具和知識本體庫含有的專業(yè)詞匯進行數(shù)據(jù)挖掘,并把檢索表達式中的無意義的詞刪除處理。抽取詞后進行詞性標(biāo)注,并進行語法分析與概念識別,采用概念圖匹配算法在語義試題庫中進行匹配[12],其過程如圖5所示。
圖5信息需求處理流程〖〗
圖書信息檢索與導(dǎo)航模塊是指對讀者提出的檢索需求進行自主化學(xué)習(xí)查詢定義,在對檢索需求分析處理上構(gòu)建概念圖模型,然后通過概念圖匹配算法實現(xiàn)語義信息實體庫快速查詢,并把該概念圖的相似度計算與讀者偏好庫匹配,通過排序后展示給用戶。其具體過程是首先為用戶構(gòu)建個性偏好庫實現(xiàn)自主化學(xué)習(xí)查詢界面,自主化學(xué)習(xí)查詢界面作為讀者信息查詢與瀏覽的窗口,實現(xiàn)讀者與系統(tǒng)之間的人機交互,用戶在信息檢索窗口進行信息查詢,并與后臺個人信息庫進行匹配,同時在偏好庫中增加權(quán)重,并對讀者行為庫進行更新,查詢模塊對讀者查詢在知識本體中進行語義擴展,并生成對應(yīng)的概念圖,接著通過該概念圖在語義信息試題庫中采用概念圖匹配算法進行相似度計算與信息匹配。
4總結(jié)
本論文介紹Web10、Web20、Web30的特點與發(fā)展及其相關(guān)概念,在此基礎(chǔ)上分析Web30中核心語義網(wǎng)概念與相關(guān)技術(shù),并將語義網(wǎng)與概念圖結(jié)合應(yīng)用到數(shù)字化圖書館中,構(gòu)建基于Web30數(shù)字圖書館自主學(xué)習(xí)平臺框架模型,語義網(wǎng)能夠理解字符中所包含的語義,從而更加有利于信息資源的共建共享,方便人們與計算機進行交流,做到人機對話與協(xié)同工作。
參考文獻
[1]鄭貞愛.在大學(xué)外語教學(xué)中培養(yǎng)學(xué)生自主學(xué)習(xí)能力[J].遼寧教育行政學(xué)院學(xué)報,2011,(1):163-164.
[2]Mingzhang Zuo,Lixin Diao,Xiaomei Liu.Research on the Construc-tion of Network Study Platform Based on Blended Learning[C].MProc.of 2009 Second International Conference on Education Technology and Training,Sanya China,2010:224-226.
[3]趙姍,李門樓,郭嘉,等.基于1NET的課程自主學(xué)習(xí)平臺的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2008,29(15):4067-4069.
[4]李門樓,李晴.基于Web的研究生英語自主學(xué)習(xí)平臺的構(gòu)建及實施[J].中國教育信息化,2012,(1):45-47.
[5]惠麗,張凝,徐輝.基于Web20下網(wǎng)絡(luò)自主學(xué)習(xí)平臺關(guān)鍵技術(shù)研究[J].黑龍江大學(xué)自然科學(xué)學(xué)報,2011,26(1):72-74.
[6]馬啟花.基于Web30的高校圖書館圖書采訪智能化決策設(shè)想[J].現(xiàn)代情報,2009,29(4):117-119.
[7]朱勤,陸志明.基于信息隱藏的外包數(shù)據(jù)庫版權(quán)保護系統(tǒng)[J].計算機科學(xué),2010,37(1):163-167.
[8]曾慶田,段華,等.面向知識處理的領(lǐng)域本體及其應(yīng)用研究[J].情報學(xué)報,2006,25(6):713-719.
[9]黃坷萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學(xué),2012,20(2):12-18.
[10]陳剛,基于領(lǐng)域知識重用的虛擬領(lǐng)域本體構(gòu)造[J].軟件學(xué)報,2011,36(6):1-11.
[11]朱益瓊,蔡鴻明,姜朋紅.基于領(lǐng)域本體的多層次服務(wù)綜合匹配[J].計算機工程與應(yīng)用,2009,33(14):22-28.
[12]Studer R,Benjamins VR,FenselD.knowledge Engineering,Prinei Plesand Methods[J].Data and Knowledge Engineering,2012,25(122):161-197.
(本文責(zé)任編輯:馬卓)
endprint
要的各種教學(xué)資源,其資源信息包括教材庫、習(xí)題庫、案例庫、視頻庫、圖片庫、素材庫等,同時該模塊支持多用戶集中管理、圖書信息檢索與導(dǎo)航等,模塊是自主學(xué)習(xí)平臺的核心,其資源檢索模型就是基于Web30技術(shù)而實現(xiàn),其優(yōu)越性是傳統(tǒng)資源檢索無法比擬的。
讀者行為庫主要由讀者行為記錄、讀者知識網(wǎng)絡(luò)兩個模塊構(gòu)成,主要用于記錄學(xué)生自主學(xué)習(xí)過程中圖書信息檢索、自主學(xué)習(xí)過程跟蹤,為讀者提供圖書推薦等功能。
圖書信息資源整合處理模塊主要是指通過信息資源合理的機構(gòu)化組織提高信息檢索效率。通過成熟的圖書分類體系、主題詞表達工具以及Web30中的語義網(wǎng)(XML、RDFS、OWL)、概念圖等技術(shù)詳細描述圖書館中的信息概念,并創(chuàng)建本體模型與本體知識庫。其本體構(gòu)建過程中,首先對圖書館信息資源元數(shù)據(jù)信息進行數(shù)據(jù)挖掘,通過數(shù)字圖書館中成熟的元數(shù)據(jù)(MARC、DC等)與XML文檔來組織與整合讀者偏好元數(shù)據(jù)信息。其具體過程是[11]:首先對圖書館資源整合,實現(xiàn)信息資源結(jié)構(gòu)化和統(tǒng)一格式存儲,接著通過(MARC、DC)元數(shù)據(jù)標(biāo)準(zhǔn)進一步規(guī)范文檔,并進行有效元數(shù)據(jù)挖掘,將挖掘出的有效元數(shù)據(jù)通過XML重新組織,并存入元數(shù)據(jù)庫中。XML很好地進行了文檔信息的結(jié)構(gòu)化,實現(xiàn)了本地類層次關(guān)系描述。
語義分析處理模塊主要負責(zé)本體知識庫創(chuàng)建,并將本體映射為概念圖。本體通過三元組進行事務(wù)屬性與關(guān)系描述,它是一種特殊概念圖,由此可以通過概念圖的方式來描述事物本體,并在語言分析處理模塊進語義級別的搜索。例如:若讀者喜歡大氣科學(xué)類期刊,就可以直接用自然語言“大氣科學(xué)的期刊種數(shù)有多少”進行信息檢索,語義分析處理模塊通過表達式抽取關(guān)鍵詞、詞性標(biāo)注、句法分析、概念識別等操作抽取檢索式中的詞語,并轉(zhuǎn)換為概念圖模型。在對讀者信息進行抽詞處理時,通過現(xiàn)有抽詞工具和知識本體庫含有的專業(yè)詞匯進行數(shù)據(jù)挖掘,并把檢索表達式中的無意義的詞刪除處理。抽取詞后進行詞性標(biāo)注,并進行語法分析與概念識別,采用概念圖匹配算法在語義試題庫中進行匹配[12],其過程如圖5所示。
圖5信息需求處理流程〖〗
圖書信息檢索與導(dǎo)航模塊是指對讀者提出的檢索需求進行自主化學(xué)習(xí)查詢定義,在對檢索需求分析處理上構(gòu)建概念圖模型,然后通過概念圖匹配算法實現(xiàn)語義信息實體庫快速查詢,并把該概念圖的相似度計算與讀者偏好庫匹配,通過排序后展示給用戶。其具體過程是首先為用戶構(gòu)建個性偏好庫實現(xiàn)自主化學(xué)習(xí)查詢界面,自主化學(xué)習(xí)查詢界面作為讀者信息查詢與瀏覽的窗口,實現(xiàn)讀者與系統(tǒng)之間的人機交互,用戶在信息檢索窗口進行信息查詢,并與后臺個人信息庫進行匹配,同時在偏好庫中增加權(quán)重,并對讀者行為庫進行更新,查詢模塊對讀者查詢在知識本體中進行語義擴展,并生成對應(yīng)的概念圖,接著通過該概念圖在語義信息試題庫中采用概念圖匹配算法進行相似度計算與信息匹配。
4總結(jié)
本論文介紹Web10、Web20、Web30的特點與發(fā)展及其相關(guān)概念,在此基礎(chǔ)上分析Web30中核心語義網(wǎng)概念與相關(guān)技術(shù),并將語義網(wǎng)與概念圖結(jié)合應(yīng)用到數(shù)字化圖書館中,構(gòu)建基于Web30數(shù)字圖書館自主學(xué)習(xí)平臺框架模型,語義網(wǎng)能夠理解字符中所包含的語義,從而更加有利于信息資源的共建共享,方便人們與計算機進行交流,做到人機對話與協(xié)同工作。
參考文獻
[1]鄭貞愛.在大學(xué)外語教學(xué)中培養(yǎng)學(xué)生自主學(xué)習(xí)能力[J].遼寧教育行政學(xué)院學(xué)報,2011,(1):163-164.
[2]Mingzhang Zuo,Lixin Diao,Xiaomei Liu.Research on the Construc-tion of Network Study Platform Based on Blended Learning[C].MProc.of 2009 Second International Conference on Education Technology and Training,Sanya China,2010:224-226.
[3]趙姍,李門樓,郭嘉,等.基于1NET的課程自主學(xué)習(xí)平臺的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2008,29(15):4067-4069.
[4]李門樓,李晴.基于Web的研究生英語自主學(xué)習(xí)平臺的構(gòu)建及實施[J].中國教育信息化,2012,(1):45-47.
[5]惠麗,張凝,徐輝.基于Web20下網(wǎng)絡(luò)自主學(xué)習(xí)平臺關(guān)鍵技術(shù)研究[J].黑龍江大學(xué)自然科學(xué)學(xué)報,2011,26(1):72-74.
[6]馬啟花.基于Web30的高校圖書館圖書采訪智能化決策設(shè)想[J].現(xiàn)代情報,2009,29(4):117-119.
[7]朱勤,陸志明.基于信息隱藏的外包數(shù)據(jù)庫版權(quán)保護系統(tǒng)[J].計算機科學(xué),2010,37(1):163-167.
[8]曾慶田,段華,等.面向知識處理的領(lǐng)域本體及其應(yīng)用研究[J].情報學(xué)報,2006,25(6):713-719.
[9]黃坷萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學(xué),2012,20(2):12-18.
[10]陳剛,基于領(lǐng)域知識重用的虛擬領(lǐng)域本體構(gòu)造[J].軟件學(xué)報,2011,36(6):1-11.
[11]朱益瓊,蔡鴻明,姜朋紅.基于領(lǐng)域本體的多層次服務(wù)綜合匹配[J].計算機工程與應(yīng)用,2009,33(14):22-28.
[12]Studer R,Benjamins VR,FenselD.knowledge Engineering,Prinei Plesand Methods[J].Data and Knowledge Engineering,2012,25(122):161-197.
(本文責(zé)任編輯:馬卓)
endprint
要的各種教學(xué)資源,其資源信息包括教材庫、習(xí)題庫、案例庫、視頻庫、圖片庫、素材庫等,同時該模塊支持多用戶集中管理、圖書信息檢索與導(dǎo)航等,模塊是自主學(xué)習(xí)平臺的核心,其資源檢索模型就是基于Web30技術(shù)而實現(xiàn),其優(yōu)越性是傳統(tǒng)資源檢索無法比擬的。
讀者行為庫主要由讀者行為記錄、讀者知識網(wǎng)絡(luò)兩個模塊構(gòu)成,主要用于記錄學(xué)生自主學(xué)習(xí)過程中圖書信息檢索、自主學(xué)習(xí)過程跟蹤,為讀者提供圖書推薦等功能。
圖書信息資源整合處理模塊主要是指通過信息資源合理的機構(gòu)化組織提高信息檢索效率。通過成熟的圖書分類體系、主題詞表達工具以及Web30中的語義網(wǎng)(XML、RDFS、OWL)、概念圖等技術(shù)詳細描述圖書館中的信息概念,并創(chuàng)建本體模型與本體知識庫。其本體構(gòu)建過程中,首先對圖書館信息資源元數(shù)據(jù)信息進行數(shù)據(jù)挖掘,通過數(shù)字圖書館中成熟的元數(shù)據(jù)(MARC、DC等)與XML文檔來組織與整合讀者偏好元數(shù)據(jù)信息。其具體過程是[11]:首先對圖書館資源整合,實現(xiàn)信息資源結(jié)構(gòu)化和統(tǒng)一格式存儲,接著通過(MARC、DC)元數(shù)據(jù)標(biāo)準(zhǔn)進一步規(guī)范文檔,并進行有效元數(shù)據(jù)挖掘,將挖掘出的有效元數(shù)據(jù)通過XML重新組織,并存入元數(shù)據(jù)庫中。XML很好地進行了文檔信息的結(jié)構(gòu)化,實現(xiàn)了本地類層次關(guān)系描述。
語義分析處理模塊主要負責(zé)本體知識庫創(chuàng)建,并將本體映射為概念圖。本體通過三元組進行事務(wù)屬性與關(guān)系描述,它是一種特殊概念圖,由此可以通過概念圖的方式來描述事物本體,并在語言分析處理模塊進語義級別的搜索。例如:若讀者喜歡大氣科學(xué)類期刊,就可以直接用自然語言“大氣科學(xué)的期刊種數(shù)有多少”進行信息檢索,語義分析處理模塊通過表達式抽取關(guān)鍵詞、詞性標(biāo)注、句法分析、概念識別等操作抽取檢索式中的詞語,并轉(zhuǎn)換為概念圖模型。在對讀者信息進行抽詞處理時,通過現(xiàn)有抽詞工具和知識本體庫含有的專業(yè)詞匯進行數(shù)據(jù)挖掘,并把檢索表達式中的無意義的詞刪除處理。抽取詞后進行詞性標(biāo)注,并進行語法分析與概念識別,采用概念圖匹配算法在語義試題庫中進行匹配[12],其過程如圖5所示。
圖5信息需求處理流程〖〗
圖書信息檢索與導(dǎo)航模塊是指對讀者提出的檢索需求進行自主化學(xué)習(xí)查詢定義,在對檢索需求分析處理上構(gòu)建概念圖模型,然后通過概念圖匹配算法實現(xiàn)語義信息實體庫快速查詢,并把該概念圖的相似度計算與讀者偏好庫匹配,通過排序后展示給用戶。其具體過程是首先為用戶構(gòu)建個性偏好庫實現(xiàn)自主化學(xué)習(xí)查詢界面,自主化學(xué)習(xí)查詢界面作為讀者信息查詢與瀏覽的窗口,實現(xiàn)讀者與系統(tǒng)之間的人機交互,用戶在信息檢索窗口進行信息查詢,并與后臺個人信息庫進行匹配,同時在偏好庫中增加權(quán)重,并對讀者行為庫進行更新,查詢模塊對讀者查詢在知識本體中進行語義擴展,并生成對應(yīng)的概念圖,接著通過該概念圖在語義信息試題庫中采用概念圖匹配算法進行相似度計算與信息匹配。
4總結(jié)
本論文介紹Web10、Web20、Web30的特點與發(fā)展及其相關(guān)概念,在此基礎(chǔ)上分析Web30中核心語義網(wǎng)概念與相關(guān)技術(shù),并將語義網(wǎng)與概念圖結(jié)合應(yīng)用到數(shù)字化圖書館中,構(gòu)建基于Web30數(shù)字圖書館自主學(xué)習(xí)平臺框架模型,語義網(wǎng)能夠理解字符中所包含的語義,從而更加有利于信息資源的共建共享,方便人們與計算機進行交流,做到人機對話與協(xié)同工作。
參考文獻
[1]鄭貞愛.在大學(xué)外語教學(xué)中培養(yǎng)學(xué)生自主學(xué)習(xí)能力[J].遼寧教育行政學(xué)院學(xué)報,2011,(1):163-164.
[2]Mingzhang Zuo,Lixin Diao,Xiaomei Liu.Research on the Construc-tion of Network Study Platform Based on Blended Learning[C].MProc.of 2009 Second International Conference on Education Technology and Training,Sanya China,2010:224-226.
[3]趙姍,李門樓,郭嘉,等.基于1NET的課程自主學(xué)習(xí)平臺的設(shè)計與實現(xiàn)[J].計算機工程與設(shè)計,2008,29(15):4067-4069.
[4]李門樓,李晴.基于Web的研究生英語自主學(xué)習(xí)平臺的構(gòu)建及實施[J].中國教育信息化,2012,(1):45-47.
[5]惠麗,張凝,徐輝.基于Web20下網(wǎng)絡(luò)自主學(xué)習(xí)平臺關(guān)鍵技術(shù)研究[J].黑龍江大學(xué)自然科學(xué)學(xué)報,2011,26(1):72-74.
[6]馬啟花.基于Web30的高校圖書館圖書采訪智能化決策設(shè)想[J].現(xiàn)代情報,2009,29(4):117-119.
[7]朱勤,陸志明.基于信息隱藏的外包數(shù)據(jù)庫版權(quán)保護系統(tǒng)[J].計算機科學(xué),2010,37(1):163-167.
[8]曾慶田,段華,等.面向知識處理的領(lǐng)域本體及其應(yīng)用研究[J].情報學(xué)報,2006,25(6):713-719.
[9]黃坷萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學(xué),2012,20(2):12-18.
[10]陳剛,基于領(lǐng)域知識重用的虛擬領(lǐng)域本體構(gòu)造[J].軟件學(xué)報,2011,36(6):1-11.
[11]朱益瓊,蔡鴻明,姜朋紅.基于領(lǐng)域本體的多層次服務(wù)綜合匹配[J].計算機工程與應(yīng)用,2009,33(14):22-28.
[12]Studer R,Benjamins VR,FenselD.knowledge Engineering,Prinei Plesand Methods[J].Data and Knowledge Engineering,2012,25(122):161-197.
(本文責(zé)任編輯:馬卓)
endprint