摘 要:本文是以教育網(wǎng)格為背景,結(jié)合教學(xué)資源系統(tǒng)的特點(diǎn)和實(shí)際應(yīng)用情況,從理論和應(yīng)用兩個(gè)層次對(duì)構(gòu)建基于網(wǎng)格技術(shù)的遠(yuǎn)程教學(xué)資源庫(kù)系統(tǒng)進(jìn)行了較為深入的研究,提出了網(wǎng)格教學(xué)資源采用“專業(yè)門類—課程—不同類型媒體資源”的結(jié)構(gòu)化資源管理體系結(jié)構(gòu)和基于關(guān)鍵字相關(guān)度搜索引擎的設(shè)計(jì)方案。
關(guān)鍵詞:網(wǎng)格技術(shù) 教學(xué)資源庫(kù) 目錄存儲(chǔ) 搜索算法
中圖分類號(hào):G203 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-8454(2008)13-0087-03
網(wǎng)格技術(shù)是基于互聯(lián)網(wǎng)技術(shù)、而又具有自身特點(diǎn)的新一代互聯(lián)網(wǎng)技術(shù)。網(wǎng)格技術(shù)的最大特點(diǎn)是信息資源共享?;诖?,網(wǎng)格技術(shù)在遠(yuǎn)程教育中的運(yùn)用,可以解決當(dāng)前遠(yuǎn)程教育領(lǐng)域中資源庫(kù)的資源存儲(chǔ)和管理等問(wèn)題。
一、研究背景
美國(guó)計(jì)算網(wǎng)格項(xiàng)目的領(lǐng)導(dǎo)人之一,Ian Foster把網(wǎng)格描述為:“網(wǎng)格就是構(gòu)筑在互聯(lián)網(wǎng)上的一組新興技術(shù)。它將高速互聯(lián)網(wǎng)、高性能計(jì)算機(jī)、大型數(shù)據(jù)庫(kù)、傳感器、遠(yuǎn)程設(shè)備等融為一體,為科技人員和普通用戶提供更多的資源、功能和交互性。傳統(tǒng)互聯(lián)網(wǎng)主要為用戶提供電子郵件、網(wǎng)頁(yè)瀏覽等通信功能,而網(wǎng)格的功能更多更強(qiáng),它能讓人們透明地使用計(jì)算、存儲(chǔ)等其他資源?!盵1] 簡(jiǎn)單地說(shuō),網(wǎng)格就是把整個(gè)因特網(wǎng)整合成一臺(tái)巨大的超級(jí)計(jì)算機(jī),實(shí)現(xiàn)計(jì)算資源、存儲(chǔ)資源、數(shù)據(jù)資源、信息資源、知識(shí)資源、專家資源的全面共享。
1.網(wǎng)格技術(shù)在教育領(lǐng)域中的應(yīng)用現(xiàn)狀
2003年起,教育部與英特爾(中國(guó))有限公司攜手構(gòu)建下一代中國(guó)高等教育網(wǎng)格計(jì)算平臺(tái),教育網(wǎng)格計(jì)算系統(tǒng)(EGCS:Educational Grid Computing System)的目標(biāo)是建立一個(gè)由教育系統(tǒng)各單位提供資源共享的科研、教育、培訓(xùn)等高性能計(jì)算設(shè)施,實(shí)現(xiàn)跨學(xué)科、跨部門和跨地域的合作和人才培養(yǎng)的網(wǎng)格計(jì)算系統(tǒng)。EGCS的結(jié)構(gòu)模型如圖1所示。
EGCS系統(tǒng)以頁(yè)面作為對(duì)外提供服務(wù)的統(tǒng)一界面,以保證它與平臺(tái)無(wú)關(guān),易于操作,避免使用者直接對(duì)計(jì)算系統(tǒng)的訪問(wèn),防止無(wú)意破壞或惡意攻擊,保證系統(tǒng)的安全性。管理系統(tǒng)實(shí)現(xiàn)各種控制和管理功能,向下對(duì)不同的計(jì)算機(jī)系統(tǒng)進(jìn)行控制和管理,在不同系統(tǒng)之間進(jìn)行資源分配,對(duì)上提供各種服務(wù)實(shí)現(xiàn)用戶提出的各種計(jì)算任務(wù)。
另外,教育資源網(wǎng)格以著名高校為主,進(jìn)行課程資源建設(shè),建立網(wǎng)格管理環(huán)境,為課程資源使用者提供服務(wù),在此基礎(chǔ)上形成一定規(guī)模的大學(xué)課程在線網(wǎng)格系統(tǒng),為高等教育提供必要的在線資源支持。
2.網(wǎng)格體系結(jié)構(gòu)
目前最新的一種網(wǎng)格體系結(jié)構(gòu)被稱為開(kāi)放網(wǎng)格服務(wù)結(jié)構(gòu)OGSA(Open Grid Service Architecture)[2][3],是一種基于網(wǎng)格服務(wù)的分布式交互的計(jì)算體系結(jié)構(gòu),用來(lái)確保異構(gòu)系統(tǒng)間的互操作性,使不同類型的系統(tǒng)可以實(shí)現(xiàn)資源共享。OGSA 是 Globus Toolkit 4.0與 Web Service 相結(jié)合的產(chǎn)物,服務(wù)都遵循指定的網(wǎng)格服務(wù)接口和行為,網(wǎng)格服務(wù)的標(biāo)準(zhǔn)接口包含多重綁定和實(shí)現(xiàn)。
OGSA體系結(jié)構(gòu)(見(jiàn)圖2)是一個(gè)四層模型,最下面一層是構(gòu)造層,它包括網(wǎng)絡(luò)上所有可用的設(shè)備和資源。構(gòu)造層之上是連接層,它主要包括與服務(wù)器、網(wǎng)絡(luò)進(jìn)行連接的資源和連接協(xié)議。再上面的一層是集群服務(wù),這層的作用是將服務(wù)資源匯聚在一起,供虛擬組織的應(yīng)用程序共享、調(diào)用,它包括目錄的處理、診斷、監(jiān)測(cè),資源的注冊(cè)、分配、代理,和負(fù)荷控制、賬戶管理等。最上面的一層是應(yīng)用層,指的是用戶應(yīng)用程序,以及相關(guān)應(yīng)用接口。
二、構(gòu)建基于網(wǎng)格技術(shù)的遠(yuǎn)程教育資源庫(kù)系統(tǒng)
資源的缺乏,尤其是優(yōu)秀網(wǎng)絡(luò)教學(xué)資源的缺乏,是制約遠(yuǎn)程教育發(fā)展的瓶頸之一。近幾年來(lái),我國(guó)教育部,及電大系統(tǒng)和各個(gè)網(wǎng)絡(luò)學(xué)院都把遠(yuǎn)程教育資源建設(shè)擺在重要位置。但是,當(dāng)前的資源建設(shè)存在如下一些問(wèn)題:優(yōu)質(zhì)資源沒(méi)有形成資源共享;資源的重復(fù)建設(shè)情況嚴(yán)重;對(duì)資源檢索的技術(shù)智能化水平不高;資源的獲取和應(yīng)用及更新速度慢,動(dòng)態(tài)適應(yīng)性較差等,其中主要問(wèn)題還是沒(méi)有形成資源的有效共享。
1.網(wǎng)格計(jì)算環(huán)境中的遠(yuǎn)程教學(xué)資源的特點(diǎn)
一是資源的數(shù)量巨大,這些資源可能在地理上是分布的,而且是異構(gòu)的,它們由多級(jí)網(wǎng)絡(luò)互聯(lián),形成一個(gè)巨大的資源庫(kù)。二是資源是動(dòng)態(tài)變化的,資源庫(kù)系統(tǒng)可以對(duì)此做出動(dòng)態(tài)的適應(yīng)。三是資源共享機(jī)制的建立,這些資源雖然由不同的個(gè)體所管理,但是網(wǎng)格資源庫(kù)系統(tǒng)提供了一個(gè)統(tǒng)一的標(biāo)準(zhǔn),可以實(shí)現(xiàn)互操作,提供交互和協(xié)作功能。
2.基于網(wǎng)格的教學(xué)資源庫(kù)體系結(jié)構(gòu)
根據(jù)開(kāi)放網(wǎng)格服務(wù)結(jié)構(gòu)OGSA四層模型,我們總結(jié)教學(xué)資源庫(kù)在開(kāi)放教育中的實(shí)際應(yīng)用,提出了基于網(wǎng)格技術(shù)的遠(yuǎn)程教育資源庫(kù)系統(tǒng)的建設(shè)框架,如圖3。
(1)網(wǎng)格資源庫(kù)節(jié)點(diǎn)。網(wǎng)上可訪問(wèn)的各類資源,包括各類主機(jī)、運(yùn)行不同平臺(tái)的工作站,也可以是運(yùn)行集群操作系統(tǒng)的機(jī)群設(shè)備、大型存儲(chǔ)設(shè)備、數(shù)據(jù)庫(kù),這里主要指各種資源庫(kù)、資料庫(kù)。
(2)網(wǎng)格資源庫(kù)中間件。中間件是(Grid Resources Library System Middleware)定義了一系列協(xié)議和服務(wù),提供一系列工具和協(xié)議軟件,其功能是屏蔽網(wǎng)格資源庫(kù)系統(tǒng)中基礎(chǔ)設(shè)施中空間信息的分布、異構(gòu)特性,向數(shù)據(jù)網(wǎng)格應(yīng)用層提供透明、一致的使用接口。提供遠(yuǎn)程管理服務(wù)、資源分配服務(wù)、存儲(chǔ)訪問(wèn)服務(wù)、信息服務(wù)、安全控制服務(wù)等等。管理層中間件包括虛擬組織中的信息和資源的動(dòng)態(tài)分配和統(tǒng)一管理,資源的預(yù)定義。目前來(lái)說(shuō),首先實(shí)現(xiàn)教學(xué)資源的語(yǔ)義檢索。
(3)網(wǎng)格資源庫(kù)開(kāi)發(fā)環(huán)境,提供用戶二次開(kāi)發(fā)環(huán)境和工具,開(kāi)發(fā)高水平的服務(wù),允許應(yīng)用的程序員管理調(diào)度所有的資源節(jié)點(diǎn)開(kāi)展計(jì)算。
(4)網(wǎng)格門戶提供了網(wǎng)絡(luò)應(yīng)用的服務(wù),也就是用戶能夠通過(guò)一個(gè)Web界面提交和收集他們所需的各地的遠(yuǎn)程資源,用戶可以通過(guò)該層調(diào)用網(wǎng)格上的各地的信息資源,并對(duì)它們進(jìn)行整理、加工和使用。
三、基于網(wǎng)格的教學(xué)資源存儲(chǔ)和管理
1.教學(xué)資源的結(jié)構(gòu)化存儲(chǔ)
遠(yuǎn)程教育教學(xué)資源是一個(gè)非常復(fù)雜的體系。從內(nèi)容上包括數(shù)學(xué)、物理學(xué)、化學(xué)、生物學(xué)、農(nóng)學(xué)、醫(yī)藥學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、電子通信與自動(dòng)控制技術(shù)、土木建筑工程、工程機(jī)械、管理學(xué)、漢語(yǔ)言文學(xué)、英語(yǔ)、經(jīng)濟(jì)學(xué)、法學(xué)、統(tǒng)計(jì)學(xué)、教育學(xué)等眾多學(xué)科領(lǐng)域,而且它們還在不斷地細(xì)分成各個(gè)門類的課程,或者又相互融合交叉。從表現(xiàn)方式上有網(wǎng)絡(luò)課程、課件,視頻、音頻,圖形、動(dòng)畫(huà),文獻(xiàn)資料, 學(xué)術(shù)論文,試卷,文本等的任意組合。
正是基于教學(xué)資源系統(tǒng)的這些特征,進(jìn)行抽象化模型化處理,提出了采用“專業(yè)門類—課程—不同類型媒體資源”的結(jié)構(gòu)化教學(xué)資源管理體系結(jié)構(gòu)。每一個(gè)教學(xué)資源以一種類型的媒體進(jìn)行分布式的存儲(chǔ),存儲(chǔ)的數(shù)據(jù)結(jié)構(gòu)如表1所示,然后在此基礎(chǔ)上進(jìn)行課程和專業(yè)門類的智能分類。這樣,教學(xué)資源也滿足了網(wǎng)格資源的概念,能夠納入網(wǎng)格資源體系進(jìn)行管理操縱。
2.教學(xué)資源目錄管理方法
在我們?cè)O(shè)計(jì)的教學(xué)資源庫(kù)系統(tǒng)中,根據(jù)遠(yuǎn)程教學(xué)的要求設(shè)置19個(gè)專業(yè)學(xué)科,每個(gè)專業(yè)學(xué)科目錄下分為課程,按照網(wǎng)絡(luò)課程、課件,視頻、音頻,圖形、動(dòng)畫(huà),文獻(xiàn)資料,學(xué)術(shù)論文,試卷,文本分類顯示各類資源,并且統(tǒng)計(jì)每類資源數(shù)量之和;其中各類資源按更新時(shí)間排序,而且顯示出每個(gè)媒體資源瀏覽次數(shù)。需要說(shuō)明的是,不同的專業(yè)學(xué)科中,課程允許有交叉,即相同的課程屬于不同的專業(yè)學(xué)科,但是不同的課程中,各類資源不允許有交叉,即一種資源只能屬于一門課程。其編目結(jié)構(gòu)如圖4所示。
四、教學(xué)資源智能檢索算法
資源搜索是根據(jù)資源搜索策略將網(wǎng)格資源庫(kù)中可用計(jì)算資源、存儲(chǔ)資源和網(wǎng)絡(luò)資源等進(jìn)行匹配,找到最佳的資源分配方式,完成用戶提交的任務(wù)或滿足用戶提出的要求。[4] 網(wǎng)格教學(xué)資源廣泛冗余分布于各個(gè)節(jié)點(diǎn)中,資源信息駐留于中央大型數(shù)據(jù)庫(kù),數(shù)據(jù)量大而且復(fù)雜多變,對(duì)資源的檢索精確度直接影響系統(tǒng)對(duì)用戶的響應(yīng),因此,提高搜索準(zhǔn)確度對(duì)于提高網(wǎng)格資源調(diào)用性能至關(guān)重要。
在我們?cè)O(shè)計(jì)基于網(wǎng)格技術(shù)教學(xué)資源庫(kù)檢索模塊中,顯示出每個(gè)教學(xué)資源與搜索關(guān)鍵詞的相關(guān)度。我們的基本思想是,根據(jù)中央大型數(shù)據(jù)庫(kù)存儲(chǔ)的每個(gè)教學(xué)資源的標(biāo)題、摘要和關(guān)鍵字信息,分析請(qǐng)求資源的特征屬性,如所屬專業(yè)學(xué)科、課程等,在搜索過(guò)程中根據(jù)這些信息略去與目標(biāo)學(xué)科或?qū)I(yè)方向無(wú)關(guān)的分支,以減少搜索空間,提高搜索效率;然后統(tǒng)計(jì)搜索關(guān)鍵詞出現(xiàn)的條件概率P(q|D),如公式1,其中q是搜索關(guān)鍵字,D表示檢索資源文檔,c(q|D)表示搜索關(guān)鍵詞出現(xiàn)頻度,|D|表示檢索資源文檔長(zhǎng)度,采用這種的算法描述搜索關(guān)鍵字與請(qǐng)求資源的相關(guān)度,并按相關(guān)度由高到低排序。由此準(zhǔn)確地定位用戶的搜索需求,使用戶得到比較一致和完備的信息。
P(q|D)c(q|D)|D|(公式1)
五、網(wǎng)格開(kāi)發(fā)環(huán)境部署及資源庫(kù)網(wǎng)格系統(tǒng)簡(jiǎn)介
教育資源網(wǎng)格系統(tǒng)架構(gòu),[2],[5],[6] 從邏輯層次上采取了三層結(jié)構(gòu):資源層、網(wǎng)格服務(wù)層和客戶端服務(wù)層,每層開(kāi)發(fā)環(huán)境部署和完成的功能如圖5所示。
六、結(jié)束語(yǔ)
隨著教育的發(fā)展,受教育群體不斷擴(kuò)大,教學(xué)資源的需求和建設(shè)不斷的膨脹,但教學(xué)資源在合理建設(shè)、有效配置、充分利用上還存在很大的問(wèn)題,難以協(xié)調(diào)共享,發(fā)揮其應(yīng)有的功效。通過(guò)我們的實(shí)踐,如何使基于網(wǎng)格的教學(xué)資源庫(kù)系統(tǒng)充分發(fā)揮作用,還有許多有待研究的地方。
第一,需要建立高性能計(jì)算中心,并且通過(guò)高速網(wǎng)絡(luò),將這些中心和資源庫(kù)的節(jié)點(diǎn)和一些資源中心等等互聯(lián)起來(lái)。第二,采用“媒體—課程—專業(yè)”進(jìn)行資源存儲(chǔ)管理,這里的分類信息一般為被動(dòng)獲得,依賴于資源提供方,不利于資源的動(dòng)態(tài)增長(zhǎng),如果采用主動(dòng)獲取的方式就能增加系統(tǒng)的靈活性,這需要本體學(xué)習(xí)和語(yǔ)義技術(shù)的支持。第三,需要與各種用戶建立合作伙伴關(guān)系,擴(kuò)展網(wǎng)格的應(yīng)用。第四,有一些社會(huì)工程的工作需要展開(kāi),需要讓人們知道網(wǎng)格,學(xué)會(huì)使用網(wǎng)格,讓網(wǎng)格發(fā)揮作用。
參考文獻(xiàn):
[1] The Grid:Blueprint for a New Computing Infrastructure,Ian Foster, Carl Kesselman, Argonne Lab USA
[2]桂小林.網(wǎng)格技術(shù)導(dǎo)論[M]北京:北京郵電大學(xué)出版社,2005.3.
[3]Introduction to Grid Computing with Globus,Luis Ferreira、Viktors Berstis、Jonathan Armstrong, etc,IBM
[4]王清心,胡建華.一種新的網(wǎng)格資源查找方法[J].計(jì)算機(jī)科學(xué),2004(9).
[5]楊廣文,武永衛(wèi),朱晶.一種全局統(tǒng)一的層次化網(wǎng)格資源模型[J].計(jì)算機(jī)研究與發(fā)展,2003(12).
[6]顧明,孫功星.網(wǎng)格資源動(dòng)態(tài)管理系統(tǒng)的研究與設(shè)計(jì)[J].計(jì)算機(jī)工程,2004(10).