韓麗屏
摘要:在網(wǎng)絡(luò)技術(shù)、信息技術(shù)和多媒體技術(shù)的迅猛發(fā)展之下,支撐通信的硬件設(shè)施也在不斷完善,通過互聯(lián)網(wǎng)迅速、方便地與世界無界限溝通的用戶比例持續(xù)增加。為廣大學(xué)習(xí)者自由尋找新型數(shù)字化教學(xué)資源提供了開放、快速、交互的渠道。為隨時隨地學(xué)習(xí)提供了極大便利的同時,同時如何有效地找到適合的教學(xué)資源,加強資源的分析處理,避免同類資源的重復(fù)開發(fā),促進現(xiàn)有資源的高效運用也成為權(quán)威資源開發(fā)部門和各大院校亟待解決的問題。文章通過分析、比較現(xiàn)有教學(xué)資源信息分析處理的基礎(chǔ)上,研究如何將Web挖掘技術(shù)引入有效教學(xué)資源獲取的智能分析處理中,構(gòu)建基于Web挖掘的海量信息分析方法,快速獲取網(wǎng)絡(luò)世界中海量教學(xué)資源,分析歸類形成資源庫,以便智能獲取有效教學(xué)資源信息。
關(guān)鍵詞:Web挖掘:教學(xué)資源;智能分析
Web挖掘是建立在對網(wǎng)絡(luò)上大量信息分析的基礎(chǔ)上,利用數(shù)據(jù)挖掘算法有效地收集、選擇和存儲所需要的有價值信息。在日益增多的信息中發(fā)現(xiàn)新的概念和相互間的關(guān)系,以實現(xiàn)信息處理的自動化,數(shù)據(jù)收集和數(shù)據(jù)的分析處理對學(xué)校建立智能的教學(xué)資源庫有著重要的意義。為了能準確、智能化地獲取所需的數(shù)字化教學(xué)資源,需要通過互聯(lián)網(wǎng)準確發(fā)送搜索請求,實現(xiàn)查詢需求的網(wǎng)絡(luò)化表達,而這就需要依靠Web挖掘技術(shù)來實現(xiàn)。
(1)互聯(lián)網(wǎng)的飛速發(fā)展,沖擊傳統(tǒng)教學(xué)資源獲取形式,越來越多的學(xué)習(xí)者通過互聯(lián)網(wǎng)的途徑獲取有價值的知識。
(2)高校、教育機構(gòu)、官方教育部門和個體學(xué)習(xí)者紛紛將教學(xué)資源開發(fā)成數(shù)字化形式,方便高效使用,已經(jīng)形成了現(xiàn)有網(wǎng)站中大量的教學(xué)資源。
(3)有效獲取教學(xué)資源需要先進信息技術(shù)的支持,否則開發(fā)者與使用者無法形成實際意義上的“供求”關(guān)系。
(4)提出運用Web挖掘技術(shù)高效獲取網(wǎng)站中的海量資源信息,快捷運用現(xiàn)有資源,避免重復(fù)開發(fā),從大量信息智能分析的角度,為新型“高效教和自主學(xué)”提供技術(shù)層面的支持[1]。
1 基于Web挖掘的教學(xué)資源分析方法現(xiàn)狀
1.1互聯(lián)網(wǎng)發(fā)展現(xiàn)狀
伴隨著互聯(lián)網(wǎng)發(fā)展日趨成熟,越來越多的學(xué)習(xí)者可直接通過網(wǎng)絡(luò)形式獲取大量自身所需的信息,這其中網(wǎng)絡(luò)教學(xué)、網(wǎng)絡(luò)資源開發(fā)、網(wǎng)絡(luò)教育平臺也迅速成為除傳統(tǒng)課堂教學(xué)之外學(xué)習(xí)者獲取知識的最有效途徑。
1.2高校教學(xué)資源開發(fā)現(xiàn)狀
隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,各地學(xué)校已經(jīng)意識到信息技術(shù)在數(shù)字化教學(xué)資源建設(shè)中的重要性,紛紛加大力度進行數(shù)字化信息技術(shù)的運用,但在具體教學(xué)資源開發(fā)推進過程中,也遇到了制約發(fā)展的瓶頸:由于缺乏統(tǒng)一的標準和權(quán)威平臺的支持,形成現(xiàn)在各個院校之間“各自為陣”的局勢,很多重復(fù)性、低使用率的建設(shè)工作一再進行,浪費了大量的人力和物力,使得海量的教學(xué)資源的開發(fā)陷入低使用率和低推廣率的尷尬境地[2]。
2 基于Web挖掘的教學(xué)資源分析方法研究的內(nèi)容和方法
2.1項目研究的內(nèi)容
在網(wǎng)絡(luò)技術(shù)、信息技術(shù)和多媒體技術(shù)的發(fā)展之下,支撐通信的硬件設(shè)施也在不斷完善,通過互聯(lián)網(wǎng)迅速、方便地與世界無界限溝通的用戶比例持續(xù)增加,為廣大學(xué)習(xí)者自由尋找新型數(shù)字化教學(xué)資源提供了開放、快速、交互的渠道。為自由學(xué)習(xí)提供便利的同時,如何有效地找到適合的資源,加強資源的分析處理,促進現(xiàn)有資源的高效運用也成為權(quán)威資源開發(fā)部門亟待解決的問題。
本文通過研究現(xiàn)有的網(wǎng)絡(luò)教學(xué)資源獲取方式以及分析方法的特點,找出不足,探討在海量數(shù)字化教學(xué)資源獲取過程中的智能搜索和智能分析方法,從而構(gòu)建基于Web挖掘的教學(xué)資源智能分析模型,并思考如何將海量教學(xué)資源構(gòu)建為教學(xué)資源庫的方法。2.2項目研究的目標 文章主要研究如何將Web挖掘技術(shù)運用在海量網(wǎng)絡(luò)教學(xué)資源的有效獲取中,分別進行Web挖掘的新技術(shù)和新理論的研究、如何建立專門針對網(wǎng)絡(luò)教學(xué)資源構(gòu)建所需的智能分析方法、如何建立“基于Web挖掘的教學(xué)資源智能系統(tǒng)模型”,為Web挖掘在資源獲取中的具體實施提供有利支撐。
2.3擬解決的關(guān)鍵問題
(1)解決教學(xué)資源獲取中大量依賴人工獲取的問題。在現(xiàn)行的教學(xué)資源獲取中,人們多是借助搜索引擎等工具進行“半自動化”的搜索,獲取的資源模較大且質(zhì)量差,實際能用的有價值信息仍需通過人工區(qū)分歸入資源庫中,形成真正有“教學(xué)資源”。而網(wǎng)絡(luò)信息量巨大,動態(tài)更新速度快,依賴人工手動搜索的形式加重了人力負擔,又無法跟上網(wǎng)絡(luò)動態(tài)更新速度。
(2)解決獲取的教學(xué)資源缺乏智能化分析處理的問題。由于現(xiàn)行的網(wǎng)絡(luò)信息獲取和分析多采用類似搜索引擎的網(wǎng)頁搜索與分析技術(shù),存在收集與分析分離、對所收集的教學(xué)資源信息無法進行深層次分析和處理。本文提出尋找智能分析手段的想法,以適應(yīng)網(wǎng)絡(luò)信息日益增長和動態(tài)變化的特點。
(3)解決教學(xué)資源獲取和分析的模型問題。本文將Web挖掘技術(shù)與教學(xué)資源庫建立的特點相互結(jié)合,嘗試建立智能分析模型[3]。
3 基于Web挖掘的教學(xué)資源分析采取的技術(shù)路線及關(guān)鍵技術(shù)
3.1 Web挖掘的技術(shù)方法
Web挖掘技術(shù)實現(xiàn)了海量網(wǎng)絡(luò)信息中有效資源的智能挖掘。Web挖掘不僅是對文字內(nèi)容的查找,更是對網(wǎng)絡(luò)中不同媒體資源分析和搜索的過程。網(wǎng)絡(luò)資源類型的多樣性決定了挖掘任務(wù)的多樣性。智能搜索出的資源會根據(jù)不同媒體形式采取不同呈現(xiàn)方式。在Web挖掘中根據(jù)挖掘?qū)ο蟛煌譃閃eb內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用挖掘3方面。
Web內(nèi)容挖掘是指從Web的文檔內(nèi)容及描述信息中可有效地對大量文本內(nèi)容進行總結(jié)、分析、聚類和關(guān)聯(lián)分析。
Web結(jié)構(gòu)挖掘是指通過挖掘到的資源的內(nèi)部結(jié)構(gòu)和鏈接關(guān)系,開展進一步的分析,研討該資源蘊含的更多有效和有用的知識,以便獲取更多與搜索主題相關(guān)的鏈接和邏輯結(jié)構(gòu),從而獲取拓展的知識結(jié)構(gòu)。Web結(jié)構(gòu)挖掘主要運用于分析階段。
Web使用挖掘是針對用戶訪問Web時在服務(wù)器上留下的訪問記錄進行挖掘,獲取用戶訪問Web頁面的模式,分析用戶潛在需求特點進行挖掘,也可稱作Web用戶日志挖掘。
針對Web的內(nèi)容挖掘主要任務(wù)是提高教學(xué)資源的質(zhì)量,并幫助用戶過濾落后、無用的資源:針對Web的結(jié)構(gòu)挖掘是發(fā)現(xiàn)不同類型教學(xué)資源之間的聯(lián)系并判斷資源的重要性,實現(xiàn)資源的自組織和自適應(yīng)功能:針對Web的使用挖掘則有利于改進資源庫中資源聚類的結(jié)構(gòu)和組織形式,以提高庫的有效使用性[4]。
3.2研究所用技術(shù)路線
通過建立“基于Web挖掘技術(shù)的教學(xué)資源智能分析模型”,串聯(lián)整個項目研究過程(見圖1)。
3.3選用的主要實驗手段
在“數(shù)據(jù)層”的建立中,我們選擇從高校教學(xué)資源網(wǎng)、教育機構(gòu)網(wǎng)站、教育部門專題網(wǎng)站、熱門個人網(wǎng)站以及新媒體網(wǎng)站中獲取教學(xué)資源的初始化信息。
在“挖掘?qū)印钡慕⒅?,對初始信息資源庫中的素材進行Web的內(nèi)容挖掘、Web的結(jié)構(gòu)挖掘、Web的應(yīng)用挖掘。 在“分析層”的建立中,將挖掘的教學(xué)資源進行識別和聚類,主要功能是將經(jīng)過挖掘處理后的模式和知識形式化描述。在題網(wǎng)站、熱門個人網(wǎng)站以及新媒體網(wǎng)站中獲取教學(xué)資源的初始化信息。
在“應(yīng)用層”的建立中,用戶可以通過一定的軟件平臺查看挖掘分析結(jié)果,也可運用可視化技術(shù)直觀展示結(jié)果。
3.4采取的關(guān)鍵技術(shù)
目前Web挖掘的主要技術(shù)包括統(tǒng)計分析、關(guān)聯(lián)分析、序列分析、分類分析和聚類分析等,統(tǒng)計分析是指充分運用概率學(xué)、統(tǒng)計學(xué)的原理,對資源的各項屬性進行有效分析統(tǒng)計,找出內(nèi)部的相關(guān)性和規(guī)律性;關(guān)聯(lián)分析是指挖掘隱藏數(shù)據(jù)中的相互關(guān)系,通過分析記錄集合推導(dǎo)出屬性間的相關(guān)性;序列分析有類似于關(guān)聯(lián)分析的部分,也是為了分析數(shù)據(jù)之間的相互關(guān)聯(lián)性,但它更多地是為了分析出數(shù)據(jù)之間前后關(guān)系的規(guī)律;分類分析首先按照特定標記對記錄集合進行分類,然后按照特定標記分類的記錄集合更豐富、更細致的特征描述;聚類分析是一種以探索性分析為主的分析方法,它主要是按照信息的某種相近、相似程度,將一組未分類的信息分成互補相同的類型[5]。
4 研究特色
4.1挖掘技術(shù)
本項目在挖掘技術(shù)的研究中嘗試將Web挖掘技術(shù)運用于網(wǎng)絡(luò)教學(xué)資源的有效獲取中,便于形成自動和智能的資源獲取形式。Web挖掘技術(shù)源自傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),但又不是單純的數(shù)據(jù)挖掘,而是結(jié)合網(wǎng)絡(luò)技術(shù)和信息技術(shù)的新特點而產(chǎn)生的交叉型技術(shù)和理論體系。這一技術(shù)的出現(xiàn)實現(xiàn)了互聯(lián)網(wǎng)海量信息、數(shù)據(jù)和資源的有效分類和智能搜索。本項目基于這一技術(shù)特點并結(jié)合各大院校對教學(xué)資源迫切需求的現(xiàn)狀,嘗試將Web挖掘運用于網(wǎng)絡(luò)資源的獲取中。
4.2分析方法
本文在智能分析方法的尋找中,針對現(xiàn)行的網(wǎng)絡(luò)信息獲取和分析多采用類似搜索引擎的網(wǎng)頁搜索與分析技術(shù),存在收集與分析分離、對教學(xué)資源信息無法進行深層次分析和處理的問題。提出尋找智能分析手段的想法,以適應(yīng)網(wǎng)絡(luò)信息日益增長和動態(tài)變化的特點。
4.3模型建立
本文力求建立“基于Web挖掘的教學(xué)資源智能系統(tǒng)模型”,為Web挖掘在資源獲取中的具體實施提供有力支撐。針對各學(xué)校教學(xué)資源庫在建設(shè)和使用過程中對資源的不同使用需求進行分析和獲取,并且預(yù)測資源真實的使用周期,建立基于Web挖掘技術(shù)的教學(xué)資源分析模型。
[參考文獻]
[1]趙璽基于海量冗余網(wǎng)頁過濾的Web挖掘技術(shù)研究[J]..科技通報,2013 (4):21-22
[2]劉東慧,姜薇.基于事件本體的Web不良信息挖掘[J].山東大學(xué)學(xué)報(工學(xué)版),2012(5):35-40.
[3]尤建新,孟銀薇基于Web數(shù)據(jù)挖掘的網(wǎng)站知識獲取及應(yīng)用[J].上海大學(xué)學(xué)報,2014 (3):261-273
[4]徐昊,謝文閣一種隱式關(guān)聯(lián)面面的挖掘方法[J].計算機系統(tǒng)應(yīng)用,2014(9):167-169
[5]陳永當,王鈺鑫,鮑志強,等基于用戶訪問信息的數(shù)據(jù)挖掘方法及其算法[J].計算機工程與應(yīng)用,2012 (15):133-179