【摘要】 隨著計(jì)算機(jī)技術(shù)的發(fā)達(dá),遠(yuǎn)程教育已經(jīng)成為現(xiàn)代教育的重要方式之一。智能在線答疑系統(tǒng)能夠?qū)崿F(xiàn)教育資源的優(yōu)化共享,并且為學(xué)生提供教學(xué)輔導(dǎo)和交流機(jī)會(huì),因此具有積極意義。但其數(shù)據(jù)挖掘的設(shè)計(jì)還存在一定的技術(shù)問(wèn)題,為了解決這一問(wèn)題,文章將我國(guó)遠(yuǎn)程教育智能在線答疑系統(tǒng)的數(shù)據(jù)挖掘設(shè)計(jì)過(guò)程進(jìn)行了具體的闡述和分析。
【關(guān)鍵詞】 遠(yuǎn)程教育 智能答疑系統(tǒng) 數(shù)據(jù)挖掘 設(shè)計(jì) 網(wǎng)絡(luò)日志
遠(yuǎn)程教育已經(jīng)得到越來(lái)越多教育者的認(rèn)可,其優(yōu)勢(shì)在于提高了教學(xué)效率,節(jié)約了時(shí)間,并且解決了空間上的問(wèn)題。但學(xué)員分散,問(wèn)題不集中是主要問(wèn)題。因此建立在線答疑系統(tǒng)并實(shí)現(xiàn)其智能化十分重要。遠(yuǎn)程教育答疑系統(tǒng)經(jīng)歷了多個(gè)階段的發(fā)展,目前已經(jīng)取得了一定的成就。其中,數(shù)據(jù)挖掘技術(shù)的提高是其關(guān)鍵點(diǎn),個(gè)性化學(xué)習(xí)導(dǎo)航的設(shè)計(jì)在這個(gè)過(guò)程中起到了積極的作用。
一、基于網(wǎng)絡(luò)日志的數(shù)據(jù)挖掘方法
智能在線答疑系統(tǒng)由持久數(shù)據(jù)與即時(shí)數(shù)據(jù)組成。前者支持在線答疑涉及的資料和數(shù)據(jù)庫(kù)。后者是對(duì)讀者信息的記錄,產(chǎn)生于操作者的系統(tǒng)應(yīng)用過(guò)程中。根據(jù)即時(shí)信息可了解學(xué)習(xí)者狀態(tài),學(xué)習(xí)行為以及出現(xiàn)問(wèn)題的信息記錄,尤其是用來(lái)分析用戶的特定知識(shí)理解能力。為了確保導(dǎo)航系統(tǒng)的高效性,數(shù)據(jù)挖掘應(yīng)采取分層信息資源記錄方式。通過(guò)這些信息,學(xué)習(xí)者的學(xué)習(xí)狀態(tài),存在問(wèn)題清晰可見(jiàn)。學(xué)??蔀閷W(xué)生解決其提問(wèn)頻率相對(duì)較高的內(nèi)容。以Web服務(wù)器日志訪問(wèn)為例,被訪問(wèn)的服務(wù)器會(huì)產(chǎn)生相應(yīng)的系統(tǒng)日志,這些日志就是用戶的主要表現(xiàn)。其主要內(nèi)容包括:訪問(wèn)者的網(wǎng)絡(luò)IP 、時(shí)間戳、訪問(wèn)方法、被訪問(wèn)文件的URL及其協(xié)議、狀態(tài)請(qǐng)求、數(shù)字傳輸?shù)淖止?jié)等。Web服務(wù)器將完整的記錄用戶的登錄信息,因此其設(shè)計(jì)方法應(yīng)考慮對(duì)日志的預(yù)處理后的結(jié)果。其中,請(qǐng)求頁(yè)面和服務(wù)器提問(wèn)頁(yè)面將保存用戶信息?;谖墨I(xiàn)提出方法,對(duì)用戶日志文件進(jìn)行處理,對(duì)原始Web日志產(chǎn)生的數(shù)據(jù)進(jìn)行處理,使其能夠與數(shù)據(jù)挖掘方法相適應(yīng),以便于實(shí)現(xiàn)網(wǎng)絡(luò)日志數(shù)據(jù)挖掘的實(shí)施。其流程主要包括:
(1)數(shù)據(jù)凈化:即過(guò)濾Web日志提供的有效數(shù)據(jù),以便于對(duì)用戶狀態(tài)進(jìn)行分析。其中包括:登錄者的IP與ID、用戶申請(qǐng)和瀏覽的頁(yè)面以及訪問(wèn)實(shí)踐和內(nèi)容以及錯(cuò)誤代碼在內(nèi)。但文章所研究的數(shù)據(jù)挖掘?qū)嶋H上只與用戶的IP地址、登錄ID和瀏覽頁(yè)面具有直接關(guān)系,也就是其訪問(wèn)的信息,與網(wǎng)頁(yè)本身的性能和產(chǎn)生的錯(cuò)誤信息無(wú)關(guān),因此可單獨(dú)研究與其相關(guān)的用戶訪問(wèn)記錄。通過(guò)數(shù)據(jù)凈化,刪除與用戶數(shù)據(jù)挖掘無(wú)關(guān)的信息,實(shí)現(xiàn)快速數(shù)據(jù)挖掘,解決網(wǎng)絡(luò)用戶的問(wèn)題。
(2)用戶識(shí)別:用戶識(shí)別具有多種方法,其中包括:根據(jù)IP的變化判斷新舊用戶,從而確定用戶的基本信息。在IP地址相同的前提下, 則查找操作系統(tǒng)或者用戶端瀏覽器軟件是否發(fā)生變化,如果并未發(fā)生任何變化,則認(rèn)定為同一用戶,反之則認(rèn)定為用戶更改。另外,還可通過(guò)站點(diǎn)拓?fù)鋪?lái)判斷是否為新用戶,判斷標(biāo)準(zhǔn)為用戶所請(qǐng)求的頁(yè)面是否能從已訪問(wèn)的頁(yè)面到達(dá),如不能,則判定為用戶改變。
(3)用戶會(huì)話識(shí)別:會(huì)話識(shí)別的目的在于拆分用戶訪問(wèn)記錄,使其成為單獨(dú)的多個(gè)對(duì)話。不同的訪問(wèn)頁(yè)面則劃分為不同的會(huì)話。但存在相同用戶的較長(zhǎng)時(shí)間訪問(wèn),則采用超時(shí)方法設(shè)定一定的時(shí)間界限,超過(guò)這個(gè)界限則視為新的會(huì)話。
(4)提問(wèn)模式識(shí)別:提問(wèn)模式識(shí)別即提取用戶提問(wèn)模式特征。智能在線答疑系統(tǒng)多存在于受限領(lǐng)域中, 因此具有局限性。因此我們定義如下文法規(guī)則:
::=[V]+E+Z+D|[V]+D+Z+E|
V::=[<查詢動(dòng)詞>]
D::=[<查詢副詞>]
Z::=[<謂詞>|<助詞>]
E::=<名詞>E是能夠在領(lǐng)域知識(shí)庫(kù)中識(shí)別的關(guān)鍵詞。
根據(jù)上述規(guī)則,可建立用戶問(wèn)題模擬系統(tǒng)。從而尋找最佳問(wèn)題,實(shí)現(xiàn)數(shù)據(jù)挖掘。
二、遠(yuǎn)程教育智能答疑系統(tǒng)中的數(shù)據(jù)挖掘設(shè)計(jì)結(jié)構(gòu)分析
在數(shù)據(jù)預(yù)處理過(guò)程中,通過(guò)對(duì)用戶提問(wèn)的數(shù)據(jù)處理獲得數(shù)據(jù)特征,并通過(guò)與原系統(tǒng)數(shù)據(jù)的對(duì)比構(gòu)建智能在線答疑框架,實(shí)現(xiàn)知識(shí)庫(kù)更新。資源庫(kù)與知識(shí)庫(kù)之間具有一定的關(guān)系,這決定了其需要不斷的更新和調(diào)整,以滿足對(duì)方的特征,為用戶提供更豐富的途徑。文章所構(gòu)建的遠(yuǎn)程在線答疑系統(tǒng)屬于智能個(gè)性化系統(tǒng),能夠滿足不同的行為特征。本系統(tǒng)通過(guò)數(shù)據(jù)挖掘模塊的增加, 并針對(duì)用戶的提問(wèn)記錄進(jìn)行更新,能夠滿足多用戶的需求,運(yùn)行效率較高,因此具有較大的優(yōu)勢(shì)。
三、總結(jié)
通過(guò)對(duì)遠(yuǎn)程教育智能在線答疑系統(tǒng)中的數(shù)據(jù)挖掘設(shè)計(jì)進(jìn)行分析,實(shí)現(xiàn)新的智能在線答疑數(shù)據(jù)庫(kù)。遠(yuǎn)程教育的廣泛應(yīng)用使得其在線答疑系統(tǒng)的數(shù)據(jù)挖掘設(shè)計(jì)十分重要。為了明確這一問(wèn)題,文章針對(duì)智能答疑系統(tǒng)中用戶訪問(wèn)日志等問(wèn)題進(jìn)行了具體的分析,設(shè)計(jì)了基于網(wǎng)絡(luò)日志數(shù)據(jù)挖掘的智能答疑系統(tǒng)。并且分析了這一系統(tǒng)的優(yōu)越性和缺陷,以便于進(jìn)一步改善這一技術(shù),提高我國(guó)遠(yuǎn)程教育的效率,實(shí)現(xiàn)教育形勢(shì)的改革,滿足社會(huì)的需求。
參 考 文 獻(xiàn)
[1]李曉晨,宋正江.基于網(wǎng)絡(luò)學(xué)習(xí)的智能答疑系統(tǒng)的研究[J].科技風(fēng),2010(14).
[2]李思.數(shù)據(jù)挖掘在學(xué)科建設(shè)中的應(yīng)用研究[J].科學(xué)大眾(科學(xué)教育), 2012(9).
[3]杜芳芳.數(shù)據(jù)挖掘技術(shù)在遠(yuǎn)程教學(xué)輔助系統(tǒng)中的應(yīng)用研究[J].河南科技,2011(12).
[4]王夙娟.數(shù)據(jù)挖掘自動(dòng)答疑系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)與研究[J].黑龍江科技信息,2012(23).