亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于葉貝斯分類的個(gè)性化學(xué)習(xí)風(fēng)格研究

2014-11-19 13:25:06繆廣寒

電子技術(shù)與軟件工程 2014年20期

繆廣寒

摘要利用數(shù)據(jù)挖掘技術(shù)中的貝葉斯分類技術(shù)可以對(duì)大量學(xué)習(xí)數(shù)據(jù)進(jìn)行分析，確定其學(xué)習(xí)風(fēng)格，完善個(gè)性化特征提取，為系統(tǒng)進(jìn)一步的學(xué)習(xí)推薦與教學(xué)引導(dǎo)提供有效依據(jù)，進(jìn)一步的提高學(xué)習(xí)質(zhì)量與效率。

【關(guān)鍵詞】葉貝斯分類數(shù)據(jù)挖掘個(gè)性化學(xué)習(xí) 學(xué)習(xí)風(fēng)格

網(wǎng)絡(luò)環(huán)境下的個(gè)性化學(xué)習(xí)是以學(xué)生作為教育系統(tǒng)的中心與教育服務(wù)主體。在個(gè)性化的教育系統(tǒng)中我們?cè)跔I(yíng)造數(shù)字學(xué)習(xí)氛圍的同時(shí)要強(qiáng)調(diào)并堅(jiān)持學(xué)生的主體地位，開展個(gè)性化學(xué)習(xí)，把它看作是一種探索式性、實(shí)踐性、創(chuàng)造性的學(xué)習(xí)。實(shí)現(xiàn)網(wǎng)絡(luò)個(gè)性化學(xué)習(xí)的關(guān)鍵在于根據(jù)學(xué)習(xí)者的信息數(shù)據(jù)分析提取個(gè)性化特征，進(jìn)而實(shí)現(xiàn)對(duì)學(xué)習(xí)者的個(gè)性化推薦或教學(xué)指導(dǎo)。

本文針對(duì)目前網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)中存在的個(gè)性化單一與實(shí)現(xiàn)難度大的問題，利用葉貝斯分類算法解決學(xué)習(xí)風(fēng)格分類問題，讓學(xué)生更深入的了解自己的學(xué)習(xí)模式與需求，實(shí)現(xiàn)真正自主式、個(gè)性化學(xué)習(xí)。

1 數(shù)據(jù)挖掘與分類

1995年，美國(guó)計(jì)算機(jī)學(xué)會(huì)（Association for Computing Machinery ，簡(jiǎn)稱ACM）組織提出了數(shù)據(jù)挖掘（Data Mining）概念。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中，提取隱含在其中的、人們事先未知的、但又是潛在有用的信息和知識(shí)的過程。數(shù)據(jù)挖掘又稱為數(shù)據(jù)庫中知識(shí)挖掘（Knowledge Discovery in Databases）、知識(shí)提?。↘nowledge Extraction）、數(shù)據(jù)采礦等。

數(shù)據(jù)挖掘是一個(gè)跨學(xué)科技術(shù)領(lǐng)域，它是數(shù)據(jù)庫技術(shù)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)據(jù)可視化、信息提取、并行計(jì)算和分布式計(jì)算等多個(gè)學(xué)科結(jié)合的產(chǎn)物。發(fā)現(xiàn)潛在未知的規(guī)則，是數(shù)據(jù)挖掘的重要特征也是它的目標(biāo)，它與數(shù)據(jù)分析的差別在于數(shù)據(jù)分析通常從一個(gè)假設(shè)出發(fā)，通過建立方程、模型來驗(yàn)證假設(shè)是否成立，而數(shù)據(jù)挖掘則是直接挖掘信息之中隱藏的規(guī)律，發(fā)現(xiàn)新的知識(shí)。

分類是常用的數(shù)據(jù)挖掘手段之一。它是將一組組個(gè)體分門別類的歸入預(yù)先設(shè)定的幾個(gè)類中。分類的目的是建立一個(gè)分類模型，該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到類別中的某一個(gè)類別。常用的分類方法有：決策樹分類方法、貝葉斯分類方法和規(guī)則歸納方法。

2 應(yīng)用葉貝斯分類算法判定學(xué)習(xí)風(fēng)格

學(xué)習(xí)風(fēng)格是指學(xué)習(xí)者一貫持續(xù)的帶有個(gè)性特征的學(xué)習(xí)方式，它是學(xué)習(xí)傾向和學(xué)習(xí)策略的總和。學(xué)習(xí)風(fēng)格是個(gè)體在長(zhǎng)期的學(xué)習(xí)過程中逐漸形成的，受特定的家庭、教育和社會(huì)文化的影響，通過個(gè)體自身長(zhǎng)期的學(xué)習(xí)活動(dòng)而形成，具有鮮明的個(gè)性特征。心理學(xué)認(rèn)為人有七種學(xué)習(xí)風(fēng)格：Linguistic（語言）、Logical（邏輯）、Visual（視覺）、Musical（音樂）、Kinesthetic（動(dòng)覺）、Intrapersonal（內(nèi)?。┡cInterpersonal（人際）。使用葉貝斯分類算法我們可以通過分析學(xué)習(xí)記錄，獲得學(xué)生的學(xué)習(xí)風(fēng)格。葉貝斯分類算法基于貝葉斯定理，應(yīng)用于文本分類時(shí)，通過計(jì)算文本屬于每個(gè)類別的概率.將該文本歸為概率最大的一類中。

2.1 樸素貝葉斯分類和貝葉斯網(wǎng)絡(luò)

貝葉斯定理是關(guān)于隨機(jī)事件A和B的條件概率和邊緣概率的一則定理。

P（A|B） = P（A^B） / P（B） = P（A）*P（B|A） / P（B）

其中P（A|B）表示在B發(fā)生的情況下A發(fā)生的可能性。其中P（A）是A的先驗(yàn)概率或邊緣概率。（A|B）是已知B發(fā)生后A的條件概率， P（B|A）是已知A發(fā)生后B的條件概率， P（B）是B的先驗(yàn)概率或邊緣概率，也作標(biāo)準(zhǔn)化常量。由此，貝葉斯定理可表述為：

后驗(yàn)概率 = （相似度*先驗(yàn)概率）/標(biāo)準(zhǔn)化常量

由于，比例P（B|A）/P（B）也有時(shí)被稱作標(biāo)準(zhǔn)相似度，所以貝葉斯定理又可表述為：

后驗(yàn)概率 = 標(biāo)準(zhǔn)相似度*先驗(yàn)概率

貝葉斯分類方法是基于貝葉斯定理的，樸素貝葉斯（Naive Bayes）和貝葉斯網(wǎng)絡(luò)（Bayesian Networks）看作是兩種不同情形下的分類方法。

2.1.1 樸素貝葉斯分類

樸素貝葉斯分類方法是一個(gè)基于概率的分類方法，它通過計(jì)算后驗(yàn)證概率的方法來確定所屬類別的概率。

Vj屬于V集合，其中Vmap是給定一個(gè)example，得到的最可能的目標(biāo)值。其中a1...an是這個(gè)example里面的屬性。這里面，Vmap目標(biāo)值，就是后面計(jì)算得出的概率最大的一個(gè).所以用max 來表示。

樸素貝葉斯分類默認(rèn)基于一個(gè)簡(jiǎn)單的假定：給定目標(biāo)值時(shí)屬性之間相互條件獨(dú)立。因此，該假定說明給定實(shí)力的目標(biāo)值情況下。觀察到聯(lián)合的a1，a2...an的概率正好是對(duì)每個(gè)通過概率計(jì)算，從待分類的樣本數(shù)據(jù)的屬性 a1，a2，...，an 中求出最可能的分類目標(biāo)值，即計(jì)算各類 Vj∈ V對(duì)于這組屬性的條件概率 P（Vj|al，a2，...，an），其中j=1，2，...m（類別標(biāo)識(shí)數(shù)），并輸出條件概率最大的類別標(biāo)識(shí)作為該樣本數(shù)據(jù)的所屬類別。這個(gè)假設(shè)是樸素貝葉斯不同于貝葉斯網(wǎng)絡(luò)等其它貝葉斯分類算法的根本，也是樸素貝葉斯這個(gè)名稱的由來。

2.1.2 貝葉斯網(wǎng)絡(luò)

在實(shí)際應(yīng)用中，大多數(shù)情況下不支持樸素貝葉斯的假設(shè)，即各特征并非彼此獨(dú)立，此情況下可以使用貝葉斯網(wǎng)絡(luò)進(jìn)行分類。

貝葉斯網(wǎng)絡(luò)是根據(jù)變量之間的依賴關(guān)系，使用圖論方法表示變量集合的聯(lián)合概率分布的圖形模型，它引入了一個(gè)有向無環(huán)圖（Directed Acyclic Graph）和一個(gè)條件概率表集合。DAG的結(jié)點(diǎn)v包括隨機(jī)變量（類別和特征），有向連接E（A->B）表示結(jié)點(diǎn)A是結(jié)點(diǎn)B的parent，且B與A是有依賴關(guān)系的。同時(shí)引入了一個(gè)條件性獨(dú)立（conditional independence）概念：即圖中任意結(jié)點(diǎn)v在給定v的parent結(jié)點(diǎn)的情況下，與圖中其它結(jié)點(diǎn)都是獨(dú)立的，也就是說P（v|par（v），x1，x2...，xn） = P（v|par（v））。這里par（v）表示v的parent結(jié)點(diǎn)集，x1，x2，...，xn表示圖中其它結(jié)點(diǎn)。如果已知所有聯(lián)合概率值（joint distribution），那么就可以解決任何形式的概率問題。但現(xiàn)實(shí)中的特征集合數(shù)量過多（>10），幾乎無法通過統(tǒng)計(jì)得到。所以，這個(gè)問題要通過條件獨(dú)立的概念來對(duì)各條件概率值進(jìn)行優(yōu)化來解決。貝葉斯網(wǎng)絡(luò)的建模有兩個(gè)步驟：創(chuàng)建網(wǎng)格結(jié)構(gòu)與估計(jì)每一個(gè)結(jié)點(diǎn)的概率表中的概率值。endprint

2.2 貝葉斯分類過程

在本學(xué)習(xí)系統(tǒng)中，主要使用樸素貝葉斯分類方法對(duì)網(wǎng)絡(luò)學(xué)習(xí)某一體育課程的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類。

2.2.1 建立樣本數(shù)據(jù)

根據(jù)體育學(xué)科的學(xué)習(xí)特點(diǎn)，我們可以把學(xué)習(xí)者的學(xué)習(xí)風(fēng)格簡(jiǎn)要概括為視覺型（V）、語言型（L）和動(dòng)覺型（K）。把每一個(gè)學(xué)習(xí)者看作一個(gè)矢量 S，學(xué)習(xí)者的每一次學(xué)習(xí)記錄作為屬性 Ai，學(xué)習(xí)者的風(fēng)格（視覺型、聽覺型和動(dòng)覺型）作為可能的類別 C，對(duì)于隨機(jī)分類向量S={a1，a2，…，an}，由此知道 s對(duì)每個(gè)類別的概率P（ Ci|S）分布，其中P（ Ci|S）由貝葉斯公式P（ Ci|S）=P（ S|Ci）P（Ci ）/P（S ）計(jì)算得到，概率最大的那個(gè)就是 s的預(yù)測(cè)類別。

當(dāng)學(xué)生登入系統(tǒng)時(shí)，系統(tǒng)首先根據(jù)學(xué)號(hào)查看學(xué)習(xí)風(fēng)格數(shù)據(jù)庫中是否有該生的學(xué)習(xí)風(fēng)格類型記錄，如果有，系統(tǒng)則推薦學(xué)生適合其風(fēng)格的學(xué)習(xí)內(nèi)容，如果無，則系統(tǒng)將學(xué)習(xí)者這次學(xué)習(xí)的學(xué)習(xí)記錄保存在學(xué)生學(xué)習(xí)記錄庫的學(xué)習(xí)過程數(shù)據(jù)表中。

經(jīng)過數(shù)據(jù)預(yù)處理，我們可以確保建模的數(shù)據(jù)是正確有效的。分析處理中我們需要得到分類模型需要的訓(xùn)練樣本集的相關(guān)屬性，包括文本學(xué)習(xí)次數(shù)（T）、視頻學(xué)習(xí)次數(shù)（V）、活動(dòng)次數(shù)（A）、文本學(xué)習(xí)平均成績(jī)（TS）、視頻學(xué)習(xí)平均成績(jī)（VS）、活動(dòng)成績(jī)（AS）、學(xué)習(xí)風(fēng)格類型（S）。當(dāng)學(xué)生登錄次數(shù)達(dá)到某值時(shí)，系統(tǒng)自動(dòng)將這些屬性值計(jì)算并存儲(chǔ)。在分析訓(xùn)練樣本時(shí)我們把學(xué)習(xí)次數(shù)屬性值分為<5、5-10、>10 三個(gè)區(qū)間，將成績(jī)分為 A（90-100）、B（75-89）、 C（60-74）、 D（< 60）。樸素貝葉斯分類法對(duì)于學(xué)習(xí)次數(shù)和學(xué)習(xí)成績(jī)這類連續(xù)屬性的類條件概率計(jì)算，一是把連續(xù)的屬性用相應(yīng)的離散區(qū)間替換進(jìn)而離散化，或是通過訓(xùn)練數(shù)據(jù)估計(jì)分布的參數(shù)。

2.2.2 建立學(xué)習(xí)風(fēng)格建模

根據(jù)貝葉斯的最大后驗(yàn)準(zhǔn)則，對(duì)任一未知樣本 s={a1，a2，…，an}，確定后驗(yàn)概率 P（Cj| a1，a2，…，an），把最大的類確定為該樣本的學(xué)習(xí)風(fēng)格。具體步驟為：

（1）計(jì)算得到每一種學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率P（Ci ）。

（2）相對(duì)于每個(gè)類別的概率 P（aj|ci），訓(xùn)練樣本集計(jì)算得出各屬性的所有取值。

（3）計(jì)算出未知樣本對(duì)三種類別的概率，選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

其中，建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。

2.2.3 建立算法

根據(jù)上述分析，設(shè)計(jì)算法如下：

初始化訓(xùn)練集D；計(jì)算每個(gè)學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率

由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

3 結(jié)論

本文將葉貝斯算法應(yīng)用在判定學(xué)習(xí)者的學(xué)習(xí)風(fēng)格中，發(fā)現(xiàn)了學(xué)生的學(xué)習(xí)成績(jī)、學(xué)習(xí)興趣與學(xué)習(xí)風(fēng)格之間的潛在聯(lián)系。經(jīng)過實(shí)際應(yīng)用發(fā)現(xiàn)當(dāng)樸素貝葉斯分類的假定條件成立時(shí)，它是一種非常精確的分類方法。使用貝葉斯分類對(duì)系統(tǒng)中的學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進(jìn)行分類，其特點(diǎn)主要有：

（1）它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法，可以利用領(lǐng)域知識(shí)和其它先驗(yàn)信息，計(jì)算假設(shè)概率。

（2）可以把所有的屬性都參與分類。

（3）針對(duì)離散屬性的對(duì)象進(jìn)行分析。

（4）數(shù)據(jù)樣本可以增加也可以減少，這樣可以進(jìn)行增量學(xué)習(xí)。

（5）利用有向圖的表示方式非常直觀，弧表示變量之間的關(guān)系。

參考文獻(xiàn)

[1]田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實(shí)現(xiàn)[D].碩士學(xué)位論文，吉林：吉林大學(xué)，2011（05）.

[2]鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個(gè)性化屬性調(diào)查及啟示[J].現(xiàn)代教育技術(shù)，2003.13（1）：49-54.

[3]凌江榮.在e_Learning中建立自適應(yīng)學(xué)習(xí)路徑的研究[D].碩士學(xué)位論文，湖南：湘潭大學(xué)，2007.

[4]田曉輝.基于Web的個(gè)性化學(xué)習(xí)系統(tǒng)在遠(yuǎn)程教育中的應(yīng)用研究[D].碩士學(xué)位論文，西安：陜西師范大學(xué)，2007.

[5]史春秀.基于數(shù)據(jù)挖掘的個(gè)性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文，天津：天津大學(xué)，2007.

[6]王志平.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文，重慶：重慶大學(xué)，2007.

作者單位

1.無錫高等師范學(xué)校江蘇省無錫市 214000

2.無錫城市職業(yè)技術(shù)學(xué)院江蘇省無錫市 214000endprint

2.2 貝葉斯分類過程

2.2.1 建立樣本數(shù)據(jù)

2.2.2 建立學(xué)習(xí)風(fēng)格建模

（1）計(jì)算得到每一種學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率P（Ci ）。

（2）相對(duì)于每個(gè)類別的概率 P（aj|ci），訓(xùn)練樣本集計(jì)算得出各屬性的所有取值。

（3）計(jì)算出未知樣本對(duì)三種類別的概率，選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

其中，建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。

2.2.3 建立算法

根據(jù)上述分析，設(shè)計(jì)算法如下：

初始化訓(xùn)練集D；計(jì)算每個(gè)學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率

由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

3 結(jié)論

（1）它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法，可以利用領(lǐng)域知識(shí)和其它先驗(yàn)信息，計(jì)算假設(shè)概率。

（2）可以把所有的屬性都參與分類。

（3）針對(duì)離散屬性的對(duì)象進(jìn)行分析。

（4）數(shù)據(jù)樣本可以增加也可以減少，這樣可以進(jìn)行增量學(xué)習(xí)。

（5）利用有向圖的表示方式非常直觀，弧表示變量之間的關(guān)系。

參考文獻(xiàn)

[1]田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實(shí)現(xiàn)[D].碩士學(xué)位論文，吉林：吉林大學(xué)，2011（05）.

[2]鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個(gè)性化屬性調(diào)查及啟示[J].現(xiàn)代教育技術(shù)，2003.13（1）：49-54.

[3]凌江榮.在e_Learning中建立自適應(yīng)學(xué)習(xí)路徑的研究[D].碩士學(xué)位論文，湖南：湘潭大學(xué)，2007.

[4]田曉輝.基于Web的個(gè)性化學(xué)習(xí)系統(tǒng)在遠(yuǎn)程教育中的應(yīng)用研究[D].碩士學(xué)位論文，西安：陜西師范大學(xué)，2007.

[5]史春秀.基于數(shù)據(jù)挖掘的個(gè)性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文，天津：天津大學(xué)，2007.

[6]王志平.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文，重慶：重慶大學(xué)，2007.

作者單位

1.無錫高等師范學(xué)校江蘇省無錫市 214000

2.無錫城市職業(yè)技術(shù)學(xué)院江蘇省無錫市 214000endprint

2.2 貝葉斯分類過程

2.2.1 建立樣本數(shù)據(jù)

2.2.2 建立學(xué)習(xí)風(fēng)格建模

（1）計(jì)算得到每一種學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率P（Ci ）。

（2）相對(duì)于每個(gè)類別的概率 P（aj|ci），訓(xùn)練樣本集計(jì)算得出各屬性的所有取值。

（3）計(jì)算出未知樣本對(duì)三種類別的概率，選取概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

其中，建立學(xué)習(xí)風(fēng)格分類模型最關(guān)鍵的步驟就是建立訓(xùn)練樣本集。見表2-1。

2.2.3 建立算法

根據(jù)上述分析，設(shè)計(jì)算法如下：

初始化訓(xùn)練集D；計(jì)算每個(gè)學(xué)習(xí)風(fēng)格類型的先驗(yàn)概率

由上述算法得出概率最大的類別為學(xué)生的學(xué)習(xí)風(fēng)格類型。

3 結(jié)論

（1）它結(jié)合了概率與貝葉斯網(wǎng)絡(luò)的分類方法，可以利用領(lǐng)域知識(shí)和其它先驗(yàn)信息，計(jì)算假設(shè)概率。

（2）可以把所有的屬性都參與分類。

（3）針對(duì)離散屬性的對(duì)象進(jìn)行分析。

（4）數(shù)據(jù)樣本可以增加也可以減少，這樣可以進(jìn)行增量學(xué)習(xí)。

（5）利用有向圖的表示方式非常直觀，弧表示變量之間的關(guān)系。

參考文獻(xiàn)

[1]田文詩.基于學(xué)習(xí)者行為的序列模式挖掘算法研究與實(shí)現(xiàn)[D].碩士學(xué)位論文，吉林：吉林大學(xué)，2011（05）.

[2]鄧暉、徐梅林.網(wǎng)絡(luò)學(xué)習(xí)環(huán)境之個(gè)性化屬性調(diào)查及啟示[J].現(xiàn)代教育技術(shù)，2003.13（1）：49-54.

[3]凌江榮.在e_Learning中建立自適應(yīng)學(xué)習(xí)路徑的研究[D].碩士學(xué)位論文，湖南：湘潭大學(xué)，2007.

[4]田曉輝.基于Web的個(gè)性化學(xué)習(xí)系統(tǒng)在遠(yuǎn)程教育中的應(yīng)用研究[D].碩士學(xué)位論文，西安：陜西師范大學(xué)，2007.

[5]史春秀.基于數(shù)據(jù)挖掘的個(gè)性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文，天津：天津大學(xué)，2007.

[6]王志平.基于數(shù)據(jù)挖掘技術(shù)的個(gè)性化學(xué)習(xí)系統(tǒng)的研究[D].碩士學(xué)位論文，重慶：重慶大學(xué)，2007.

作者單位

1.無錫高等師范學(xué)校江蘇省無錫市 214000

2.無錫城市職業(yè)技術(shù)學(xué)院江蘇省無錫市 214000endprint