王娜
摘 要:簡要介紹了基于貝葉斯網(wǎng)絡的試卷分析試驗,試驗主要用到的工具是基于MATLAB語言編寫的BNT軟件包。通過試驗研究,分析了平時的出勤率、作業(yè)提交率等五方面內容對學生成績的影響。
關鍵詞:試卷分析;貝葉斯網(wǎng)絡;概率推理;BNT工具包
中圖分類號:TP183 文獻標識碼:A 文章編號:2095-6835(2014)21-0137-02
考試是教學過程中不可缺少的組成部分,是對教和學的質量檢驗??荚嚱Y果可以反饋出大量的信息——反映出整個教學過程的得失,反映出各個教學環(huán)節(jié)的情況,反映出學生的能力,反映出學生的學習特點和規(guī)律。針對以上幾方面,在命題時要有多方面的設計??荚嚱Y果可以反映命題和考試本身的情況,也就是測量工具、測量方法和測量過程的情況。分析這些信息,進行一定的思考,提出一些觀點和建議,供領導決策時參考,以此作為制訂工作策略的依據(jù),為學校老師和學生提供一定的指導。所以說,試卷分析是一件很重要的工作。
1 貝葉斯網(wǎng)絡與因果推理
貝葉斯網(wǎng)絡又稱為置信網(wǎng)絡,是基于概率分析、圖論的一種不確定性知識的表達和推理模型。一個典型的貝葉斯網(wǎng)絡由兩部分組成:①有向無環(huán)的圖,其中每一個節(jié)點代表一個變量、屬性、狀態(tài)或其他的實體,節(jié)點之間的弧反映了變量間的依賴關系,指向節(jié)點X的所有節(jié)點被稱為X的父節(jié)點。②與每個節(jié)點相聯(lián)系的條件概率表列出了此節(jié)點相對于其父節(jié)點所有可能的條件概率。貝葉斯網(wǎng)絡約定以節(jié)點Vi的父節(jié)點為條件,Vi與任意非Vi子節(jié)點條件獨立。
2 利用BNT軟件包分析試卷
在此次的試卷分析試驗中,以過去學生的期末考試成績?yōu)橐劳?,隨機抽取了一部分學生的考試信息作為此次試驗的原始數(shù)據(jù)。利用軟件篩選、整理這些數(shù)據(jù),然后通過基于MATLAB語言開發(fā)的關于貝葉斯網(wǎng)絡學習的BNT軟件包建模,主要完成建立貝葉斯網(wǎng)絡的工作,以此來反映選定因素對試卷成績的影響。影響試卷成績的因素主要有:A——作業(yè)提交率、B——上課出勤率、C——否是留級生、D——主觀題得分率和E——客觀題得分率。
2.1 為試卷分析篩選數(shù)據(jù)
第一步:把影響試卷的因素作為變量,即貝葉斯網(wǎng)絡模型中的節(jié)點,得到的候選數(shù)據(jù)集如表1所示。其中,R(is pass)標記為該樣本的狀態(tài)值,“1”表示成績及格,“0”表示成績不及格。
表1 變量與狀態(tài)的關系
A B C D E R
0.67 0.85 0 0.78 0.56 1
0.54 0.66 1 0.54 0.39 0
0.89 0.96 0 0.85 0.78 1
… … … … … …
第二步:由于貝葉斯網(wǎng)絡是用離散型變量,因此,對原始數(shù)據(jù)進行處理,數(shù)據(jù)離散處理結果如表2所示。
例如離散處理“上課出勤率”這一變量。根據(jù)教學經(jīng)驗,一般同學的出勤率都在90%以上,如果低于70%,學習成績很
———————————————————————————
可能不理想,所以,將變量B分為3段——小于70%為low,70%~90%為mid,大于90%為high。
表2 對表1數(shù)據(jù)的離散處理結果
A B C D E R
high mid no high mid yes
mid low yes mid mid no
high high no high high yes
… … … … … …
第三步:數(shù)據(jù)格式轉換。
根據(jù)MATLAB的特點,將數(shù)據(jù)集轉換為矩陣的形式,而且所有屬性的取值全部依次編號為1,2,3.
表2對應的矩陣為: .
以由此得到的樣本數(shù)據(jù)集作為模型數(shù)據(jù)集來構造模型。
2.2 貝葉斯網(wǎng)絡的建模
接下來的工作就是以得到的數(shù)據(jù)建立貝葉斯網(wǎng)絡,然后對得到的貝葉斯網(wǎng)絡進行參數(shù)學習。從得到的貝葉斯網(wǎng)絡和學習得到的參數(shù)中可以看出選定的因素對試卷的影響。
經(jīng)過實踐,筆者得到的結果是:“上課出勤率”和“作業(yè)提交率”是影響其他因素的原因,而“上課出勤率”又可以影響到“作業(yè)提交”,這是與限制了父節(jié)點個數(shù)的結果相同的部分,不同的是:①“是否是留級生”又影響了“客觀題得分率”和“主觀題得分率”兩項。如果出現(xiàn)這樣的結果,不難看出,留級生在考試分數(shù)上和正班生還是有一定差距的。②“主觀題得分率”影響了“是否及格”這一項。出現(xiàn)這種結果是因為在統(tǒng)計數(shù)據(jù)時,主觀題分值占了60%.
從以上試驗結果的數(shù)據(jù)中可以看出,作業(yè)提交率和上課出勤率對其他三個因素的影響。
3 結論
對試驗結果分析后發(fā)現(xiàn),得到的結果基本符合實際情況。學生的“上課出勤率”和“作業(yè)提交率”是影響其學習成績的重要因素。由此可見,知識是平時一點一滴積累起來的,即便是在大學校園,在日常教學過程中,也應加強對學生的紀律管理,督促學生按部就班地學習。
參考文獻
[1]沈海峰.基于貝葉斯網(wǎng)絡數(shù)據(jù)挖掘技術理論計算法的研究[D].安徽:合肥工業(yè)大學,2005.
〔編輯:白潔〕
Paper based on Bayesian Network Analysis
Wang Na
Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.
Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit
摘 要:簡要介紹了基于貝葉斯網(wǎng)絡的試卷分析試驗,試驗主要用到的工具是基于MATLAB語言編寫的BNT軟件包。通過試驗研究,分析了平時的出勤率、作業(yè)提交率等五方面內容對學生成績的影響。
關鍵詞:試卷分析;貝葉斯網(wǎng)絡;概率推理;BNT工具包
中圖分類號:TP183 文獻標識碼:A 文章編號:2095-6835(2014)21-0137-02
考試是教學過程中不可缺少的組成部分,是對教和學的質量檢驗??荚嚱Y果可以反饋出大量的信息——反映出整個教學過程的得失,反映出各個教學環(huán)節(jié)的情況,反映出學生的能力,反映出學生的學習特點和規(guī)律。針對以上幾方面,在命題時要有多方面的設計??荚嚱Y果可以反映命題和考試本身的情況,也就是測量工具、測量方法和測量過程的情況。分析這些信息,進行一定的思考,提出一些觀點和建議,供領導決策時參考,以此作為制訂工作策略的依據(jù),為學校老師和學生提供一定的指導。所以說,試卷分析是一件很重要的工作。
1 貝葉斯網(wǎng)絡與因果推理
貝葉斯網(wǎng)絡又稱為置信網(wǎng)絡,是基于概率分析、圖論的一種不確定性知識的表達和推理模型。一個典型的貝葉斯網(wǎng)絡由兩部分組成:①有向無環(huán)的圖,其中每一個節(jié)點代表一個變量、屬性、狀態(tài)或其他的實體,節(jié)點之間的弧反映了變量間的依賴關系,指向節(jié)點X的所有節(jié)點被稱為X的父節(jié)點。②與每個節(jié)點相聯(lián)系的條件概率表列出了此節(jié)點相對于其父節(jié)點所有可能的條件概率。貝葉斯網(wǎng)絡約定以節(jié)點Vi的父節(jié)點為條件,Vi與任意非Vi子節(jié)點條件獨立。
2 利用BNT軟件包分析試卷
在此次的試卷分析試驗中,以過去學生的期末考試成績?yōu)橐劳?,隨機抽取了一部分學生的考試信息作為此次試驗的原始數(shù)據(jù)。利用軟件篩選、整理這些數(shù)據(jù),然后通過基于MATLAB語言開發(fā)的關于貝葉斯網(wǎng)絡學習的BNT軟件包建模,主要完成建立貝葉斯網(wǎng)絡的工作,以此來反映選定因素對試卷成績的影響。影響試卷成績的因素主要有:A——作業(yè)提交率、B——上課出勤率、C——否是留級生、D——主觀題得分率和E——客觀題得分率。
2.1 為試卷分析篩選數(shù)據(jù)
第一步:把影響試卷的因素作為變量,即貝葉斯網(wǎng)絡模型中的節(jié)點,得到的候選數(shù)據(jù)集如表1所示。其中,R(is pass)標記為該樣本的狀態(tài)值,“1”表示成績及格,“0”表示成績不及格。
表1 變量與狀態(tài)的關系
A B C D E R
0.67 0.85 0 0.78 0.56 1
0.54 0.66 1 0.54 0.39 0
0.89 0.96 0 0.85 0.78 1
… … … … … …
第二步:由于貝葉斯網(wǎng)絡是用離散型變量,因此,對原始數(shù)據(jù)進行處理,數(shù)據(jù)離散處理結果如表2所示。
例如離散處理“上課出勤率”這一變量。根據(jù)教學經(jīng)驗,一般同學的出勤率都在90%以上,如果低于70%,學習成績很
———————————————————————————
可能不理想,所以,將變量B分為3段——小于70%為low,70%~90%為mid,大于90%為high。
表2 對表1數(shù)據(jù)的離散處理結果
A B C D E R
high mid no high mid yes
mid low yes mid mid no
high high no high high yes
… … … … … …
第三步:數(shù)據(jù)格式轉換。
根據(jù)MATLAB的特點,將數(shù)據(jù)集轉換為矩陣的形式,而且所有屬性的取值全部依次編號為1,2,3.
表2對應的矩陣為: .
以由此得到的樣本數(shù)據(jù)集作為模型數(shù)據(jù)集來構造模型。
2.2 貝葉斯網(wǎng)絡的建模
接下來的工作就是以得到的數(shù)據(jù)建立貝葉斯網(wǎng)絡,然后對得到的貝葉斯網(wǎng)絡進行參數(shù)學習。從得到的貝葉斯網(wǎng)絡和學習得到的參數(shù)中可以看出選定的因素對試卷的影響。
經(jīng)過實踐,筆者得到的結果是:“上課出勤率”和“作業(yè)提交率”是影響其他因素的原因,而“上課出勤率”又可以影響到“作業(yè)提交”,這是與限制了父節(jié)點個數(shù)的結果相同的部分,不同的是:①“是否是留級生”又影響了“客觀題得分率”和“主觀題得分率”兩項。如果出現(xiàn)這樣的結果,不難看出,留級生在考試分數(shù)上和正班生還是有一定差距的。②“主觀題得分率”影響了“是否及格”這一項。出現(xiàn)這種結果是因為在統(tǒng)計數(shù)據(jù)時,主觀題分值占了60%.
從以上試驗結果的數(shù)據(jù)中可以看出,作業(yè)提交率和上課出勤率對其他三個因素的影響。
3 結論
對試驗結果分析后發(fā)現(xiàn),得到的結果基本符合實際情況。學生的“上課出勤率”和“作業(yè)提交率”是影響其學習成績的重要因素。由此可見,知識是平時一點一滴積累起來的,即便是在大學校園,在日常教學過程中,也應加強對學生的紀律管理,督促學生按部就班地學習。
參考文獻
[1]沈海峰.基于貝葉斯網(wǎng)絡數(shù)據(jù)挖掘技術理論計算法的研究[D].安徽:合肥工業(yè)大學,2005.
〔編輯:白潔〕
Paper based on Bayesian Network Analysis
Wang Na
Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.
Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit
摘 要:簡要介紹了基于貝葉斯網(wǎng)絡的試卷分析試驗,試驗主要用到的工具是基于MATLAB語言編寫的BNT軟件包。通過試驗研究,分析了平時的出勤率、作業(yè)提交率等五方面內容對學生成績的影響。
關鍵詞:試卷分析;貝葉斯網(wǎng)絡;概率推理;BNT工具包
中圖分類號:TP183 文獻標識碼:A 文章編號:2095-6835(2014)21-0137-02
考試是教學過程中不可缺少的組成部分,是對教和學的質量檢驗??荚嚱Y果可以反饋出大量的信息——反映出整個教學過程的得失,反映出各個教學環(huán)節(jié)的情況,反映出學生的能力,反映出學生的學習特點和規(guī)律。針對以上幾方面,在命題時要有多方面的設計??荚嚱Y果可以反映命題和考試本身的情況,也就是測量工具、測量方法和測量過程的情況。分析這些信息,進行一定的思考,提出一些觀點和建議,供領導決策時參考,以此作為制訂工作策略的依據(jù),為學校老師和學生提供一定的指導。所以說,試卷分析是一件很重要的工作。
1 貝葉斯網(wǎng)絡與因果推理
貝葉斯網(wǎng)絡又稱為置信網(wǎng)絡,是基于概率分析、圖論的一種不確定性知識的表達和推理模型。一個典型的貝葉斯網(wǎng)絡由兩部分組成:①有向無環(huán)的圖,其中每一個節(jié)點代表一個變量、屬性、狀態(tài)或其他的實體,節(jié)點之間的弧反映了變量間的依賴關系,指向節(jié)點X的所有節(jié)點被稱為X的父節(jié)點。②與每個節(jié)點相聯(lián)系的條件概率表列出了此節(jié)點相對于其父節(jié)點所有可能的條件概率。貝葉斯網(wǎng)絡約定以節(jié)點Vi的父節(jié)點為條件,Vi與任意非Vi子節(jié)點條件獨立。
2 利用BNT軟件包分析試卷
在此次的試卷分析試驗中,以過去學生的期末考試成績?yōu)橐劳?,隨機抽取了一部分學生的考試信息作為此次試驗的原始數(shù)據(jù)。利用軟件篩選、整理這些數(shù)據(jù),然后通過基于MATLAB語言開發(fā)的關于貝葉斯網(wǎng)絡學習的BNT軟件包建模,主要完成建立貝葉斯網(wǎng)絡的工作,以此來反映選定因素對試卷成績的影響。影響試卷成績的因素主要有:A——作業(yè)提交率、B——上課出勤率、C——否是留級生、D——主觀題得分率和E——客觀題得分率。
2.1 為試卷分析篩選數(shù)據(jù)
第一步:把影響試卷的因素作為變量,即貝葉斯網(wǎng)絡模型中的節(jié)點,得到的候選數(shù)據(jù)集如表1所示。其中,R(is pass)標記為該樣本的狀態(tài)值,“1”表示成績及格,“0”表示成績不及格。
表1 變量與狀態(tài)的關系
A B C D E R
0.67 0.85 0 0.78 0.56 1
0.54 0.66 1 0.54 0.39 0
0.89 0.96 0 0.85 0.78 1
… … … … … …
第二步:由于貝葉斯網(wǎng)絡是用離散型變量,因此,對原始數(shù)據(jù)進行處理,數(shù)據(jù)離散處理結果如表2所示。
例如離散處理“上課出勤率”這一變量。根據(jù)教學經(jīng)驗,一般同學的出勤率都在90%以上,如果低于70%,學習成績很
———————————————————————————
可能不理想,所以,將變量B分為3段——小于70%為low,70%~90%為mid,大于90%為high。
表2 對表1數(shù)據(jù)的離散處理結果
A B C D E R
high mid no high mid yes
mid low yes mid mid no
high high no high high yes
… … … … … …
第三步:數(shù)據(jù)格式轉換。
根據(jù)MATLAB的特點,將數(shù)據(jù)集轉換為矩陣的形式,而且所有屬性的取值全部依次編號為1,2,3.
表2對應的矩陣為: .
以由此得到的樣本數(shù)據(jù)集作為模型數(shù)據(jù)集來構造模型。
2.2 貝葉斯網(wǎng)絡的建模
接下來的工作就是以得到的數(shù)據(jù)建立貝葉斯網(wǎng)絡,然后對得到的貝葉斯網(wǎng)絡進行參數(shù)學習。從得到的貝葉斯網(wǎng)絡和學習得到的參數(shù)中可以看出選定的因素對試卷的影響。
經(jīng)過實踐,筆者得到的結果是:“上課出勤率”和“作業(yè)提交率”是影響其他因素的原因,而“上課出勤率”又可以影響到“作業(yè)提交”,這是與限制了父節(jié)點個數(shù)的結果相同的部分,不同的是:①“是否是留級生”又影響了“客觀題得分率”和“主觀題得分率”兩項。如果出現(xiàn)這樣的結果,不難看出,留級生在考試分數(shù)上和正班生還是有一定差距的。②“主觀題得分率”影響了“是否及格”這一項。出現(xiàn)這種結果是因為在統(tǒng)計數(shù)據(jù)時,主觀題分值占了60%.
從以上試驗結果的數(shù)據(jù)中可以看出,作業(yè)提交率和上課出勤率對其他三個因素的影響。
3 結論
對試驗結果分析后發(fā)現(xiàn),得到的結果基本符合實際情況。學生的“上課出勤率”和“作業(yè)提交率”是影響其學習成績的重要因素。由此可見,知識是平時一點一滴積累起來的,即便是在大學校園,在日常教學過程中,也應加強對學生的紀律管理,督促學生按部就班地學習。
參考文獻
[1]沈海峰.基于貝葉斯網(wǎng)絡數(shù)據(jù)挖掘技術理論計算法的研究[D].安徽:合肥工業(yè)大學,2005.
〔編輯:白潔〕
Paper based on Bayesian Network Analysis
Wang Na
Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.
Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit