盧錚松 李珂珂
【摘要】在研究生網(wǎng)上課程評(píng)價(jià)系統(tǒng)收集的大量數(shù)據(jù)基礎(chǔ)上,構(gòu)建了一種基于人工神經(jīng)網(wǎng)絡(luò)的多指標(biāo)課程評(píng)價(jià)模型,并將網(wǎng)上調(diào)查的結(jié)果以連接權(quán)的方式賦予該評(píng)價(jià)模型進(jìn)行訓(xùn)練。通過實(shí)際評(píng)價(jià)數(shù)據(jù)的驗(yàn)證,該模型能夠準(zhǔn)確地按照實(shí)際評(píng)價(jià)的過程進(jìn)行工作。
【關(guān)鍵詞】評(píng)價(jià)模型;人工神經(jīng)網(wǎng)絡(luò);課程評(píng)價(jià)
【中圖分類號(hào)】G420 【文獻(xiàn)標(biāo)識(shí)碼】A 【論文編號(hào)】1009—8097(2009)10—0053—05
一 引言
目前,我國高等教育面臨著培養(yǎng)大批創(chuàng)新人才和為國家自主創(chuàng)新做出更大貢獻(xiàn)兩大任務(wù),對(duì)研究生教育已經(jīng)從注重培養(yǎng)數(shù)量轉(zhuǎn)變?yōu)樽⒅嘏囵B(yǎng)質(zhì)量。研究生的課程教學(xué)過程,是研究生培養(yǎng)質(zhì)量控制中一個(gè)重要環(huán)節(jié),因此對(duì)于研究生課程教學(xué)質(zhì)量的評(píng)估,也成為提高培養(yǎng)質(zhì)量的重要課題之一。
然而,對(duì)研究生課程教學(xué)質(zhì)量進(jìn)行評(píng)價(jià),是一項(xiàng)復(fù)雜的系統(tǒng)工程。在課程評(píng)價(jià)中涉及的因素較多,在評(píng)價(jià)中通常采用的問卷調(diào)查,由于指標(biāo)和權(quán)重的確定帶有很大的主觀性,調(diào)查對(duì)象的反饋也存在部分無效信息或噪聲數(shù)據(jù),因此并不能完全客觀地反映課程教學(xué)水平的高低。
隨著研究生培養(yǎng)工作的不斷發(fā)展,在課程調(diào)查方面已經(jīng)積累了大量原始數(shù)據(jù)。通過數(shù)據(jù)挖掘技術(shù),利用已經(jīng)存在的大量研究生培養(yǎng)和課程調(diào)查數(shù)據(jù),將其轉(zhuǎn)換成有用的信息和知識(shí),建立一個(gè)完善的研究生課程評(píng)價(jià)體系和課程評(píng)價(jià)模型,能夠?yàn)檎n程評(píng)價(jià)提供高效客觀的結(jié)論,并以此為參考,不斷提高研究生的課程教學(xué)質(zhì)量和培養(yǎng)質(zhì)量。
本文試圖在構(gòu)建研究生課程評(píng)價(jià)體系的基礎(chǔ)上,基于數(shù)據(jù)挖掘技術(shù),通過數(shù)據(jù)分析和機(jī)器學(xué)習(xí),提出一種基于人工神經(jīng)網(wǎng)絡(luò)的多指標(biāo)綜合評(píng)價(jià)模型。該評(píng)價(jià)模型不僅可以模擬調(diào)查者對(duì)課程進(jìn)行評(píng)價(jià),而且還具有很強(qiáng)的容錯(cuò)能力,非常適合大規(guī)模的評(píng)價(jià)系統(tǒng)。
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,簡(jiǎn)稱ANN)是近年發(fā)展起來的一門處理復(fù)雜系統(tǒng)的理論,其特有的信息處理能力和獨(dú)到的解算能力在很多方面都呈現(xiàn)出廣闊的應(yīng)用前景。ANN主要解決數(shù)據(jù)挖掘的分類和回歸任務(wù),它基于并行處理的機(jī)制,從結(jié)構(gòu)上對(duì)人類的思維過程進(jìn)行模擬,從而能實(shí)現(xiàn)人類思維的某些功能,如學(xué)習(xí)、邏輯推想、聯(lián)想記憶和自組織等[1]。相對(duì)于判定樹算法,ANN可以找出輸入屬性和可預(yù)測(cè)屬性之間平滑而連續(xù)的非線性關(guān)系。ANN已經(jīng)在信號(hào)處理、模式識(shí)別、目標(biāo)跟蹤、機(jī)器人控制、專家系統(tǒng)、組合優(yōu)化、網(wǎng)絡(luò)管理等眾多領(lǐng)域的應(yīng)用中獲得了引人注目的成果。特別是在解決非線性系統(tǒng)的問題的方面,具有獨(dú)特的優(yōu)勢(shì)。
二 研究生課程評(píng)價(jià)體系構(gòu)建
通過對(duì)某重點(diǎn)高校2007-2009年網(wǎng)上課程評(píng)價(jià)設(shè)計(jì)的調(diào)查問卷進(jìn)行總結(jié),以及對(duì)網(wǎng)上課程評(píng)價(jià)系統(tǒng)獲取的原始數(shù)據(jù)整理和匯總,并參考部分典型的課程教育質(zhì)量評(píng)價(jià)體系,可以從課程內(nèi)容、教學(xué)過程、教師情況等三個(gè)方面來構(gòu)建課程評(píng)價(jià)體系。具體的評(píng)價(jià)指標(biāo)詳見表1。
三 基于神經(jīng)網(wǎng)絡(luò)的研究生課程評(píng)價(jià)模型
1 BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建
目前人工神經(jīng)網(wǎng)絡(luò)的算法模型有很多種,其中BP神經(jīng)網(wǎng)絡(luò)是被廣泛應(yīng)用的一種重要網(wǎng)絡(luò)形式,主要用來進(jìn)行非線性系統(tǒng)的輸出輸入映射關(guān)系建模。其主要結(jié)構(gòu)是由一個(gè)輸入層,一個(gè)或多個(gè)隱含層,一個(gè)輸出層組成,各層由若干個(gè)神經(jīng)元(節(jié)點(diǎn))構(gòu)成,每一個(gè)節(jié)點(diǎn)的輸出值由輸入值、作用函數(shù)和閾值決定[2]。
本文采用的是如圖1所示的隱含層為一層的三層BP神經(jīng)網(wǎng)絡(luò)模型。
(6)利用輸出層各單元的一般化誤差 與隱含層各單元的輸出 來修正連接權(quán) 和閾值 。
(7)利用隱含層各單元的一般化誤差 ,輸入層各單元的輸入 來修正連接權(quán) 和閾值 。
(8)隨機(jī)選取下一個(gè)學(xué)習(xí)樣本向量提供給網(wǎng)絡(luò),返回到步驟(2),直到m個(gè)訓(xùn)練樣本訓(xùn)練完畢。
(9)重新從m個(gè)學(xué)習(xí)樣本中隨機(jī)選取一組輸入和目標(biāo)樣本,返回步驟(2),直到網(wǎng)絡(luò)全局誤差E小于預(yù)先設(shè)定的一個(gè)極小值,即網(wǎng)絡(luò)收斂。如果學(xué)習(xí)次數(shù)大于預(yù)先設(shè)定的值,則網(wǎng)絡(luò)無法收斂。
(10)學(xué)習(xí)結(jié)束。
3 研究生課程評(píng)價(jià)模型中的BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)
在研究生課程評(píng)價(jià)模型中的BP神經(jīng)網(wǎng)絡(luò)中,共有21個(gè)指標(biāo)作為輸入的神經(jīng)元;輸出層只有一個(gè)神經(jīng)元,即研究生培養(yǎng)質(zhì)量評(píng)價(jià)值,它是一個(gè)取值范圍是[0,1]的代數(shù)值。
隱含層的神經(jīng)元數(shù)目選擇是一個(gè)十分復(fù)雜的問題,往往需要根據(jù)設(shè)計(jì)者的經(jīng)驗(yàn)和多次試驗(yàn)來確定,因而不存在一個(gè)理想的解析式來表示,更不能機(jī)械地按照Kolmogorov定理來簡(jiǎn)單地確定隱含層的神經(jīng)元數(shù)目。隱含層的神經(jīng)元數(shù)目與問題的要求、輸入和輸出單元的數(shù)目都有著直接關(guān)系。若隱含層節(jié)點(diǎn)數(shù)太少,網(wǎng)絡(luò)可能根本不能訓(xùn)練或網(wǎng)絡(luò)性能很差;若隱含層節(jié)點(diǎn)數(shù)太多,雖然可使網(wǎng)絡(luò)的系統(tǒng)誤差減小,但一方面使網(wǎng)絡(luò)訓(xùn)練時(shí)間延長(zhǎng),另一方面,訓(xùn)練容易陷入局部極小點(diǎn)而得不到最優(yōu)點(diǎn),也是訓(xùn)練時(shí)出現(xiàn)“過擬合”的內(nèi)在原因。
本文的具體應(yīng)用當(dāng)中,根據(jù)下面的經(jīng)驗(yàn)公式來確定隱含層節(jié)點(diǎn)數(shù)[4],在編程實(shí)現(xiàn)時(shí)分別選取高、中、低三個(gè)不同數(shù)值來觀察網(wǎng)絡(luò)性能,當(dāng)網(wǎng)絡(luò)的評(píng)價(jià)誤差最小時(shí),網(wǎng)絡(luò)中間層的神經(jīng)元數(shù)目就是最佳值。
(7)
其中S為隱含層節(jié)點(diǎn)數(shù),m為輸入層節(jié)點(diǎn)數(shù),n為輸出層節(jié)點(diǎn)數(shù),S取值范圍為5~15。
根據(jù)公式(7),我們首先將隱含層神經(jīng)元數(shù)目設(shè)為5,然后逐步增加到10和15。多次試驗(yàn)之后,通過對(duì)這3種情況下的誤差進(jìn)行對(duì)比,發(fā)現(xiàn)隱含層神經(jīng)元個(gè)數(shù)為10時(shí),該B-P神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能最好。因此,本應(yīng)用中,隱含層神經(jīng)元數(shù)目設(shè)為10。
由于應(yīng)用神經(jīng)網(wǎng)絡(luò)模型需要進(jìn)行數(shù)據(jù)的預(yù)處理,即對(duì)輸入進(jìn)行歸一化。同時(shí)課程評(píng)價(jià)調(diào)查中定性因素較多,對(duì)于每個(gè)指標(biāo)的選項(xiàng)采用計(jì)分法,共分為1.0、0.7、0.5、0.3、0.1五個(gè)等級(jí)[5]。通過網(wǎng)絡(luò)評(píng)價(jià)系統(tǒng),讓指定范圍的研究生(如指定班級(jí)、指定專業(yè)等)對(duì)調(diào)查問卷進(jìn)行評(píng)價(jià),得出各個(gè)指標(biāo)的評(píng)分值。
表2中以U5課程內(nèi)容包含信息量、U9對(duì)創(chuàng)造性思維的鼓勵(lì)程度和U18講解清晰邏輯性強(qiáng)三個(gè)指標(biāo)為例,說明評(píng)價(jià)指標(biāo)歸一化處理參考對(duì)照表。
四 研究生課程評(píng)價(jià)模型的應(yīng)用驗(yàn)證
該應(yīng)用的樣本來自于天津大學(xué)研究生課程評(píng)價(jià)與調(diào)查系統(tǒng)2007年到2009年的課程評(píng)價(jià)調(diào)查數(shù)據(jù)。在2007年到2009年間,對(duì)當(dāng)年的一年級(jí)研究生進(jìn)行了15門課程共6次評(píng)價(jià)調(diào)查活動(dòng),共計(jì)2992人次參與了問卷調(diào)查,生成有效調(diào)查記錄2972份。在評(píng)價(jià)系統(tǒng)中可進(jìn)行調(diào)查結(jié)果的統(tǒng)計(jì)工作,統(tǒng)計(jì)頁面如圖2所示。
本文對(duì)調(diào)查結(jié)果進(jìn)行了適當(dāng)整理。首先將不同時(shí)期不同內(nèi)容的調(diào)查問卷按照評(píng)價(jià)體系指標(biāo)進(jìn)行了歸納,剔除了個(gè)別只針對(duì)具體課程的問題。其次是對(duì)各項(xiàng)評(píng)價(jià)指標(biāo)進(jìn)行了歸一化處理。最后,對(duì)單門課程的調(diào)查問卷結(jié)果進(jìn)行統(tǒng)計(jì),得到每門參與調(diào)查課程各項(xiàng)指標(biāo)的平均得分。最后統(tǒng)計(jì)結(jié)果如表3所示。
將各項(xiàng)指標(biāo)的平均得分輸入BP神經(jīng)網(wǎng)絡(luò)模型中,進(jìn)行學(xué)習(xí)訓(xùn)練。通過對(duì)訓(xùn)練結(jié)果進(jìn)行測(cè)試,誤差達(dá)到所要求的范圍之內(nèi)則說明學(xué)習(xí)成功。一旦學(xué)習(xí)成功后,神經(jīng)網(wǎng)絡(luò)就可再現(xiàn)調(diào)查對(duì)象們作為整體的經(jīng)驗(yàn)、知識(shí)和直覺思維,從而降低評(píng)價(jià)過程中的人為因素影響,較好的保證了模型計(jì)算的客觀性。
該應(yīng)用具體步驟如下:
(1)按照?qǐng)D1的網(wǎng)絡(luò)設(shè)計(jì)結(jié)構(gòu),隱含層神經(jīng)元的傳遞函數(shù)為S型正切函數(shù)。由于輸出已經(jīng)被歸一化到區(qū)間[0,1]中。因此,輸出層神經(jīng)元的傳遞函數(shù)可以設(shè)定為S型對(duì)數(shù)函數(shù)。下面代碼片段用來創(chuàng)建一個(gè)符合本文應(yīng)用的BP網(wǎng)絡(luò)(本文所有代碼均為MATLAB7.1代碼):
threshold = [0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1];
net = newff ( threshold, [10,1], {'tansig','logsig'}, 'traingdx');
其中,threshold設(shè)定了網(wǎng)絡(luò)輸入向量的取值范圍[0,1],網(wǎng)絡(luò)所用的學(xué)習(xí)函數(shù)為traingdx,該函數(shù)以梯度下降法進(jìn)行學(xué)習(xí),并且學(xué)習(xí)速率是自適應(yīng)的[6]。
(2)利用參與調(diào)查課程的前10個(gè)樣本數(shù)據(jù)進(jìn)行訓(xùn)練。訓(xùn)練參數(shù)的設(shè)定中,訓(xùn)練次數(shù)為1000次,精度設(shè)為0.0001,其它參數(shù)取默認(rèn)值。網(wǎng)絡(luò)訓(xùn)練代碼如下:
net.trainParam.epochs =1000;
net.trainParam.goal=0.0001;
net=init(net);
net=train(net,P,T);
變量P和T分別表示網(wǎng)絡(luò)的輸入向量和目標(biāo)向量。訓(xùn)練結(jié)果如圖3所示,經(jīng)過478次訓(xùn)練后,網(wǎng)絡(luò)的目標(biāo)誤差達(dá)到要求。
圖3:實(shí)際的MATLAB7.1訓(xùn)練結(jié)果收斂圖
(3)利用后5個(gè)樣本數(shù)據(jù)進(jìn)行測(cè)試。測(cè)試代碼如下:
Y = sim(net,P_test);
測(cè)試結(jié)果如表4:
由表4可見,預(yù)測(cè)誤差達(dá)到預(yù)期效果。因此,該模型可以滿足實(shí)際的應(yīng)用要求[7]。
五 結(jié)論
由于對(duì)研究生課程進(jìn)行評(píng)價(jià)的因素相對(duì)較為復(fù)雜,各項(xiàng)目權(quán)重的衡量屬于非線性問題,因此盡管有較多的調(diào)查結(jié)果,但對(duì)于某門課程效果的評(píng)價(jià)過程還是比較困難的。本文通過分析具體調(diào)查項(xiàng)目和結(jié)果的基礎(chǔ)上,提出一種基于BP神經(jīng)網(wǎng)絡(luò)的課程評(píng)價(jià)模型。該模型通過BP網(wǎng)絡(luò)對(duì)歷史課程調(diào)查數(shù)據(jù)的分析和學(xué)習(xí),能夠?qū)ρ芯可n程進(jìn)行評(píng)價(jià)分析。通過實(shí)例驗(yàn)證,該模型的評(píng)價(jià)效果達(dá)到了預(yù)期的要求。
此外,該課程評(píng)價(jià)模型在實(shí)際應(yīng)用中尚存在部分問題,主要是評(píng)價(jià)結(jié)果統(tǒng)計(jì)時(shí)的歸一化無法對(duì)定性指標(biāo)進(jìn)行處理,如“課程主要提高了哪方面的能力”這樣的問題無法納入該體系中,需要在今后的研究中進(jìn)一步完善。
參考文獻(xiàn)
[1] 徐宗本,張講社,鄭亞林.計(jì)算智能中的仿生學(xué):理論與算法[M].北京:科學(xué)出版社,2003:138-139.
[2] CALLAN R. Artificial Intelligence [M].黃厚寬, 田盛豐, 等譯.北京: 電子工業(yè)出版社, 2004:252-254.
[3] Lili Rong.Building a three-layer BP neural network by fuzzy rules [A].Proc of the 9th International Conference on Neural Information Processing[C], 2002:452-456.
[4] 周開利.神經(jīng)網(wǎng)絡(luò)模型及其MATLAB仿真程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2005:70-80.
[5] 龐玉成.基于人工神經(jīng)網(wǎng)絡(luò)的項(xiàng)目集成管理績(jī)效評(píng)價(jià)研究[J].施工技術(shù),2008,37(2):22-24.
[6] 馮楠,李敏強(qiáng),寇紀(jì)淞,等.基于人工神經(jīng)網(wǎng)絡(luò)的IT項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型[J].計(jì)算機(jī)工程與應(yīng)用,2006(6):24-26.
[7] Liang Haifeng.An adaptive BP-network approach to short term load forecasting [A].
Proc of the 2004 IEEE International Conference on Electric Utility Deregulation [C].2004:1004-1019.