李蘋+王麗花+陶燕林
摘要:將邏輯回歸方法,引入到學(xué)生綜合素質(zhì)量化評(píng)估領(lǐng)域。以一個(gè)班學(xué)生的綜合素質(zhì)評(píng)估成績?yōu)橛?xùn)練樣本,構(gòu)造預(yù)測模型、假設(shè)函數(shù),并用梯度下降法得到模型的參數(shù)向量。根據(jù)參數(shù)向量構(gòu)造評(píng)選“省級(jí)三好學(xué)生”的邏輯回歸模型,對(duì)模型中各個(gè)特征的權(quán)重進(jìn)行分析。
關(guān)鍵詞:邏輯回歸;綜合素質(zhì)量化
中圖分類號(hào):TP301 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)25-0183-01
學(xué)生綜合素質(zhì)量化評(píng)估是促進(jìn)學(xué)生全面發(fā)展的重要手段。通過科學(xué)的綜合素質(zhì)量化評(píng)估體系可以幫助學(xué)生了解自己的長處和不足,找準(zhǔn)努力的方向,也是對(duì)學(xué)生進(jìn)行評(píng)優(yōu)的依據(jù)[1]。在綜合素質(zhì)評(píng)估系統(tǒng)中,不同的指標(biāo)由于權(quán)重不同,導(dǎo)致評(píng)價(jià)不同[2]。根據(jù)學(xué)生培養(yǎng)目標(biāo)的要求,量化評(píng)估的指標(biāo)包括:思想道德評(píng)價(jià),文化知識(shí)素質(zhì)評(píng)價(jià),身體心理素質(zhì)的評(píng)價(jià),創(chuàng)新發(fā)展能力評(píng)價(jià)。
目前我校各個(gè)指標(biāo)在綜合素質(zhì)量化評(píng)估中的比重分別為20%、10%、10%、60%,表明我校學(xué)生在綜合素質(zhì)量化評(píng)估中各個(gè)特征的重要性。
然而,不同的評(píng)優(yōu)標(biāo)準(zhǔn)要求不完全一致,推優(yōu)時(shí)應(yīng)該有針對(duì)性。例如,省級(jí)三好學(xué)生的評(píng)選標(biāo)準(zhǔn)是“具有堅(jiān)定正確的政治方向,堅(jiān)持黨的基本路線……善于學(xué)習(xí)和吸收新知識(shí),熱愛所學(xué)專業(yè),勤奮學(xué)習(xí),成績優(yōu)異……有較強(qiáng)的實(shí)踐能力……有健康的身體、良好的心理素質(zhì)……”。省級(jí)優(yōu)秀學(xué)生干部的評(píng)選標(biāo)準(zhǔn)是“有較高的思想政治素質(zhì)……熱心承擔(dān)社會(huì)工作……有很強(qiáng)的工作能力……”。
大四畢業(yè)之際,能否根據(jù)以往的綜合成績公平公正推選各種優(yōu)秀,是每個(gè)畢業(yè)生關(guān)注的焦點(diǎn)。因此,本研究從已有的綜合素質(zhì)量化評(píng)估成績出發(fā),得出邏輯回歸模型,分析各個(gè)特征的權(quán)重,并與現(xiàn)有的指標(biāo)量化權(quán)重進(jìn)行比較,為有針對(duì)性地推優(yōu)提供參考依據(jù)。
1 邏輯回歸的基本原理
邏輯回歸是機(jī)器學(xué)習(xí)算法中的一種分類算法,適用于標(biāo)簽取值離散的情況。假設(shè)函數(shù)可以表示為:
其中,為邏輯回歸模型參數(shù)向量,x為該數(shù)據(jù)樣本特征值向量。為設(shè)定一個(gè)閾值,當(dāng)大于閾值時(shí),判定該樣本屬于某一特定分類,反之亦然[3]。
邏輯回歸分類模型使用代價(jià)函數(shù)來衡量模型的精確度,正則化后的代價(jià)函數(shù)表示為:
其中,表示第i個(gè)數(shù)據(jù)樣本的特征向量。表示第i個(gè)樣本在訓(xùn)練集中的分類標(biāo)注,取值分別為1時(shí)表示樣本屬于某一類別,為0時(shí)表示樣本不屬于該類別。為正則化參數(shù),控制在兩個(gè)不同的目標(biāo)中的平衡關(guān)系。正則化化后的代價(jià)函數(shù)可以保持假設(shè)的形式相對(duì)簡單,避免過度的擬合。能使取極小值的邏輯回歸模型參數(shù)向量就可以用于對(duì)新樣本的預(yù)測。
可以采用梯度下降法來求解參數(shù)最小化正則化代價(jià)函數(shù)的更新公式為:
其中,是學(xué)習(xí)速率,用于控制梯度下降的步長值。
2預(yù)測模型的建立
收集一個(gè)班50名學(xué)生7個(gè)學(xué)期的綜合素質(zhì)評(píng)估成績,取各個(gè)特征7個(gè)學(xué)期的平均值形成訓(xùn)練集樣本集,以評(píng)選“省級(jí)三好學(xué)生”為例建立測評(píng)模型,分析以往的推優(yōu)結(jié)果是否體現(xiàn)了“思想道德和文化知識(shí)素質(zhì)”為主要指標(biāo)的評(píng)價(jià)方式。
2.1變量說明
(1)y:測評(píng)結(jié)果,y=0表示沒有選中,y=1表示選中為省級(jí)三好學(xué)生
(2)x1:思想道德評(píng)估成績
(3)x2:文化知識(shí)素質(zhì)評(píng)價(jià)成績
(4)x3:身體心理素質(zhì)評(píng)價(jià)成績
(5)x4:創(chuàng)新發(fā)展評(píng)價(jià)成績
對(duì)50名學(xué)生的成績獲得50組數(shù)據(jù)(),i=1,2,…,50
2.2算法步驟
(1)構(gòu)造假設(shè)函數(shù)
(2)構(gòu)造代價(jià)函數(shù)
(3)最小化代價(jià)函數(shù)。用梯度下降法求出初始代價(jià)值和梯度值,然后調(diào)用Octave中的無線約束最小化函數(shù)fminunc,找到最佳值。
獲得
(4)根據(jù)構(gòu)造評(píng)選“省級(jí)三好學(xué)生”的預(yù)測模型為:
2.3模型評(píng)價(jià)
用該模型進(jìn)行預(yù)測,得到該模型的準(zhǔn)確率為98.08,查準(zhǔn)率為0.5,召回率為1,F(xiàn)值為0.67,所以即便訓(xùn)練數(shù)據(jù)集擁有偏斜類,但是算法表現(xiàn)很好。
3 邏輯回歸結(jié)論分析
通過邏輯回歸模型分析發(fā)現(xiàn),權(quán)重從大到小分別是。表明該班在評(píng)選省級(jí)三好學(xué)生時(shí),沒有完全把思想道德和文化知識(shí)素質(zhì)作為評(píng)價(jià)的標(biāo)準(zhǔn),只是簡單按照綜合素質(zhì)量化評(píng)估的成績打分進(jìn)行評(píng)價(jià),沒有針對(duì)性。所以,建議各班級(jí)在以后在各種推優(yōu)過程中應(yīng)該根據(jù)評(píng)選標(biāo)準(zhǔn),有針對(duì)性的調(diào)整各個(gè)量化指標(biāo)的比重,而不能單純根據(jù)綜合素質(zhì)量化評(píng)估的原有成績。
參考文獻(xiàn):
[1]李瑞勤.大學(xué)生綜合素質(zhì)量化評(píng)估初探[J].云南民族學(xué)院學(xué)報(bào),2002,19(3):118-119.
[2]梁寶華.基于數(shù)據(jù)挖掘的大學(xué)生綜合素質(zhì)評(píng)價(jià)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].廣西:廣西師范大學(xué),2007.
[3]高婕.邏輯回歸參數(shù)訓(xùn)練過程的MapReduce并行化實(shí)現(xiàn)[J].廣西技術(shù)師范學(xué)院學(xué)報(bào),2015(5):39.