周霞 張映雪 李哲
摘? 要: 課程設置與學生實際需要之間的不適應是當前高校教學發(fā)展中的突出問題。由于影響課程設置和學生需求關系的因素眾多,且缺少結構化數(shù)據(jù)集和量化性評價指標,所以已有研究多以定性分析為主,未能解釋各影響因素之間相關性的強度及順序,使得現(xiàn)有的課程設計仍以經(jīng)驗設計為主。該文以相關性模型為基礎,提出基于聚類分析方法的課程需求分析與量化評價模型。將學生對課程的需求定義為“自主型”“友好型”“自驅(qū)型”“被動型”四種類型,并將自教務管理系統(tǒng)中收集的客觀成績和主觀評教等數(shù)據(jù)進行人工標定以形成數(shù)據(jù)集。通過相關性對數(shù)據(jù)屬性進行有效分析以獲取相關性排序,并將相關性最高的屬性作為特征數(shù)據(jù)使用聚類分析進行對比驗證。在測試中,“交流?成績”和“交流?評價”兩項最強相關關系的準確率分別為91%和83%,從而證明了所提相關性分析方法的有效性,能夠為高校大學英語課程改革提供量化分析指標。
關鍵詞: 課程需求分析; 量化評價模型; 聚類分析; 數(shù)據(jù)標定; 相關性排序; 高校英語教學
中圖分類號: TN923.34?34; TP391? ? ? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2019)16?0154?05
0? 引? 言
大學英語課程是高校課程設置中的重要組成部分[1]。高校學生通過兩年的課程學習需要達到教學大綱所要求的語言運用能力和跨文化交際能力[2]。而在實際學習中,大部分學生仍很難達到該要求,更難成為應用型國際化人才。這表明學生的實際需求、教學大綱和大學英語課程設置三者之間仍需進一步協(xié)調(diào),進行有機組合[3]。大學英語課程的設置應著重考慮學生的實際需求和自身條件進行合理調(diào)整。
常規(guī)教學與效果分析主要以統(tǒng)計數(shù)據(jù)和定性分析為主,缺乏對非數(shù)值數(shù)據(jù)的支持[4]。從學生角度出發(fā)的課程需求數(shù)據(jù)的獲取大多停留在主觀評價部分。其中,學生評教是學生表達對課程需求的一項重要數(shù)據(jù),屬于個人主觀評價,同時又受到同學間評價的影響,即易受情緒支配;其他需求數(shù)據(jù)可通過教師座談等數(shù)據(jù)獲得,但也存在主觀評價問題[5]。將評教數(shù)據(jù)轉(zhuǎn)化為可量化的有效數(shù)據(jù)就需要考慮數(shù)據(jù)轉(zhuǎn)移效率的問題[4],而這種效率難以度量。大數(shù)據(jù)環(huán)境中有更多數(shù)據(jù)可用于教學效果的評價[6]以及課程建設,但已有研究中大多以大綱式框架建設方案為主,缺少可直接借鑒的模型和方法。而其他評價模型,如LDA可對評價類文本數(shù)據(jù)進行較好的處理[6],但缺少教學相關的多因素相關性分析研究。
由于教學和需求是多種因素相互作用的結果,教學研究中也存在不少使用相關性分析的研究[7?8],但該類研究仍以定性相關性分析為主,以簡單統(tǒng)計為輔,缺乏數(shù)據(jù)和量化指標支持。
為揭示現(xiàn)有英語課程與學生實際需求之間的關聯(lián),為后續(xù)高校課程設置提供直觀量化的依據(jù),結合已有研究和數(shù)據(jù)分析,本文基于聚類分析方法提出了因素相關性課程需求量化分析模型,以此對影響課程效果的四類主要因素進行定量研究。首先,本文收集了湖北某高校大學生對英語相關課程的評價數(shù)據(jù)1 500條;然后,對數(shù)據(jù)集進行預處理,重點進行了評價數(shù)據(jù)屬性的有效性分析與過濾;隨后,將數(shù)據(jù)集按4∶1拆分為訓練集和測試集。其中,將學生對課程的需求程度標定為“自主型”“友好型”“自驅(qū)型”“被動型”四種類型,以提高模型訓練的準確性,并便于對測試結果進行評價。最后,通過K?means聚類分析算法進行了測試,從而驗證了“成績與聽課率”關系在英語課程需求中具有最高的相關性,為高校大學英語課程改革提供量化分析數(shù)據(jù)和指標依據(jù)。
1? 樣本數(shù)據(jù)集
1.1? 數(shù)據(jù)獲取
本文以湖北某高校教務系統(tǒng)歷史運行數(shù)據(jù)作為研究基礎,包含英語各專業(yè)與課程成績、評教成績、到課/聽課率、學生性別等。為便于后續(xù)測試,將調(diào)查的數(shù)據(jù)結果進行預處理,形成影響學生課程需求的5個因素屬性,分別為“性別”“評教”“成績”“聽課率”“考勤”,可得樣本集為:
[Ui=ui1,ui2,…,uik] (1)
式中:[i∈1,M],[M]描述集合大小;[uik]描述集合中第[i]個樣本[ui]的第[k]個屬性值。
1.2? 數(shù)據(jù)預處理
原始數(shù)據(jù)中,“性別”、“課程類型”與“分析類型”均屬于文本類型,不能被多因子分析方法[9]直接使用。因此,本文選用One hot編碼[10]將文本數(shù)據(jù)轉(zhuǎn)換成數(shù)值型進行表示如表1所示。
本文采用人工標定方法對需求類型進行標定,形成標定的數(shù)據(jù)集,來更好地評價分析模型[5],然后再將其分為訓練集和測試集。訓練集數(shù)據(jù)屬性與范例數(shù)據(jù)見表2。
為了解數(shù)據(jù)集中課程的分布情況,按“自主型”“友好型”“自驅(qū)型”“被動型”四種需求類型分別進行了統(tǒng)計。統(tǒng)計結果如圖1所示。
由此可見,訓練集中屬性值“成績”與“聽課率”,“評教”與“成績”對課程需求類型相關性最高。因此,在對測試集進行聚類分析時,主要根據(jù)該關系組開展測試與分析工作。
3? 聚類分析與結果測試
在上述數(shù)據(jù)預處理的基礎上,將原始數(shù)據(jù)集中的20%數(shù)據(jù)采用K?means算法進行聚類測試。
3.1? K?means算法測試
1) 將收集好的大學英語需求特征數(shù)據(jù)值轉(zhuǎn)化為向量預先保存到文本中。
2) 構建隨機質(zhì)心[O](中心點),并設置[k=4],即將數(shù)據(jù)集分為“自主型”“自驅(qū)型”“友好型”“被動型”4個簇。隨機質(zhì)心[O]在整個數(shù)據(jù)集的邊界之內(nèi),這可以通過找到數(shù)據(jù)集每一維的最小和最大值來完成,然后生成0~1.0之間的隨機數(shù)并通過取值范圍和最小值,以便確保隨機點在數(shù)據(jù)的邊界之內(nèi)。
3) 基于上述初始化過程,構建K?means算法。創(chuàng)建[K]個質(zhì)心,然后將每個點分配到最近的質(zhì)心,再重新計算質(zhì)心。這個過程重復數(shù)次,直到數(shù)據(jù)點的簇分配結果不再改變位置。返回類質(zhì)心與點分配結果。停止條件為沒有需要分配的任務到不同的簇,質(zhì)心不再發(fā)生變化,或者均方誤差[E]的值下降幅度最小。[E]的計算公式為:
4? 結? 論
針對當前課程設置與學生實際需要間的不匹配發(fā)展問題,探究如何將課程設置中的多種因素及其相互關系數(shù)值化,在此基礎上展開多因素相關性量化分析,從多相關因素中找到影響最強烈,即與“學生學習需求”相關性最高的因素。以此優(yōu)化并設計新的教學目標和教學方法?;谶@一目標,本文從學生日常教學運行數(shù)據(jù)源著手,將學生對課程的需求進行分類,并將影響分類的數(shù)據(jù)屬性進行有效性分析,最后利用聚類分析中常用的K?means算法加以驗證。本文測試數(shù)據(jù)是教務管理系統(tǒng)中的歷史數(shù)據(jù),更多條件下的課程需求研究并未包含在本研究中,這也是未來具有潛在研究價值的內(nèi)容。
參考文獻
[1] 郝強,邵榮,閆旭.大學英語課程轉(zhuǎn)型發(fā)展的思考[J].運城學院學報,2019(3):64?68.
HAO Qiang, SHAO Rong, YAN Xu. Thoughts on the transformation and development of college English courses [J]. Journal of Yuncheng University, 2019(3): 64?68.
[2] 董艷云.培養(yǎng)思辨能力構建英語素質(zhì)教育模式[N].中國社會科學報,2017?01?12(8).
DONG Yanyun. Cultivate speculative ability and construct English q uality education model [N]. Chinese Social Sciences Today, 2017?01?12(8).
[3] 張瓊.培養(yǎng)應用型人才背景下民辦本科高校大學英語教學策略研究[N].科學導報,2017?03?24(C2).
ZHANG Qiong. Research on college English teaching strategies in private undergraduate colleges under the background of cultivating applied talents [N]. Scientific guide, 2017?03?24(C2).
[4] 張?zhí)m蘭.大學生在慕課中學習態(tài)度與學習成績的研究[D].哈爾濱:哈爾濱師范大學,2019.
ZHANG Lanlan. Study on the attitude and academic achievement of college students in the MOOC [D]. Harbin: Harbin Normal University, 2019.
[5] 王儉,修國義,過仕明.基于知識特征的在線評論知識轉(zhuǎn)移效率測度研究[J].情報科學,2019,37(7):146?150.
WANG Jian, XIU Guoyi, GUO Shiming. The measurement of knowledge transfer efficiency of online reviews based on knowledge features [J]. Information science, 2019, 37(7): 146?150.
[6] 鐘明玲,周曉玲.大數(shù)據(jù)環(huán)境下大學英語課程有效評估模式的構建[J].英語廣場,2019(8):114?115.
ZHONG Mingling, ZHOU Xiaoling. The construction of effective evaluation mode of college English course in big data environment [J]. English square, 2019(8): 114?115.
[7] 徐朝軍,房小敏.LDA模型在Web教育資源語義標注中的應用研究[J].高等理科教育,2019(3):61?67.
XU Chaojun,F(xiàn)ANG Xiaomin. Application of LDA in semantic tagging of web educational resource [J]. Higher education of science, 2019(3): 61?67.
[8] 高素艷.大學英語及其與通識教育的相關性分析[J].科教導刊(上旬刊),2018(12):46?47.
GAO Suyan. College English and its relevance analysis with general education [J]. The guide of science & education(On the ten?day), 2018(12): 46?47.
[9] 余磊,梁永林,田永衍,等.中醫(yī)基礎理論課程過程性考核與成績的相關性分析[J].中醫(yī)教育,2018,37(4):47?49.
YU Lei, LIANG Yonglin, TIAN Yongyan, et al. Correlation between process assessment and achievement in course of basic theory of traditional Chinese medicine [J]. Education of chinese medicine, 2018, 37(4): 47?49.
[10] 芮立.基于多因子分析的無線傳感器網(wǎng)絡可靠性評估模型設計[J].現(xiàn)代電子技術,2019,42(12):156?160.
RUI Li. Design of reliability evaluation model based on multifactor analysis for wireless sensor network [J]. Modern electronics technique, 2019, 42(12): 156?160.
[11] RODRIGUEZ P, BAUTISTA M A, GONZALEZ J, et al. Beyond one?hot encoding: lower dimensional target embedding [J]. Image and vision computing, 2018, 75: 21?31.