孟慶祥 王帆 馮苑君 申力 盧冰 杜娟
摘? 要:高校教學(xué)質(zhì)量評(píng)估活動(dòng)開(kāi)展為廣大教師及時(shí)調(diào)整教學(xué)策略提供針對(duì)性建議,有助于提高教學(xué)質(zhì)量。但現(xiàn)行評(píng)估方法多為簡(jiǎn)單加權(quán)平均,人為給定指標(biāo)權(quán)重,常存在主觀性和片面性局限。針對(duì)上述現(xiàn)象,該文綜合學(xué)生、同行教師、督導(dǎo)員三方評(píng)價(jià)將教學(xué)質(zhì)量分為優(yōu)秀、良好、一般和較差4個(gè)等級(jí),并采用神經(jīng)網(wǎng)絡(luò)算法,建立基于卷積神經(jīng)網(wǎng)絡(luò)的教學(xué)質(zhì)量評(píng)估模型。該文首先研究現(xiàn)行教學(xué)質(zhì)量評(píng)估體系優(yōu)缺點(diǎn),判斷模型構(gòu)建可行性,提出基于深度學(xué)習(xí)的教學(xué)質(zhì)量評(píng)估模型構(gòu)建方法,然后代入現(xiàn)有教學(xué)評(píng)估數(shù)據(jù),比較所得結(jié)果與已知事實(shí)驗(yàn)證模型準(zhǔn)確性。結(jié)果證明,評(píng)估模型準(zhǔn)確性較高。該研究將有助于建立一個(gè)更加科學(xué)可靠的教學(xué)質(zhì)量評(píng)估標(biāo)準(zhǔn)體系。
關(guān)鍵詞:教學(xué)質(zhì)量;深度學(xué)習(xí);評(píng)估方法;CNN網(wǎng)絡(luò);評(píng)價(jià)體系
中圖分類號(hào):G642? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ? 文章編號(hào):2096-000X(2023)S1-0014-04
Abstract: The development of teaching quality assessment activities in colleges and universities can provide more targeted information for teachers to adjust teaching strategies in a timely manner and do college lecturers a favor to improve teaching quality. Nevertheless, the majority of the current evaluation methods are weighted average algorithms. The weights of each indicator are artificially given empirical values, which often have limitations of subjectivity and one-sidedness. In view of the above phenomenon, this paper not only comprehensively considers the course evaluations of students, peer teachers and supervisors to divide the teaching quality into four grades: excellent, good, average and inferior, but also uses neural network algorithms to establish a teaching quality evaluation model structure based on Convolutional Neural Networks (CNN).This paper studies the pros and cons of the current teaching quality evaluation system, judges the feasibility of building a CNN model, and proposes a construction method for the model of teaching quality evaluation based on deep learning. Subsequently, the data of existing teaching evaluation is substituted into the model for calculation and the obtained results are compared with known facts to verify the accuracy of the model. According to the result, the accuracy of the CNN evaluation model is high, which will help to establish a more scientific and reliable teaching quality evaluation standard system.
Keywords: teaching quality; deep learning; assessment method; CNN network; evaluation system
基金項(xiàng)目:湖北省科技廳省級(jí)基金項(xiàng)目“基于全天空成像儀和輻射傳輸模型的太陽(yáng)能短時(shí)預(yù)測(cè)方法研究”(2019CFB732);武漢大學(xué)遙感信息工程學(xué)院“三全育人”教改項(xiàng)目“疫情期間遙感大類卓越工程師人才培養(yǎng)改革”(YGJY202210);武漢大學(xué)遙感信息工程學(xué)院“三全育人”教改項(xiàng)目“探索‘教與學(xué)革命’背景下教師教學(xué)能力提升優(yōu)化及制度設(shè)計(jì)”(YGJY202214);武漢大學(xué)遙感信息工程學(xué)院“三全育人”教改項(xiàng)目“價(jià)值引領(lǐng)式的大學(xué)生競(jìng)賽科研創(chuàng)新育人模式改革路徑探索”(YGJY202114);武漢大學(xué)教改項(xiàng)目“學(xué)科競(jìng)賽與大創(chuàng)科研驅(qū)動(dòng)的遙感類綜合創(chuàng)新育人模式研究”(00030791)
第一作者簡(jiǎn)介:孟慶祥(1977-),男,漢族,內(nèi)蒙古烏蘭察布人,博士,講師。研究方向?yàn)檫b感科學(xué)與技術(shù)、深度學(xué)習(xí)、教學(xué)研究等。
目前,我國(guó)大多高校已建成由督導(dǎo)員、同行教師和教學(xué)學(xué)生評(píng)價(jià)共同組成的教學(xué)質(zhì)量評(píng)估體系,該體系主要由督導(dǎo)員評(píng)價(jià)指標(biāo)調(diào)查表、同行教師評(píng)價(jià)指標(biāo)調(diào)查表和學(xué)生評(píng)價(jià)指標(biāo)調(diào)查表構(gòu)成。相較于單方面由學(xué)生或督導(dǎo)員評(píng)價(jià)的手段,該體系更客觀,但其最終等級(jí)評(píng)估結(jié)果依賴于加權(quán)平均計(jì)算,且各權(quán)重乃人為給定經(jīng)驗(yàn)值,在可靠性上仍有欠缺[1]。此外,受多種不定量因素影響,現(xiàn)行評(píng)估方法還存在評(píng)分結(jié)果與測(cè)評(píng)結(jié)果聯(lián)系松散的問(wèn)題,難以直觀體現(xiàn)最終教學(xué)評(píng)價(jià)分?jǐn)?shù)代表的實(shí)際意義,對(duì)課程教學(xué)改進(jìn)的指導(dǎo)意義不強(qiáng)[2]。
傳統(tǒng)反向傳播(Back Propagation ,BP) 神經(jīng)網(wǎng)絡(luò)常常需要大量樣本進(jìn)行訓(xùn)練,計(jì)算量大,不利于推廣應(yīng)用[3]。而卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)作為一種特殊的深度前饋神經(jīng)網(wǎng)絡(luò)模型,與生物神經(jīng)網(wǎng)絡(luò)具有高度相似性。卷積網(wǎng)絡(luò)由大量獨(dú)立神經(jīng)元構(gòu)成二維平面,多個(gè)二維平面構(gòu)成單層神經(jīng)網(wǎng)絡(luò),單層神經(jīng)網(wǎng)絡(luò)相互連結(jié)構(gòu)成[4]。其特殊性主要體現(xiàn)在以下兩點(diǎn):一是神經(jīng)元之間采用非全連接,有效降低模型復(fù)雜度;二是相同層級(jí)中特殊神經(jīng)元的連接權(quán)重相同,減少權(quán)值數(shù)量[5]。同時(shí),CNN具備準(zhǔn)確度高、學(xué)習(xí)能力強(qiáng)、對(duì)噪聲神經(jīng)有較強(qiáng)的魯棒性和容錯(cuò)能力等特點(diǎn)[6]。最后,CNN模型還有一個(gè)獨(dú)具的優(yōu)點(diǎn),即廣泛適用性。搭建CNN模型的知識(shí)來(lái)源不是固定的歷史模型參數(shù),而是對(duì)有參考價(jià)值的評(píng)估樣本的學(xué)習(xí)結(jié)果,并基于習(xí)得模型分類規(guī)則進(jìn)行實(shí)例分析[7]。這樣的特點(diǎn)使得模型具有很強(qiáng)的時(shí)效性,只要收集到最新的評(píng)估樣本訓(xùn)練集,就能通過(guò)深度學(xué)習(xí)得到最新的、最適合的評(píng)估系統(tǒng),適用于當(dāng)前社會(huì)背景。
根據(jù)武漢大學(xué)2016年教學(xué)評(píng)估工作數(shù)據(jù),本研究基于CNN構(gòu)造教學(xué)質(zhì)量評(píng)估模型,通過(guò)學(xué)習(xí)樣本中學(xué)生、教師及督導(dǎo)員課程評(píng)價(jià)和綜合教學(xué)質(zhì)量的對(duì)應(yīng)關(guān)系,得到區(qū)分不同教學(xué)質(zhì)量的規(guī)則,直觀反映課程教學(xué)質(zhì)量,進(jìn)而形成一個(gè)科學(xué)可靠的教學(xué)質(zhì)量評(píng)估標(biāo)準(zhǔn)體系。
一? 基于CNN的教學(xué)質(zhì)量評(píng)估模型
(一)? 指標(biāo)體系的建立
指標(biāo)體系是進(jìn)行課堂教學(xué)評(píng)估的前提。為從不同角度評(píng)估某課程教學(xué)質(zhì)量,本研究評(píng)估指標(biāo)體系的構(gòu)建由學(xué)生、同行教師及督導(dǎo)員展開(kāi)。其中,學(xué)生是課堂內(nèi)容的第一接收者,故而學(xué)生評(píng)價(jià)是課程教學(xué)質(zhì)量評(píng)估必不可少的部分,但其評(píng)價(jià)側(cè)重于課堂信息的傳遞和課下溝通方式,難以覆蓋教學(xué)策略等專業(yè)方面;同行教師經(jīng)驗(yàn)豐富,對(duì)于課程體系和課程目標(biāo)本身有較透徹的理解,能夠?qū)虒W(xué)過(guò)程中老師使用了何種教學(xué)策略、該策略對(duì)學(xué)生理解課堂知識(shí)具有多大影響等方面作出專業(yè)評(píng)價(jià);督導(dǎo)員更專注于評(píng)價(jià)課堂教學(xué)控制,一般從一些硬性指標(biāo),如課堂的紀(jì)律、出勤率、課程成績(jī)等方面出發(fā)完成評(píng)價(jià)。
綜上,我們將教學(xué)質(zhì)量評(píng)估指標(biāo)細(xì)分為三級(jí)。
1)一級(jí)指標(biāo)為教學(xué)質(zhì)量綜合評(píng)估等級(jí),分為4級(jí):分別為1級(jí)(優(yōu)秀),2級(jí)(良好),3級(jí)(一般),4級(jí)(較差)。
2)二級(jí)指標(biāo)為學(xué)生、同行教師及督導(dǎo)員對(duì)課堂教學(xué)質(zhì)量的評(píng)估結(jié)果,分為4級(jí):分別為1級(jí)(優(yōu)秀),2級(jí)(良好),3級(jí)(一般),4級(jí)(較差)。
3)三級(jí)指標(biāo)為學(xué)生、同行教師及督導(dǎo)員評(píng)價(jià)表上的細(xì)分項(xiàng),分為3級(jí):分別為1級(jí)(優(yōu)秀),2級(jí)(一般),3級(jí)(較差)。
具體指標(biāo)體系見(jiàn)表1,同級(jí)指標(biāo)間相互獨(dú)立沒(méi)有聯(lián)系。而且,本研究制定該指標(biāo)體系時(shí)注重傳統(tǒng)評(píng)價(jià)數(shù)據(jù)的輸入便捷性,三級(jí)指標(biāo)與往常進(jìn)行課程教學(xué)質(zhì)量評(píng)價(jià)時(shí)數(shù)據(jù)收集的方式一致,便于我們通過(guò)CNN模型劃分教學(xué)質(zhì)量等級(jí)。
(二)? CNN分類器
綜合評(píng)價(jià)模型使用三類人物的評(píng)價(jià)指標(biāo)作為分類器的分類特征項(xiàng),建立CNN分類器以搭建教學(xué)質(zhì)量評(píng)估系統(tǒng)如圖1所示。首先由下層分類器確定二級(jí)指標(biāo)X、Y、Z值,然后再基于上層分類器得到一級(jí)指標(biāo)值。其中二級(jí)指標(biāo)能夠幫助課程教師快速鎖定自己在哪個(gè)教學(xué)環(huán)節(jié)存在不足,更高效地進(jìn)行教學(xué)計(jì)劃調(diào)整:如果學(xué)生評(píng)價(jià)對(duì)應(yīng)的二級(jí)指標(biāo)X值較低,則主要需要調(diào)整課堂上的信息傳遞方式或課下與學(xué)生的溝通方法;如果同行教師的評(píng)價(jià)等級(jí)Y較低,則應(yīng)考慮授課時(shí)教學(xué)策略運(yùn)用是否存在不完善問(wèn)題,提高備課能力;如果督導(dǎo)員評(píng)價(jià)等級(jí)Z較低,則應(yīng)關(guān)注課堂紀(jì)律管理、給分是否合理等方面。
(三)? 訓(xùn)練樣本的建立
基于CNN分類器的教學(xué)質(zhì)量評(píng)估模型的建立需要考慮兩個(gè)問(wèn)題:一是確定網(wǎng)絡(luò)結(jié)構(gòu);二是學(xué)習(xí)屬性變量的條件概率分布及確定類的先驗(yàn)概率。因設(shè)計(jì)教學(xué)質(zhì)量評(píng)估指標(biāo)時(shí)已考慮屬性變量間的獨(dú)立性,故不再進(jìn)行結(jié)構(gòu)學(xué)習(xí),只需對(duì)屬性類條件概率進(jìn)行估計(jì)。
本文中選取的學(xué)生評(píng)價(jià)表、同行教師評(píng)價(jià)表和督導(dǎo)員評(píng)價(jià)表,以及教學(xué)質(zhì)量評(píng)估等級(jí)數(shù)據(jù)均來(lái)自武漢大學(xué)2016年教學(xué)評(píng)估工作。
使用CNN分類器進(jìn)行等級(jí)分類的前提是利用部分已有分類結(jié)果的樣本進(jìn)行先驗(yàn)概率統(tǒng)計(jì),CNN分類器的準(zhǔn)確度和樣本空間大小有關(guān),樣本空間越大其準(zhǔn)確性越強(qiáng)。因此,本研究從已有學(xué)生、同行教師及督導(dǎo)員的打分結(jié)果中隨機(jī)選出500份作為樣本,樣本的一級(jí)指標(biāo)和二級(jí)指標(biāo)已知。使用CNN模型進(jìn)行機(jī)器學(xué)習(xí),從已有的樣本中總結(jié)得出教學(xué)質(zhì)量等級(jí)劃分規(guī)則,利用計(jì)算機(jī)習(xí)得的分類規(guī)則對(duì)實(shí)例進(jìn)行教學(xué)質(zhì)量評(píng)估。這里需要注意的是,隨機(jī)選中的500個(gè)樣本不需要全部作為訓(xùn)練樣本集輸入到CNN分類器中,我們?cè)趯?shí)驗(yàn)中隨機(jī)取出400個(gè)樣本作為訓(xùn)練集用于擬合模型、調(diào)整參數(shù),剩余100個(gè)樣本作為驗(yàn)證分類器正確性的驗(yàn)證樣本集,以保證所得CNN分類器準(zhǔn)確性在應(yīng)用前已被檢驗(yàn)。
二? 實(shí)例分析
使用武漢大學(xué)2016年教學(xué)評(píng)估工作中提取出的樣本生成CNN分類器,進(jìn)行神經(jīng)網(wǎng)絡(luò)樣本計(jì)算機(jī)學(xué)習(xí)后,進(jìn)行實(shí)例處理,取得結(jié)果見(jiàn)表2。
隨后,對(duì)未有綜合評(píng)價(jià)結(jié)果的10 000個(gè)課程進(jìn)行教學(xué)質(zhì)量評(píng)估。通過(guò)問(wèn)卷調(diào)查和網(wǎng)上評(píng)價(jià)系統(tǒng)等渠道,我們收集了上述課程的三級(jí)指標(biāo)。使用CNN分類器確定二級(jí)指標(biāo),并將二級(jí)指標(biāo)作為新的屬性特征值輸入得到一級(jí)指標(biāo),即綜合教學(xué)質(zhì)量等級(jí)。結(jié)果如圖2所示,其中1級(jí)課程占總課程數(shù)的5.32%,2級(jí)課程占總課程數(shù)的27.42%,3級(jí)課程占總課程數(shù)的60.77%,4級(jí)課程占總課程數(shù)的6.49%。
將評(píng)價(jià)結(jié)果與現(xiàn)實(shí)情況進(jìn)行對(duì)比,可以發(fā)現(xiàn):1級(jí)課程多為學(xué)生評(píng)選出的“最受學(xué)生喜愛(ài)課程”或被評(píng)為“武漢大學(xué)精品課程”;4級(jí)課程多為新開(kāi)課程,任教老師的教學(xué)策略等有待改善。這一結(jié)果與現(xiàn)實(shí)的相互印證,代表本研究通過(guò)學(xué)習(xí)樣本得到的基于CNN的教學(xué)質(zhì)量評(píng)估模型能有效地、高可用地協(xié)助劃分課程等級(jí),進(jìn)而幫助課程教師針對(duì)性地調(diào)整教學(xué)方法。
而且,通過(guò)多次實(shí)驗(yàn)并總結(jié)分析所得結(jié)果,團(tuán)隊(duì)證明:CNN的分類準(zhǔn)確性與提供的特征屬性數(shù)成反比,若跳過(guò)二級(jí)指標(biāo)的生成環(huán)節(jié),將一級(jí)指標(biāo)及三級(jí)指標(biāo)作為分類的特征屬性集合作為樣本輸入,所得模型教學(xué)質(zhì)量等級(jí)劃分誤差明顯增大。因此,本研究采用了二級(jí)指標(biāo),更好地規(guī)避了因特征類別數(shù)過(guò)多而造成誤差呈指數(shù)增長(zhǎng)的問(wèn)題,為教學(xué)質(zhì)量評(píng)估活動(dòng)帶來(lái)了更高的準(zhǔn)確性和實(shí)用性。
最后,通過(guò)選取特定三級(jí)指標(biāo)項(xiàng)并組合,本模型能夠研究不同課程的附加價(jià)值。但應(yīng)注意樣本價(jià)值的確定需要研究人員對(duì)于課程內(nèi)容進(jìn)行深入研究,而樣本集中的級(jí)別定義亦必須相對(duì)準(zhǔn)確,如此才能保證最后得到的分類器進(jìn)行等級(jí)劃分所得結(jié)果是可解釋的、有研究?jī)r(jià)值的。以課程對(duì)于高校教育的科研意義為例。從表1中抽出與課程科研價(jià)值密切相關(guān)的X14,X18,Y6,Y12,Z2,Z3六個(gè)指標(biāo),從課內(nèi)學(xué)生論文發(fā)表數(shù)、參與項(xiàng)目數(shù)、老師在該領(lǐng)域的科研成果情況等多個(gè)方面入手,評(píng)估該課程的科研價(jià)值等級(jí),共分為3級(jí):1級(jí)(優(yōu)秀),2級(jí)(良好),3級(jí)(普通)。使用樣本訓(xùn)練分類器并進(jìn)行實(shí)例分析,評(píng)估所選10門課程的科研價(jià)值,統(tǒng)計(jì)得到,1級(jí)科研價(jià)值課程占總數(shù)的6.72%,2級(jí)科研價(jià)值課程占總數(shù)的60.39%,3級(jí)科研價(jià)值課程占總數(shù)的32.89%。而在本科人才培養(yǎng)方案中,肩負(fù)科研培養(yǎng)重任的專業(yè)教育課程占53.57%。兩相對(duì)比發(fā)現(xiàn),目前高校具有很高科研價(jià)值的課程占比很少,大部分課程與科研有一般聯(lián)系或基本無(wú)聯(lián)系,具有較高科研價(jià)值的課程數(shù)目達(dá)不到預(yù)設(shè)目標(biāo),從而向?qū)W校、教師等提示教學(xué)現(xiàn)狀的紕漏之處,以促進(jìn)新的教學(xué)策略的制定,進(jìn)而推動(dòng)高??蒲邪l(fā)展。
三? 結(jié)束語(yǔ)
利用本模型進(jìn)行課程教學(xué)質(zhì)量評(píng)估,對(duì)比實(shí)際與所得的綜合教學(xué)質(zhì)量等級(jí)和二級(jí)指標(biāo)值,發(fā)現(xiàn)模型能夠較準(zhǔn)確地反映課程真實(shí)情況,并能夠?qū)φn程的附加價(jià)值進(jìn)行評(píng)價(jià)。CNN不但有嚴(yán)格的數(shù)學(xué)基礎(chǔ),還具有完備的語(yǔ)義表達(dá)能力,充分利用專家知識(shí)和數(shù)據(jù)信息,具有很強(qiáng)的學(xué)習(xí)、推理能力,能夠比較好地利用先驗(yàn)知識(shí)。但由于CNN模型本身的原理性缺陷,當(dāng)前文章涉及的分類器存在一定的預(yù)測(cè)和分類誤差。CNN模型的訓(xùn)練樣本集的確定也需要研究小組花費(fèi)較多精力收集樣本課程相關(guān)消息,權(quán)衡多方面因素,盡可能得到一個(gè)有學(xué)習(xí)價(jià)值的訓(xùn)練樣本集。未來(lái),決策樹(shù)方法、層次分析方法等其他分類模型均將被列入考慮范疇中,以設(shè)計(jì)更優(yōu)的綜合教學(xué)質(zhì)量評(píng)估模型。
參考文獻(xiàn):
[1] 劉海燕,孫悅,關(guān)曉輝,等.基于ICA和CNN算法在教學(xué)質(zhì)量評(píng)價(jià)中應(yīng)用的探析[J].科技視界,2013(10):92.
[2] 祝智庭,彭紅超.深度學(xué)習(xí):智慧教育的核心支柱[J].中國(guó)教育學(xué)刊,2017(5):36-45.
[3] 徐欣,徐立鴻.教學(xué)質(zhì)量評(píng)價(jià)與預(yù)測(cè)的人工神經(jīng)網(wǎng)絡(luò)方法[J].統(tǒng)計(jì)與決策,2009(20):159-160.
[4] 周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2017,40(6):1229-1251.
[5] 曹玉東,劉海燕,賈旭,等.基于深度學(xué)習(xí)的圖像質(zhì)量評(píng)價(jià)方法綜述[J].計(jì)算機(jī)工程與應(yīng)用,2021,57(23):27-36.
[6] 趙德安,吳任迪,劉曉洋,等.基于YOLO深度卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜背景下機(jī)器人采摘蘋果定位[J].農(nóng)業(yè)工程學(xué)報(bào),2019,35(3):164-173.
[7] 王良玉,張明林,祝洪濤,等.人工神經(jīng)網(wǎng)絡(luò)及其在地學(xué)中的應(yīng)用綜述[J].世界核地質(zhì)科學(xué),2021,38(1):15-26.