張 娟 許志勇
(天津市教育招生考試院,天津 300687)
教育評(píng)價(jià)事關(guān)教育發(fā)展方向,是教育辦學(xué)的“指揮棒”,其中教學(xué)質(zhì)量評(píng)價(jià)是教育評(píng)價(jià)的重要組成部分。實(shí)施教學(xué)質(zhì)量評(píng)價(jià),一是指導(dǎo)學(xué)校教育教學(xué)管理,對(duì)學(xué)校發(fā)展具有積極作用;二是調(diào)動(dòng)各學(xué)科教師的積極性,對(duì)教師團(tuán)隊(duì)發(fā)展具有督導(dǎo)作用;三是促進(jìn)學(xué)生綜合發(fā)展,對(duì)學(xué)生全面發(fā)展具有導(dǎo)向作用。
目前,許多學(xué)者和研究機(jī)構(gòu)都在積極探索教學(xué)質(zhì)量評(píng)價(jià),研究方向主要集中在三個(gè)方面:一是以政策落實(shí)為目標(biāo),探索教學(xué)質(zhì)量評(píng)價(jià)抓手。郭朝紅和王彬(2021)[1]基于國(guó)際經(jīng)驗(yàn)及國(guó)家對(duì)普通高中教育評(píng)價(jià)改革的政策目標(biāo)和要求,探討了普通高中教育評(píng)價(jià)的質(zhì)量標(biāo)準(zhǔn),提出了關(guān)注差異、強(qiáng)化過(guò)程,探索增值、聚焦進(jìn)步的建議,設(shè)計(jì)了數(shù)據(jù)驅(qū)動(dòng)、滾動(dòng)評(píng)估的評(píng)價(jià)思路。雷新勇(2020)[2]認(rèn)為教學(xué)評(píng)價(jià)要考慮學(xué)生的成績(jī)和綜合素質(zhì),綜合素質(zhì)評(píng)價(jià)是對(duì)學(xué)生在思想品德、身心健康、興趣特長(zhǎng)、社會(huì)實(shí)踐、勞動(dòng)實(shí)踐等方面的行為評(píng)價(jià)。二是以解決問(wèn)題為導(dǎo)向,探索教學(xué)質(zhì)量評(píng)價(jià)指標(biāo)維度。喬春江和張靜(2010)[3]探索構(gòu)建區(qū)域初中教學(xué)質(zhì)量評(píng)價(jià)體系,通過(guò)對(duì)學(xué)校教學(xué)實(shí)施綜合過(guò)程管理、會(huì)考和中考成績(jī)、學(xué)校報(bào)考率的量化考核來(lái)評(píng)價(jià)教學(xué)質(zhì)量。三是以客觀(guān)評(píng)價(jià)為依據(jù),探索教學(xué)質(zhì)量評(píng)價(jià)方法。在評(píng)價(jià)方法的探索上,裴少婧和蘇雅(2021)[4]構(gòu)建高校教學(xué)質(zhì)量評(píng)價(jià)指標(biāo)體系,并采用層次分析法對(duì)評(píng)價(jià)指標(biāo)進(jìn)行量化,使用模糊綜合評(píng)判法完善高校教師教學(xué)質(zhì)量的評(píng)價(jià)問(wèn)題。
綜上,可以看出傳統(tǒng)的學(xué)校教學(xué)質(zhì)量評(píng)價(jià)主要以學(xué)業(yè)成績(jī)和升學(xué)率為衡量標(biāo)準(zhǔn),忽視了學(xué)生綜合素質(zhì)和個(gè)性發(fā)展,也忽視了學(xué)校的努力,且計(jì)算方法傾向于分維度評(píng)價(jià),對(duì)綜合評(píng)價(jià)模型的探索研究較少。本文旨在結(jié)合灰色關(guān)聯(lián)理論和TOPSIS 方法構(gòu)建學(xué)校教學(xué)質(zhì)量評(píng)價(jià)模型,運(yùn)用相對(duì)距離衡量學(xué)校教學(xué)質(zhì)量。
灰色關(guān)聯(lián)分析模型是灰色系統(tǒng)理論的核心之一,其基本方法是觀(guān)測(cè)序列曲線(xiàn)的幾何形狀,并依據(jù)幾何形狀的相似度判斷事物的聯(lián)系程度。幾何形狀越接近,說(shuō)明序列之間的關(guān)聯(lián)度越大,反之越小。該方法自1982 年提出以來(lái),在各行各業(yè)得到廣泛應(yīng)用。
TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)法是一種逼近理想解排序法,常用于多目標(biāo)決策分析。TOPSIS 法對(duì)數(shù)據(jù)分析資料要求低,且易于理解計(jì)算,因此在各領(lǐng)域拓展迅速且應(yīng)用廣泛。TOPSIS 法的實(shí)質(zhì)是根據(jù)實(shí)際情況與理想狀態(tài)之間的距離衡量被測(cè)事物的發(fā)展水平。但是,僅以距離作為尺度只能反映數(shù)據(jù)之間的位置關(guān)系,無(wú)法體現(xiàn)數(shù)據(jù)的動(dòng)態(tài)變化。
基于此,將以上兩種方法結(jié)合使用,建立基于灰色關(guān)聯(lián)度法和TOPSIS 法的學(xué)校教學(xué)質(zhì)量評(píng)價(jià)模型,綜合灰色關(guān)聯(lián)程度和歐式距離判斷理想和現(xiàn)實(shí)狀態(tài)的接近程度,從而對(duì)學(xué)校教學(xué)質(zhì)量進(jìn)行評(píng)價(jià)。
由于各指標(biāo)的單位和含義不同,評(píng)價(jià)指標(biāo)通常具有不同的量綱。為了消除不同量綱對(duì)分析結(jié)果的影響,建模前對(duì)所有指標(biāo)進(jìn)行無(wú)量綱化處理。
其中,xij表示第i 個(gè)評(píng)價(jià)對(duì)象的第j 個(gè)指標(biāo),m 表示參與評(píng)價(jià)對(duì)象總數(shù),n 表示評(píng)價(jià)指標(biāo)總數(shù)。
對(duì)指標(biāo)進(jìn)行無(wú)量綱化處理的公式為:
接著,對(duì)“成本型”指標(biāo)進(jìn)行正向化處理,正向化的處理公式為:
其中,x'ij為標(biāo)準(zhǔn)化后的值,x'j為需處理變量的所屬列值,max(x'j)表示該指標(biāo)所屬列的最大值。
指標(biāo)權(quán)重的確定方法主要有兩種:一是主觀(guān)賦權(quán)法,主要有德?tīng)柗疲▽?zhuān)家調(diào)查)法、層次分析法(AHP)等,依賴(lài)于評(píng)價(jià)者的知識(shí)、經(jīng)驗(yàn)、直覺(jué)。二是客觀(guān)賦權(quán)法,主要有相關(guān)系數(shù)法、熵權(quán)法。主客觀(guān)賦權(quán)法各有優(yōu)劣,主觀(guān)賦權(quán)法帶有很強(qiáng)的主觀(guān)性,客觀(guān)賦權(quán)法僅依賴(lài)于數(shù)據(jù)信息,得出的結(jié)論可能與經(jīng)驗(yàn)相悖。因此,本文在確定指標(biāo)權(quán)重時(shí)使用主客觀(guān)賦權(quán)結(jié)合的方法。分析過(guò)程中,首先使用層次分析法、熵值法分別計(jì)算各指標(biāo)權(quán)重,隨后將兩者乘積結(jié)果歸一化處理作為最終權(quán)重。
1.層次分析法
層次分析法(AHP)是將復(fù)雜問(wèn)題分層,將其分解成多個(gè)目標(biāo),在此基礎(chǔ)上進(jìn)行定性和定量分析。其依據(jù)專(zhuān)家主觀(guān)判斷,將所有變量?jī)蓛苫ハ啾容^,采用相對(duì)重要性排序尺度,構(gòu)造重要性程度為1—9 的判斷矩陣,最終得出該方法確定的權(quán)重τ,構(gòu)造方法如表1所示。
表1 判斷矩陣
2.熵值法
熵值法(Entropy Method)是很常用的客觀(guān)賦權(quán)方法。其通過(guò)計(jì)算信息熵,得出變異系數(shù),評(píng)估變異程度,從而判斷指標(biāo)權(quán)重的大小。一般來(lái)講,信息熵越大,差異系數(shù)越大,則權(quán)重越小。權(quán)重計(jì)算步驟如下:首先使用公式(2)、公式(3)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和正向化處理,并確定比重;接著計(jì)算熵值ej=,并得出變異系數(shù)δj=1-ej;最后計(jì)算出客觀(guān)權(quán)重向量矩陣ν=(ν1,ν2,ν3,…,νj),1≤j≤n,其中νj=。
3.確定組合權(quán)重
通過(guò)上述方法分別得出主客觀(guān)權(quán)重后,將其進(jìn)行歸一化處理,得出最終權(quán)重向量矩陣ω =(ω1,ω2,ω3,…,ωj),1≤j≤n,其中。
其中,ρ 為分辨系數(shù),取值范圍為ρ ∈[0,1],通常取值為ρ=0.5。
根據(jù)灰色關(guān)聯(lián)度的相對(duì)貼近度大小,評(píng)價(jià)各學(xué)校的教學(xué)質(zhì)量。
高中教育包含普通高中、成人高中和職業(yè)高中教育。其上承初中義務(wù)教育階段教育,下啟以大學(xué)教育為主的高等教育。同時(shí),高中教育也承擔(dān)為社會(huì)培養(yǎng)合格人才的職責(zé)。因此,普通高中教育教學(xué)質(zhì)量不能僅僅以升學(xué)率考量,更應(yīng)注重學(xué)生的全面發(fā)展,承擔(dān)起提高全體公民素質(zhì)的責(zé)任,因此用單一的變量和標(biāo)準(zhǔn)來(lái)評(píng)價(jià)學(xué)校的教學(xué)質(zhì)量,不僅缺乏科學(xué)性、客觀(guān)性與公平性,還缺少對(duì)培養(yǎng)學(xué)生全面發(fā)展的引導(dǎo)。2020年《深化新時(shí)代教育評(píng)價(jià)改革總體方案》提出普通高中主要評(píng)價(jià)學(xué)生全面發(fā)展的培養(yǎng)情況。為了對(duì)每所學(xué)校做出更公平的評(píng)價(jià),需要構(gòu)建科學(xué)、合理的評(píng)價(jià)指標(biāo)體系。
教學(xué)質(zhì)量評(píng)價(jià)不僅需要計(jì)算學(xué)生的考試成績(jī)和升學(xué)率,還要衡量學(xué)生的成長(zhǎng)和綜合素質(zhì),因此可以將教學(xué)質(zhì)量評(píng)價(jià)劃分為學(xué)業(yè)考試成績(jī)和非學(xué)業(yè)問(wèn)卷調(diào)查兩個(gè)子系統(tǒng)。本文依據(jù)《關(guān)于推進(jìn)中小學(xué)教育質(zhì)量綜合評(píng)價(jià)改革的意見(jiàn)》,對(duì)學(xué)校教學(xué)質(zhì)量評(píng)價(jià)指標(biāo)進(jìn)行分析,建立了學(xué)業(yè)和非學(xué)業(yè)兩個(gè)一級(jí)指標(biāo),在兩個(gè)一級(jí)指標(biāo)下建立若干個(gè)二級(jí)指標(biāo)和三級(jí)指標(biāo)(見(jiàn)表2)。
表2 教學(xué)質(zhì)量評(píng)價(jià)指標(biāo)體系
1.數(shù)據(jù)來(lái)源
本文以某地區(qū)2020 年高考考生為研究對(duì)象進(jìn)行實(shí)證研究,剔除缺失的考生信息,共有6 所學(xué)校739名考生計(jì)入實(shí)證分析范圍。中、高考考試數(shù)據(jù)為高利害數(shù)據(jù),為了保證考試數(shù)據(jù)的真實(shí)性,文中涉及的中、高考考試數(shù)據(jù)來(lái)源于該地區(qū)教育考試院。非學(xué)業(yè)問(wèn)卷調(diào)查數(shù)據(jù)來(lái)源于該地區(qū)教育質(zhì)量評(píng)估監(jiān)測(cè)中心普通中小學(xué)辦學(xué)質(zhì)量綠色評(píng)價(jià)項(xiàng)目。本文分析時(shí)使用了該項(xiàng)目的部分問(wèn)卷數(shù)據(jù),使用前檢驗(yàn)問(wèn)卷數(shù)據(jù)的信度系數(shù)克隆巴赫α =0.862,效度系數(shù)KMO=0.895(sig≈0.00<0.05,說(shuō)明問(wèn)卷數(shù)據(jù)的信度和效度較高,評(píng)價(jià)結(jié)果具有穩(wěn)定性和可靠性)。
2.數(shù)據(jù)預(yù)處理
建模之前,數(shù)據(jù)預(yù)處理時(shí)將中、高考成績(jī)標(biāo)準(zhǔn)化,一方面可以解決中、高考成績(jī)滿(mǎn)分值不同的問(wèn)題,另一方面可以消除兩次考試難度不同帶來(lái)的分析難題。將中、高考成績(jī)均標(biāo)準(zhǔn)化為均值為70、方差為10 的標(biāo)準(zhǔn)成績(jī),處理后的成績(jī)數(shù)據(jù)均分布在0—100 之間,易于理解。
(1)學(xué)生中、高考成績(jī)處理
按照上述方法,將學(xué)生中考和高考成績(jī)作標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化計(jì)算公式如下:
(2)學(xué)生增值成績(jī)處理
學(xué)生增值成績(jī)主要衡量經(jīng)過(guò)三年學(xué)習(xí),學(xué)生是否獲得了學(xué)業(yè)進(jìn)步。長(zhǎng)期以來(lái),我國(guó)學(xué)者積極探索增值評(píng)價(jià),并取得很大進(jìn)展。探索過(guò)程中,多層線(xiàn)性模型、殘差模型、SGP 學(xué)生成長(zhǎng)模型等專(zhuān)業(yè)教育統(tǒng)計(jì)模型逐漸被熟知。但不同模型都有相似的衡量標(biāo)準(zhǔn),即通過(guò)計(jì)算得出學(xué)生“出口成績(jī)”(高考成績(jī))和“入口成績(jī)”(中考成績(jī))的差值,用以判斷學(xué)生學(xué)習(xí)成長(zhǎng)情況。本文將標(biāo)準(zhǔn)化高考成績(jī)與標(biāo)準(zhǔn)化中考成績(jī)的差值算作學(xué)生的增值成績(jī),同時(shí)將增值成績(jī)也做均值為70、方差為10 的標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化計(jì)算公式如下:
(3)非學(xué)業(yè)問(wèn)卷調(diào)查數(shù)據(jù)指標(biāo)處理
非學(xué)業(yè)問(wèn)卷調(diào)查數(shù)據(jù)主要以問(wèn)卷調(diào)查的方式收集,該項(xiàng)目的問(wèn)卷采用李克特五級(jí)量表形式設(shè)計(jì),題目選項(xiàng)按照符合程度排序,“非常不符合”“比較不符合”“一般”“比較符合”“非常符合”五級(jí)量表分別使用1—5 代替。處理問(wèn)卷數(shù)據(jù)時(shí),將其轉(zhuǎn)化為數(shù)值型數(shù)據(jù),并將每個(gè)二級(jí)指標(biāo)中的三級(jí)指標(biāo)作為該指標(biāo)的作答結(jié)果。
數(shù)據(jù)預(yù)處理完成后,使用公式(2)、(3)進(jìn)行指標(biāo)無(wú)量綱化和“成本型”指標(biāo)正向化處理。使用層次分析法確定主觀(guān)權(quán)重時(shí),構(gòu)造如表3 所示判斷矩陣,檢驗(yàn)系數(shù)CR=0.088<0.1,一致性檢驗(yàn)通過(guò)。同時(shí)使用熵值法確定客觀(guān)權(quán)重,最終得出最終權(quán)重矩陣,如表4 所示。確定權(quán)重后出按照上述建模步驟計(jì)算得出灰色關(guān)聯(lián)相對(duì)貼近度,分別計(jì)算各考生的綜合得分,評(píng)估各學(xué)校教學(xué)質(zhì)量。
表3 層次分析法判斷矩陣
表4 各指標(biāo)權(quán)重
使用上述建模方法,計(jì)算出每位考生的綜合得分及每所學(xué)校的綜合得分,如表5 所示。由表5 可知,該地區(qū)綜合評(píng)價(jià)得分為0.466,標(biāo)準(zhǔn)差為0.064。D、E兩所學(xué)校的平均分低于區(qū)域平均分,教學(xué)質(zhì)量較差;B、D、E 三所學(xué)校的標(biāo)準(zhǔn)差大于區(qū)域標(biāo)準(zhǔn)差,說(shuō)明該三所學(xué)??忌C合得分離散程度較大。使用每所學(xué)校學(xué)生綜合得分的最小值、25%分位數(shù)、中位數(shù)、75%分位數(shù)和最大值作箱線(xiàn)圖,如圖1 所示。從圖1 可以看出,除D 學(xué)校外,其他五所學(xué)校的箱體位置相當(dāng),說(shuō)明學(xué)校D的教學(xué)質(zhì)量較差。F 學(xué)校的箱體長(zhǎng)度小于其他學(xué)校,說(shuō)明F 學(xué)校離散程度更小,成績(jī)更加均衡。C 學(xué)校和E學(xué)校箱體位置和長(zhǎng)度相當(dāng),但E 學(xué)校成績(jī)上下限均大于C 學(xué)校,說(shuō)明C 學(xué)校較E 學(xué)校成績(jī)更加均衡。同理,A學(xué)校、B 學(xué)校成績(jī)離散程度相當(dāng),但A 學(xué)校成績(jī)比C學(xué)校均衡。結(jié)合表5 數(shù)據(jù)也可驗(yàn)證以上推論。
表5 不同學(xué)校綜合得分情況
圖1 不同學(xué)校綜合得分箱線(xiàn)圖
通過(guò)建立基于灰色關(guān)聯(lián)度法和TOPSIS 法的學(xué)校教學(xué)質(zhì)量評(píng)價(jià)模型,綜合各維度教學(xué)數(shù)據(jù)評(píng)價(jià)學(xué)校教學(xué)質(zhì)量,探索評(píng)價(jià)學(xué)校教學(xué)質(zhì)量的新方法。新評(píng)價(jià)方法的應(yīng)用為教學(xué)質(zhì)量評(píng)價(jià)提供了新思路,該方法在評(píng)價(jià)教學(xué)質(zhì)量過(guò)程中不僅計(jì)算了高考成績(jī)、增值成績(jī)等學(xué)業(yè)成績(jī),還引入學(xué)生非學(xué)業(yè)數(shù)據(jù),將各維度教學(xué)質(zhì)量評(píng)價(jià)結(jié)果進(jìn)行量化,一定程度上避免了傳統(tǒng)的“唯升學(xué)”“唯分?jǐn)?shù)”的評(píng)價(jià)方法,能促進(jìn)學(xué)校構(gòu)建體現(xiàn)學(xué)生全面發(fā)展的教學(xué)體系,為推進(jìn)“立德樹(shù)人”和“五育”全面發(fā)展教學(xué)目標(biāo)提供動(dòng)力。
此外,本文首次使用綜合評(píng)價(jià)法評(píng)價(jià)學(xué)校教學(xué)質(zhì)量,存在一定缺點(diǎn)和不足。第一,從表4 最終指標(biāo)權(quán)重?cái)?shù)值可以看出,“增值成績(jī)”“人格品質(zhì)”“科學(xué)素養(yǎng)”這三個(gè)指標(biāo)權(quán)重值較小,不符合傳統(tǒng)認(rèn)知。其原因可能有:①研究中雖然使用組合權(quán)重的方法確定最終權(quán)重,但實(shí)際計(jì)算的權(quán)重仍受數(shù)據(jù)客觀(guān)規(guī)律和客觀(guān)權(quán)重的影響。②“增值成績(jī)”的計(jì)算方法較為簡(jiǎn)單,“人格品質(zhì)”“科學(xué)素養(yǎng)”兩個(gè)指標(biāo)收集的原始數(shù)據(jù)可能存在瑕疵。第二,由于此類(lèi)評(píng)價(jià)方法的應(yīng)用需要數(shù)據(jù)積累,因此在實(shí)際分析和計(jì)算時(shí),缺少結(jié)果對(duì)比分析。以上缺點(diǎn)和不足,在接下來(lái)的研究中亟待解決。