任延青, 魚先鋒
(1.商丹高新學(xué)校,陜西,商洛 726000;2.商洛學(xué)院,數(shù)學(xué)與計算機(jī)應(yīng)用學(xué)院, 陜西,商洛 726000)
中小學(xué)教學(xué)質(zhì)量評價是師生教學(xué)的指揮棒,它直接決定師生教學(xué)行為。科學(xué)的教學(xué)質(zhì)量評價可以充分調(diào)動師生的積極性,促進(jìn)學(xué)生全面協(xié)調(diào)發(fā)展和教師教學(xué)水平提高,也可作為教師考核的重要依據(jù)。近年來,無論在理論還是實踐上,對課堂教學(xué)質(zhì)量評價都有了較大的進(jìn)展。2002年教育部《關(guān)于積極推進(jìn)中小學(xué)評價與考試制度改革的通知》和《基礎(chǔ)教育課程改革綱要(試行)》是學(xué)生綜合素質(zhì)評價的直接的政策依據(jù)[1]。2013年6月,教育部出臺《關(guān)于推進(jìn)中小學(xué)教育質(zhì)量綜合評價改革的意見》,規(guī)定包括學(xué)生品德發(fā)展水平、學(xué)業(yè)發(fā)展水平、身心發(fā)展水平、興趣特長養(yǎng)成、學(xué)業(yè)負(fù)擔(dān)狀況等五大方面20項關(guān)鍵指標(biāo)的中小學(xué)綜合素質(zhì)評價內(nèi)容,并明確了評價的程序[2]。2014年9月3日國務(wù)院《關(guān)于深化考試招生制度改革的實施意見》明確了綜合素質(zhì)評價與考試招生制度實行“硬掛鉤”。從上述政策的發(fā)布可見,我國對中小學(xué)生綜合素質(zhì)評價的目的和定位由不明確變明確[3]。教學(xué)質(zhì)量評價始終是學(xué)生綜合素質(zhì)評價的核心內(nèi)容之一。評價方法是評價體系的重要組成部分,在評價實施過程中扮演著重要的角色。如果說理念是評價的靈魂,決定著評價的性質(zhì)和取向,那么技術(shù)和方法就是評價的骨骼,支撐和架構(gòu)起評價的各相關(guān)因素,決定著評價完成的質(zhì)量[4]。所以近年來很多教師和學(xué)者在中小學(xué)課堂教學(xué)評價方面進(jìn)行了大量的研究工作[5-8]。但是,這些研究多重于定性分析缺少定量計算,多偏于手工評價沒有給出自動化實現(xiàn)模型與方法。現(xiàn)實評價中既有定性信息也有定量信息,人工評價費(fèi)時費(fèi)力且容易出錯。模糊評價可以有效地綜合定性與定量信息對評價對象進(jìn)行更自然、客觀的描述和評價[9-12]。作者在充分研習(xí)國家教育方針政策、教育評測標(biāo)準(zhǔn)的基礎(chǔ)上,結(jié)合自身多年從教經(jīng)驗,設(shè)計了中小學(xué)課堂教學(xué)評價指標(biāo)體系,基于模糊計算基本理論建立了中小學(xué)課堂教學(xué)質(zhì)量的模糊多級評價模型,結(jié)合定性與定量信息,自然、客觀地對課堂教學(xué)質(zhì)量進(jìn)行評價。結(jié)合實例做了課堂教學(xué)質(zhì)量評價,結(jié)果顯示該模型客觀、高效且自動化程度高。
先給出模糊綜合評價的一些基本概念包括模糊集、模糊評價矩陣、權(quán)重、評價算子等。在此基礎(chǔ)上對模糊多級評價形式化建模給出一個普適的評價模型。
定義1[13]設(shè)X為經(jīng)典集合,稱映射,A:X→[0,1]為X上的模糊集(Fuzzy set),?x∈X,A(x)稱為x對A的隸屬度,函數(shù)A也稱為模糊集A的隸屬函數(shù)。
在模糊評價過程中X是評價指標(biāo)之集,A是評價等級,?x∈X,A(x)是指標(biāo)x隸屬于評價等級A的可能性測度。隸屬度在[0,1]上取值,取值越大表明隸屬可能越大,即?x1,x2∈X,A(x1)≤A(x2)表示指標(biāo)x1對評價等級A的隸屬程度不超過指標(biāo)x2。一般地,隸屬度函數(shù)刻畫了評價對象對評價等級隸屬程度和隸屬程度相對大小2個屬性信息。
定義2 在一次模糊評價中,有m個評價指標(biāo),n個評價等級,則模糊評價矩陣為
(1)
其中,?rij,rij∈[0,1]表示第i個評價指標(biāo)對第j個評價等級的隸屬度。初級評價矩陣一般由原始評價數(shù)據(jù)模糊化得到。原始評價數(shù)據(jù)為
(2)
權(quán)重可以通過特爾斐法、層次分析法、二項系數(shù)法、變異系數(shù)法、主成分分析法等方法獲得[14]。
定義4 在一次模糊評價中,有m個評價指標(biāo)n個評價等級,則模糊評價矩陣為
(3)
各指標(biāo)對應(yīng)權(quán)重之集為W=(w1,w2,…,wm),記E′∈[0,1]m為此次評價結(jié)果,定義評價算子“*”如下。
(1)樂觀評價算子(max-product),
(4)
(2)悲觀評價算子(min-product),
(5)
(3)綜合評價算子(sum-product),
(6)
命題1 樂觀模糊評價算子(max-product)刻畫評價對象對每個評價等級最大隸屬程度,體現(xiàn)了最大隸屬原則;悲觀觀模糊評價算子(min-product)反映評價對象對每個評價等級最小隸屬程度,是一種保守考慮;綜合評價算子(sum-product)體現(xiàn)了評價的期望結(jié)果,符合概率統(tǒng)計規(guī)律。
沒有采用模糊計算理論的經(jīng)典模糊合成算子max-min運(yùn)算, 有兩方面考慮。首先,max-min運(yùn)算已被證明將權(quán)重(wi)和評價值(rij)取小的結(jié)果不合理[15],因為wi∧rij只是單方面權(quán)重wi或此級評價值rij,不能客觀反映出高一級評價結(jié)果。其次,權(quán)重wi較小時,對應(yīng)評價值rij的信息會被淹沒。權(quán)重與評價值的乘積(product)才體現(xiàn)了乘法原理和統(tǒng)計學(xué)基本規(guī)律。
下面對模糊多級評價模型進(jìn)行形式化建模。約定k表示評價等級數(shù)。g1,g2,…,gk∈N+,gi表示第i層每個指標(biāo)的指標(biāo)個數(shù)。
max{g1,g2,…,gk}=n為各層指標(biāo)個數(shù)最大值。?k∈N+,定義I(k)={1,2,…,k}則,
im∈I(gm),j∈I(n),m∈I(k)
(7)
序列i1,i2,…,ik∈N+k,gi標(biāo)識第im個m級指標(biāo)的位置。i1,i2,…,ikj∈N+k,gi標(biāo)識第im個m級指標(biāo)的第j個等級的測度(樣本分布數(shù)、隸屬度)的位置。用序列#gi,…,gk∈N+ω,標(biāo)記k,k-1,…,i+1層評價已經(jīng)做完正要做第i層評價。
定義5 一個模糊多級評價模型(Fuzzy Multilevel Evaluation Model,FMEM)E是一個六元組,E=(AP,R,D,W,δ,S),其中記號意義說明如下。
(1)AP={λ1,λ2,…,λn}表示評價等級之集,?λi∈AP是結(jié)構(gòu)體數(shù)據(jù),封裝了第i個評價等級的標(biāo)識及其對應(yīng)的特征區(qū)間或特征值。特征區(qū)間和特征值一般取百分制區(qū)間和百分制實數(shù),是去模糊化時對各等級打分要用的數(shù)據(jù)。
(2)原始數(shù)據(jù)矩陣D存儲記錄初級指標(biāo)的初始評價值,D=Dg1g2…gkn是一個k+1維的矩陣,?di1i2…ikj∈Dg1g2…gkn表示第im個m級指標(biāo)在第j個等級λj的樣本分布個數(shù)。
(4)權(quán)重矩陣W存儲記錄初級指標(biāo)的初始評價值,W=Wg1g2…gk是一個k維的矩陣,?wi1i2…ik∈Wg1g2…gk表示第im個m級指標(biāo)在m層評價時的權(quán)重。
(5)映射δ:W×R→R是模糊評價函數(shù),根據(jù)定義4關(guān)于模糊評價算子的定義有,
(8)
(6)得分矩陣S存儲記錄每一級指標(biāo)評價得分,S=Sg1g2…gk是一個k維的矩陣,則,?s#imgi+1…gk∈Sg1g2…gk,表示第im個m級指標(biāo)的得分。則有
(9)
其中,r#(imj)gm+1…gk表示第im個m級指標(biāo)對第j個等級的隸屬度,λj表示第j個等級的特征值。一般我們只計算一級評價的最終得分,其他等級不做計算。
定理1E=(AP,R,D,W,δ,S)為FMEM,若需要k級評價,每一級指標(biāo)個數(shù)不超過m,每個指標(biāo)的評價等級分n級,則做k級模糊多級評價的時間和空間復(fù)雜度都為o(mkn)。
定理1指出FMEM的復(fù)雜度隨評價等級數(shù)k呈指數(shù)增長,但現(xiàn)實中評價等級數(shù)一般較小,常見的k∈I(5)。所以FMEM是易于在計算機(jī)上實現(xiàn)的。
下面以中小學(xué)課堂教學(xué)評價為例,對FMEM進(jìn)行應(yīng)用。
量化評價的核心是指標(biāo)體系的建立和權(quán)重的確定。在充分研習(xí)國家教育方針政策、教育評測標(biāo)準(zhǔn)的基礎(chǔ)上,結(jié)合自身多年從教經(jīng)驗,設(shè)計了中小學(xué)課堂教學(xué)評價指標(biāo)體系如表1所示。表中第1列給出了“教學(xué)目標(biāo)”“教學(xué)內(nèi)容”“課堂結(jié)構(gòu)”“教學(xué)方法”“教學(xué)效果”“教學(xué)基本功”等6個一級評價指標(biāo),第2列對每個一級指標(biāo)細(xì)分共給出了“符合大綱、教材要求”等23個二級指標(biāo),并根據(jù)特爾菲法確定了每個指標(biāo)的權(quán)重。
表2截取了表1中部分,其中第2個一級指標(biāo)“教學(xué)內(nèi)容R2”對應(yīng)的第2個二級指標(biāo)“難易適度,容量適當(dāng)R22”,R223=1是沒有模糊化之前指標(biāo)R22分布在等級λ3=“及格”的樣本數(shù),其模糊化后實際存儲為0.1。w22=20%=0.2表示第2個一級指標(biāo)“教學(xué)內(nèi)容R2”對應(yīng)的第2個二級指標(biāo)“難易適度,容量適當(dāng)R22”在二級評價時所占權(quán)重為0.2。
表2 R存儲記錄各級指標(biāo)與評價值示例
作者將表1中的23個二級指標(biāo)列到表上,在學(xué)校期中教學(xué)檢查集體聽課時發(fā)給11名聽課教師,對作者所帶某門課程進(jìn)行評價。聽課教師只需要在各指標(biāo)對應(yīng)等級“優(yōu)秀、良好、中等、及格、差”下打“√”即可。收回10張打分表,統(tǒng)計結(jié)果為表1中最后5列所示各指標(biāo)對應(yīng)不同等級選擇人數(shù)。
表1 指標(biāo)體系與原始評價數(shù)據(jù)
對應(yīng)于定義5給出的FMEM模型對模型參數(shù)初始化,并用模型進(jìn)行課堂教學(xué)質(zhì)量的模糊多級評價。樣本數(shù)H=10,評價等級數(shù)k=2,評價等級劃分在表3中給出,
表3 各評價等級的特征值
AP={λ1,λ2,…,λ5}=
(優(yōu)秀/95,良好/85,一般/75,及格/65,差/50)
(10)
(12)
(14)
類似地可計算得到
(15)
依據(jù)定義5的(6)計算最終得分計算一級指標(biāo)評價得分為
(16)
類似算得,
S2=90.10,S3=87.20,S4=85.50,S5=83.44,S6=87.00
(17)
S2∈[90,100]=λ1說明該教師在所評價課堂上第2個一級指標(biāo)“教學(xué)內(nèi)容”評價為“優(yōu)秀”;S1,S3,S4,S5,S6∈[80,90)=λ2說明該教師在所評價課堂上除了第2個一級指標(biāo)外其余5個一級指標(biāo)評價均為“良好”。
一級評價計算如,
sum(E′)=1,所以,
(19)
依據(jù)定義5的(6)計算最終得分,
(20)
因為84.96∈λ2=[80,90),所以對該教師這堂課的評價結(jié)果是“良好”。
設(shè)計了中小學(xué)課堂教學(xué)評價指標(biāo)體系(表1)。定義了3個模糊評價算子(定義4),討論了評價算子的合理性(命題1)?;谀:嬎慊纠碚摻⒘酥行W(xué)課堂教學(xué)質(zhì)量的模糊多級評價模型(定義5),結(jié)合定性與定量信息,自然、客觀地對課堂教學(xué)質(zhì)量進(jìn)行評價。討論了用FMEM進(jìn)行模糊多級評價的復(fù)雜度,證明了該模型高效且自動化程度高(定理1)。結(jié)合實例進(jìn)行了課堂教學(xué)質(zhì)量評價,結(jié)果顯示所評價教師本節(jié)課教學(xué)質(zhì)量“良好”。
后續(xù)工作考慮:①模型加上時間維度,考慮被評價對象在時間變化上教學(xué)質(zhì)量的變化,以發(fā)展的眼光看待被評價對象;②課堂評價打分不限于同行教師,可考慮領(lǐng)導(dǎo)、學(xué)生打分,進(jìn)行3級綜合評價;③將FMEM應(yīng)用與其他背景,比如水質(zhì)評估、旅游景點(diǎn)滿意度評估、礦井安全評估等。