鐘 君,許志勇
(天津市教育招生考試院,天津300387)
在國(guó)家大力推進(jìn)義務(wù)教育均衡發(fā)展過(guò)程中,如何科學(xué)檢驗(yàn)義務(wù)教育均衡建設(shè)成果、評(píng)估義務(wù)教育均衡發(fā)展成效是一個(gè)現(xiàn)實(shí)而重要的問(wèn)題.這包含2個(gè)層面的內(nèi)容:(i)建立全面反映均衡發(fā)展內(nèi)涵的指標(biāo)體系;(ii)確立科學(xué)測(cè)算均衡發(fā)展程度的方法.國(guó)內(nèi)學(xué)者對(duì)此也開展了專門研究,如翟博等[1-3]從受教育機(jī)會(huì)、教育資源配置、教育過(guò)程和教育結(jié)果4個(gè)方面建立了評(píng)估指標(biāo),并主要采用了差異系數(shù)來(lái)測(cè)算教育均衡發(fā)展程度;傅祿建等[4]從資源配置、教育過(guò)程和辦學(xué)質(zhì)量3個(gè)方面構(gòu)建了評(píng)估指標(biāo),并專門采用了基尼系數(shù)來(lái)研究教育均衡發(fā)展程度.此外,國(guó)家《縣域義務(wù)教育均衡發(fā)展督導(dǎo)評(píng)估暫行辦法》也采用了差異系數(shù)來(lái)評(píng)估縣域內(nèi)中小學(xué)校際均衡情況.
評(píng)估義務(wù)教育均衡發(fā)展程度,無(wú)論是采用差異系數(shù)法還是基尼系數(shù)法,均面臨統(tǒng)計(jì)分析中一個(gè)無(wú)法回避的問(wèn)題就是異常值的影響.這里的異常值不是指由于人工記錄、數(shù)據(jù)錄入等過(guò)失性錯(cuò)誤導(dǎo)致的數(shù)據(jù)錯(cuò)誤,而是指正確采集到的少數(shù)過(guò)大或過(guò)小的極端值.在我國(guó)現(xiàn)階段義務(wù)教育校際差異、城鄉(xiāng)差異和區(qū)域差異還比較明顯的情況下,異常值的存在無(wú)法避免.但是在“辦好每一所學(xué)校,教好每一個(gè)學(xué)生”的教育發(fā)展理念下,又必須關(guān)注每一所學(xué)校的數(shù)據(jù),不應(yīng)按照常規(guī)的統(tǒng)計(jì)分析程序清理掉異常值[5].因此,在對(duì)義務(wù)教育發(fā)展具有重要導(dǎo)向作用的均衡發(fā)展程度評(píng)估中,不同的統(tǒng)計(jì)測(cè)算方法對(duì)異常值的敏感程度如何、異常值對(duì)評(píng)估結(jié)果有何影響,都是值得思考,并應(yīng)審慎對(duì)待的問(wèn)題.
差異系數(shù)(coefficient of variation)是一種描述數(shù)據(jù)離散程度的相對(duì)差異量數(shù),指一組數(shù)據(jù)標(biāo)準(zhǔn)差與平均值的百分比,通常用CV表示.假設(shè)一組數(shù)據(jù)為 X1,X2,…,Xn,其平均值記為,標(biāo)準(zhǔn)差記為S,則這組數(shù)據(jù)差異系數(shù)的計(jì)算公式為
由于差異系數(shù)本身經(jīng)過(guò)“均值化”的無(wú)量綱化處理[6],不以原始數(shù)據(jù)的單位為單位,常用于2種測(cè)量單位不同或測(cè)量單位雖然相同但平均值相差很大的數(shù)據(jù)資料的差異情況的比較.差異系數(shù)大,表示數(shù)據(jù)分散范圍廣,參差不齊,差異較大;差異系數(shù)小,表示數(shù)據(jù)較為集中,變動(dòng)范圍小,差異較小.此外,差異系數(shù)的無(wú)量綱特性,特別適合多指標(biāo)綜合評(píng)價(jià),利用多個(gè)單項(xiàng)指標(biāo)評(píng)價(jià)結(jié)果合成綜合評(píng)價(jià)結(jié)果.
正因?yàn)椴町愊禂?shù)既能通過(guò)度量數(shù)據(jù)的離散程度來(lái)評(píng)價(jià)單項(xiàng)指標(biāo)的均衡程度,又適合將多個(gè)單項(xiàng)指標(biāo)評(píng)價(jià)結(jié)果合成綜合評(píng)價(jià)結(jié)果,因此在義務(wù)教育均衡發(fā)展程度評(píng)估中得以采用.
基尼系數(shù)(gini coefficient)是意大利經(jīng)濟(jì)學(xué)家基尼(Corrado Gini)于1922年以洛倫茲曲線(Lorenz curve)為基礎(chǔ)提出的,用于定量測(cè)定收入分配的差異程度.后來(lái)逐漸有學(xué)者將基尼系數(shù)從經(jīng)濟(jì)領(lǐng)域引入教育領(lǐng)域,開始用基尼系數(shù)分析研究教育問(wèn)題,如張長(zhǎng)征等[7]和孫百才[8]分別用基尼系數(shù)測(cè)算方法研究了我國(guó)改革開放后近二三十年的教育公平程度及教育平等問(wèn)題.
洛倫茲曲線是經(jīng)濟(jì)學(xué)中用以描述社會(huì)收入分配狀況的一種曲線,由累計(jì)的一定人口數(shù)量占總?cè)丝诘陌俜直扰c這部分人口所獲得的收入占總收入的百分比的對(duì)應(yīng)關(guān)系來(lái)表示,如圖1所示.
圖1 洛倫茲曲線與收入不平等
基尼系數(shù)由圖1中的絕對(duì)公平線和實(shí)際洛倫茲曲線圍成的面積A與絕對(duì)公平線和絕對(duì)不公平線圍成的面積A+B之比來(lái)測(cè)度.基尼系數(shù)通常用G表示,用公式表示為
基尼系數(shù)取值范圍為0~1,越接近0就表明收入分配越趨向平等,反之,收入分配越趨向不平等.基尼系數(shù)的計(jì)算方法很多,張建華[9]提出了一種簡(jiǎn)便易用的方法.假定全部人口平均分為n組,每組人口占全部人口的比例即為1/n,并假定以Wi表示從第1組直到第i組人口累計(jì)收入占全部人口總收入的百分比,則基尼系數(shù)的計(jì)算公式為
國(guó)際上通行的基尼系數(shù)計(jì)算,一般采用“五等份分組”法,即把全部人口平均分成5組,如圖1所示.此時(shí),基尼系數(shù)的計(jì)算公式為
以《義務(wù)教育均衡發(fā)展程度測(cè)評(píng):綜合教育基尼系數(shù)方法》中,全部39所小學(xué)生均計(jì)算機(jī)臺(tái)數(shù)為例[12],利用拉依達(dá)準(zhǔn)則,重復(fù)5遍剔除異常值的過(guò)程如表1所示.
表1 生均計(jì)算機(jī)臺(tái)數(shù)異常值剔除過(guò)程
由表1可以看出,隨著異常值的逐個(gè)剔除,差異系數(shù)和基尼系數(shù)也逐漸減小,尤其是差異系數(shù)的減小程度明顯高于基尼系數(shù).采用拉依達(dá)準(zhǔn)則剔除全部異常值后,差異系數(shù)比最初減小了約46%,基尼系數(shù)比最初減小了約35%.由此猜想,異常值對(duì)差異系數(shù)的影響程度高于基尼系數(shù).
在我國(guó)現(xiàn)實(shí)教育環(huán)境下,無(wú)論從教育資源配置,還是從辦學(xué)質(zhì)量來(lái)看,總體而言還是中等學(xué)校居多,待提高學(xué)校和優(yōu)質(zhì)學(xué)校相對(duì)少一些.鑒于此,為簡(jiǎn)便起見,這里假定評(píng)估指標(biāo)數(shù)據(jù)服從正態(tài)分布,并在此基礎(chǔ)上開展異常值對(duì)差異系數(shù)和基尼系數(shù)影響的模擬研究.
模擬研究的基本思路是:產(chǎn)生正態(tài)分布隨機(jī)數(shù),向其中摻加異常值,然后計(jì)算并分析差異系數(shù)和基尼系數(shù)的變化情況.
2.2.1 正態(tài)分布隨機(jī)數(shù)的產(chǎn)生 假定正態(tài)分布的均值為μ,標(biāo)準(zhǔn)差為σ.當(dāng)差異系數(shù)大于1/3時(shí),即σ/μ>1/3,此時(shí)μ-3σ<0,產(chǎn)生隨機(jī)數(shù)中出現(xiàn)負(fù)數(shù)的可能性就會(huì)增大,這與現(xiàn)實(shí)中各評(píng)估指標(biāo)一般不會(huì)出現(xiàn)負(fù)值的情形不符.因此,在模擬研究中考慮2種情況:(i)當(dāng)差異系數(shù)小于1/3時(shí),直接產(chǎn)生正態(tài)分布隨機(jī)數(shù),這里取μ=10,σ=2;(ii)當(dāng)差異系數(shù)大于1/3時(shí),產(chǎn)生大于零的截尾正態(tài)分布隨機(jī)數(shù),這里取μ=10,σ=5.鑒于現(xiàn)實(shí)中一個(gè)區(qū)域內(nèi)學(xué)校數(shù)量的有限性,這里分別考慮20所學(xué)校、50所學(xué)校、100所學(xué)校和200所學(xué)校的情況,并模擬產(chǎn)生相應(yīng)數(shù)量的隨機(jī)數(shù).
2.2.2 異常值的產(chǎn)生 由于現(xiàn)實(shí)中異常值僅是少數(shù),這里只在各種模擬情形下,逐步添加1~4個(gè)異常值進(jìn)行模擬研究.但為避免異常值對(duì)原始隨機(jī)樣本的過(guò)大影響,控制異常值的數(shù)量不超過(guò)隨機(jī)樣本總量的10%,即在20所學(xué)校的情況,最多添加2個(gè)異常值.
(i)在μ=10,σ=2產(chǎn)生正態(tài)分布隨機(jī)數(shù)的條件下,根據(jù)拉依達(dá)準(zhǔn)則在(μ-5σ,μ-3σ)區(qū)間隨機(jī)產(chǎn)生2個(gè)異常值,在(μ+3σ,μ+5σ)區(qū)間隨機(jī)產(chǎn)生2個(gè)異常值.按照(μ-5σ,μ-3σ)區(qū)間異常值產(chǎn)生的先后順序及(μ+3σ,μ+5σ)區(qū)間異常值產(chǎn)生的先后順序,將2個(gè)區(qū)間中的異常值逐個(gè)交替添加到正態(tài)分布隨機(jī)數(shù)中,即研究添加雙側(cè)異常值對(duì)差異系數(shù)和基尼系數(shù)的影響.
(ii)在μ=10,σ=5產(chǎn)生截尾正態(tài)分布隨機(jī)數(shù)的條件下,根據(jù)拉依達(dá)準(zhǔn)則,只在(μ+3σ,μ+5σ)區(qū)間隨機(jī)產(chǎn)生4個(gè)異常值,以避免在(μ-5σ,μ-3σ)區(qū)間上產(chǎn)生負(fù)值,并將4個(gè)異常值按產(chǎn)生的先后順序逐個(gè)添加到截尾正態(tài)分布隨機(jī)數(shù)中,即研究添加單側(cè)異常值對(duì)差異系數(shù)和基尼系數(shù)的影響.
每種情形經(jīng)過(guò)20次模擬運(yùn)算,計(jì)算得到差異系數(shù)和基尼系數(shù)的結(jié)果如表2所示.
表2 模擬計(jì)算結(jié)果
差異系數(shù)和基尼系數(shù)是義務(wù)教育均衡發(fā)展程度評(píng)估2種常用的測(cè)算方法,本文通過(guò)向正態(tài)分布數(shù)據(jù)加入雙側(cè)異常值,以及向截尾正態(tài)分布數(shù)據(jù)加入單側(cè)異常值進(jìn)行模擬,研究結(jié)果表明:異常值對(duì)差異系數(shù)的影響程度明顯高于基尼系數(shù).但由于統(tǒng)計(jì)分布的多樣性,若數(shù)據(jù)服從其他分布時(shí),異常值對(duì)差異系數(shù)和基尼系數(shù)的影響如何,可參照此方法進(jìn)一步研究.
此外,不同階段我國(guó)義務(wù)教育均衡發(fā)展建設(shè)的重點(diǎn)可能不同,應(yīng)根據(jù)不同測(cè)算方法的特點(diǎn),選擇適合評(píng)估目的的測(cè)算方法,以有利于達(dá)到促進(jìn)義務(wù)教育高水平均衡發(fā)展的目的.
[1]翟博.教育均衡發(fā)展:理論、指標(biāo)及測(cè)算方法[J].教育研究,2006(3):16-28.
[2]翟博.中國(guó)基礎(chǔ)教育均衡發(fā)展實(shí)證分析[J].教育研究,2007(7):22-30.
[3]翟博,孫百才.中國(guó)基礎(chǔ)教育均衡發(fā)展實(shí)證研究報(bào)告[J].教育研究,2012(5):22-30.
[4]傅祿建,湯林春.義務(wù)教育均衡發(fā)展程度測(cè)評(píng):綜合教育基尼系數(shù)方法[M].上海:華東師范大學(xué)出版社,2013:56-74.
[5]程開明.統(tǒng)計(jì)數(shù)據(jù)預(yù)處理的理論與方法述評(píng)[J].統(tǒng)計(jì)與信息論壇,2007,22(6):98-103.
[6]張衛(wèi)華,趙銘軍.指標(biāo)無(wú)量綱化方法對(duì)綜合評(píng)價(jià)結(jié)果可靠性的影響及其實(shí)證分析[J].統(tǒng)計(jì)與信息論壇,2005,20(3):33-36.
[7]張長(zhǎng)征,郇志堅(jiān),李懷祖.中國(guó)教育公平程度實(shí)證研究:1978—2004——基于教育基尼系數(shù)的測(cè)算與分析[J].清華大學(xué)教育研究,2006,27(2):10-14.
[8]孫百才.測(cè)度中國(guó)改革開放30年來(lái)的教育平等:基于教育基尼系數(shù)的實(shí)證分析[J].教育研究,2009(1):12-18.
[9]張建華.一種簡(jiǎn)便易用的基尼系數(shù)計(jì)算方法[J].山西農(nóng)業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2007,6(3):275-283.
[10]何平.剔除測(cè)量數(shù)據(jù)中異常值的若干方法[J].航空計(jì)測(cè)技術(shù),1995,15(1):19-22.
[11]張敏,袁輝.拉依達(dá)(PaǔTa)準(zhǔn)則與異常值剔除 [J].鄭州工業(yè)大學(xué)學(xué)報(bào),1997,18(1):84-88.
[12]傅祿建,湯林春.義務(wù)教育均衡發(fā)展程度測(cè)評(píng):綜合教育基尼系數(shù)方法[M].上海:華東師范大學(xué)出版社,2013:87-89.
江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2014年4期