張 磊
政策學(xué)認為,一項政策在頒布實施后,需要進行執(zhí)行過程與后果(結(jié)果)評估,其中,“后果評估(被認為)是教育政策評估中最重要的一種評估方式”[1]?!稑?biāo)準(zhǔn)》作為一項旨在促進學(xué)生加強體育鍛煉,監(jiān)測學(xué)生體質(zhì)健康狀況的學(xué)校體育政策,遺憾的是,當(dāng)前人們對《標(biāo)準(zhǔn)》的評估主要集中于過程評估,即對《標(biāo)準(zhǔn)》執(zhí)行過程中學(xué)校、教師、學(xué)生存在的執(zhí)行偏差問題以及《標(biāo)準(zhǔn)》本身存在的問題的揭示,對《標(biāo)準(zhǔn)》進行的后果評估還較為鮮見。本研究以教育政策學(xué)、教育生態(tài)學(xué)、政策群等相關(guān)理論與相關(guān)文獻作為論說支撐,一方面揭示《標(biāo)準(zhǔn)》進行后果評估可能遇到的障礙,認清其難度所在,為現(xiàn)實中《標(biāo)準(zhǔn)》的評估提供警示;另一方面借鑒政策評估的利益相關(guān)者模式對《標(biāo)準(zhǔn)》的執(zhí)行效果進行嘗試性后果評估,旨在對過去15 年的《標(biāo)準(zhǔn)》實施效果進行事實與價值判斷同時,為今后《標(biāo)準(zhǔn)》的再修訂提供參考。
姚萬祿等[2]較為全面的描述了政策后果評估所可能存在的困境,分別為“政策目標(biāo)障礙、因果關(guān)系障礙、政策資源障礙、政策成本障礙、評估信息障礙、評估方式障礙、評估主體障礙、評估客體障礙”等,從現(xiàn)實來看,這些障礙在不同時期的《標(biāo)準(zhǔn)》中都有不同程度的表現(xiàn)。
有時一項政策由于政策的修訂調(diào)整,使得政策在演變過程中政策目標(biāo)也在不斷變化,從而導(dǎo)致政策目標(biāo)的不確定,這給不同時期的政策評估帶來了障礙?!稑?biāo)準(zhǔn)》自2002 年實施伊始,經(jīng)歷了2007 年和2014 年的兩次修訂,三次《標(biāo)準(zhǔn)》的政策目標(biāo)見表1。
表1 2002版、2007版、2014版《標(biāo)準(zhǔn)》政策目標(biāo)的具體表述一覽表Table 1 The Specific Statements of Policy Objectives of Criterion in 2002,2007 and 2014 Editions
由表1 可見,不同時期的《標(biāo)準(zhǔn)》在政策目標(biāo)的表述上有些許不同,2014版《標(biāo)準(zhǔn)》在目標(biāo)表述上更加強調(diào)《標(biāo)準(zhǔn)》的激勵意義與效果,并且將更加全面的健康觀——由原來一維的體質(zhì)健康觀發(fā)展為身心二維健康觀——與全面發(fā)展寫入《標(biāo)準(zhǔn)》目標(biāo)中。但是,這種趨于全面的政策目標(biāo)卻給《標(biāo)準(zhǔn)》的后果評估帶來了政策目標(biāo)障礙——“矛盾與模糊的雙重性障礙”。首先,2002版《標(biāo)準(zhǔn)》中的“提高自我保健能力”因沒有相應(yīng)的評價指標(biāo),2014版《標(biāo)準(zhǔn)》也沒有針對心理健康而設(shè)置相應(yīng)的評價指標(biāo),這與《標(biāo)準(zhǔn)》提出的促進學(xué)生心理健康目標(biāo)相矛盾的;其次,“全面發(fā)展”這一目標(biāo)如何評估?“全面發(fā)展”本身的模糊性使得《標(biāo)準(zhǔn)》的價值取向缺乏指向性。
如前所述,不同時期《標(biāo)準(zhǔn)》的政策目標(biāo)在于“提高體質(zhì)健康水平”,從現(xiàn)實情況來看,學(xué)生體質(zhì)健康水平的提高是體育課、課余體育活動、飲食、作息時間以及《標(biāo)準(zhǔn)》的激勵作用在內(nèi)的眾多因素的綜合效應(yīng),若要從中分離出屬于不同時期《標(biāo)準(zhǔn)》政策獨立影響的那部分效果,難度之大可想而知。再從政策評估方法來看,無論是準(zhǔn)實驗法,還是專家判斷法,抑或是對象評定法,都難以從眾多因素帶來的綜合效應(yīng)中清晰準(zhǔn)確的分離出《標(biāo)準(zhǔn)》所帶來的準(zhǔn)確效果。如此一來,不同時期《標(biāo)準(zhǔn)》的結(jié)果評估都會面臨因果關(guān)系障礙,這實際上又反映了作為《標(biāo)準(zhǔn)》目標(biāo)達成影響因素的復(fù)合性這一事實。
“政策資源的障礙主要表現(xiàn)在兩個方面:政策混合和政策重疊”[2]。自2002 年以來,國家頒布的旨在促進學(xué)生積極參加體育鍛煉,提高體質(zhì)健康水平的政策文件達10余件(見表2)。
表2 2002年以來國家頒布的“促進學(xué)生參加體育鍛煉”的相關(guān)政策一覽表Table 2 The Relevant Policies on Promoting Students'Participa‐tion in Physical Exercise Promulgated by the State since 2002
由表2 可見,不同時期國家頒布的旨在促進學(xué)生體質(zhì)健康的相關(guān)政策可謂頻繁,政策主體眾多,而且每一項政策都需要學(xué)校投入一定的人力、物力、財力,如果說是這些政策之間能夠處于耦合狀態(tài),那么所帶來的問題也是不可避免的,即對不同時期的《標(biāo)準(zhǔn)》政策進行結(jié)果評估時必然因為眾多政策的混合與重疊帶來無法分離出《標(biāo)準(zhǔn)》獨立效果的問題。由此可見,學(xué)生體質(zhì)健康狀況并未因為如此多政策的頒布得到緩解,政策邊際效應(yīng)遞減問題不容忽視。
“這里的政策成本,包括兩個方面,一是政策運行成本,二是政策評估成本”[2]。政策運行成本不僅包括教育主管部門為政策運行所提供的經(jīng)費,還包括機會成本和時間成本,由于機會成本和時間成本本身在計算方面的難度,這給《標(biāo)準(zhǔn)》運行成本的計算帶來困難。由此,也使得通過“成本—收益分析方法”進行政策結(jié)果評估的難度增大。再看政策收益,教育政策的收益一般反映在受益者學(xué)生身上,就《標(biāo)準(zhǔn)》而言,學(xué)生體質(zhì)健康水平的提高由于受到多種因素的影響,使得《標(biāo)準(zhǔn)》政策目標(biāo)需要較長時間才能實現(xiàn),也就是體質(zhì)發(fā)展的滯后性,而且?guī)в胁淮_定性。如此,《標(biāo)準(zhǔn)》的政策成本障礙不會因為某個時期政策的頒布而不存在,而是表現(xiàn)為成本計算與收益滯后的評估難度。
政策評估需要真實全面的資料或數(shù)據(jù),但“評估信息失真、失效和信息量不足,是政策評估中經(jīng)常遇到的難題”[2],該問題在《標(biāo)準(zhǔn)》中的表現(xiàn)見表3。
由表3可知,在《標(biāo)準(zhǔn)》實施的不同時期,測試數(shù)據(jù)的真實性與有效性都有不同程度的反映,如此,基于上報數(shù)據(jù)對《標(biāo)準(zhǔn)》的評估便存在一定風(fēng)險。教育部2014 年印發(fā)了《學(xué)生體質(zhì)健康監(jiān)測評價辦法》、《中小學(xué)校體育工作評價辦法》以及《學(xué)校體育工作年度報告辦法》等三個文件(以下簡稱“三個文件”),要求加強對《標(biāo)準(zhǔn)》執(zhí)行、數(shù)據(jù)上報等工作的監(jiān)督,這在一定程度上有利于提高《標(biāo)準(zhǔn)》測試與數(shù)據(jù)上報的準(zhǔn)確性與時效性。但正如有研究者所指出的,這些文件“屬于原則性、指導(dǎo)性文件,易產(chǎn)生目標(biāo)異化”[3]??梢哉f,評估信息障礙問題在不同時期《標(biāo)準(zhǔn)》執(zhí)行中都有所表現(xiàn),并不會隨著相關(guān)文件的頒布而在短期內(nèi)消解。
表3 2002年以來反映《標(biāo)準(zhǔn)》信息失真、失效問題的相關(guān)文獻一覽表Table 3 The Relevant Literatures Reflecting the Information Dis‐tortion and Failure of Criterion since 2002
政策的評估方式有正式評估、內(nèi)部評估和委托評估,自然也就有非正式評估、外部評估和非委托評估。“不論哪種類型的評估,都是政策評估過程中行之有效的方法”[2]?!稑?biāo)準(zhǔn)》的兩次修訂可看作對《標(biāo)準(zhǔn)》評估之后的政策調(diào)整,從評估方式來看更多的是內(nèi)部評估,特別是“三個文件”的頒布,要求學(xué)校每年進行學(xué)校體育工作自評并上報教育行政部門,教育行政部門再進行復(fù)評,由此形成評估報告。但這種“內(nèi)部評估存在著評估主體‘既當(dāng)運動員又當(dāng)裁判’的情況,評估結(jié)論與評估主體自身的利益存在一定的相關(guān)性,因而他們就有可能在評估活動中故意隱瞞事實真相”[4]。毛振明[5]等更是將這種情況稱為誠信失效,《標(biāo)準(zhǔn)》陷入了“學(xué)校用自己測的數(shù)據(jù)讓領(lǐng)導(dǎo)評價自己的邏輯死結(jié)”。
面對內(nèi)部評估的問題,外部評估被給予了很高的期望,對此,“三個文件”中也提到了教育部可以依托第三方機構(gòu)設(shè)立全國學(xué)生體質(zhì)健康監(jiān)測評價研究機構(gòu),開展學(xué)生體質(zhì)健康監(jiān)測評價的監(jiān)測、結(jié)果公示等工作。“不過,由于接受委托的評估者有可能會出現(xiàn)為迎合委托人的意愿而得出傾向于迎合委托人利益的評估結(jié)論而有失公允”[4]。因此,由誰來進行《標(biāo)準(zhǔn)》評估的問題確實由于利益相關(guān)性的原因而處于兩難境地。
“從評估的主體上講,政策評估者可能由于形形色色的動機,有意識地夸大或縮小、掩蓋或曲解評估中的某些事實”[2]。評估方式的不同便決定了評估主體的差異,但無論是內(nèi)部評估,還是外部評估,各評估主體——學(xué)校、第三方等都會由于利益相關(guān)性問題而不可避免的在評估中表現(xiàn)出不真實或者不公平公正的問題。一個不爭的事實是,學(xué)校在進行《標(biāo)準(zhǔn)》自評時必然從學(xué)校利益出發(fā),掩蓋《標(biāo)準(zhǔn)》執(zhí)行中的某些關(guān)鍵問題,而僅僅上報一些表面性的或者客觀因素造成的問題。可以說,評估主體障礙是“趨利避害”這一本能在《標(biāo)準(zhǔn)》評估中的體現(xiàn),而且會存在于不同時期《標(biāo)準(zhǔn)》評估中。
“無論用什么名稱來表述政策評估的行為,它歸根到底都涉及對政策功績的評判。這種評判可能有利于與政策制定和執(zhí)行相關(guān)的人,也可能產(chǎn)生不利影響,從而危及他們的工作生活或社會評價?!咴u估的客體在不能支配評估的情況下,有可能對評估設(shè)置障礙”[2]??梢姡u估客體已不僅僅是政策本身,而是由于對政策的價值評判帶來的利害關(guān)系而衍生出的與政策相關(guān)的利益相關(guān)者——教師、學(xué)校、政府等,他們與政策本身一道成為評估的客體。就學(xué)校而言,學(xué)校提供不準(zhǔn)確的數(shù)據(jù)便是這一障礙表現(xiàn)。對于政府與第三方所表現(xiàn)出的障礙問題,李沖,史曙生指出[6],“政府相關(guān)職能部門迫于社會公共輿論的壓力,為了維護其社會公眾形象,對于青少年體質(zhì)健康促進政策評估有較強的敏感性抵制心理。同時,我國的外部評估機構(gòu)缺乏獨立性,沒有相應(yīng)的職權(quán),在實際工作中迫于政府的壓力,使得外部的評估機制不能正常運轉(zhuǎn),政策評估的效度與信度不高”。
評估自然需要評估標(biāo)準(zhǔn),但無論是以往的顧客導(dǎo)向模式、效果模式,經(jīng)濟模式,還是專業(yè)模式,評估標(biāo)準(zhǔn)在內(nèi)容上基本上涵蓋了進行“事實評估”所要求的政策效率、政策效益、政策目標(biāo)達成度、政策影響等方面,顯然,從這些方面對《標(biāo)準(zhǔn)》進行評估都會遇到前面所提到的評估障礙。近年來,“公民參與是當(dāng)今世界公共管理的共同趨勢”[7],瑞典學(xué)者韋唐(VEDUNG)所提出的政策評估的利益相關(guān)者模式正是符合了這一趨勢。該模式“從利益相關(guān)者角度出發(fā)評價政策的影響和合理性,傾聽被政策影響和可以影響政策的社會成員的不同意見,最大限度的回應(yīng)公民訴求,使得政策制定更加科學(xué)、民主,順應(yīng)了行政民主的政府管理新趨勢”[7]。由于該模式下各方利益相關(guān)者都可以表達各自的需求、利益,并且能從各利益相關(guān)者出發(fā)來審視政策的實施效果,因此,相較于其他模式,一方面“用這種模式來評價政策的合理性與公正性、政策執(zhí)行和服務(wù)提供的有效性,以及政策影響的廣泛性,優(yōu)勢更為明顯”[7],另一方面由于利益相關(guān)者的廣泛參與,可以達成不同利益相關(guān)者的互動與政策回應(yīng),從而可以“使政策更加順民心、合民意”[7]。因此,無論從國家社會發(fā)展的民主化、法制化進程,還是從政策評估本身的合理性與科學(xué)性角度來講,利益相關(guān)者模式都可以成為我們對《標(biāo)準(zhǔn)》進行評估的依據(jù)。
“利益相關(guān)者模式的評估程序包括:(1)利益相關(guān)者的定位;(2)利益相關(guān)者抽樣,確定評估樣本;(3)調(diào)查利益相關(guān)者的意見,內(nèi)容視評估對象而定;(4)對調(diào)查結(jié)果進行統(tǒng)計分析,作出評估結(jié)論”[7]。不同的政策,其利益相關(guān)者自然會有所不同?!霸诮逃呃嫦嚓P(guān)者當(dāng)中,最為核心的群體就是教師和學(xué)生”[8]。因此,這里也將《標(biāo)準(zhǔn)》的利益相關(guān)者確定為參與《標(biāo)準(zhǔn)》測試的教師與學(xué)生。
對于利益相關(guān)者的抽樣以及意見調(diào)查方面,由于已有來自全國不同地區(qū)關(guān)于《標(biāo)準(zhǔn)》執(zhí)行情況的大量文獻,其中不乏《標(biāo)準(zhǔn)》執(zhí)行過程中教師與學(xué)生的態(tài)度與行為調(diào)查,因此,可以以文獻調(diào)查為主。為了更為全面有效的對《標(biāo)準(zhǔn)》加以評估,我們綜合借鑒了政策評估的“目標(biāo)標(biāo)準(zhǔn)、效率標(biāo)準(zhǔn)、政策回應(yīng)度”等相關(guān)標(biāo)準(zhǔn),以描述性評估為主,主要選擇了教師與學(xué)生對于《標(biāo)準(zhǔn)》的認知度、認同度信息——以此評價《標(biāo)準(zhǔn)》的政策目標(biāo)效果(有效性),教師與學(xué)生在《標(biāo)準(zhǔn)》執(zhí)行過程中的忠誠度信息——以此評價《標(biāo)準(zhǔn)》的政策效率(有效率),教師與學(xué)生的意見、問題在《標(biāo)準(zhǔn)》執(zhí)行、修訂中的回應(yīng)度信息——以此評價《標(biāo)準(zhǔn)》的政策公平性與民主性問題。
2.3.1 《標(biāo)準(zhǔn)》的認知度與認同度不高,有效性有限 一項政策的順利實施,首先要取得利益相關(guān)者的廣泛認知與認同,因此,政策在利益相關(guān)者那里的認知與認同情況便是政策評估的重要內(nèi)容,表4 所呈現(xiàn)的便是《標(biāo)準(zhǔn)》自2002年頒布以來教師與學(xué)生的認知情況。
由表4可知,在《標(biāo)準(zhǔn)》實施的不同時期,作為利益相關(guān)者的教師與學(xué)生,對《標(biāo)準(zhǔn)》的認知程度與認同度均表現(xiàn)的不高。盡管《標(biāo)準(zhǔn)》還出臺了“評獎評優(yōu)、不及格肄業(yè)處理”等獎懲措施,但從現(xiàn)實情況來看,這些“一刀切”式的措施都因為前面提到的評估主體障礙或評估實施障礙等問題,而未能真正觸發(fā)學(xué)生的體育鍛煉動機。因此,如何通過差異化的外部激勵措施真正激發(fā)學(xué)生的內(nèi)在體育鍛煉動機是今后《標(biāo)準(zhǔn)》修訂時需要著重考慮的。
表4 《標(biāo)準(zhǔn)》不同時期“認知度與認同度不高,有效性有限”問題具體表現(xiàn)一覽表Table 4 The Specific Manifestations of Low Recognition and Ac‐ceptance and Limited Effectiveness in Different Periods of Criterion
2.3.2 《標(biāo)準(zhǔn)》的執(zhí)行忠誠度不高,政策效率有待完善 教育政策評估中的效率評價原本“有兩種基本評估形式:一是單位成本所能產(chǎn)生的最大價值;二是既定目標(biāo)所需要的最小成本”[9],當(dāng)然,通過投入與產(chǎn)出的比較是對政策效率最直接的體現(xiàn)。但是,在無法獲取投入與產(chǎn)出準(zhǔn)確數(shù)據(jù)情況下,可以通過考察教師與學(xué)生在《標(biāo)準(zhǔn)》測試過程中的忠誠度來反映測試數(shù)據(jù)的真實性與準(zhǔn)確性,以此來評判《標(biāo)準(zhǔn)》的效率問題。其中,教師的忠誠度表現(xiàn)為測試過程中的認真、規(guī)范程度,學(xué)生的忠誠度則表現(xiàn)為測試過程中按規(guī)則測試與積極測試的程度,這兩方面的文獻情況見表5。
表5 《標(biāo)準(zhǔn)》不同時期“教師、學(xué)生執(zhí)行忠誠度”問題具體表現(xiàn)一覽表Table 5 The Specific Manifestations of Teacher and Student Ex‐ecutive Loyalty in Different Periods of Criterion
由表5可知,在《標(biāo)準(zhǔn)》實施的不同時期,作為利益相關(guān)者的教師與學(xué)生,在《標(biāo)準(zhǔn)》測試過程中均表現(xiàn)出測試不負責(zé)、不按規(guī)則測試、測試時作弊等忠誠度不高的現(xiàn)象。如此一來,在付出了大量的人力、物力、財力等物質(zhì)成本與時間成本情況下,并沒有獲得國家所需要的真實有效的數(shù)據(jù)。如此一來,僅從投入與測試結(jié)果的準(zhǔn)確性和真實性,以及實效性而言,《標(biāo)準(zhǔn)》的政策效率有待完善。
2.3.3 《標(biāo)準(zhǔn)》的回應(yīng)度不高,公平性有待進一步提高 作為一項政策,需要對利益相關(guān)者的有關(guān)意見或反映的問題、所表現(xiàn)出的困惑給予及時的回應(yīng),特別是在政策的修訂或調(diào)整過程中,以便政策更好地執(zhí)行。也正因如此,有研究者將“政策回應(yīng)度”作為政策評估標(biāo)準(zhǔn)之一[9],認為“政策評估即政策回應(yīng)”[10]。“在實際研究中,教育政策的回應(yīng)度依靠教育政策實施的具體效果,特別是通過該教育政策是否能夠維護、保障、提升弱勢群體,如低收入者、偏遠貧苦地區(qū)群體等的權(quán)利和利益”[11]。那么,不同時期的《標(biāo)準(zhǔn)》是否對教師與學(xué)生的利益會有所沖擊呢?如果有,《標(biāo)準(zhǔn)》的修訂是否給予了政策上的回應(yīng)以加以維護呢?這里主要從《標(biāo)準(zhǔn)》實施對體育課的沖擊,教師因《標(biāo)準(zhǔn)》實施而產(chǎn)生的工作量問題,以及不同區(qū)域?qū)W生采用統(tǒng)一測試標(biāo)準(zhǔn)進行測試所帶來的公平性問題三方面加以呈現(xiàn)(見表6)。
由表6 可知,不同時期的《標(biāo)準(zhǔn)》測試都存在著隨堂測試的問題,這一方面使得教師正常的教學(xué)利益——通過教學(xué)實踐提高教學(xué)能力——受到了很大的沖擊,另一方面也使得學(xué)生的課堂學(xué)習(xí)利益——通過體育課堂學(xué)習(xí)提高運動技能——也受到了很大的沖擊,體測測什么便教什么、學(xué)什么的現(xiàn)象便是該問題最好的注腳。加之因《標(biāo)準(zhǔn)》測試工作量得不到合理地補償,教師的物質(zhì)利益也受到影響。此外,從學(xué)生層面來看,最大的問題抑或是《標(biāo)準(zhǔn)》統(tǒng)一測試標(biāo)準(zhǔn)因區(qū)域差異而帶來的教育公平利益問題——即學(xué)生身體素質(zhì)的區(qū)域差異并未得到公平對待,而且這一問題并未隨著《標(biāo)準(zhǔn)》的修改而得到改善。因此,從政策回應(yīng)度來看,《標(biāo)準(zhǔn)》的實施并沒有建立起對利益相關(guān)者教師與學(xué)生的教學(xué)利益、學(xué)習(xí)利益、物質(zhì)利益、教育公平利益的保障體系,這也是今后《標(biāo)準(zhǔn)》修訂時需要關(guān)注的問題。
表6 《標(biāo)準(zhǔn)》不同時期“回應(yīng)度”問題具體表現(xiàn)一覽表Table 6 The Specific Manifestations of Responsiveness in Differ‐ent Periods of Criterion
一項政策在執(zhí)行后大體有三種走向,即政策終止、政策繼續(xù)和政策調(diào)整。就《標(biāo)準(zhǔn)》而言,其作為國家監(jiān)測、評判學(xué)生體質(zhì)健康狀況的主要手段具有不可替代性。因此,盡管《標(biāo)準(zhǔn)》的評估結(jié)果表明,《標(biāo)準(zhǔn)》在教師與學(xué)生的認知度與認同度、忠誠度、回應(yīng)度方面都存在問題,但《標(biāo)準(zhǔn)》在相當(dāng)長一段時間內(nèi)繼續(xù)進行調(diào)整實施的走向不會變。實際上對于政策評估而言,“如果公共政策評估對評估對象不產(chǎn)生任何影響,評估工作就是一種徒勞之舉”[12]。因此,這里有必要從以上三個方面出發(fā),提出一些具有針對性的調(diào)整建議,以便于《標(biāo)準(zhǔn)》的進一步修訂完善。
不同時期的《標(biāo)準(zhǔn)》分別從評獎和畢業(yè)兩方面制定了獎懲措施,來提高激發(fā)學(xué)生主動積極進行體育鍛煉的內(nèi)在動機與政策有效性(見表7)。
表7 不同時期《標(biāo)準(zhǔn)》評定等級與評獎關(guān)系表Table 7 The Relationship Between Rating and Award in Different Periods of Criterion
由表7 可見,不同時期《標(biāo)準(zhǔn)》在評獎激勵辦法上并沒有很大的差異,都規(guī)定達到良好以上者方可參加評獎評優(yōu),但明顯區(qū)分度不夠。管理學(xué)認為,激勵性原則在使用上應(yīng)區(qū)別對待,“適當(dāng)拉開員工之間的薪酬差距,這樣一來,可以使業(yè)績好的員工認為得到了鼓勵,業(yè)績差的員工認為值得去改進績效,以獲得更好的回報”[13]。這提示我們,《標(biāo)準(zhǔn)》只規(guī)定達到良好以上的學(xué)生方可評獎評優(yōu),其合理性有待商榷。眾所周知,體育鍛煉是一個循序漸進的過程,學(xué)生不可能在短時間內(nèi)身體素質(zhì)有很大的提升,特別是對于一些由于身體原因,無法短期內(nèi)達到良好的學(xué)生,如果他們也進行了積極地鍛煉,并取得了一定的進步,但仍無法達到良好的等級。那么,學(xué)生便會因為無望感而失去進一步鍛煉的積極性與主動性——利益相關(guān)性變得不那么大了。因此,最為重要的,還應(yīng)該讓學(xué)生體會到通過自己努力——積極的身體鍛煉——所取得的進步而帶來的激勵效果,即可以增加“進步幅度獎勵措施”,從而形成《標(biāo)準(zhǔn)》“階梯式獎勵機制”(見表8)。
表8 《標(biāo)準(zhǔn)》階梯式獎勵機制構(gòu)想一覽表Table 8 The Ideas of Stepped Incentive Mechanism of Criterion
為建立以上階梯式獎勵機制,必然帶來進步幅度的評定問題,此問題對于現(xiàn)代化學(xué)校管理而言倒也比較容易實現(xiàn),只要將學(xué)生學(xué)業(yè)成績管理系統(tǒng)與學(xué)生體質(zhì)測試管理系統(tǒng)打通,那么,一方面學(xué)生便可以清晰的看到每學(xué)期自己的體質(zhì)測試成績,這也解決了體質(zhì)測試成績反饋的問題;另一方面,作為管理者,教師便可以通過學(xué)生成績管理系統(tǒng)評定學(xué)生體質(zhì)測試成績的進步幅度,為評獎評優(yōu)提供客觀依據(jù)。
《標(biāo)準(zhǔn)》在測試過程中所表現(xiàn)出的教師抵觸情緒與學(xué)生不理解行為,從深層次上來看,是由于教師或?qū)W生在主觀上對“份外工作”——主觀上認為《標(biāo)準(zhǔn)》測試乃是體育課外的另一項任務(wù)——的潛在不認同所致。從教育生態(tài)學(xué)角度來看,《標(biāo)準(zhǔn)》所帶來的測試與練習(xí)因為影響到了體育與健康課程的教學(xué),在無意間成了影響體育教學(xué)正常開展的“限制性因子”。那么,如何變限制性因子為非限制性因子,發(fā)揮學(xué)校體育生態(tài)系統(tǒng)的整體生態(tài)學(xué)效應(yīng)呢?“在生態(tài)學(xué)的視野下,課程知識是能夠相互包容的。各類課程資源之間可以兼容并蓄,進行有效的整合”[14]。這種整合如果從更廣泛的知識興趣角度來看,正如美國學(xué)者A.B.JAMES 在《課程統(tǒng)整》一書中所言,“更能反映廣泛的社會興趣和理解”[15]。如此,體質(zhì)測試作為社會價值功能較強的資源納入到體育與健康課程中來,既是課程開放性所需,亦是課程社會興趣使然,體育課堂教學(xué)與體質(zhì)測試的整合問題便具有了重要的社會關(guān)懷。更為重要的是,體育課堂教學(xué)與體質(zhì)測試的整合,也是對“體育課堂教(學(xué))什么——體育與健康課程知識,考試(中考、體測等)不考什么”“體育課堂教(學(xué))體育與健康課程知識,考試(中考、體測等)考身體素質(zhì)”等現(xiàn)實疑問的回應(yīng),更因為《標(biāo)準(zhǔn)》內(nèi)容成為體育與健康課程內(nèi)容,而使得考核——《標(biāo)準(zhǔn)》測試成為教師與學(xué)生的份內(nèi)之事,從形式和內(nèi)容上更能提高教師和學(xué)生對《標(biāo)準(zhǔn)》測試的認同感。如此,體育與健康課程與《標(biāo)準(zhǔn)》由目標(biāo)的一致性——增強學(xué)生體質(zhì),走向了“學(xué)練評”一體化,實現(xiàn)了學(xué)校體育生態(tài)的價值共同體。根據(jù)前期研究成果以及思考,這里對核心素養(yǎng)下體育與健康課程與《標(biāo)準(zhǔn)》測試如何整合的問題給予了相應(yīng)的理論構(gòu)想,當(dāng)然,其中也包含了對體育與健康課程知識自身知識整合問題的思考(見圖1)。
圖1 核心素養(yǎng)下體育與健康課程內(nèi)容與《標(biāo)準(zhǔn)》測試內(nèi)容的整合機制圖Figure 1 The Integration Mechanism Diagram of Physical Educa‐tion and Health Curriculum Content and Criterion Test Content un‐der Core Literacy
前面提到,《標(biāo)準(zhǔn)》需要提高對于民眾特別是利益相關(guān)團體或個人——學(xué)校、教師或?qū)W生的訴求、需求的滿足程度,這一過程中“必須要有健全的社會回應(yīng)機制來彌補傳統(tǒng)模式的不足,從而達到政府與民眾之間的互動”[16],這里的社會回應(yīng)機制便是政策學(xué)中的“民意表達機制”?!肮娡ㄟ^民意表達使得政策主客體之間的矛盾得以調(diào)節(jié),最大限度平衡了政策與目標(biāo)群體之間利益的需求,促進了以社會群體整體利益訴求為核心的教育政策目標(biāo)的實現(xiàn)”[17]。此外,民意表達機制的建立還有利于《標(biāo)準(zhǔn)》執(zhí)行過程中來自執(zhí)行主體與目標(biāo)群體的一些執(zhí)行偏差問題能夠得到及時、真實地反映,從而形成全員監(jiān)督的工作機制,這無疑有利于《標(biāo)準(zhǔn)》數(shù)據(jù)真實性與有效性的提高,也在一定程度上有利于解決前面所提到的《標(biāo)準(zhǔn)》效率所存在的尷尬境地。對于如何建立民意表達機制,高建生指出,民意表達機制由“信息公開發(fā)布機制、訴求充分表達機制、民意表達運行機制、民意表達監(jiān)督反饋機制、民意表達法律機制”等五個方面的機制構(gòu)成[18]。我們結(jié)合現(xiàn)實狀況,借鑒民意表達的相關(guān)研究,構(gòu)想了《標(biāo)準(zhǔn)》民意表達機制體系(見圖2)。
圖2 《標(biāo)準(zhǔn)》民意表達機制構(gòu)想圖Figure 2 The Schematic Diagram of Public Opinion Expression Mechanism of Criterion
當(dāng)前,人們對政策評估的認識盡管還存在著重政策執(zhí)行、輕政策評估,重政府正式評估,輕民眾非正式評估的問題,但不可否認的是,無論是政府層面的評估,還是專家學(xué)者、大眾的評估,其考察、完善、提高政策目標(biāo)達成度的政策評估指向是一致的,而且這種體現(xiàn)政治參與、民主的評估行為更不應(yīng)該被低估?!稑?biāo)準(zhǔn)》不斷的修訂過程,正體現(xiàn)了《標(biāo)準(zhǔn)》對來自不同層面討論、評估的政策回應(yīng)。新時期,《標(biāo)準(zhǔn)》理應(yīng)從政策學(xué)的角度與高度完善相應(yīng)的利益平衡機制、民主參與機制、溝通協(xié)調(diào)機制、執(zhí)行監(jiān)督機制、權(quán)力配置機制、政治社會化機制、激勵機制、責(zé)任追究機制等,走出一條“由人治化思維到程序性思維、由單線式思維到系統(tǒng)化思維、由獨斷式思維到民主化思維”[19]的政策治理之路。