謝小慶
作者簡介:
北京語言大學(xué)教育測量研究所所長、研究員,博士生導(dǎo)師,人力資源和社會保障部特聘公務(wù)員錄用考試命題專家
國家公務(wù)員制度的實行和公務(wù)員錄用考試制度的建立是20年來中國政治體制改革的一個重要進展。早在1989年1月,由國家人事部和中共中央組織部聯(lián)合下發(fā)的《關(guān)于國家行政機關(guān)補充工作人員實行考試辦法的通知》中,就明文確立了“凡進必考”的原則。20年來,數(shù)以十萬計的青年才俊通過考試進入政府機關(guān),其中許多人今天已步入重要的崗位。
一、公務(wù)員錄用考試所面臨的挑戰(zhàn)
競爭激烈的能力考試保證了公務(wù)員的基本素質(zhì),就整體而言,公務(wù)員已經(jīng)是今天素質(zhì)最高的一個社會群體。公務(wù)員錄用考試制度已經(jīng)在提高政府機關(guān)工作人員素質(zhì)方面產(chǎn)生了顯著的效果。
從“戰(zhàn)略”層面上講,公務(wù)員錄用考試制度取得了巨大的成功。它在國內(nèi)率先引入能力考試、申論考試,取消以考查記憶力為主的公共知識考試,逐漸打破地域界限、身份界限,向具有基層工作經(jīng)驗的報考者傾斜一項項具有戰(zhàn)略眼光的改革措施,使公務(wù)員錄用制度改革成為我國政治體制改革中最引人注目的一件實事,成為人事管理改革中一個引人矚目的亮點。公務(wù)員錄用考試的種種改革舉措不僅對提高政府工作人員素質(zhì)產(chǎn)生了重要的影響,也對考試觀念的轉(zhuǎn)變產(chǎn)生了積極的促進作用,為教育考試的改革起到了重要的示范作用。教育領(lǐng)域在這個示范作用下也開始引入一些能力考試,如國務(wù)院學(xué)位辦主持的“碩士學(xué)位研究生入學(xué)資格考試(GCT)”及人力資源和社會保障部職業(yè)技能鑒定中心主持的“國家職業(yè)漢語能力測試(ZHC)”。
但是,在“戰(zhàn)術(shù)”層面,公務(wù)員錄用考試遠不如其在“戰(zhàn)略”層面那樣成功。如今的考試存在一些迫切需要解決的問題,面臨著一些嚴峻的挑戰(zhàn),主要表現(xiàn)在以下幾個方面:
1、考試的科學(xué)化、規(guī)范化程度有待提高
就考試的命題、施測和評分的標(biāo)準(zhǔn)化、規(guī)范化水平而言,不用說與世界先進水平比較,即使與國內(nèi)的許多考試相比,我國的公務(wù)員錄用考試也尚存在較大的差距。受原國家人事部公務(wù)員管理司的委托,筆者曾經(jīng)對2001年至2008年的中央機關(guān)公務(wù)員錄用考試的筆試試卷進行過非常全面的統(tǒng)計分析和心理測量學(xué)分析。分析結(jié)果顯示,試題質(zhì)量尚存在較大的改進空間。由于部分試題沒有經(jīng)過考前預(yù)測,試卷中存在著一些太難或太容易的試題、區(qū)分度不高的試題,乃至個別負區(qū)分度的試題??梢酝茰y,在地方的公務(wù)員錄用考試中,也很可能存在同樣的試題質(zhì)量問題。
2、“錯拒人才”的可能性在增大
1994年《國家公務(wù)員條例》正式生效以后,政府機關(guān)工作人員錄用考試才正式被稱為公務(wù)員考試。從1994年到1999年的6年中,報考中央機關(guān)的考生累計不過4萬余人,報考人數(shù)與職位的比例大約是10:1。今天,情況已經(jīng)發(fā)生了很大的變化,報考比例已經(jīng)增加到幾十比一甚至幾百比一。2009年招考職位1.35萬個,通過資格審查并經(jīng)過現(xiàn)場確認的報考者77.5萬人,報考比例達到57:1。“殘聯(lián)”的一個職位,報考人數(shù)竟達到4584人。人才選拔中可能犯的錯誤有兩種,一種是“誤用庸才”,一種是“錯拒人才”。在如此高的報考比例之下,“誤用庸才”的可能性幾乎為零,但“錯拒人才”的可能性卻大大增加。事實上,行政職業(yè)能力測驗(AAT)的命題已經(jīng)陷入困境:為了提高測驗在高分段的區(qū)分度,命題者只好盡量加大試卷難度。這種做法導(dǎo)致的結(jié)果是,由于試卷過難,不少考生已經(jīng)不是憑自己的能力水平,而是憑運氣入選。這種局面將不利于選拔最優(yōu)秀的人才。如何給優(yōu)秀人才提供更多展現(xiàn)才能的機會?如何降低“錯拒人才”的可能性?這些都是迫切需要解決的問題。
3、兼職的命題隊伍面對專職的輔導(dǎo)隊伍
行政職業(yè)能力測驗和申論考試的設(shè)計思想,都是力圖考查那些“冰凍三尺非一日之寒”的穩(wěn)定心理素質(zhì)特征,從而選拔出稱職的政府工作人員。針對考試進行的輔導(dǎo)是導(dǎo)致測量產(chǎn)生誤差的因素,會降低選拔的信度和效度。今天的局面是,命題隊伍主要由兼職人員組成,幾乎所有的命題人員都同時承擔(dān)著繁重的本職工作;輔導(dǎo)隊伍卻主要由專職人員組成,他們幾乎將全部精力都投入到考試輔導(dǎo)中,專心致志。
在命題隊伍和審題隊伍的組織中,考試主持部門面臨著兩難困境時間充裕、可以保證精力投入的人,考試部門不感興趣,考試部門請來參與命題和審題的人,又往往是一些本職工作任務(wù)繁重、時間和精力非常緊張的人。結(jié)果,由于精力投入不足,雖然命題隊伍往往由一些非常優(yōu)秀、德才兼?zhèn)涞娜藛T組成,但他們對公務(wù)員考試試題的研究水平,卻常常不及輔導(dǎo)隊伍。
4、高科技、集團化的作弊行為
今天,圍繞考試作弊手段已經(jīng)發(fā)展起一些具有相當(dāng)技術(shù)含量的產(chǎn)業(yè)。目前,借助互聯(lián)網(wǎng)實現(xiàn)的針對考試的“考中”(不是考前泄題)集團作弊非常猖獗。例如,在2009年中央機關(guān)的公務(wù)員考試中,就發(fā)現(xiàn)多起向考場內(nèi)發(fā)送答案的作弊事件??贾凶鞅椎幕玖鞒淌牵嚎忌鷰⑿蛿z像機進入考場——將試卷內(nèi)容以無線發(fā)射方式傳出考場外——事先招聘的一組“解題高手”分別做出答案——答案通過互聯(lián)網(wǎng)發(fā)送給全國各地的場外“作弊助手”——“作弊助手”以無線方式將答案發(fā)送給考場內(nèi)的考生。在互聯(lián)網(wǎng)上,可以買到用于考試作弊的一系列設(shè)備,包括筆形掃描器、眼鏡形掃描器、傳輸覆蓋范圍1000米的10w發(fā)射器、傳輸覆蓋范圍3000米的35w發(fā)射器、手表形短信接收器、橡皮形短信接收器、米粒形隱形耳機等等。高科技、集團化的作弊行為已經(jīng)威脅到公務(wù)員考試的公平性和公正性。
二、面對挑戰(zhàn)的相應(yīng)對策
20年政府工作人員錄用考試的實踐經(jīng)驗告訴我們,公務(wù)員考試不僅要建立在公平、公正、公開的法制基礎(chǔ)之上,還需要建立在有效、可靠的科學(xué)基礎(chǔ)之上。面對挑戰(zhàn),考試主持部門必須對提高考試科學(xué)性的問題予以足夠的重視。相關(guān)部門需要加強下列幾個方面的科學(xué)研究工作。
1、實行分類分等考試
在政府中不同部門從事不同工作的人員在能力方面有不同的需要,不同層次的公務(wù)員在能力方面的需要也不相同。只有在對國家公務(wù)員進行合理分類、分等的基礎(chǔ)上組織考試,才能達到“考以致用”的目的,才能真正提高政府的辦事效率。
“他山之石,可以攻玉”。雖然我國是公務(wù)員錄用考試的發(fā)源地,但近代以來,在公務(wù)員錄用和公務(wù)員管理的科學(xué)性方面,我們需要向其他國家學(xué)習(xí)的地方很多。就像我國雖然是造紙術(shù)和印刷術(shù)的發(fā)源地,如今也常常需要引進一些發(fā)達國家的造紙和印刷成套設(shè)備一樣。在提高公務(wù)員管理的科學(xué)性、可行性和經(jīng)濟性方面,各國都走過了一
段探索的路程,都有一些成功的經(jīng)驗和失敗的教訓(xùn)。學(xué)習(xí)他人的成功經(jīng)驗、借鑒別人的失敗教訓(xùn)可以使我們自己的路走得更穩(wěn),更快。
2、合理設(shè)置報考資格
在分類、分等的基礎(chǔ)之上,考試主持部門需要合理地設(shè)置不同類別和不同等級的公務(wù)員錄用考試的報考資格。報考資格的合理設(shè)置對提高公務(wù)員錄用考試的效率具有重要意義。目前錄用考試存在的一個問題是筆試在整個錄用過程中的作用過大,通過筆試淘汰的人數(shù)過多。因此,我們在錄用過程中還需要探索筆試之外的其他評價方式和手段。設(shè)置合理的報考資格是在錄用過程中降低筆試比重的方式之一。
3、科目設(shè)置和分數(shù)組合研究
在分類、分等和合理設(shè)置報考資格的基礎(chǔ)之上,不同類別和不同等級的公務(wù)員錄用考試科目也需要合理地設(shè)置。考試科目的設(shè)置不僅關(guān)系到考試的選拔效率,而且關(guān)系到考試的經(jīng)濟性和可行性。當(dāng)存在多種考試科目的時候,不同的分數(shù)組合方式會產(chǎn)生差別很大的選拔結(jié)果。目前經(jīng)常被采用的原始分直接相加的總分計算方法并不合理,相關(guān)部門還需要研究更合理的分數(shù)組合方式。
4、從特定選拔考試向一般任用資格考試過渡的研究
目前,一些大學(xué)畢業(yè)生成為“公考一族”,奔波于參加中央、省、地區(qū)的各級公務(wù)員考試之中,交通食宿負擔(dān)很重。由于一些地區(qū)關(guān)于考試科學(xué)化的研究不足,導(dǎo)致考試質(zhì)量出現(xiàn)參差不齊的情況。如果公務(wù)員錄用考試能從特定選拔考試逐漸過渡到一般任用資格考試,考生就會減少許多負擔(dān)。但是,資格考試面臨“等值”和“及格線設(shè)定”兩個難題,開發(fā)難度遠高于選拔考試。相關(guān)部門需要通過對得失利弊的分析來研究這種過渡的可行性。
5、行政職業(yè)能力測驗的題庫建設(shè)研究
(1)試卷結(jié)構(gòu)改進和新題型開發(fā),面對強大的考試輔導(dǎo)力量,為了提高考試的效度和信度,命題部門需要對試卷結(jié)構(gòu)進行調(diào)整,淘汰掉某些已經(jīng)缺乏命題挖掘潛力的題型(如數(shù)列題、部分圖形題)。在考前輔導(dǎo)的影響下,這些題型已經(jīng)走入絕境。近年來,為了提高區(qū)分度,命題部門大幅度提高了試題難度,使試題向偏題、怪題方向發(fā)展,背離了此種題型考查邏輯思維能力的初衷,令許多優(yōu)秀的考生在此類題目中不再具有優(yōu)勢。“常識判斷”題型也需要進行改造。目前“常識判斷”的命題已經(jīng)陷入悖論:如果考查內(nèi)容真正是常識,題目便會缺乏區(qū)分度,通過率高達90%以上;如果為了提高區(qū)分度而增加題目難度,所考查的內(nèi)容就不再是“常識”,而成為“專識”,即特定的生物、醫(yī)學(xué)、工程、經(jīng)濟、法律等方面的專業(yè)知識。綜上,命題部門需要開發(fā)新的題型,使試卷具有更多的靈活性和彈性,使考試可以更好地向那些確實具有潛力、適合從事政府工作的人才傾斜。
(2)預(yù)測設(shè)計,預(yù)測是保證試卷質(zhì)量的重要環(huán)節(jié)。全國各省市、各地區(qū)每年進行大量的公務(wù)員錄用考試,具有很大的回旋余地和開發(fā)空間。如果設(shè)計合理,相關(guān)部門完全可以將預(yù)測與正式考試相結(jié)合,將題庫建設(shè)與服務(wù)基層相結(jié)合,構(gòu)造一個行政職業(yè)能力試題預(yù)測網(wǎng)絡(luò),利用各地的錄用考試組織預(yù)測和實現(xiàn)題目等值,完成行政職業(yè)能力題庫建設(shè)的任務(wù)。
(3)題庫的參數(shù)體系,合理地設(shè)計題庫參數(shù)體系是建設(shè)科學(xué)化題庫的前提。參數(shù)中不僅要包括統(tǒng)計測量參數(shù),如難度、區(qū)分度、猜測度等,還需要包括內(nèi)容方面的參數(shù),如所考查的內(nèi)容、能力等。內(nèi)容參數(shù)需要由命題人員和審題人員進行標(biāo)注。
(4)題庫的等值模型,如果逐步將行政職業(yè)能力考試過渡到資格考試,就需要解決好題庫的等值模型問題。
(5)試卷的自動(半自動)生成系統(tǒng):題庫應(yīng)具有試卷自動(半自動)生成功能。在合理設(shè)計參數(shù)體系的基礎(chǔ)上,合理的選題模型不僅要滿足試卷的難度、區(qū)分度等統(tǒng)計指標(biāo)的要求,還需要滿足試題在內(nèi)容覆蓋、能力覆蓋方面的要求。
(6)題庫試題的曝光度(重復(fù)使用率)控制。
(7)關(guān)于逐步實現(xiàn)行政職業(yè)能力機考和適應(yīng)性考試的可行性研究,計算機化和網(wǎng)絡(luò)化是考試發(fā)展的方向,相關(guān)部門應(yīng)對此展開可行性研究。
6、相關(guān)法律問題研究
考試的主持部門還應(yīng)對與考試有關(guān)的法律問題進行研究,例如,年齡限制的合法性問題、試卷保密的合法性問題、有關(guān)殘疾人考試的法律問題、有關(guān)傳染病患者考試的法律問題、與少數(shù)民族考生有關(guān)的法律問題、有關(guān)試卷雷同統(tǒng)計判定的法律問題等。
歷史的教訓(xùn)需要引以為鑒??婆e考試是一種形式非常完備的考試,在公平性、公開性、競爭性方面都近乎完美,許多保證考試公平性的措施今天都很難做到。例如,科舉的“單間”施測、進場搜身、謄錄(為了避免辨認筆跡將所有答卷全部重新抄錄)等等。但是,科舉考試卻遭到幾乎所有近代進步思想家的切齒痛恨并最終被取消。今天的國家公務(wù)員錄用考試已經(jīng)走到了一個非常重要的歷史關(guān)口,是重蹈科舉考試失敗的覆轍,還是在科學(xué)研究的基礎(chǔ)上闖出考試科學(xué)化的新路,這個問題已經(jīng)尖銳地擺在了各級公務(wù)員錄用考試主持部門的面前。