杜 娟 榮維東
當今語文考試改革中的測試框架建構(gòu)
——2014年度語文論著評析之十二
杜 娟 榮維東
主持人簡介:王榮生,語文課程與教學論博士,上海師范大學學科教育研究所教授、博士生導師。
執(zhí)行主持簡介:胡根林,語文課程與教學論博士,上海市浦東教育發(fā)展研究院副研究員。
黨的十八大報告提出:“全面實施素質(zhì)教育,深化教育領域綜合改革,著力提高教育質(zhì)量,培養(yǎng)學生社會責任感、創(chuàng)新精神、實踐能力?!薄翱荚囍贫雀母锼婕暗牟粌H僅是高考制度,還涉及整個考試評價,包括從小學開始一直到博士研究生階段??荚嚫母锏暮诵氖窃谂ΡU瞎降那疤嵯?,打破目前考試評價及人才選拔手段太過單一的局面。要逐步推行初高中學業(yè)水平考試和綜合素質(zhì)評價。”①在綱領性文件的指導下,語文考試制度改革也在逐步推進,我們不妨從2014年度《中國教育學刊》與《課程·教材·教法》刊登的三篇文章中透視“語文考試改革中的測試框架”的內(nèi)涵和發(fā)展方向。
【評析文章】葉麗新:《測試框架:語文考試改革的重要著眼點》,原載于《中國教育學刊》2014年第4期。
【原文提要】考試改革一般會從宏觀的制度改革和微觀的試題優(yōu)化兩個層面著手。然而,中觀層面的“測試框架”也是我們必須予以重視的,它是從課程目標、評價理念到考試命題之間的一個有效的引導和過渡。新構(gòu)建的語文“測試框架”文件,應該符合國際“測驗框架”文件的屬性:對測量對象有清晰、立體的認識;描述、引導“概念理解”與實際命題之間的關(guān)系;具有關(guān)于出題、評分等的重要技術(shù)指導;基于考試結(jié)果不斷完善對測量對象的認識?!皽y試框架”將是促進教學和考試之間形成良性循環(huán)的關(guān)鍵。
(一)構(gòu)建新的語文測試框架的必要性
考試招生制度改革是教育領域綜合改革的突破口,也是家長、教師、學校、全社會最關(guān)心的事情?!吨袊逃龍蟆?014年10月1日第002版刊登了一篇新聞評論——《語文評分之爭要向考試改革求解》,透過湖南籍青年作家張一一將湖南教育考試院告上法庭的事件,揭示了現(xiàn)行高考作文評分標準的機械死板,使得原本最為主觀性的,最能考察學生語言能力的題目落入“套路”,從技術(shù)上說,類似于“八股文”。作者最后強調(diào),問題出在卷子上,高考模式、考試命題模式、教育模式等體制性因素存在很大的問題。同樣的,葉麗新在其文章開篇指出,考試改革是我國面臨的一個大難題,這個難題一般會從宏觀的制度改革和微觀的試題優(yōu)化兩個層面著手。然而,這兩個層面之間需要有一個關(guān)鍵性的引導和過渡,也就是作者指出的“測試框架”。對于概念界定時作者給出的三種表述:“測驗框架、測評框架、測試框架”,是為了在不同語境中使用最恰當?shù)恼f法。針對我國語文考試制度的實際情況,作者最終確定了“測試框架”這一說法。由美國教育研究協(xié)會(AmericanE ducationalResearchAssociation,AERA)、美國心理學協(xié)會(AmericanPsychologicalAssociation,APA)和全美教育測量學會 (NationalCouncilonMeasurementin Education,NCME)三家共同研制的《教育與心理測試標準》界定了“測驗框架”的定義:“在構(gòu)念或內(nèi)容范疇的概念形成和研制評估構(gòu)念的測驗之間常常會有微妙的相互作用發(fā)生。測驗框架將這個構(gòu)念或內(nèi)容范疇如何體現(xiàn)在測驗中具體描述出來。用于出題、制定評分規(guī)則和檢查試題特性的步驟常有助于闡明框架的內(nèi)容。”為了更直觀地表述這個概念的要點,我們用下表進行說明。
隨后,結(jié)合我國語文測試的實際情況和其他學者的已有研究,作者分析了語文測試研究和實踐中既有的相關(guān)“框架”、依據(jù)及其缺憾。她指出:在語文命題實踐中,顯性和隱性的“框架”有三類。其一,語文考試命題直接遵循的基本依據(jù)是“考試大綱”和“考試說明”,但目前考試大綱與新課程改革對語文知識與能力的要求和目標匹配度不高,對測試的基本問題說明也不夠充分。其二,從語文課程標準的角度來說,應依據(jù)國家課程標準進行評估和考試命題。其局限性一是比考試的測量目標和內(nèi)容領域?qū)挿旱枚啵侨狈σ痪S性,對各類知識或特點的描述不夠清晰。其三,長期潛在地影響著各級各類考試的宏觀框架是布盧姆的教育目標分類學框架。然而這個框架很難指導命題實踐。此外,在其《能力測試點與試題之間的“張力”:國際閱讀測評項目的經(jīng)驗》(《全球教育展望》,2014年第6期)一文中,作者從微觀層面指出:在大規(guī)??荚囍校瑢φZ文能力測試點的定位、理解偏于簡單化,語文能力測試點與試題之間的對接過于模式化,即每一次考試的考點似乎都很“明確”“穩(wěn)定”,但又似乎過于“明確”“穩(wěn)定”,考點的穩(wěn)定直接體現(xiàn)在題型和題目表達層面上②。
正是由于存在各種各樣的問題,而目前又有一個過渡性的“測評框架”,因此構(gòu)建新的語文測評框架是語文考試改革走向深化的必經(jīng)之路。
(二)國外測評框架的經(jīng)驗及對我國的啟示
綜觀PISA、PIRLS、NAEP等國際閱讀測評項目,作者認為,他們具有三個比較明顯的特征,值得我國的“考試大綱”借鑒。一是測驗文件翔實,能夠兼顧理念與技術(shù),即以扎實的理論研究為基礎,也在實際操作中不斷完善。如上海中小學曾參與過的國際學生評價項目PISA(TheProgrammeforInternationalStudentAs sessment)就有兩份文件對其進行說明,即測評框架和技術(shù)報告。我國語文測試中缺少的正是如三大測評項目中列出的對命題的理念、內(nèi)容、依據(jù)進行細致入微的解釋和說明的 “測評框架”(AssessmentFramework)以及能將命題和后期數(shù)據(jù)分析方面的技術(shù)細節(jié)進行詳細規(guī)定的“技術(shù)報告”(TechnicalReport)或“測評說明”(Specifications)。二是“概念框架”清晰,即測量的“構(gòu)念”明確。基本都是從閱讀的目的、閱讀的情境(或環(huán)境)、文本類型、認知目標(或過程)幾個基本要素展開的。三是化抽象為具體命題實踐,落實概念框架。如NAEP評價框架,在層層理論解釋和量的規(guī)定的基礎上,測評項目中文本的選擇范圍和特定文本命題的指向相對清晰。作者強調(diào),在國際測評項目中,我們可以看到,所有的概念、分類等都能對命題過程和結(jié)果產(chǎn)生直接和真實的影響,從設定測量目標到編制試題的過程,認知目標闡釋立體,與試題之間內(nèi)在的準確對應,試題本身的表達與認知目標的表達沒有固定的對應模式。相比之下,我國既有的“考試大綱”則不夠立體,認知目標與試題之間缺少“張力”。
(三)構(gòu)建新的語文測試框架的實施路徑
如何構(gòu)建新的語文測評框架呢?作者直言我國與國外語言、課程、教育目標、測評目的等方面存在諸多差異,因而在分析了國際閱讀“測評框架”文件的可借鑒性之后,作者明確我們需要的不是直接“套用”過來,而是依據(jù)我國語文測試實際存在的問題重新構(gòu)建適應我國考試招生改革制度的新的“測試框架”。她提出在符合新課程改革和符合測量與評價規(guī)范的基礎上,我們至少可以從三個層面學習國外的“測評框架”,分別是從基層定位對全新的測驗文件的認識,從橫向?qū)用娼∪珜y量對象的認識,在縱向?qū)用嬉苿永砟畹矫}實踐的轉(zhuǎn)化,并依次對這三個層次從不同角度進行闡述。
在基本定位上,新的語文測試框架是指導命題的中觀框架和依據(jù)。它是位于教育目標分類學和課程標準下一層級的專門的命題依據(jù);能夠引導教學實踐;內(nèi)容也更加立體、豐富,能完善或更新目前的“考試大綱”“考試說明”。
在橫向構(gòu)建上,新的語文測試框架作出了對測量對象(語文素養(yǎng)以及可考察的子要素)符合測試語境的內(nèi)涵和外延的認識、界定。它以對語文素養(yǎng)的合理理解為基礎,且勾勒出語文測試需要考慮的相關(guān)維度;相對完滿、立體地揭示原本抽象的測試“構(gòu)念”,對后續(xù)命題具有指導意義;適用于測試評估,是可操作的,利于命題者分類處理材料和試題,也利于后期數(shù)據(jù)統(tǒng)計和結(jié)果解釋。
在縱向構(gòu)建上,新的語文測試框架能夠推動理念到命題實踐的轉(zhuǎn)化,勾勒出“測試途徑”和設計題型示例。它保證了命題的彈性空間,由此弱化了當前的考題
模式化及由此導致的應試風氣;能夠矯正考試與教學之間的關(guān)系,解決從“構(gòu)念”到具體“測試工具”之間的過渡性指導;并且?guī)椭痪€教師真正深刻理解語文素養(yǎng),探尋各種具體的語文能力的培養(yǎng)途徑。
【評析文章】張燕華,鄭國民,關(guān)惠文:《中學生語文學科能力表現(xiàn)——基于Rasch模型的語文測試評價》,原載于《課程·教材·教法》2014年第11期。
【原文提要】基于語文學科能力的測試評價既是了解學生學業(yè)水平的途徑,同時也可以形成測試中的“反撥效應”,對語文課堂教學產(chǎn)生一定的影響。以能力考察為核心的語文測試評價框架包括學習理解、實踐應用和創(chuàng)新遷移三個能力層級。在建構(gòu)中學生語文學科能力構(gòu)成體系的基礎上,對北京市兩個區(qū)的七年級至十一年級共4322名中學生的語文能力進行測試,運用Rasch模型進行分析與討論,研究結(jié)果發(fā)現(xiàn):從學習理解能力來說,中學生尤其應該加強分析概括能力和領會理解能力的培養(yǎng);從實踐應用能力來說,語文教學應該關(guān)注中學生應用交際能力的培養(yǎng)。針對不同的文類,應該培養(yǎng)學生的文類意識;從創(chuàng)新遷移能力來說,應該重視培養(yǎng)中學生的寫作能力,尤其在內(nèi)容創(chuàng)新、表達真情實感等方面更需要加強。
《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》提出了“堅持能力為重”的指導思想③。三十多年來,我國把各門課程的學科能力表現(xiàn)統(tǒng)統(tǒng)歸結(jié)為“分析問題、解決問題的能力”,并作為“雙基”的重要一維來看待,顯然缺乏對學科能力表現(xiàn)的深入剖析,沒有“基本技能”的具體指標和要求,從而導致教學過程中“基礎知識”的教學十分系統(tǒng)和扎實,但“基本技能”的培養(yǎng)難以系統(tǒng)地落實④。因而通過學科學習,切實促進學生能力的發(fā)展,是當前深化基礎教育課程改革、全面提高教育質(zhì)量的關(guān)鍵點。作者們抓住了這一“關(guān)鍵點”,認為以能力考察為核心的語文測試評價框架包括學習理解、實踐應用和創(chuàng)新遷移三個能力層級。在這個基礎上,語文測試試卷以主題為內(nèi)容,分為文化底蘊(優(yōu)秀詩文、經(jīng)典名著和名言警句),閱讀(文言文、實用類、文學類)和寫作(任務型表達和個性化表達)。這個結(jié)論的得出得益于運用Rasch模型(Rasch模型是丹麥數(shù)學家和統(tǒng)計學家GeorgRasch在丹麥政府的委托之下開始研究現(xiàn)代考試理論,從而提出的一個數(shù)學公式,它是基于項目反應模型提出的一個潛在特征模型。Rasch模型通過個體在題目上的表現(xiàn)——通常表示為原始分數(shù)——來測量不可直接觀察的、潛在的變量,它是一個理性化的數(shù)學模型。)對北京市兩個區(qū)的七年級至十一年級共4322名中學生的語文能力測試結(jié)果的分析與討論,此次測試評價主要是運用Rasch模型分析試題的難度和學生平均得分率兩方面的內(nèi)容。
這篇文章的主旨是語文測試要“以能力考查為核心”。依據(jù)這個主旨,作者指出語文測試評價框架的建立主要參照了認知理論、語言學理論、各類測試評價標準及課程文件。學科能力表現(xiàn)大致可分為基礎性學科能力表現(xiàn)、知識性學科能力表現(xiàn)、學科素養(yǎng)性能力表現(xiàn)等不同類型⑤。具體到語文學科,作者認為中學語文學科能力構(gòu)成體系包括三個遞進的能力層級,即基礎能力——學習理解能力(代號A)、中級能力——實踐應用能力(代號B)和最高能力——創(chuàng)新遷移能力(代號C)。每一個能力層級下又有幾個逐級遞進的分層。語文學科學習理解(A)包括觀察注意(A1)、記憶(A2)、信息提?。ˋ3)、分析概括(A4)和領會理解(A5),強調(diào)多角
度地觀察生活和積累等能力;實踐應用能力(B)包括應用交際(B1)、解釋推斷(B2)、解決問題(B3)、策略應用(B4),強調(diào)根據(jù)不同目的和場合表達觀點,能解釋現(xiàn)象,解決問題等能力;創(chuàng)新遷移能力(C)包括發(fā)散創(chuàng)造(C1)、批判賞析(C2)、內(nèi)化完善(C3),強調(diào)加深對世界的認識思考,能批判性地評價多元文化,完善自身等能力。作者認為,這樣的評價框架不僅能打破各個評價內(nèi)容之間的界限,還能打破年級限制即考察不同年級的學生在某一能級的水平,從而為教學診斷提供參考。
【評析文章】潘涌:《高考作文的深度轉(zhuǎn)向:接軌國際“學術(shù)能力導向”——評年高考作文的基本特點》,原載于《中國教育學刊》2014年第9期。
【原文提要】通過評析2014年我國各地高考作文,從“全命題”到“探索話題和開放材料”的蛻變呈現(xiàn)出了高考作文題型所發(fā)生的曲折而顯著的進步,特點之一是開放生活哲學的空間;特點之二是通過“思想評論體”來釋放考生的“自由評論力”。認為我國高考作文在深化改革的價值取向下已經(jīng)開始與國際高考作文“學術(shù)能力導向”相接軌,完全順應全球化背景下“語言強國”的戰(zhàn)略需要。國內(nèi)高考作文命題研制上的進步趨勢,要言之即引導考生釋放“思想力”和“評論力”。這種新趨勢符合國際語言考試和語言教育的價值導向——“寫作即交流”。
如果說,第一篇闡述建立新的語文測試框架的必要性,以及應該建立什么樣的測評框架;第二篇文章則是基于數(shù)據(jù)分析得出語文測評框架應該以考察學生學科能力為宗旨。那么接下來要評析的文章講的就是將以上理念應用到實際測試中——如何進行高考作文測試。文章中作者的基本觀點是高考作文測試要接軌國際“學術(shù)能力導向”,即以美國學術(shù)能力評估測試SAT(ScholasticAssessmentTest)考試中“寫作”科目的測試文體“Essay”為借鑒對象,認為高考作文測試的深度轉(zhuǎn)向是要引導學生的“思想力”和“評論力”。
作者分析了2014年21份高考作文試卷,認為2014年高考作文命題打破了長期以來過度預制、過度封閉、過度壟斷的指令性課程束縛,突破了單一、狹隘、指向過于明確的形式命題,徹底告別了各種各樣的“命題”,迎來一個思維空間開放、價值導向多元的“后命題時代”。同時,作者指出,2014年高考作文的話題特色是“接軌生活”,采用“探索話題”或“開放材料”的形式,引導學生進行“思想評論體”的獨立自由創(chuàng)作。隨后,透過分析Essay的話題及其材料的三個特征——爭議性、思辨性、主觀性,及其文體結(jié)構(gòu)特征——論和評,作者認為完成Essay的過程實際上是一個表達的過程。這與 2011年美國國家教育進展評估委員會(NAEP,2011)寫作評定框架強調(diào)“寫作即交流”的觀點類似,NAEP將寫作活動界定為交流活動⑥,即作者與目標讀者之間的交流,主要針對三種寫作能力進行評定,即勸說能力、解釋能力和傳達能力。具體能力要素體現(xiàn)的方面如下:第一,在一個觀念、視角多元化的復雜社會里,學生需要清晰地、富有邏輯地表達自己的觀點,以說服他人。因此,2011年美國國家教育進展評估委員會測試的是學生用寫作進行說服的能力,目的是要改變讀者觀點,影響讀者行為。第二,在信息時代,傳遞信息和概念的能力至關(guān)重要。2011年,NAEP寫作評定框架評估了學生的解釋能力,目的是拓展讀者的理解力。第三,世界各國之間聯(lián)系日益密切,通過寫作不僅可以探索和分享個人經(jīng)歷,而且可以實現(xiàn)全球共享。2011年,NAEP寫作評定框架評估了學生的表達能力,即敘述或撰寫故事的能力,目的是與讀者進行交流。
綜上所述,我們認為語文考試改革要實現(xiàn)深度轉(zhuǎn)向,其測試框架要以測評語言文字運用能力(語用能力)為核心進行構(gòu)建,也是第二篇文章中說的“從實踐應用能力來說,語文教學應該關(guān)注中學生應用交際能力的培養(yǎng)”,“語言學理論對于建構(gòu)評價框架的啟示作用在于強調(diào)語言學習的情境化及其交際運用的功能,并且強調(diào)語言的學習不能脫離生活和社會實際。”再者,此項能力也符合《義務教育語文課程標準(2011年版)》指出的“學科特性”:語文課程是一門學習語言文字運用的綜合性、實踐性課程。
①劉利民:《中學教育綜合改革與校長的使命——在第四屆中國中學校長大會上的講話》,《中國教育學刊》,2014年第6期。
②葉麗新:《能力測試點與試題之間的 “張力”:國際閱讀測評項目的經(jīng)驗》,《全球教育展望》,2014年第6期。
③中華人民共和國國務院:《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020)》,2010年版。
④⑤郭元祥,馬友平:《學科能力表現(xiàn):意義、要素與類型》,《教育發(fā)展研究》,2015年第15-16期。
⑥李英杰:《美國NAEP(2011)寫作評價框架評介》,《語文建設》,2012年第9期。
[作者通聯(lián):西南大學文學院]