馬利紅
(天津職業(yè)技術(shù)師范大學,天津 300222)
批判性思維能力不僅是21世紀公民必備的核心素養(yǎng),而且是很多國家高等教育(甚至基礎(chǔ)教育階段)的重要目標。近年來,批判性思維培養(yǎng)引起廣泛專注和熱烈討論,其中我國外語界尤其重視培養(yǎng)學生的批判性思維,但批判性思維培養(yǎng)只有和批判性思維測評相結(jié)合才能真正取得成效[1]。迄今國外已開發(fā)出很多成熟的批判性思維測評工具,如加利福尼亞系列、哈爾彭系列、沃森-格萊澤系列、劍橋系列等。國內(nèi)開發(fā)的批判性思維測評工具以中學生審辯式思維測評和外語類大學生思辨能力量具為代表。國內(nèi)外已有的批判性思維測評工具以客觀題形式為主,但研究表明,利用客觀題測評批判性思維受被試的批判性思維發(fā)展水平和測評理念影響,只能測量其認知水平,難以測量批判性思維的核心技能[2]。與客觀題相比,開放題強調(diào)在真實生活情境中解決問題,能最大程度激發(fā)被試的思維過程,有助于多角度思考問題,具有測評批判性思維的天然優(yōu)勢[3]。目前,我國對于批判性思維開放題測評的開發(fā)和研究還處于初級階段,西方國家的批判性思維測評研究歷史悠久,成果顯著。了解國外批判性思維開放題測評的發(fā)展能為我國開展相關(guān)研究提供借鑒與參考。
一般認為,批判性思維起源于古希臘的蘇格拉底,而現(xiàn)代批判性思維則可以追溯到杜威的“反思性思維”。后來,恩尼斯提出批判性思維就是理性的反思性思維,用來決定信念和行動。20世紀90年代,批判性思維的內(nèi)涵強調(diào)元認知能力和問題解決能力,著名的德爾菲項目提出批判性思維包括思維能力與人格傾向,并對批判性思維的6種技能達成共識,即闡釋、分析、評價、推理、解釋、自我調(diào)節(jié)[4]。近年來,隨著對批判性思維培養(yǎng)的實證研究增多,有些研究者傾向于認為批判性思維是以一般方式定義并可以在多個學科領(lǐng)域廣泛應(yīng)用的技能,但需要依靠特定學科主題的知識、常識和工具進行表達,是內(nèi)化于特定學科領(lǐng)域的[5]。批判性思維的內(nèi)涵是批判性思維測評的基礎(chǔ),直接影響著批判性思維測試題目的開發(fā)。
本研究以“critical thinking assessment”為檢索關(guān)鍵詞,對Web of Science核心子集數(shù)據(jù)庫進行文獻檢索,檢索年限不做限定,共得到87篇文獻。為保證研究文獻的全面性,本研究還對批判性思維專業(yè)測評網(wǎng)站Insight Assessment和Foundation of Critical Thinking官網(wǎng)上有關(guān)批判性思維測評的在線文檔進行梳理。通過文獻分析,共得到批判性思維測評相關(guān)文獻93篇。通過對文獻內(nèi)容的二次分析,共得到批判性思維開放題測評相關(guān)文獻34篇。通過對文獻內(nèi)容進行審讀,筆者發(fā)現(xiàn)國外批判性思維開放題測評方式可以歸結(jié)為三種:批判性思維語篇測試、批判性思維讀寫測試、批判性思維寫作測試。
測評批判性思維時,語篇測試比選擇題形式更科學,因為選擇題主要側(cè)重批判性思維的評價技能,即被試作出正確判斷的能力,而語篇測試可以評價批判性思維的創(chuàng)造性方面,即被試對語篇內(nèi)容作出回應(yīng)并有邏輯地捍衛(wèi)回應(yīng)的能力。有研究者曾提出三種批判性思維語篇測試方法:一是超復(fù)雜結(jié)構(gòu)(high structure),即提供一篇標有段落的論證性文章,大部分段落中有論證錯誤,要求被試對每一段及整篇文章中隱含的寫作思維方式進行評價,并論證為何這樣評價;二是中等復(fù)雜結(jié)構(gòu)(medium structure),即提供一篇結(jié)構(gòu)相對簡單的論證性文章,要求被試對文章主題進行論證或者辯護,但不具體闡述為何這樣論證或辯護;三是微復(fù)雜結(jié)構(gòu)(minimal structure),即提供一篇結(jié)構(gòu)較簡單的文章,要求被試就某個感興趣的話題發(fā)表看法或捍衛(wèi)立場[6]。上述三種批判性思維語篇測試方法對批判性思維開放題測評的開發(fā)和研究具有重要指導意義。
在批判性思維語篇測試中,運用最廣泛的是《恩尼斯-韋爾批判性思維語篇測試》(Ennis-Weir Critical Thinking Essay Test,EWCTET)。 EWCTET在論證語境中測評被試的通用批判性思維技能,評價被試辨別語篇中的推理漏洞以及如何捍衛(wèi)自己立場的能力。EWCTET往往就一個熟悉話題,以給報社編輯寫信的形式提供語境,要求被試閱讀和評價信件中表達的觀點,寫回信對此作出判斷和評價并提供證據(jù)支撐。原始信件中的每一段代表批判性思維的不同方面,比如概括主旨大意,提供支撐理由,辨別其他可能性解釋,識別或避免含糊、不相關(guān)、重復(fù)循環(huán)、過度概括、情緒化或帶有偏見的語言等。命題時,首先要對原始信件的每個段落進行編號,要求被試對每一段內(nèi)容都作出回應(yīng)或辯護,然后再回應(yīng)整封信的內(nèi)容。這種遞進式命題結(jié)構(gòu)科學,設(shè)問層層深入,符合被試的思維發(fā)展過程,有利于批判性思維的充分發(fā)揮。
EWCTET的評分關(guān)注被試對原始信件內(nèi)容的回應(yīng)本身,而不是寫作的質(zhì)量。雖然有關(guān)語篇測試內(nèi)容效度的證據(jù)并不多見,但是語篇測試強調(diào)在真實生活情境中應(yīng)用評價和提出觀點等批判性思維技能。有學者認為,語篇測試的真實性本身就蘊含了內(nèi)容效度和生態(tài)效度[7]。
EWCTET具有開放性,允許不同風格的回應(yīng)存在,這與批判性思維測評所要求的真實生活情境相吻合。但是語篇測試的開放性使得評分更加主觀和耗時,評分員對較廣范圍內(nèi)的作答反應(yīng)作出合理判斷時必須進行批判性思維,評分的主觀性和非標準化導致語篇測試很難成為正式場合評價被試批判性思維的有力工具,但語篇測試可以成為評價學習者批判性思維發(fā)展過程和促進批判性思維教學的有力工具。
閱讀和寫作關(guān)系密切,為了能夠進行批判性寫作,學生必須能夠批判性閱讀。批判性閱讀包括閱讀前弄清文本材料的寫作目的;閱讀中與文本材料進行對話,比如通過質(zhì)疑、概括、對比、關(guān)聯(lián)等方式多角度思考文本內(nèi)容;閱讀后進行反思、概括和闡釋文本,從自己的經(jīng)驗出發(fā)提供例證,綜合考慮多種觀點,有邏輯地分析段落大意,根據(jù)清晰性、準確性、相關(guān)性、邏輯性、重要性等標準評價文本內(nèi)容。同理,作為交流思想和促進學習的工具,批判性寫作包括深化對核心概念的理解,澄清概念間的關(guān)系,分析文本材料的觀點與自己觀點的差異。批判性寫作也需要反思和監(jiān)控寫作過程,基于先前經(jīng)驗舉例,綜合考慮各種觀點并闡釋主題,根據(jù)清晰性、準確性、精確性、相關(guān)性、邏輯性、重要性、公平性、深度和寬度等思維標準評價寫作內(nèi)容[8]。
用批判性閱讀和批判性寫作相結(jié)合測評被試的批判性思維發(fā)展情況以Paul和Elder研發(fā)的國際批判性思維閱讀與寫作測試(International Critical Thinking Reading and Writing Test,ICTRWT)為 代表。ICTRWT包括五個水平,從低到高依次為釋義(paraphrasing)、解讀(explicating)、分析(analysis)、評價(evaluation)、模仿(role-playing)(詳見表1)。
根據(jù)批判性思維閱讀和寫作能力的五個水平,ICTRWT包括五項基礎(chǔ)測試,即Form A、Form B、Form C、Form D、Form E,每項測試所測評的思維能力從低到高依次為逐句釋義文本的能力、解讀文本命題的能力、分析文本邏輯的能力、評價文本邏輯的能力和模仿作者思維的能力(詳見表2)。這五項基礎(chǔ)測試不一定同時出現(xiàn)在同一個測試場景中,可以先采用考查水平一和水平二的測試材料,然后采用考查水平三、四、五的測試材料,特定測試情境下可根據(jù)需要可采用不同測試形式的組合。
ICTRWT中,每種測試形式都采用1~10的評分等級,包括unskilled(0~2分)、minimally skilled(3~4分)、beginning skills(5~6 分)、skilled(7~8 分)、highly skilled(9~10分)五個水平。評分方式包括兩種:單獨評分和整體評分。ICTRWT的評分程序有明確要求,比如評分之前,評分員應(yīng)該先熟悉批判性思維、批判性閱讀和批判性寫作的內(nèi)涵。為保證評分信度,評分程序應(yīng)堅持如下原則:評分前評分員應(yīng)親自做一遍測試題,然后對比他們的作答與參考答案的異同,把參考答案看作合理答案而不是最正確的答案,因為釋義文本、概括大意、解釋推理的方法有很多種;至少三位評分員一起評分且對被試作答達成共識,評分誤差控制在±1分區(qū)間內(nèi)。ICTRWT已有充分的效度和信度驗證,為我國外語教育界開展批判性思維教學和測評研究提供了可資借鑒的思路。
思維和寫作關(guān)系密切。寫作過程既是提出觀點、組織論證和反復(fù)修改的過程,也是理解、分析、推理、評價和自我調(diào)控的批判性思維過程[9]。作為一種認知技能,批判性思維重視反思,反思既可促進思維發(fā)展,也可提高寫作能力,因此寫作過程是思維與寫作相互作用、相得益彰的發(fā)展過程。以寫作形式評價批判性思維在學術(shù)界和實踐中都取得了令人欣喜的成果。
表1 國際批判性思維閱讀與寫作測試能力框架表
表2 國際批判性思維閱讀和寫作測試基礎(chǔ)題型
在學術(shù)界,以寫作形式評價批判性思維的測試方法主要分布在外語領(lǐng)域。Wade最早提出運用寫作發(fā)展和評價批判性思維,并認為外語寫作體現(xiàn)出的批判性思維能力包括提出問題、定義問題、提供證據(jù)、驗證假設(shè)、分析偏見、避免情緒化推理、避免簡單化、考慮其他解釋等[10]。有研究者基于圖爾敏論證模型提出以議論文為媒介,通過語篇分析評價日本二語學習者批判性思維能力的評價框架。具體來講,通過論證數(shù)量、證據(jù)范圍、相反觀點、謬誤數(shù)量、反駁等評價二語寫作中的批判性思維[11]。一篇好論證是精心組織、多視角闡釋并由充分證據(jù)支撐的,是觀點清楚、證據(jù)充分、論證得當、反證有力的。論證和反證相融合評價二語寫作中的批判性思維受到研究者青睞,比如Qin和Karabacak基于圖爾敏論證模型提出六維度分析框架,即論斷、證據(jù)、反證論斷、反證證據(jù)、反駁論斷、反駁證據(jù)[12]。
在實踐中,美國教育考試服務(wù)中心(Educational Testing Service,ETS)認識到批判性思維的重要性并改革題型,在寫作中滲透對批判性思維的評價。比如2002年GRE測試中增加的分析性寫作包括分析問題和分析論證兩種題型。在分析問題部分,被試可以給出具體理由或適當案例闡釋觀點或維護立場,拼寫和語法錯誤不會影響分析問題的得分,但是語篇的邏輯結(jié)構(gòu)和觀點表達的模糊性會影響得分。在分析論證部分,主要評價被試能否發(fā)現(xiàn)所給論證中的邏輯錯誤,這類題目的得分與被試在論證邏輯中發(fā)現(xiàn)問題的數(shù)量和評價結(jié)論的合理建議有關(guān)。分析問題和分析論證相輔相成,分析問題要求建構(gòu)自己的觀點并提供證據(jù)支撐,分析論證要求通過分析論點和論據(jù)來評價他人的觀點。正如ETS官網(wǎng)所說,分析性寫作測評被試的批判性思維和分析性寫作技能,評估被試表達、支持和評價復(fù)雜觀點的能力。
總之,寫作過程和批判性思維過程具有一定相似性,二者都要求運用充分相關(guān)的證據(jù)合乎邏輯地論證觀點。寫作能力在某種程度上反映了批判性思維能力,批判性思維能力也能通過寫作外顯。不管是在學術(shù)研究中還是在實踐中,通過寫作評價批判性思維已越來越受關(guān)注,有學者甚至認為,在寫作中評價學生的批判性思維將是批判性思維測評發(fā)展的重要趨勢[13]。
近年來,我國批判性思維研究蓬勃發(fā)展,研究成果迅速增加,研究領(lǐng)域逐漸拓展,研究隊伍不斷壯大,但批判性思維測評研究還比較薄弱。通過對國外批判性思維開放題測評研究的梳理,我們發(fā)現(xiàn)批判性思維開放題測評呈現(xiàn)兩大趨勢:一是重視命題材料的選擇,二是評分過程重視論證質(zhì)量,而非語言本身,這對我國批判性思維測評研究的命題、評分等方面具有一定的啟示作用。
國際知名的批判性思維基金會(Foundation for Critical Thinking)提出設(shè)計批判性思維任務(wù)時要滿足四個標準:一是應(yīng)包括基本概念和核心概念;二是應(yīng)要求學生運用合適的認知技能;三是應(yīng)使學生思維滿足一定的智力標準;四是應(yīng)關(guān)注沖突語境中的推理判斷問題或需要證據(jù)和推理的復(fù)雜問題。上述批判性思維語篇測試、讀寫測試和寫作測試都包含與批判性思維任務(wù)標準一致的情景材料,且情景材料的信息都是被試熟悉的話題。這種命題形式有一定的理論基礎(chǔ)。根據(jù)輸入假設(shè)理論,只有獲得足夠的輸入,才能有高質(zhì)量的輸出,因此作為輸入的情景材料可以促進論證輸出[14]。另外,監(jiān)控(monitoring)、闡述(elaborating)、構(gòu)造(structuring)、體現(xiàn)(projecting)四步以讀促寫也涵蓋闡釋、分析、評價等批判性思維技能[15]。
這啟示我們設(shè)計批判性思維評價任務(wù)時要提供多樣化的情景材料,可以是文字、表格、圖示,或者文字加圖示、文字加表格等多種表征形式。情景材料的內(nèi)容要來自日常生活且具有正確價值導向,情景材料的語言應(yīng)與考生的認知能力相匹配,一般不應(yīng)包含新概念或新單詞,或者所含新概念或新單詞不影響考生對情景材料的理解。設(shè)問要語言清晰、明確、指向性強,能驅(qū)動被試利用先驗知識和其他信息進行批判性思維,確立并捍衛(wèi)自己的觀點。
批判性思維開放題測評的評分重視內(nèi)容本身,而不是語言形式,即根據(jù)學生支撐其立場的論證質(zhì)量(而非回答的正確性)來評價學生的批判性思維表現(xiàn)。批判性思維開放題測評依據(jù)被試在論證或得出結(jié)論過程中提供的證據(jù)質(zhì)量和邏輯進行評價,這對在外語教學中通過開放題評價批判性思維的評分具有一定的啟示作用。
因批判性思維具有多元性和復(fù)雜性,對于采用開放題形式測評批判性思維的評分要實行雙評或三評。具體操作如下:
第一輪:兩位評分員獨立對隨機抽取的若干份作答運用分析評分法進行評分,初步計算兩位評分員的內(nèi)部一致性信度系數(shù)。評分員需注意評分標準描述的特定細節(jié),然后討論評分標準的哪些方面影響給分。
第二輪:基于兩位評分員的反饋,修改評分標準,確保評分標準的描述具體、細化、具有可區(qū)分性和可操作性。
第三輪:運用修改好的評分標準,兩位評分員再次獨立對隨機抽取的另外若干份文本進行評分,計算評分員內(nèi)部一致性信度系數(shù),然后評分員對修改后的評分標準再次反饋,對評分標準進一步微調(diào)。
第四輪:兩位評分員運用最后定稿的評分標準對所有作答進行評分,取兩位評分員的均值作為被試的最后得分,如果評分差異超過一定閾值范圍,可進行三評。
信度指測驗結(jié)果的穩(wěn)定性和一致性,信度越高,測評的標準誤越低。常用的信度檢驗方法為內(nèi)部一致性信度系數(shù)(即α系數(shù))。α系數(shù)越高,代表測評工具的內(nèi)部一致性越高。上述三種批判性思維開放題測評工具的信度檢驗都采用評分員內(nèi)部一致性信度系數(shù)。這啟示我們采用開放題測評批判性思維時,信度檢驗可采用評分員內(nèi)部一致性信度系數(shù)。如果只有兩人評N份試卷,或一人先后兩次評N份試卷,用斯皮爾曼(Spearman)等級相關(guān)系數(shù),如果三個以上(含三個)評分者評N份試卷,用肯德爾和諧系數(shù)計算信度。
效度指測評能夠在多大程度上測量到所欲測的心理或行為特質(zhì)。上述批判性思維開放題測評中,EWCTET沒有報告效度信息,ICTRWT和寫作測評都采用專家效度和效標關(guān)聯(lián)效度進行效度驗證。這啟示我們采用開放題評價批判性思維時,效度驗證可以采用多種方法,一是可以進行專家效度驗證;二是可以用其他效標與批判性思維技能的相關(guān)來驗證,國際成熟的批判性思維測評工具或?qū)W業(yè)成績都可以作為批判性思維開放題測評的效標。
培養(yǎng)學生的批判性思維能力已成為我國外語教學的重要目標之一,如何準確測評學習者的批判性思維是影響批判性思維培養(yǎng)成效的重要一環(huán)。國外批判性思維開放題測評的經(jīng)驗對我國外語教學領(lǐng)域的批判性思維培養(yǎng)和評價研究具有參考價值。雖然開放題具有測評批判性思維的天然優(yōu)勢,但是運用開放題測評批判性思維也存在很多弊端,比如評分時耗費精力、信度難以保障、主觀性偏強、評分受評分員信度影響等。因此,對于批判性思維測評,我們要理性對待,選擇適合學生思維水平的最佳測評方式,才能助力我國學生的批判性思維培養(yǎng)。
[1]ABRAMI P,BERNARD E,BOROKHOVSKI D,et al.Strategies for teaching students to think critically:A meta-analysis[J].Review of Educational Research,2014(2):275-314.
[2]KU K Y.Assessing students’critical thinking performance:Urging for measurements using multi-response format[J].Thinking Skills and Creativity,2009,41(1):70-76.
[3]ENNIS R H.Critical testing assessment:Theory into practice[J].Teaching for Higher Order Thinking,1993,32(3):179-186.
[4]FACIONE P A.California Critical Thinking Skills Test Manual[M].Millbrae:California Academic Press,1990.
[5]VENTURA M,LAI E,DICERBO K.Skills for Today:What We Know about Teaching and Assessing Critical Thinking[M].London:Pearson,2017.
[6]ENNIS R H,WEIR E.The Ennis-Weir CT Essay Test:An Instrument for Testing and Teaching[R].Pacific Grove,CA:Midwest publications,1985.
[7]NORRIS S P,ENNIS R H.Evaluating critical thinking[M].Pacific Grove,CA:Midwest Publications,1989.
[8]PAUL R,Elder L.Critical thinking:Learn the tools the best thinkers use[M].Columbus,OH:Pearson Prentice Hall,2006.
[9]DEANE P.Writing Assessment and Cognition[M].Princeton,NJ:Educational Testing Service,2011.
[10]WADE C.Using writing to develop and assess critical thinking[J].Teaching of Psychology,1995,22(1):24-28.
[11]STAPLETON P.Critical thinking in Japanese L2 writing:rethinking tired constructs[J].ELT Journal,2002(3):250-257.
[12]QIN J,KARABACAK E.The analysis of Toulmin elements in Chinese EFL university argumentative writing[J].System,2010(38):444-456.
[13]PREISS D D.Writing and its assessment across life-span[J].Learning and Individual Differences,2013(28):131-132.
[14]KRASHEN S.Second language acquisition and second language learning[M].Oxford:Oxford Press,1981.
[15]STEIN V.Elaboration:Using what you know(Reading-to-Write Report No.6)[J].Center for the Study of Writing,1989(25):1-31.