摘要:難度是把握考試性質(zhì)、體現(xiàn)學(xué)情理解、反映命題質(zhì)量的重要指標(biāo)之一?;趯W(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)合理轉(zhuǎn)化和闡釋試卷試題難度是依標(biāo)命題的關(guān)鍵所在。改變以往簡單以“了解、理解、應(yīng)用”等認(rèn)知性詞語來模糊對應(yīng)考試難度的做法,結(jié)合課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量要求,我們對現(xiàn)有難度模型進(jìn)行了重構(gòu),這一重構(gòu)將有利于促進(jìn)考試與課程標(biāo)準(zhǔn)的緊密銜接,對于考試結(jié)果的解釋與使用也將發(fā)揮重要的作用。
關(guān)鍵詞:核心素養(yǎng);依標(biāo)命題;考試難度模型;學(xué)業(yè)質(zhì)量水平
引用格式:任建英.依標(biāo)命題要求下考試難度的重構(gòu)與操作轉(zhuǎn)化[J].教學(xué)與管理,2025(07):63-67.
依據(jù)課程標(biāo)準(zhǔn)進(jìn)行命題已經(jīng)成為考試評價最突出的要求[1]??荚囯y度的“依標(biāo)”是依標(biāo)命題的核心要義。難度不僅指向診斷(區(qū)分)不同學(xué)生的學(xué)業(yè)水平,更重要的是難度的設(shè)定依據(jù)要和課程標(biāo)準(zhǔn)充分結(jié)合,這樣考試結(jié)果才能反映學(xué)生學(xué)習(xí)結(jié)果之于國家要求的實現(xiàn)程度。2017年以來,普通高中、義務(wù)教育新的課程方案和課程標(biāo)準(zhǔn)相繼頒布。課程標(biāo)準(zhǔn)系統(tǒng)構(gòu)建了以發(fā)展學(xué)生核心素養(yǎng)為目標(biāo)的教學(xué)、評價體系。全面依據(jù)課程標(biāo)準(zhǔn)命題、強(qiáng)化素養(yǎng)導(dǎo)向是新階段考試的重要要求,最核心的在于兩個方面:一是對課程內(nèi)容的覆蓋度;二是對核心素養(yǎng)及其水平的考察程度。前者本身具有層次性,現(xiàn)代學(xué)習(xí)進(jìn)階、知識結(jié)構(gòu)化等理論已有多方面的研究,主要強(qiáng)調(diào)對核心知識的覆蓋,很難具體說覆蓋到何種程度,因為考試要考察學(xué)生核心素養(yǎng)發(fā)展情況,知識總歸是一種載體。第二方面是本文討論的重點,集中反映為學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)如何有效轉(zhuǎn)化到考試命題設(shè)計之中,這是一個理論問題,也是一個實踐問題。
一、考試難度研究現(xiàn)狀
題目難度以及難度分布是否合適,主要取決于測驗的目的和性質(zhì)[2]??荚囯y度是測試測驗的關(guān)鍵指標(biāo),得到了考評戰(zhàn)線以及研究人員廣泛的重視。當(dāng)前理論研究主要集中在三個方面:第一,超越難度的數(shù)據(jù)統(tǒng)計層面,從情緒意義、社會意義等多個角度來建立考試難度結(jié)構(gòu)。有學(xué)者從測量難度、感受難度、印象難度構(gòu)建了高考難度的三元框架,進(jìn)一步拓展了考試難度的內(nèi)涵與外延[3]。第二,系統(tǒng)分析考試難度的影響因素。有學(xué)者通過實證研究,提出影響物理合格性考試難度的因素包括建模、情境熟悉程度、閱讀量、提示度、認(rèn)知水平、圖表、推理廣度、數(shù)學(xué)復(fù)雜性、情境結(jié)合程度、知識量等[4]。有學(xué)者從問題表征(信息呈現(xiàn)方式、信息利用方式、情境陌生程度)、問題解決(知識綜合程度、思維層次)、結(jié)果輸出(答案表達(dá)方式、答案開放程度)三大維度對影響因素進(jìn)行了結(jié)構(gòu)化和定量化分析[5]。對于特定類型試題,也要把握好難度影響要素,如開放性試題設(shè)問要明確指向考查目標(biāo),不能無限開放;評分標(biāo)準(zhǔn)要符合學(xué)生的認(rèn)知水平,不能以教師的思維水平為依據(jù)來評價學(xué)生[6]。對于特定任務(wù),如聽力任務(wù)難度受到輸入語篇(長度、文本復(fù)雜度、語音特征、播放次數(shù))、測試任務(wù)(指導(dǎo)語、題干等)、試題三大要素的影響[7]。第三,對考試難度設(shè)置與控制理論的研究。高中等級性考試難度設(shè)計要充分考慮大規(guī)模教育考試的測量學(xué)要求、試點省份分?jǐn)?shù)轉(zhuǎn)換的理論模型、高考相關(guān)學(xué)科的實測數(shù)據(jù),體現(xiàn)對高考綜合改革實施的長遠(yuǎn)影響[8]。利用代表性小樣本試測新題的方法預(yù)控考試難度、采用計算機(jī)化自適應(yīng)測試方式控制考試難度、采用標(biāo)準(zhǔn)設(shè)定的方法預(yù)估考試難度,可以有效提高測量效果[9]。
總體而言,關(guān)于考試以及考試難度的研究在一定程度上都關(guān)注到了與課程標(biāo)準(zhǔn)要求的關(guān)系,但對于如何把課程標(biāo)準(zhǔn)要求有效轉(zhuǎn)化到考試命題流程與體系之中,研究很少,指導(dǎo)性、可操作性有限?;谶@種情形,把課程標(biāo)準(zhǔn)特別是綜合反映新理念的學(xué)業(yè)質(zhì)量要求轉(zhuǎn)化到多維細(xì)目表之中,實現(xiàn)與考試難度設(shè)定的有機(jī)結(jié)合,迫切需要研究突破與指導(dǎo)。
二、考試難度解釋模型
雖然難度是計算出來的,但在命題中怎樣區(qū)分試題難易程度,需要一個理論模型或者解釋。當(dāng)前,預(yù)設(shè)難度、實測難度都主要分為“難、中、易”三個等級。一場考試的性質(zhì)集中反映在試卷難度以及難度結(jié)構(gòu)上,即試卷總體難度以及“難、中、易”等級上的試題(分值)比例?!半y、中、易”三個等級只是對試題難度的抽象標(biāo)識,它的設(shè)定依據(jù)是什么?通常而言,“難、中、易”分別對應(yīng)“應(yīng)用、理解、了解”三個認(rèn)知層次(如圖1)。這三個詞主要來源于布魯姆認(rèn)知水平分類理論,為了規(guī)避該理論在高層次認(rèn)知活動上的交叉與模糊,在考試中將布魯姆“了解、理解、應(yīng)用、分析、綜合、評鑒”六個層級概化為“了解、理解、應(yīng)用”三個層級。這種處理一定程度上解決了一些理論上的問題,而且從字面上或者直觀來講,“了解、理解、應(yīng)用”三個詞的層級差異性比較明顯。但進(jìn)一步分析可見,其自身的理論困境仍舊沒有解除。比如,一點不“理解”的“了解”有多大意義,特別是在人工智能迅猛發(fā)展的背景之下;不能“應(yīng)用”的“理解”是真的“理解”嗎?姑且不論認(rèn)知動詞之間的邊界問題,動詞本身具有的模糊特點實則才是最大的困難與問題所在。有人認(rèn)為,正是這種模糊性質(zhì)才給了命題人員與評卷人員空間與張力,說得難聽一點,總會拼湊出一個合理的結(jié)果來回應(yīng)各方面的質(zhì)疑。然而,這與基礎(chǔ)教育階段新課程的理念和要求相去甚遠(yuǎn)。
如果以“了解、理解、應(yīng)用”來表征特定試題任務(wù)所需學(xué)生的認(rèn)知層級,那么核心素養(yǎng)在哪里?具體而言,有三個突出問題:第一,“了解、理解、應(yīng)用”的認(rèn)知要求與核心素養(yǎng)如何關(guān)聯(lián)?當(dāng)前,一種折中的做法是,在多維細(xì)目表中仍然對每一道題使用“了解、理解、應(yīng)用”來標(biāo)識難度,同時說明該題考察的核心素養(yǎng)。然而,考察的核心素養(yǎng)以及學(xué)生應(yīng)有的表現(xiàn)與難度是什么關(guān)系?比如,學(xué)生達(dá)到“了解”的表現(xiàn)要求,學(xué)生素養(yǎng)發(fā)展相應(yīng)是怎樣的?這些都是當(dāng)前難度模型或解釋的突出矛盾或者不足。第二,是否符合課程標(biāo)準(zhǔn)的要求?有人說,“了解”主要指向記憶性試題,那么記憶性試題和素養(yǎng)導(dǎo)向的試題是什么關(guān)系?其考察目標(biāo)與相應(yīng)的學(xué)業(yè)質(zhì)量要求是否一致?第三,不利于診斷和改進(jìn)。倘若依托“了解、理解、應(yīng)用”來標(biāo)識難度,考后就很難描述清楚一個學(xué)生的素養(yǎng)發(fā)展?fàn)顩r,對于下一步學(xué)習(xí)的指導(dǎo)性便非常弱。以上問題都需要我們構(gòu)建一個關(guān)于考試難度的新的解釋模型,并合理使用之。
三、考試難度新模型的構(gòu)建與操作轉(zhuǎn)化
利用布魯姆認(rèn)知分類體系來指導(dǎo)考試命題,在一定歷史時期內(nèi),在世界范圍內(nèi)取得了突出的成就。然而,探討教育目標(biāo)分類的理論研究沒有停止,布魯姆理論的弊端越發(fā)凸顯,最突出的問題有三個:一是經(jīng)驗性的描述用于確認(rèn)顯性的行為問題不大,要用來確認(rèn)穩(wěn)性的、抽象的思想和情感就很困難,或者因描述過于抽象而導(dǎo)致泛化不可操作,或者因描述過于具體而失去目標(biāo)的本意。這一問題在紙筆考試中更加突出。二是當(dāng)目標(biāo)涉及高層次的思維活動時,其邏輯也有很大問題,所作的描述與被描述的目標(biāo)行為之間有較大的差異。三是“了解、理解、應(yīng)用”等認(rèn)知要求對于表征學(xué)生發(fā)展是單維的、不全面的,布魯姆本人也曾嘗試從認(rèn)知、情感意志、動作技能三個領(lǐng)域來描述學(xué)生學(xué)習(xí)成果,只是后兩個領(lǐng)域由于不成熟而沒有得到應(yīng)有的關(guān)注和使用[10]。但奉之為圭臬的我國考試實踐卻未能充分重視這些新思考、新進(jìn)展,特別是不能有機(jī)結(jié)合新的育人理念,探索符合我國教育發(fā)展需要的難度模型,這是不合理的,也是不應(yīng)該的。
1.考試難度新模型的構(gòu)建
為了更好地發(fā)揮考試的診斷與改進(jìn)功能,我們必須改變現(xiàn)有考試難度模型的模糊化解釋,明確回歸到對學(xué)生學(xué)業(yè)表現(xiàn)綜合化、全面性要求更好的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)上來。學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)以核心素養(yǎng)(包括正確價值觀、關(guān)鍵能力、必備品格,而不僅僅是認(rèn)知要求)為主要維度,結(jié)合核心內(nèi)容、典型任務(wù)等,對學(xué)生學(xué)業(yè)成就的表現(xiàn)特征進(jìn)行了整體刻畫。從政策和理論的角度講,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)對于特定考試的試卷和試題難度給出了較為清晰的邊界。至于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表述方式,我們可以結(jié)合SOLO理論[11]來理解,其追求一種刻畫學(xué)生核心素養(yǎng)整體性的發(fā)展“階梯”?;谝陨嫌懻?,我們對圖1所示的難度解釋模型進(jìn)行了重構(gòu),將課標(biāo)中的學(xué)業(yè)質(zhì)量要求細(xì)化為若干水平,如水平A、水平B、水平C,代替“了解、理解、應(yīng)用”,并分別對應(yīng)“難、中、易”三個難度層次(如圖2)。
2.考試難度新模型的操作轉(zhuǎn)化
“操作轉(zhuǎn)化”可以概括為“水平細(xì)化、結(jié)構(gòu)對應(yīng)、試題具化”三個重要環(huán)節(jié)。這三個環(huán)節(jié)缺一不可,“水平細(xì)化”是“結(jié)構(gòu)對應(yīng)”的基礎(chǔ),“結(jié)構(gòu)對應(yīng)”為“水平細(xì)化”提供方向,為“試題具化”提供基本依據(jù)。前兩者由課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量要求演繹而來,是抽象概括的,具有一般性;后者結(jié)合具體測驗題目的情境、內(nèi)容、任務(wù)等進(jìn)行表述。
(1)水平細(xì)化
對照特定考試性質(zhì)與功能,將課程標(biāo)準(zhǔn)提出的學(xué)業(yè)質(zhì)量參照水平細(xì)化為3個水平。這里說明兩個問題:一是在一次考試中要有差異化的不同水平來滿足命題需求,即要從這一參照水平中生發(fā)出更多水平(如圖3)。然而,要從這個參照水平生發(fā)出一個略高的水平和一個略低的水平如圖3中的模式一,還是生發(fā)出的水平都比參照水平低如圖3中的模式二?這兩種模式哪一種更好需要進(jìn)一步討論。二是細(xì)化的水平越多,考后的反饋指導(dǎo)就越精細(xì)和精準(zhǔn),比如五個水平。
下面以初中學(xué)業(yè)水平考試為例進(jìn)行討論。此時,圖3中的“參照水平”便是學(xué)生學(xué)完九年義務(wù)教育課程后的“畢業(yè)水平”。模式一的優(yōu)勢在于,全面遵循了課標(biāo)提出的“畢業(yè)水平”的要求,但在命題上,水平C雖然只是略高于參照水平,卻又容易讓這種模式陷入“超標(biāo)”的質(zhì)疑。在實際操作過程中,要把握好水平C、水平A與水平B之間的距離,確保比較接近。模式二的優(yōu)勢非常突出,完全落實了“不超標(biāo)”的要求,但也存在一個潛在的問題,低于參照水平的水平B和水平A應(yīng)該是什么水平。通常有人會說,試卷中有一些“送分”題,說的就是這些水平對應(yīng)的試題,但存在“送”到何種程度的問題。比如,極端一點,讓水平A對應(yīng)義務(wù)教育第一個學(xué)段(1~2年級)的學(xué)業(yè)質(zhì)量要求,當(dāng)然絕大多數(shù)甚至是100%的學(xué)生都能夠正確作答相關(guān)試題。但如果水平A對應(yīng)7年級的學(xué)業(yè)要求,那么有些學(xué)生不一定可以得到滿分。當(dāng)然,沒有任何文件規(guī)定過水平B、水平A應(yīng)該對應(yīng)哪一個年級或者學(xué)段的水平,但水平B和水平A應(yīng)該比較接近“畢業(yè)水平”,而不是無限度地下沉到小學(xué),這是初中學(xué)業(yè)水平考試的性質(zhì)和定位決定的。按照模式二,以數(shù)學(xué)“抽象能力”“運算能力”為例呈現(xiàn)細(xì)化結(jié)果(見表1)[12]。需要指出的是,表1以素養(yǎng)為維度呈現(xiàn),并未將所有素養(yǎng)統(tǒng)整起來表述學(xué)生發(fā)展水平,這有待進(jìn)一步研究和完善。
(2)結(jié)構(gòu)對應(yīng)
將難度劃分與細(xì)化水平充分對應(yīng)起來,比如三個水平分別對應(yīng)“易、中、難”;如果細(xì)化為五個水平,就可以對應(yīng)到更加精細(xì)的難度結(jié)構(gòu)上,如“易、較易、中等、較難、難”。在這種對應(yīng)之后,試題難度就直接關(guān)聯(lián)到了課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量要求,而不是漏洞百出且模棱兩可的“了解”“理解”或“應(yīng)用”。具體呈現(xiàn)在多維細(xì)目表之中(見表2),其中“學(xué)業(yè)考察水平”便是上述“細(xì)化水平”。
(3)試題具化
在表2中,要明確每一道試題考察學(xué)生到什么水平,并在“學(xué)業(yè)考察水平”中寫出學(xué)生作答該試題應(yīng)有的表現(xiàn)。整個試卷要對不同的難度水平進(jìn)行結(jié)構(gòu)性覆蓋,符合考試性質(zhì)、目的要求。為對上述模型及其使用作出更清晰的說明,我們選擇下題為例進(jìn)行分析,以展示實操過程和主要做法。
為了解蘇州市的地鐵線路圖,某校學(xué)生在網(wǎng)上查到部分線路圖并利用網(wǎng)格畫出示意圖(示意圖是軸對稱圖形)(如圖4)。現(xiàn)建立平面直角坐標(biāo)系,使得圖中表示石路站點的點A的坐標(biāo)為(-1,1),表示臨頓路站點的點D的坐標(biāo)為(2,0),且測得AB=BC,∠ABC=135°,則表示蘇州火車站點的點C的坐標(biāo)為" " " " " "。
該題主要考查學(xué)生的空間觀念和運算能力。試題任務(wù)雖然源于現(xiàn)實情境,但是已經(jīng)基本完成了對真實問題的建模,不僅繪制了示意圖,而且給出了A點和D點的坐標(biāo),因而直角坐標(biāo)系的建立非常容易。結(jié)合軸對稱圖形和相關(guān)角度的提示,試題本身的計算也偏簡單。基于本文探討的主要問題,現(xiàn)主要呈現(xiàn)試題的考察意圖、學(xué)業(yè)考察水平以及預(yù)設(shè)難度系數(shù)。學(xué)業(yè)考察水平的表述應(yīng)該是表1中水平A在該題的具體化(見表3)。若干題目接續(xù)呈現(xiàn)在表2中,結(jié)構(gòu)性覆蓋應(yīng)考察的核心素養(yǎng)及其不同水平。
學(xué)生核心素養(yǎng)發(fā)展?fàn)顩r主要依據(jù)其在解決實際問題過程中的表現(xiàn)來判斷。為進(jìn)一步強(qiáng)化真實問題解決,我們對上題作了一些調(diào)整,以更加突出建模方面的考察。建模意識和能力是學(xué)生“會用數(shù)學(xué)的眼光觀察現(xiàn)實世界、會用數(shù)學(xué)的思維思考現(xiàn)實世界、會用數(shù)學(xué)的語言表達(dá)現(xiàn)實世界”的關(guān)鍵方面,改編后的題目將對教學(xué)方式轉(zhuǎn)變發(fā)揮更加積極的引導(dǎo)作用。
圖4所示為蘇州市部分地鐵線路圖。圖中線路可近似看作軸對稱圖形,蘇州火車站所在交角近似為90°。當(dāng)前,某校學(xué)生在養(yǎng)育巷站,打算乘坐地鐵,在最短時間內(nèi)到達(dá)蘇錦站。
(1)建立適當(dāng)?shù)钠矫嬷苯亲鴺?biāo)系,并近似標(biāo)注沿途各站坐標(biāo)?!梆B(yǎng)育巷-樂橋”兩站為1個單位長度。
(2)假如1個單位長度為1cm,圖6比例尺為1:150000。結(jié)合生活經(jīng)驗,估算學(xué)生需要多長時間到達(dá)目的地。
改編后的題目具有了更強(qiáng)的開放性,學(xué)生需要根據(jù)插圖明確各個站點、線路之間的位置關(guān)系,通過測量和比例尺來估算各點之間的距離。在建立直角坐標(biāo)系的過程中,相比改編前,坐標(biāo)原點不固定,給了學(xué)生更多選擇與解釋空間。同時,學(xué)生需要結(jié)合生活經(jīng)驗估算地鐵行進(jìn)速度,并對加速和減速過程進(jìn)行適當(dāng)假設(shè)(初中學(xué)生可以假設(shè)整個過程作勻速運動,但是必須要體現(xiàn)出對這一要素的考慮與假設(shè),確保論證嚴(yán)密)。這種改編在一定程度上會增加試題難度,可形成該題的多維細(xì)目表(見表4)。
對于更好體現(xiàn)素養(yǎng)立意的開放性試題,存在一個突出問題:試題的學(xué)業(yè)考察水平與評分標(biāo)準(zhǔn)(細(xì)則)有什么關(guān)系?評分標(biāo)準(zhǔn)(細(xì)則)的設(shè)定與難度控制關(guān)系很大,在開放性試題(給學(xué)生多重論證和解釋的空間,結(jié)論不確定、不唯一,關(guān)注學(xué)生的論證過程以及邏輯性合理性)的作答中尤為突出。當(dāng)學(xué)生作答表現(xiàn)符合了該題所設(shè)定的學(xué)業(yè)考察水平,應(yīng)該獲得滿分,且滿分之上的作答不再進(jìn)一步區(qū)分。有人提出,為什么要在主觀上模糊學(xué)生更高水平的表現(xiàn),從而弱化考試對學(xué)生的診斷與改進(jìn)功能?在一定程度上講,學(xué)生在開放性試題上的表現(xiàn)是上不封頂?shù)?,如果以最好的學(xué)生表現(xiàn)作為滿分答案,容易導(dǎo)致整體分?jǐn)?shù)的下滑,影響實測難度以及難度控制情況,這要綜合考試的性質(zhì)和目的來看待。
四、考試難度新模型使用的思考與建議
根據(jù)上述難度設(shè)計與實踐操作的探討,在一次考試結(jié)束之后,我們可以進(jìn)行三個方面的分析,以彰顯和深化這種難度新模型的優(yōu)勢,推進(jìn)基于課程標(biāo)準(zhǔn)的“教學(xué)評”一致性。
首先,對照多維細(xì)目表,分析試卷和試題實測難度和預(yù)設(shè)難度的一致性,特別是對于偏離預(yù)設(shè)難度較大的題目,要專門討論表3(或表4)中“學(xué)業(yè)考察水平”的設(shè)定和表述,全面分析偏離的主要原因,為下一步命題規(guī)劃的改進(jìn)提出建議。其次,考量每一道試題考查目標(biāo)的實現(xiàn)情況與水平細(xì)化結(jié)果的一致性。如果偏離應(yīng)有水平的試題較多,需要進(jìn)一步考慮當(dāng)?shù)亟糖閷W(xué)情與學(xué)業(yè)質(zhì)量要求的距離,為區(qū)域教育質(zhì)量改進(jìn)明確方向。進(jìn)一步講,從更大的范圍來說,這種對學(xué)生整體情況的反思也可以作為對課程標(biāo)準(zhǔn)中學(xué)業(yè)質(zhì)量的校正依據(jù)。同時,根據(jù)學(xué)生作答,可以形成學(xué)生素養(yǎng)發(fā)展的質(zhì)性分析報告,對學(xué)生進(jìn)一步規(guī)劃學(xué)習(xí)發(fā)揮參考作用。再次,充分認(rèn)識和把握實測難度、預(yù)設(shè)難度之間的差距與教學(xué)方式之間可能存在的隱性矛盾。比如,對于特定試題,預(yù)設(shè)難度是0.8,但是實測難度卻是0.5乃至更低,那么原因是試題考察水平設(shè)定不合理,還是試題本身出了問題?如果這道題是為了充分考察學(xué)生核心素養(yǎng)而設(shè)計的開放性、探究性試題,而我們?nèi)粘=虒W(xué)又很少有時間有機(jī)會讓學(xué)生經(jīng)歷開放探究的學(xué)習(xí)過程,這種不適也可能造成實測難度、預(yù)設(shè)難度之間的巨大偏差。這個時候,需要理性認(rèn)識這一情況,堅持素養(yǎng)考察的命題方向,而不能簡單地否定或者排斥。
參考文獻(xiàn)
[1] 教育部關(guān)于加強(qiáng)初中學(xué)業(yè)水平考試命題工作的意見(教基〔2019〕15號)[EB/OL].(2019-12-20)[2024-09-05]. http://www.moe.gov.cn/srcsite/A06/s3321/201911/t20191128_409951.html.
[2] 黃光揚(yáng).教育測量與評價[M].上海:華東師范大學(xué)出版社,2022:64-67.
[3] 于涵.中國高考難度分析理論構(gòu)建初探[J].中國考試,2024(02):1-10.
[4] 馮雪媚,張殷.物理合格性考試試題難度影響因素的實證研究[J].招生考試研究,2022(04):1-16.
[5] 劉芳,王偉群,吳星.高中學(xué)業(yè)水平考試試題難度模型建構(gòu)[J].化學(xué)教育(中英文),2022,43(21):43-47.
[6] 陸璟.考試要有效體現(xiàn)對學(xué)生成長有價值的內(nèi)容——“雙減”背景下提高中考命題科學(xué)化水平的思考[J].人民教育,2022(09):39-41.
[7] BRINDLEY G, SLATYER H. Exploring task difficulty in ESL list-ening assessment [J]. Language Testing,2002,19(04):369-394.
[8] 趙雪,宋寶和.普通高中學(xué)業(yè)水平選擇性考試的難度設(shè)計研究[J].教育理論與實踐,2022,42(02):18-22.
[9] 楊志明,徐慶樹.考試難度及其測量學(xué)調(diào)控手段[J].教育測量與評價,2022(04):3-10.
[10] 馬扎諾,肯德爾.教育目標(biāo)的新分類學(xué)[M].2版.高凌飚,吳有昌,蘇峻,譯.北京:教育科學(xué)出版社,2012:2.
[11] 彼格斯,科利斯.學(xué)習(xí)質(zhì)量評價:SOLO分類理論[M].高凌飚,張洪巖,譯.北京:人民教育出版社,2010:27-32.
[12] 中華人民共和國教育部.義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2022年版)[S].北京:北京師范大學(xué)出版社,2022:82-83.
【責(zé)任編輯" " 王澤華】
* 該文為教育部課程教材研究所2024年度科研發(fā)展基金課題“核心素養(yǎng)導(dǎo)向的命題理論與實踐研究”(JCSZD24005)的研究成果