余海峰 李德紅
近幾十年,計(jì)算機(jī)技術(shù)迅猛發(fā)展,并逐漸運(yùn)用于教育管理領(lǐng)域,Drasgow[1]、Russell[2]等人提出開(kāi)發(fā)計(jì)算機(jī)試題的設(shè)想。得益于“智慧平衡評(píng)估聯(lián)盟”(Smarter Balanced Assessment Consortium,簡(jiǎn) 稱SBAC)和“評(píng)估升學(xué)和就業(yè)準(zhǔn)備情況的合作伙伴”(the Partnership for Assessment of Readiness for College and Career,簡(jiǎn)稱PARCC)關(guān)于美國(guó)學(xué)生知識(shí)和能力的評(píng)估競(jìng)賽,計(jì)算機(jī)測(cè)評(píng)技術(shù)在美國(guó)得到了飛速發(fā)展。為了更加快速、有效地評(píng)估學(xué)生的發(fā)展水平,兩大聯(lián)盟開(kāi)發(fā)了大量的技術(shù)提升型試題(Technology-Enhanced Items,簡(jiǎn)稱TEIs),并將其應(yīng)用于大規(guī)模測(cè)試。當(dāng)今,美國(guó)有超過(guò)一半的州在測(cè)試中使用了技術(shù)提升型試題。試題的應(yīng)用范圍從英語(yǔ)、數(shù)學(xué)的測(cè)評(píng)擴(kuò)展到了科學(xué)領(lǐng)域的測(cè)評(píng);測(cè)試種類從SBAC 和PARCC 領(lǐng)導(dǎo)的測(cè)試,擴(kuò)展到部分州的其他測(cè)試以及美國(guó)國(guó)家教育進(jìn)步評(píng)價(jià)(National Assessment of Educational Progress,簡(jiǎn)稱 NAEP)。加州等部分州甚至完全取消了紙筆測(cè)試,所有試題均采用TEIs??梢哉f(shuō),TEIs 已經(jīng)成為美國(guó)最重要的教育評(píng)價(jià)工具之一。PISA、MTISS 等大規(guī)模國(guó)際評(píng)測(cè)中也越來(lái)越倚重技術(shù)提升型試題。
技術(shù)提升型試題對(duì)我國(guó)評(píng)價(jià)改革同樣具有重要的參考意義。2019 年,《中國(guó)教育現(xiàn)代化2035》提出加速現(xiàn)代化的監(jiān)測(cè)體系建設(shè)[3];《加快推進(jìn)教育現(xiàn)代化實(shí)施方案(2018-2022 年)》提出有條件的地區(qū)“探索利用新技術(shù)手段”改進(jìn)教育評(píng)價(jià)[4];2020 年,《深化新時(shí)代教育評(píng)價(jià)改革總體方案》明確指出“利用人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù),探索開(kāi)展學(xué)生各年級(jí)學(xué)習(xí)情況全過(guò)程縱向評(píng)價(jià)”[5]。上述文件的發(fā)布,為我國(guó)計(jì)算機(jī)測(cè)評(píng)改革掃清了政策障礙。
技術(shù)提升型試題的定義并不明確,Parshall 等人將TEI 定義為:“一種測(cè)試試題,該測(cè)試試題利用計(jì)算機(jī)的特征和功能的技術(shù)來(lái)進(jìn)行評(píng)估,這些評(píng)估難以通過(guò)傳統(tǒng)的紙筆格式完成”[6];SBAC 認(rèn)為,“技術(shù)提升試題是通過(guò)特殊的交互方式收集學(xué)生作答數(shù)據(jù)的計(jì)算機(jī)試題,這些交互方式與傳統(tǒng)選擇題、主觀題不同”[7];Bryant 認(rèn)為,“技術(shù)提升試題是使用與常規(guī)選擇題和主觀題不同的格式和/或作答方式開(kāi)發(fā)的計(jì)算機(jī)的試題”[8]。技術(shù)提升型試題又被稱為技術(shù)支持的試題、創(chuàng)新試題、技術(shù)提升的創(chuàng)新試題、基于計(jì)算機(jī)的試題、創(chuàng)新的計(jì)算機(jī)測(cè)試等。
上述表述雖然有所不同,但其共同點(diǎn)可總結(jié)為:技術(shù)提升型試題是指基于計(jì)算機(jī)技術(shù)開(kāi)發(fā)的、區(qū)別于傳統(tǒng)紙筆測(cè)試的創(chuàng)新試題;該試題重視計(jì)算機(jī)交互的使用,并以此來(lái)收集學(xué)生的作答數(shù)據(jù)。技術(shù)提升通常通過(guò)使用視頻、音頻、動(dòng)畫(huà)、計(jì)算機(jī)自適應(yīng)、AI等手段實(shí)現(xiàn)。
技術(shù)提升型試題的分類標(biāo)準(zhǔn)不一。其中,Parshall 根據(jù)試題構(gòu)建劃分,Scalise 則根據(jù)開(kāi)放程度、復(fù)雜程度劃分。以上這兩類分類標(biāo)準(zhǔn)受到推崇。
1. 根據(jù)創(chuàng)新性劃分
Parshall 認(rèn)為,技術(shù)提升型試題的構(gòu)建應(yīng)該包括七個(gè)維度(見(jiàn)表1),將這些維度進(jìn)行組合,就可以建構(gòu)出從最保守到最創(chuàng)新的各類試題。
表1 基于創(chuàng)新性劃分技術(shù)提升型試題[9]
2. 根據(jù)試題的開(kāi)放程度和復(fù)雜程度劃分
Scalise 根據(jù)試題答案的限制程度由低到高分為七類,每類問(wèn)題根據(jù)復(fù)雜程度由低到高又分為4 個(gè)等級(jí),共計(jì)28種,并為其中的24種提供了實(shí)例說(shuō)明,詳見(jiàn)表2。
表2 基于開(kāi)放程度和復(fù)雜程度劃分技術(shù)提升型試題[10]
表格橫向從左到右分為4 個(gè)難度水平:最左邊的題最簡(jiǎn)單,對(duì)學(xué)生的認(rèn)知要求最低;最右邊的題最復(fù)雜,對(duì)學(xué)生的認(rèn)知要求最高。表格縱向從上到下分為7 個(gè)限制程度:最上面的對(duì)考生的限制程度最高,給予學(xué)生的作答權(quán)限最低;最下面的則完全開(kāi)放,給予學(xué)生充分的作答自由。
較為詳細(xì)的說(shuō)明如下。
1.選擇
① 1A. 對(duì)/錯(cuò):從“是”“否”中二選一。考生在計(jì)算機(jī)上作答時(shí),點(diǎn)擊備選項(xiàng)前的按鈕即可。
②1B. 變式判斷:僅有兩個(gè)備選項(xiàng)。考生在計(jì)算機(jī)上作答時(shí),點(diǎn)擊備選項(xiàng)前的按鈕即可。
③1C. 多選項(xiàng)選擇:備選項(xiàng)>2??忌谟?jì)算機(jī)上作答時(shí),點(diǎn)擊所選擇的備選項(xiàng)即可。
④1D. 新媒體下選擇:多媒體情境下多選一??忌ㄟ^(guò)鼠標(biāo)的拖拽等動(dòng)作完成選擇作答,備選項(xiàng)>2。
2.選擇/鑒定
① 2A. 多個(gè)對(duì)/錯(cuò):對(duì)多個(gè)題項(xiàng)做出“是”或“否”的判斷。
② 2B. 是/否,并解釋:對(duì)多個(gè)題項(xiàng)做出“是”或“否”的判斷,并解釋。
③2C. 多項(xiàng)答案:要求考生從多個(gè)備選項(xiàng)中選出全部正確選項(xiàng)。
④ 2D. 復(fù)雜多選:要求考生在復(fù)雜情境下做出選擇,題項(xiàng)多項(xiàng),備選項(xiàng)多項(xiàng)??忌赏ㄟ^(guò)鼠標(biāo)等點(diǎn)擊下拉框,從下拉框提供的多個(gè)備選項(xiàng)中選出正確答案。
3. 重新排序
① 3A. 匹配:考生作答時(shí),通過(guò)鼠標(biāo)點(diǎn)擊等方式,將多個(gè)備選項(xiàng)匹配起來(lái)。
②3B. 分類:考生作答時(shí),通過(guò)鼠標(biāo)點(diǎn)擊選定并拖拽等方式,將對(duì)象分類。
③3C. 排序:考生作答時(shí),通過(guò)鼠標(biāo)點(diǎn)擊選定并拖拽等方式,將對(duì)象排序。
④3D. 組合性證明:考生作答時(shí),通過(guò)鼠標(biāo)點(diǎn)擊選定并拖拽等方式,將給出的證明過(guò)程排序。
4.替代/校正
①4A. 文字替換:用文字替代特定對(duì)象。例如,通過(guò)鼠標(biāo)點(diǎn)擊下拉框并從下拉框中選擇,或拖拽等方式,填充空白。
②4B. 指針替代:考生作答時(shí),通過(guò)鼠標(biāo)拖拽等方式,將指定的符號(hào)標(biāo)記在特定對(duì)象上。
③ 4C. 限制圖像繪畫(huà):在特定條件下,用鼠標(biāo)繪圖。
④ 4D. 糾錯(cuò):通過(guò)鼠標(biāo)點(diǎn)擊拖拽等形式修正圖形的錯(cuò)誤
5.完成
①5A. 單一數(shù)值構(gòu)造:鍵入單一數(shù)值填充空白。
②5B. 短答案與句子:鍵入較為簡(jiǎn)短的文字填充空白。
③5C. 完成程序:從每個(gè)空白給出的多個(gè)備選項(xiàng)中選出最佳答案填充空白。
④5D. 完成矩陣:組合式選擇填空,通過(guò)鼠標(biāo)拖拽等方式將多個(gè)備選項(xiàng)填充到多個(gè)空白中。
6.設(shè)計(jì)
① 6A. 開(kāi)放式選擇:通過(guò)對(duì)給定圖形的某些要素進(jìn)行改變完成設(shè)計(jì)。
② 6B. 圖形建構(gòu):通過(guò)鼠標(biāo)等選擇、拖拽某些圖形/圖表要素完成圖形/圖表的設(shè)計(jì)。
③6C. 概念圖:通過(guò)拖拽給定圖形要素,并使用畫(huà)圖軟件中的畫(huà)圖、文本等工具,繪制概念圖。
④ 6D. 隨筆、短文編輯:編輯/改寫短文。
7.表達(dá)
① 7A. 項(xiàng)目:鍵入文字,完成一份計(jì)劃。
② 7B. 示范,實(shí)驗(yàn),表演:通過(guò)視頻等方式進(jìn)行演示、表演等。
③7C. 討論,面試:考生通過(guò)視頻等方式在線實(shí)時(shí)參與討論、面試等。
④ 7D. 診斷,教學(xué):考生通過(guò)視頻等方式在線實(shí)時(shí)實(shí)施診斷或教學(xué)。
技術(shù)提升型試題與傳統(tǒng)的紙筆測(cè)試試題相比,在形式和內(nèi)容上都有較大差別,為了更好地分析此類試題,現(xiàn)以美國(guó)哥倫比亞地區(qū)生物學(xué)測(cè)試試題[11]為例進(jìn)行說(shuō)明。
1. 試題測(cè)試界面
與傳統(tǒng)紙筆試題不同,技術(shù)提升型試題依賴計(jì)算機(jī)環(huán)境,測(cè)試界面能夠較好地反應(yīng)出該類試題的部分特征,圖1為技術(shù)提升型試題的測(cè)試操作界面。
圖1 技術(shù)提升型試題的測(cè)試界面
通過(guò)測(cè)試界面可以發(fā)現(xiàn),技術(shù)提升型試題具備了情境、題干、設(shè)問(wèn)等一系列試題的基本要素以及一些常規(guī)作答工具,例如字跡標(biāo)記工具(可將字跡標(biāo)注為紅、藍(lán)、白3 種顏色)、輔助工具(考生可以應(yīng)用相關(guān)工具做筆記、排除錯(cuò)誤答案等)。此外,技術(shù)提升型試題還包含一些特殊工具,可以滿足特殊考生的需要,例如音頻工具(點(diǎn)擊可以實(shí)現(xiàn)試題的閱讀)可以滿足盲人考生的需要,放大鏡(可將頁(yè)面放大)可滿足弱視學(xué)生的需要等。通過(guò)為考生提供各種考試工具,技術(shù)提升型試題可以滿足特殊學(xué)生的評(píng)價(jià)需求,實(shí)現(xiàn)教育公平。
2. 技術(shù)提升型試題例題
將礫石、土壤、沙、植物、蠕蟲(chóng)、蝸牛放置在玻璃容器中形成一個(gè)密閉系統(tǒng),瓶口用帶CO2傳感器的塞子塞緊,如圖2 所示。實(shí)驗(yàn)期間,瓶?jī)?nèi)的植物數(shù)量不變,二氧化碳濃度統(tǒng)計(jì)數(shù)據(jù)如圖3所示。
圖2
圖3
【例1】玻璃瓶?jī)?nèi)的CO2如何維持恒定(A)
A.呼吸作用呼出的化學(xué)元素轉(zhuǎn)化為光合作用的原料
B.呼吸作用呼出的化學(xué)元素轉(zhuǎn)化為光合作用的產(chǎn)物
C.光合作用產(chǎn)生的化學(xué)元素轉(zhuǎn)化為呼吸作用的產(chǎn)物
D.光合作用產(chǎn)生的化學(xué)元素轉(zhuǎn)化為呼吸作用的原料
【例2】下列哪句最能描述16 分鐘的瓶?jī)?nèi)的狀態(tài)(C)
A.呼吸作用和光合作用都在增強(qiáng)
B.呼吸作用和光合作用都在減弱
C.呼吸作用強(qiáng)于光合作用
D.光合作用強(qiáng)于呼吸作用
【例3】不同的生理過(guò)程會(huì)導(dǎo)致容器內(nèi)CO2含量的變化,按要求將下列生理過(guò)程拖入圖4的方框中。
圖4
【例4】蒼蠅和植物可以通過(guò)下列分子將光合作用和呼吸作用聯(lián)系起來(lái),請(qǐng)通過(guò)拖拽完善圖5 的過(guò)程圖。
圖5
參考答案:頂部2 空為葡萄糖和O2,底部2 空為CO2和水。
【例5】容器內(nèi)的二氧化碳濃度最終會(huì)達(dá)到平衡。根據(jù)圖2 的數(shù)據(jù),在圖6 中繪出8、16、24、32、40 分二氧化碳濃度的,并預(yù)測(cè)48 分的數(shù)據(jù)。在圖6 中繪出上述6個(gè)點(diǎn)。
圖6
參考答案:點(diǎn) 1(8min)=25000,點(diǎn) 2(16min)=35000,點(diǎn)3(24min)=40000,點(diǎn)4(32min)=20000,點(diǎn)5(40min)=20000。
【6】容器中的動(dòng)物需要食物和氧氣,圖7 展示了食物和氧氣分子的變化流程圖。請(qǐng)結(jié)合流程圖回答下列問(wèn)題:
圖7
(1)化學(xué)鍵斷裂和重新形成過(guò)程,能量發(fā)生了什么變化?
(2)動(dòng)物體內(nèi)原子重新排列過(guò)程,最終形成了哪些分子?
(3)為什么動(dòng)植物必須通過(guò)這個(gè)過(guò)程才能生存?
參考答案:(1)穩(wěn)定的化學(xué)能轉(zhuǎn)化為活躍的化學(xué)能;(2)C02、H2O、ATP;(3)食物分子中的存儲(chǔ)的穩(wěn)定的化學(xué)能需要通過(guò)有氧呼吸過(guò)程轉(zhuǎn)化為ATP 貯存的活躍的化學(xué)能,為生命活動(dòng)提供能量。
賦分規(guī)則見(jiàn)表3。
表3 主觀試題賦分規(guī)則[12]
通過(guò)分析上述試題可以看出,技術(shù)提升型試題與紙筆測(cè)試一樣,都重視評(píng)價(jià)考生學(xué)業(yè)水平的達(dá)成情況,重視評(píng)價(jià)考生的能力水平。與紙筆測(cè)試相比,技術(shù)提升型試題還具有以下特點(diǎn):
(1)情境化程度高。通過(guò)大量運(yùn)用視頻、照片等素材,技術(shù)提升型試題可以為考生創(chuàng)造出更加真實(shí)的情境。
(2)試題的猜測(cè)空間小。技術(shù)提升型試題通過(guò)運(yùn)用前文所述的“分類”“開(kāi)放性選擇題”等形式,改變?cè)囶}的形式,可以大大降低考生猜測(cè)的可能。
(3)試題的可操作性強(qiáng)??忌诖痤}過(guò)程中,可以進(jìn)行點(diǎn)擊、拖拽、繪圖等活動(dòng),趣味性較強(qiáng),可以提高學(xué)生答題的積極性。
(4)評(píng)價(jià)成本較低。技術(shù)提升型試題除了部分主觀試題外,依靠計(jì)算機(jī)自行處理便可完成評(píng)分環(huán)節(jié),可節(jié)約試題評(píng)價(jià)的成本。
隨著技術(shù)提升型試題越來(lái)越多地應(yīng)用于教育評(píng)價(jià)過(guò)程,關(guān)于技術(shù)提升試題優(yōu)劣的研究也相繼出現(xiàn)。不少學(xué)者闡釋了技術(shù)提升型試題存在的優(yōu)勢(shì),也有不少學(xué)者表達(dá)了自己的擔(dān)憂,Bryant 在前人的基礎(chǔ)上進(jìn)行了總結(jié),結(jié)果如表4所示。
表4 技術(shù)提升型試題的優(yōu)勢(shì)和不足[13]
通過(guò)Bryant 的研究可以看出,技術(shù)提升型試題具有諸多優(yōu)勢(shì),部分優(yōu)勢(shì)在上述案例中得到了較為充分的展示,還有部分特征則體現(xiàn)得不夠明顯,如降低試題編制的不合理性,這一目的達(dá)成需要大規(guī)模的檢測(cè)。美國(guó)加州在開(kāi)技術(shù)提升型試題時(shí),就經(jīng)歷了數(shù)百萬(wàn)次的檢測(cè),最終才選出滿足評(píng)價(jià)要求的試題[14]。
技術(shù)提升型試題的優(yōu)勢(shì)明顯,其不足也較為突出,且主要集中于三個(gè)方面:一是試題開(kāi)發(fā)和管理的成本問(wèn)題;二是試題相關(guān)研究不足的問(wèn)題;三是如何處理測(cè)試與科技的問(wèn)題。作為新興的試題,技術(shù)提升型試題勢(shì)必會(huì)出現(xiàn)研究不足、開(kāi)發(fā)困難的情況,這些問(wèn)題都難以避免,最值得注意的是技術(shù)提升型試題的成本問(wèn)題。2013 年,美國(guó)有48 個(gè)州和地區(qū)參與SBAC 和PARCC 測(cè)試,后來(lái)數(shù)量逐漸減少,主要的影響因素便是經(jīng)濟(jì)因素[15]。
1. 使用技術(shù)提升型進(jìn)行測(cè)評(píng)是教育評(píng)價(jià)的趨勢(shì)。雖然學(xué)者對(duì)技術(shù)提升型試題提出了擔(dān)憂,但大規(guī)模測(cè)評(píng)的證據(jù)顯示,技術(shù)提升型試題越來(lái)受到重視。2016 年,NAEP 嘗試使用技術(shù)提升型試題;PARCC 和SBAC 規(guī)定測(cè)試中將更多地運(yùn)用技術(shù)提升型試題;《TIMSS 2019 評(píng)估框架》[16]和《PISA 2021 數(shù)學(xué)評(píng)估框架》[17]均要求使用技術(shù)提升型試題進(jìn)行測(cè)評(píng)。我國(guó)部分地區(qū)的教育質(zhì)量監(jiān)測(cè)評(píng)估中使用了計(jì)算機(jī)平臺(tái),雖然這與真正意義的技術(shù)提升型試題評(píng)價(jià)還有一段距離,但仍可看作是對(duì)教育評(píng)價(jià)變革的響應(yīng)。
2. 重視技術(shù)提升型試題的開(kāi)發(fā)和研究。技術(shù)提升型試題的開(kāi)發(fā)離不開(kāi)信息技術(shù)的進(jìn)步,而更重要的是依賴認(rèn)知科學(xué)和學(xué)習(xí)理論的發(fā)展。美國(guó)的技術(shù)提升型試題的開(kāi)發(fā)很大程度上是由教育機(jī)構(gòu)或部門委托教育考試服務(wù)中心(ETS)、培生教育集團(tuán)評(píng)價(jià)與信息處(PEM)、美國(guó)大學(xué)入學(xué)考試中心(ACT)這三家世界著名的教育評(píng)價(jià)公司進(jìn)行開(kāi)發(fā)、管理。因此,重視技術(shù)提升型試題的開(kāi)發(fā)工作,應(yīng)從提升試題技術(shù)層面入手。此外,為了有效解決技術(shù)提升型試題可能存在的不足,應(yīng)該積極開(kāi)展相關(guān)的研究工作。
3. 積極探索技術(shù)提升型試題應(yīng)用的道路。技術(shù)提升型試題開(kāi)發(fā)和管理過(guò)程的高成本問(wèn)題是制約其發(fā)展的重要因素。因此,在推廣技術(shù)提升型試題的過(guò)程中,應(yīng)先在部分經(jīng)濟(jì)發(fā)達(dá)省市先進(jìn)行試點(diǎn),再逐步推廣到經(jīng)濟(jì)落后地區(qū)。此外,還應(yīng)該考慮改革的阻力問(wèn)題,先將試題應(yīng)用于低風(fēng)險(xiǎn)、小規(guī)模的測(cè)試中,待取得一定成功經(jīng)驗(yàn)后,再逐漸擴(kuò)展到高風(fēng)險(xiǎn)的、大規(guī)模的測(cè)試中。