亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于認(rèn)知診斷的學(xué)習(xí)測驗(yàn)開發(fā)、應(yīng)用與啟示
        ——以Tatsuoka的分?jǐn)?shù)減法測驗(yàn)為例

        2022-10-18 01:48:54
        教育測量與評價(jià) 2022年5期
        關(guān)鍵詞:模型學(xué)生

        張 怡

        教育與心理測量學(xué)經(jīng)歷了由傳統(tǒng)的經(jīng)典測量理論、概化理論,到20世紀(jì)60 年代的項(xiàng)目反應(yīng)理論,再到20 世紀(jì)90 年代的認(rèn)知診斷理論的發(fā)展過程。經(jīng)典測量理論一般只報(bào)告測驗(yàn)總分。項(xiàng)目反應(yīng)理論則基于被試在項(xiàng)目水平上的反應(yīng),利用項(xiàng)目反應(yīng)模型分析被試整體或多個(gè)領(lǐng)域上的潛在能力水平。然而,無論是經(jīng)典測量理論還是項(xiàng)目反應(yīng)理論均不能反映被試作答項(xiàng)目時(shí)的心理特征和認(rèn)知過程,更不能獲得被試在細(xì)粒度知識(shí)點(diǎn)上的掌握情況。[1]為了解決經(jīng)典測量理論和項(xiàng)目反應(yīng)理論存在的這一弊端,認(rèn)知診斷理論應(yīng)運(yùn)而生。

        認(rèn)知診斷理論是以項(xiàng)目的形式給反應(yīng)者呈現(xiàn)任務(wù),把被試的測驗(yàn)結(jié)果作為診斷的數(shù)據(jù),把被試的潛在特質(zhì)作為屬性,并將這些屬性表示為潛在變量的變量,再用心理測評模型加以分析,得到認(rèn)知診斷結(jié)果的測評技術(shù)。[2]認(rèn)知診斷測驗(yàn)通過被試外在反應(yīng)來了解其內(nèi)部知識(shí)掌握狀態(tài),通過知識(shí)鏈間的關(guān)系獲取更恰當(dāng)?shù)膶W(xué)習(xí)路徑和學(xué)習(xí)進(jìn)階,可以更好地指導(dǎo)教學(xué)實(shí)踐。[3]可見,認(rèn)知診斷測驗(yàn)非常適合先依據(jù)學(xué)生知識(shí)或技能的掌握狀態(tài)對學(xué)生進(jìn)行精細(xì)化分類,再實(shí)施形成性評價(jià),進(jìn)而根據(jù)評價(jià)結(jié)果制定個(gè)性化的補(bǔ)救方案,這就在理論上和技術(shù)上做到了因材施教。但是,認(rèn)知診斷是一項(xiàng)專業(yè)化很強(qiáng)的測評手段,要將它廣泛應(yīng)用于教育實(shí)踐尚有一定的難度。因此,本研究從教育使用者的角度,以美國心理測量學(xué)家Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)[4]為例,對認(rèn)知診斷測驗(yàn)的編制和結(jié)果進(jìn)行詳細(xì)的剖析,試圖為教育工作者提供可操作的教育測量新方法。

        一、認(rèn)知診斷測驗(yàn)的編制

        1. 認(rèn)知屬性建構(gòu)

        屬性是認(rèn)知診斷理論中的一個(gè)重要概念,認(rèn)知診斷本質(zhì)上是對認(rèn)知屬性的診斷。Tatsuoka 認(rèn)為認(rèn)知屬性就是程序性操作、產(chǎn)生式規(guī)則、項(xiàng)目類型或者一般的認(rèn)知任務(wù)。Leighton 等人認(rèn)為認(rèn)知屬性在教育測量中一般指完成一項(xiàng)任務(wù)所具備的操作技能和知識(shí)結(jié)構(gòu)。[5]可見,認(rèn)知屬性是對被試問題解決過程中心理內(nèi)部加工過程的描述,是被試正確完成任務(wù)所需的知識(shí)、策略、技能等。[6]對被測驗(yàn)領(lǐng)域的認(rèn)知屬性的界定是認(rèn)知診斷測驗(yàn)編制的第一步,也是最為重要的一步。但界定屬性尤其是理清屬性之間的層次關(guān)系往往是很困難的,因?yàn)閷傩詫哟渭纫蠈W(xué)科邏輯思維,又要遵循學(xué)生認(rèn)知規(guī)律。這要求屬性層次建構(gòu)者在基于學(xué)科理解的基礎(chǔ)上,充分了解學(xué)生的認(rèn)知規(guī)律。有研究認(rèn)為,目前的認(rèn)知診斷屬性在評估和診斷目的方面存在困難。[7]為了解決這一困難,國際上較為成熟的方法是學(xué)科專家、心理測評專家和一線教師協(xié)作,共同構(gòu)建認(rèn)知診斷屬性層次。在具體操作方面,除了用傳統(tǒng)的文獻(xiàn)法,借鑒已有研究成果中屬性的界定,再用專家論證法對屬性進(jìn)行修正,研究者還可以采用心理研究方法來構(gòu)建適合認(rèn)知診斷的屬性層次,如口語報(bào)告法、眼動(dòng)研究等。[8]一般來說,屬性層次關(guān)系分為5 種類型,如圖1[9]所示。

        圖1 屬性層次關(guān)系的基本類型

        Tatsuoka 的分?jǐn)?shù)減法測試作為認(rèn)知診斷領(lǐng)域類公認(rèn)的典型測驗(yàn),得到了大量學(xué)者的應(yīng)用。該測驗(yàn)分為8 個(gè)屬性,分別為:A1 將整數(shù)轉(zhuǎn)換為分?jǐn)?shù),A2 將整數(shù)與分?jǐn)?shù)分開,A3 在相減之前進(jìn)行簡化,A4 找公分母,A5 從整數(shù)部分借位,A6 第一個(gè)分子借一位減去第二個(gè)分子,A7 分子相減,A8 化簡結(jié)果。Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)采用的是獨(dú)立型的屬性層次關(guān)系,沒有考慮屬性之間的關(guān)系。[10]

        2. 測驗(yàn)試題編制

        認(rèn)知診斷測驗(yàn)的編制需要依據(jù)屬性結(jié)構(gòu)建立的Q 矩陣,Q 矩陣的核心功能是將被試不可觀察的認(rèn)知狀態(tài)和測驗(yàn)試題中可觀察的作答反應(yīng)相連接,從而推測被試的知識(shí)狀態(tài)。Q 矩陣的產(chǎn)生首先依賴于認(rèn)知屬性層次關(guān)系,依據(jù)屬性層次關(guān)系圖,可產(chǎn)生鄰接矩陣,得到可達(dá)矩陣。依據(jù)可達(dá)矩陣,測驗(yàn)編制者可計(jì)算出理想掌握模式、理想測驗(yàn)?zāi)J郊袄硐敕磻?yīng)模式。Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)中20 道試題對應(yīng)的Q 矩陣如表1[4]所示。

        表1 Tatsuoka的分?jǐn)?shù)減法測驗(yàn)中20 道試題屬性考察表

        二、認(rèn)知診斷測驗(yàn)質(zhì)量的檢驗(yàn)

        1. 模型擬合效果檢驗(yàn)

        (1)認(rèn)知診斷模型的選擇

        自20 世紀(jì)80 年代,認(rèn)知診斷已經(jīng)開發(fā)出大量的認(rèn)知診斷模型。在認(rèn)知診斷測驗(yàn)中,選擇恰當(dāng)?shù)恼J(rèn)知診斷模型是準(zhǔn)確檢驗(yàn)與評估的重要前提。[2]不同的模型針對不同的問題開發(fā),因此研究者需要依據(jù)自己研究內(nèi)容的性質(zhì),選擇合適的模型進(jìn)行診斷。Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)共收集了536 名學(xué)生的數(shù)據(jù),用于對測評方法和測評指標(biāo)的檢驗(yàn)和校正。依據(jù)認(rèn)知診斷分析平臺(tái)(flexCDMs)①,表2 給出了DINA,DINO,RRUM,ACDM,LLM,G-DINA 及Mixed Model 等模型進(jìn)行參數(shù)估計(jì)的結(jié)果。

        參數(shù)個(gè)數(shù)代表了該模型評估過程中的負(fù)荷,數(shù)目越小負(fù)荷越小。AIC(Akaike information criterion)指標(biāo)是基于熵的、檢驗(yàn)擬合數(shù)據(jù)優(yōu)良性和模型復(fù)雜性的一種指標(biāo)。AIC 的值越小,表明該模型數(shù)據(jù)擬合越好。BIC(Bayesian information criterion)與AIC 相似,值越小,表明該模型數(shù)據(jù)擬合越好??梢?,一個(gè)好的模型在這3 個(gè)參數(shù)上應(yīng)該都相對較小。通過表2 的比較可知,LLM 模型的AIC 和BIC 的值都最小,因此,該模型是擬合數(shù)據(jù)最好的模型。

        表2 不同模型的參數(shù)統(tǒng)計(jì)[11]

        (2)屬性層次一致性指標(biāo)(HCI)分析

        HCI 指標(biāo)用來檢驗(yàn)被試作答模式與屬性層次結(jié)構(gòu)的一致性,旨在評估被試是否使用與解決測試項(xiàng)目時(shí)屬性層次結(jié)構(gòu)所指示的不同的認(rèn)知技能。HCI 可用于評估被試反應(yīng)模式與認(rèn)知模型是否一致并且確定整體模型數(shù)據(jù)是否擬合。盡管HCI 是在AHM 框架中開發(fā)的,但它適合檢驗(yàn)Q 矩陣的屬性層次一致性。在認(rèn)知診斷模型中,HCI 可以直接用于評估觀察到的反應(yīng)向量與Q 矩陣的擬合程度,并因此確定被試的認(rèn)知過程是否與Q 矩陣中假設(shè)的認(rèn)知過程一致。研究者通過計(jì)算給出每個(gè)被試對層次的一致性的HCI 值,這代表了不同的被試在屬性層次方面的一致性程度。但就整個(gè)測驗(yàn)而言,研究者往往更關(guān)注平均HCI值,該值代表了Q 矩陣屬性層次一致性的整體水平。[12]Cui 等人的研究表明,HCI 值高于0.60 表明模型中等數(shù)據(jù)擬合,而高于0.80 表明模型擬合度非常好,HCI 超過0.70 就表示模型—數(shù)據(jù)擬合得很好。在Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)中,該指標(biāo)的值僅為0.4659,屬性層次一致性指標(biāo)較低。[13]

        2. 測驗(yàn)質(zhì)量分析

        (1)項(xiàng)目區(qū)分度分析

        項(xiàng)目區(qū)分度是經(jīng)典測量理論和項(xiàng)目反應(yīng)理論下重要的項(xiàng)目質(zhì)量評價(jià)指標(biāo)。同樣,在認(rèn)知診斷測驗(yàn)中項(xiàng)目區(qū)分度也是刻畫項(xiàng)目質(zhì)量和影響屬性分類準(zhǔn)確率的重要因素。[14]對測驗(yàn)項(xiàng)目區(qū)分度的檢驗(yàn)也一定程度上可以反映測驗(yàn)的質(zhì)量,必要時(shí)也可以作為選擇項(xiàng)目優(yōu)劣的評判指標(biāo)。

        在認(rèn)知診斷測驗(yàn)中,區(qū)分度dj通常被定義為

        其中,pj(1)是指掌握項(xiàng)目j 所有屬性答對該題的概率;pj(0)是指未掌握項(xiàng)目j 任一屬性而答對該題的概率。通俗地講,認(rèn)知診斷測驗(yàn)中的區(qū)分度就是完全掌握所有屬性答對某一題的概率和完全靠猜測答對這一題的概率之間的差距。dj越小,說明掌握屬性對答題的影響越小,即區(qū)分度越??;反之,區(qū)分度越大。當(dāng)然,我們希望答對題目都是因?yàn)檎莆諏傩云鸬疥P(guān)鍵作用,因此,較大的區(qū)分度是優(yōu)質(zhì)試題的標(biāo)志。通過LLM 模型計(jì)算,我們可以得出Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)中20道試題的區(qū)分度,如表3 所示。

        依據(jù)表3 可以看出:這20 道試題的整體區(qū)分度較高,有3/4 的試題區(qū)分度達(dá)到0.80,在區(qū)分度上表現(xiàn)優(yōu)良;僅有第6 題、第8 題和第9 題3 道試題區(qū)分度小于0.50,區(qū)分度一般,尚有改進(jìn)的空間。

        表3 Tatsuoka的分?jǐn)?shù)減法測驗(yàn)中20 道試題的區(qū)分度

        (2)項(xiàng)目擬合度分析

        認(rèn)知診斷模型能否擬合測驗(yàn)數(shù)據(jù),直接決定了測驗(yàn)診斷結(jié)果是否準(zhǔn)確。[15]然而,傳統(tǒng)的基于卡方的擬合檢驗(yàn)方法不適用于認(rèn)知診斷測驗(yàn),這是由認(rèn)知診斷的特性及卡方檢驗(yàn)的使用條件決定的。[2]在認(rèn)知診斷測驗(yàn)中,關(guān)于擬合度的分析一般有兩種計(jì)算方式:一種是計(jì)算S-χ2統(tǒng)計(jì)量,另一種是計(jì)算殘差統(tǒng)計(jì)量。S-χ2統(tǒng)計(jì)量與傳統(tǒng)的χ2統(tǒng)計(jì)量的不同之處在于它根據(jù)被試的能力或知識(shí)狀態(tài)進(jìn)行分組。[16]S-χ2統(tǒng)計(jì)量的優(yōu)點(diǎn)是根據(jù)被試作答數(shù)據(jù)進(jìn)行分組,克服了將在一個(gè)連續(xù)尺度上的能力進(jìn)行分組的武斷性,其擬合效果更符合認(rèn)知診斷特征。[17]殘差則是某一被試組所預(yù)期的項(xiàng)目反應(yīng)理論成績與該組實(shí)際成績的差。[18]認(rèn)知診斷測驗(yàn)通常使用殘差統(tǒng)計(jì)量RMSEA 分析項(xiàng)目的擬合度。RMSEA主要比較不同潛在分類下的觀察反應(yīng)和預(yù)測反應(yīng)平方根誤差。項(xiàng)目j 的RMSEA 計(jì)算公式[19]為:

        其中,π(θc)表示第c類潛在特質(zhì)水平的分類概率,Pj表示由項(xiàng)目反應(yīng)函數(shù)估計(jì)的概率,njkc表示第c類潛在特質(zhì)水平在第j個(gè)項(xiàng)目中的第k維度的期望人數(shù),Njc表示第c類潛在特質(zhì)水平的期望人數(shù)。依據(jù)公示(2)計(jì)算可以得到Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)中20 道試題的殘差項(xiàng)目擬合度,如表4 所示。

        RMSEA的值越接近0,說明項(xiàng)目擬合越好。在Oliveri 等人的研究中,RMSEA的臨界值被設(shè)定為0.10,RMSEA>0.10 時(shí)說明項(xiàng)目擬合較差。[20]由表4 可見,Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)在RMSEA擬合指標(biāo)上整體表現(xiàn)較差。

        表4 Tatsuoka的分?jǐn)?shù)減法測驗(yàn)中20 道試題的殘差項(xiàng)目擬合度

        (3)項(xiàng)目功能差異分析

        測驗(yàn)的公平性是編制大規(guī)模測驗(yàn)時(shí)被廣泛關(guān)注的問題,它直接影響著測驗(yàn)是否公平和科學(xué)。[21]如果一項(xiàng)測試存在公平性問題,那么測驗(yàn)分?jǐn)?shù)的解釋是無效的,依據(jù)測驗(yàn)結(jié)果做出的決定及其后果都將是不合理的甚至是有害的。[22]功能差異是針對測驗(yàn)的公平性而言的,測驗(yàn)開發(fā)者期望開發(fā)出的測驗(yàn)對不同的被試而言是公平的,然而,測驗(yàn)在研發(fā)和應(yīng)用過程中不可避免地會(huì)受到一些無關(guān)因素的影響,這些因素可能會(huì)對不同被試群體產(chǎn)生不同的影響,使得能力相同的被試表現(xiàn)出不同程度的差異,這種差異就被解釋為項(xiàng)目功能差異(differential item function,DIF),其定義是:具有相同能力水平的被試,若在某試題上的得分因?yàn)楸辉嚱M別的不同而顯著不同,則該試題可能存在DIF。具有DIF 的試題可能對某一組別的考生不利而對其他組別的考生有利,從而有違考試的公平性原則。[23]在Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)中,研究者利用Wald 檢驗(yàn)了測驗(yàn)是否存在DIF,得到的數(shù)據(jù)如表5 所示。

        一般來說,p值小于0.05 的項(xiàng)目被認(rèn)為存在DIF。依據(jù)表5,第4 題、第10 題、第13 題、第19 題及第20 題存在項(xiàng)目功能差異。項(xiàng)目功能差異往往由不合理的測驗(yàn)內(nèi)容所導(dǎo)致,因此在對測驗(yàn)進(jìn)行檢驗(yàn)時(shí),測驗(yàn)編制者應(yīng)該考慮DIF 對于學(xué)生作答的影響。[24]

        表5 Tatsuoka的分?jǐn)?shù)減法測驗(yàn)DIF 檢驗(yàn)

        (4)信度分析

        認(rèn)知診斷測驗(yàn)可以從3 個(gè)方面考查信度,分別為經(jīng)典測量理論中定義的信度、屬性重測一致性指標(biāo)、分類一致性指標(biāo)。Templin 等人提出的屬性重測一致性指標(biāo)與經(jīng)典測量理論的標(biāo)準(zhǔn)參照測驗(yàn)中決策一致性的Subkoviak 方法類似,即在假設(shè)被試所掌握的屬性概率不變的情況下,計(jì)算相同被試在先后兩次測量中屬性掌握概率的相關(guān)性。[25]Cui 等人的分類一致性指標(biāo)則是依據(jù)經(jīng)典測量理論和項(xiàng)目反應(yīng)理論中計(jì)算分類一致性信度的思路而提出的。[26]關(guān)于Tatsuoka 的分?jǐn)?shù)減法測驗(yàn),通過計(jì)算得到如表6 所示結(jié)果。

        通過表6 可以發(fā)現(xiàn):Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)在經(jīng)典測量理論的信度、屬性重測一致性指標(biāo)上表現(xiàn)較好,屬性重測一致性指標(biāo)平均值達(dá)到了0.8854,各屬性的信度都在0.60 以上,并且大部分達(dá)到了0.90;分類一致性指標(biāo)則相對偏低,這可能與其信度的定義方式有關(guān)。

        表6 Tatsuoka的分?jǐn)?shù)減法測驗(yàn)信度檢驗(yàn)

        三、認(rèn)知診斷測驗(yàn)的結(jié)果報(bào)告

        1. 知識(shí)結(jié)構(gòu)分析與個(gè)性化評價(jià)

        對于經(jīng)典測量理論而言,研究者只能通過總分來體現(xiàn)學(xué)生的能力水平。但由于存在不同題型、不同內(nèi)容以及不同學(xué)科之間的差異,不同性質(zhì)的分?jǐn)?shù)所代表的含義不盡一致,不同內(nèi)容、不同題型存在等值性問題,所以簡單相加求總分的方式本身存在不合理的因素。項(xiàng)目反應(yīng)理論雖然解決了試題和內(nèi)容之間的等值性問題,將被試放在整體中考察能力值,但依然不能進(jìn)行知識(shí)點(diǎn)內(nèi)部的分析,得不到個(gè)性化診斷的效果。認(rèn)知診斷測驗(yàn)了解學(xué)生在多維、細(xì)粒度的潛在認(rèn)知屬性上的差異[27],充分體現(xiàn)了學(xué)生診斷性、個(gè)性化的形成性評估,這也是認(rèn)知診斷最大的優(yōu)點(diǎn)。認(rèn)知診斷測驗(yàn)可以分析每個(gè)學(xué)生在不同屬性上的掌握概率,即知識(shí)結(jié)構(gòu),這是一類以屬性為基本分析單位的精細(xì)化測量模型。如圖2 所示,編號(hào)12 和編號(hào)31 的學(xué)生在Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)中有著不同的知識(shí)結(jié)構(gòu)。

        依據(jù)圖2 可以看出,編號(hào)12 和編號(hào)31 的學(xué)生得分相同,都為15 分,但是他們表現(xiàn)出了不同的知識(shí)結(jié)構(gòu)。通過認(rèn)知診斷LLM 模型進(jìn)行參數(shù)估計(jì),得到編號(hào)12 的學(xué)生知識(shí)狀態(tài)為(00011111),這說明該被試掌握了后5 個(gè)屬性卻沒有掌握前3 個(gè)屬性;編號(hào)31 的學(xué)生知識(shí)狀態(tài)為(11001110),他掌握了第A1,A2,A5,A6,A7 屬性,而沒有掌握A3,A4,A8 屬性。認(rèn)知診斷測驗(yàn)不僅可以報(bào)告被試的知識(shí)狀態(tài),而且可以進(jìn)一步得到被試在測驗(yàn)中各個(gè)屬性掌握的概率。通過不同的屬性掌握模式以及屬性掌握模式的概率,教師可以進(jìn)一步了解不同學(xué)生的知識(shí)結(jié)構(gòu),進(jìn)而為個(gè)性化的評價(jià)和進(jìn)一步制定補(bǔ)救學(xué)習(xí)方案提供重要依據(jù),讓因材施教成為可能。

        圖2 得分相同(編號(hào)12 和編號(hào)31)的學(xué)生的知識(shí)結(jié)構(gòu)比較

        2. 學(xué)習(xí)路徑分析與學(xué)習(xí)進(jìn)階建構(gòu)

        認(rèn)知診斷測驗(yàn)作為新興的測量理論,融合了認(rèn)知心理學(xué)和現(xiàn)代測量學(xué)的理論和方法,不僅可以對被試的微觀認(rèn)知結(jié)構(gòu)進(jìn)行診斷分析,還能對被試群體的宏觀能力進(jìn)行評估。對被試群體的宏觀能力評估主要體現(xiàn)在兩個(gè)方面。其一是學(xué)習(xí)路徑,所謂學(xué)習(xí)路徑,也就是知識(shí)狀態(tài)的層級結(jié)構(gòu),刻畫了存在偏序關(guān)系的知識(shí)狀態(tài)之間的關(guān)系。[10]其二是學(xué)習(xí)進(jìn)階,學(xué)習(xí)進(jìn)階和學(xué)習(xí)路徑具有相似之處,前者強(qiáng)調(diào)發(fā)展階段,后者強(qiáng)調(diào)發(fā)展軌跡。雖然學(xué)習(xí)進(jìn)階自提出到現(xiàn)在已有20 多年,但仍然沒有統(tǒng)一的定義。從學(xué)生的認(rèn)知發(fā)展角度分析,學(xué)習(xí)進(jìn)階是將兒童在概念方面的發(fā)展介入具體的教育領(lǐng)域,進(jìn)而深化對兒童認(rèn)知發(fā)展規(guī)律的認(rèn)識(shí)。[28]學(xué)習(xí)進(jìn)階將學(xué)生抽象的概念理解過程具體化,用進(jìn)階水平表示學(xué)生的認(rèn)知發(fā)展過程。[29]認(rèn)知診斷理論為解決學(xué)習(xí)進(jìn)階的問題提供了新的思路:首先需要通過聚類分析,依據(jù)不同知識(shí)狀態(tài)的能力值建立學(xué)習(xí)路徑,然后進(jìn)一步通過能力值劃分得到學(xué)習(xí)進(jìn)階。

        在學(xué)習(xí)路徑建立的過程中,可以假設(shè)學(xué)生對概念的理解遵從先易后難的順序,即學(xué)生先掌握屬性層次關(guān)系中的基本屬性,再掌握難度較大的高階屬性。因此,位于低水平的屬性應(yīng)該相對容易掌握,位于高水平的屬性應(yīng)該相對較難掌握。依據(jù)這一特點(diǎn),研究者通過各種不同知識(shí)狀態(tài)的聚類,將聚類后的知識(shí)狀態(tài)按照能力值繪制出Tatsuoka 的分?jǐn)?shù)減法測驗(yàn)的學(xué)習(xí)路徑,如圖3 所示。在該路徑圖中,教師可以為不同知識(shí)狀態(tài)的學(xué)生選擇不同的學(xué)習(xí)路徑。在學(xué)習(xí)路徑的基礎(chǔ)上,教師可以依據(jù)能力值的不同對被試群體劃分進(jìn)階水平,每一個(gè)進(jìn)階水平包含了多種屬性掌握模式,這些屬性掌握模式可以為該進(jìn)階水平提供更豐富的信息,由此可對學(xué)習(xí)進(jìn)階各水平進(jìn)行科學(xué)界定。

        據(jù)圖3 可知,屬性掌握模式(00010010)和(00111110)相比,位于知識(shí)狀態(tài)(00111110)的被試掌握了位于知識(shí)狀態(tài)(00010010)的所有屬性,同時(shí)還多掌握了其他屬性,可記為(00010010)≤(00111110),也就是說這兩個(gè)知識(shí)狀態(tài)之間存在層次關(guān)系,即存在(00010010)→(00111110)的路徑。由于(00000000)≤(00010010)≤(00111110)≤(11111111),因此這些知識(shí)狀態(tài)之間可以刻畫出一條學(xué)習(xí)路徑:(00000000)→(00010010)→(00111110)→(11111111)。學(xué)習(xí)路徑從低端到頂端代表了不同的能力水平,反映了知識(shí)狀態(tài)之間的能力關(guān)系,可以清楚地刻畫學(xué)生的發(fā)展過程,為學(xué)生從低層次學(xué)習(xí)水平發(fā)展到高層次學(xué)習(xí)水平指出了明確的路徑和方向。因此,學(xué)習(xí)路徑不僅可以為學(xué)生提供個(gè)性化、精細(xì)化的診斷報(bào)告,而且可以為教師補(bǔ)救教學(xué)提供依據(jù)。

        圖3 Tatsuoka的分?jǐn)?shù)減法測驗(yàn)的學(xué)習(xí)路徑

        在學(xué)習(xí)路徑的基礎(chǔ)上,教師還可以為學(xué)生進(jìn)一步制定學(xué)習(xí)進(jìn)階,如圖3 所示,所有知識(shí)狀態(tài)所包括的能力值,可以0.5 為一個(gè)單位進(jìn)行劃分,將整個(gè)知識(shí)狀態(tài)劃分為5 個(gè)能力區(qū)間,依次從低到高,這就形成了5 層次水平的學(xué)習(xí)進(jìn)階。由于各個(gè)能力值范圍內(nèi)都包括了具體的知識(shí)狀態(tài),知識(shí)狀態(tài)又對應(yīng)具體的屬性,因此可以通過屬性包括的具體內(nèi)容對學(xué)習(xí)進(jìn)階的各水平做出較為準(zhǔn)確的界定。

        四、啟示

        1. 認(rèn)知診斷測驗(yàn)大幅度提高了測驗(yàn)的結(jié)構(gòu)效度

        認(rèn)知診斷測驗(yàn)是將測驗(yàn)的目標(biāo)整合在測驗(yàn)編制的過程中,測驗(yàn)的編制嚴(yán)格依據(jù)屬性以及屬性間的層次關(guān)系,每個(gè)項(xiàng)目都承載著不可替代的診斷信息,同時(shí)也追求以最少的測試項(xiàng)目測出學(xué)生最大的認(rèn)知信息,因此認(rèn)知診斷測驗(yàn)的試題本身就具有認(rèn)知診斷的功能。它與傳統(tǒng)的依據(jù)雙向細(xì)目表得到的經(jīng)典測量理論試題最大的區(qū)別在于:認(rèn)知診斷測驗(yàn)具有嚴(yán)格的內(nèi)部結(jié)構(gòu),項(xiàng)目的編制依據(jù)認(rèn)知規(guī)律將學(xué)生認(rèn)知過程和項(xiàng)目緊密地結(jié)合在一起;依據(jù)經(jīng)典測量理論編制的測驗(yàn)僅強(qiáng)調(diào)試題考查的覆蓋面,內(nèi)部結(jié)構(gòu)相對較差??梢姡瑢⒄J(rèn)知診斷應(yīng)用到教育測驗(yàn)中,既可以幫助教育工作者系統(tǒng)地設(shè)計(jì)結(jié)構(gòu)效度較高的測評工具,也可以幫助研究者和實(shí)踐者分析影響學(xué)生作答試題背后的認(rèn)知結(jié)構(gòu)。[30]認(rèn)知診斷測驗(yàn)依據(jù)學(xué)生行為能力表現(xiàn)推測學(xué)生能力水平,達(dá)到了通過學(xué)生外在表現(xiàn)推測其內(nèi)隱特征的目的。這種測驗(yàn)將學(xué)生的能力水平按照不同的理想掌握模型進(jìn)行細(xì)分,可以將教育測驗(yàn)的籠統(tǒng)性、混沌性更加清晰化,并且提供了明確的學(xué)習(xí)路徑,讓測評成為學(xué)生學(xué)習(xí)的一部分,促進(jìn)了學(xué)習(xí)測評觀念從“為了學(xué)習(xí)的評價(jià)”到“評價(jià)是學(xué)習(xí)的一種方式”的轉(zhuǎn)變。[31]

        2. 認(rèn)知診斷測驗(yàn)兼具形成性測評和終結(jié)性測評的功能

        認(rèn)知診斷測驗(yàn)通過分析學(xué)生在多維、細(xì)粒度知識(shí)點(diǎn)的潛在認(rèn)知屬性上的差異,充分體現(xiàn)了學(xué)生診斷性、個(gè)性化的形成性評估;同時(shí)通過知識(shí)鏈間的關(guān)系獲取更為恰當(dāng)?shù)膶W(xué)習(xí)路徑和學(xué)習(xí)進(jìn)階,關(guān)注了統(tǒng)整性的終結(jié)性評價(jià)。因此,認(rèn)知診斷是一種兼具形成性測評和終結(jié)性測評功能的綜合評價(jià)形式。[32]認(rèn)知診斷測驗(yàn)可以匯報(bào)每一個(gè)學(xué)生的診斷信息,包括每個(gè)學(xué)生掌握的屬性以及各個(gè)屬性掌握的概率,可以依據(jù)不同知識(shí)狀態(tài)之間的包含關(guān)系,為不同知識(shí)狀態(tài)下的學(xué)生選擇個(gè)性化的學(xué)習(xí)路徑和補(bǔ)救方案,同時(shí)有針對性地找到每個(gè)學(xué)生在學(xué)習(xí)中存在的問題,以及在整體中所處的水平,為學(xué)生準(zhǔn)確地自我定位和自我診斷提供參考。在終結(jié)性評價(jià)方面,認(rèn)知診斷測驗(yàn)通過對不同知識(shí)狀態(tài)的聚類分析,得到學(xué)生的學(xué)習(xí)路徑圖,進(jìn)一步通過能力水平的劃分得到測驗(yàn)內(nèi)容的學(xué)習(xí)進(jìn)階,該進(jìn)階為測驗(yàn)的垂直量尺化提供了可能。所謂垂直量尺化就是將測試同學(xué)科的不同水平測驗(yàn)轉(zhuǎn)換到同一分?jǐn)?shù)量尺上。[33]學(xué)習(xí)進(jìn)階本身就是修訂課程標(biāo)準(zhǔn)、編寫教材、教學(xué)與學(xué)習(xí)評價(jià)的重要基礎(chǔ),為整個(gè)教育教學(xué)的發(fā)展提供了有效支持。由此可見,認(rèn)知診斷的過程性、個(gè)性化測評特點(diǎn),為學(xué)習(xí)測評提供了可操作的抓手;建立在整體認(rèn)知規(guī)律基礎(chǔ)上的認(rèn)知診斷測驗(yàn)則為學(xué)習(xí)測評指明了方向。

        3. 認(rèn)知診斷測驗(yàn)為計(jì)算機(jī)自適應(yīng)測驗(yàn)奠定了基礎(chǔ)

        學(xué)習(xí)測評發(fā)展的趨勢是走向計(jì)算機(jī)自動(dòng)化。“互聯(lián)網(wǎng)+”時(shí)代的到來,給信息與通信技術(shù)(ICT)在學(xué)習(xí)測評中的應(yīng)用提供了巨大的發(fā)展空間。美國的ICT 測評技術(shù)已經(jīng)開啟了從“明確考試的范式”到“嵌入式評價(jià)范式”的轉(zhuǎn)變。在“明確考試的范式”中,測評強(qiáng)調(diào)精準(zhǔn)測查學(xué)生的學(xué)業(yè)表現(xiàn);在“嵌入式評價(jià)范式”中,測評強(qiáng)調(diào)有針對性的及時(shí)反饋。[34]可見,學(xué)習(xí)測評技術(shù)自適應(yīng)性具有傳統(tǒng)測評無法達(dá)到的眾多優(yōu)點(diǎn),學(xué)習(xí)測評走向計(jì)算機(jī)自適應(yīng)化是必然的。目前,國際學(xué)生評估項(xiàng)目(PISA)和國際測評項(xiàng)目-科學(xué)素養(yǎng)(NAP-SL)測試已全部使用計(jì)算機(jī)自適應(yīng)測試進(jìn)行學(xué)業(yè)測評。認(rèn)知診斷理論為計(jì)算機(jī)自適應(yīng)測驗(yàn)起到了基礎(chǔ)性的理論支撐作用,認(rèn)知診斷測評為學(xué)習(xí)測評的計(jì)算機(jī)自適應(yīng)測試提供了前提條件?,F(xiàn)有的學(xué)習(xí)測評分析工具,可以通過學(xué)生的在線學(xué)習(xí)和測評,將結(jié)果以可視化形式呈現(xiàn)給學(xué)生,幫助學(xué)生分析自身學(xué)習(xí)的問題,促進(jìn)反思,調(diào)整學(xué)習(xí)策略,以獲得更大進(jìn)步。[35]無論學(xué)習(xí)測評的理念如何發(fā)展都是以促進(jìn)學(xué)習(xí)為目的的評價(jià)。未來的學(xué)習(xí)測評可以通過數(shù)字化工具以及大數(shù)據(jù)、云計(jì)算等技術(shù),將心理測量模型和具體的學(xué)科知識(shí)無縫嵌入學(xué)生的學(xué)習(xí)和測評過程,對學(xué)生的學(xué)習(xí)過程進(jìn)行動(dòng)態(tài)的隱形評價(jià),以促進(jìn)學(xué)生更好地學(xué)習(xí)。[36]

        注釋:

        ①本文數(shù)據(jù)處理使用了江西師范大學(xué)涂冬波團(tuán)隊(duì)開發(fā)的認(rèn)知診斷分析平臺(tái)(flexCDMs),網(wǎng)址為:http://www.psychometrics-studio.cn。

        猜你喜歡
        模型學(xué)生
        一半模型
        快把我哥帶走
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        《李學(xué)生》定檔8月28日
        電影(2018年9期)2018-11-14 06:57:21
        趕不走的學(xué)生
        學(xué)生寫話
        3D打印中的模型分割與打包
        學(xué)生寫的話
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        国产激情无码一区二区三区| 男女动态视频99精品| 好看的日韩精品视频在线| 国产日韩精品欧美一区喷水| 国产在线无码制服丝袜无码| 国产三级黄色在线观看| 精品亚洲国产亚洲国产| 中文字幕av伊人av无码av| 午夜成人理论无码电影在线播放| 无码一区久久久久久久绯色AV| 一级a免费高清免在线| 国产精品高清网站| 无码人妻黑人中文字幕| 午夜福利不卡无码视频| 国产精品久久av高潮呻吟| 99999久久久久久亚洲| 国产麻无矿码直接观看| 亚洲女同同性少妇熟女| 女同性恋一区二区三区av| 国产午夜福利不卡在线观看| 欧美在线不卡视频| 国产无套粉嫩白浆内精| www国产亚洲精品久久麻豆| 性欧美大战久久久久久久久| 亚洲成AV人在线观看网址| 国产情侣亚洲自拍第一页| 亚洲va无码va在线va天堂| 激情丁香婷婷| 日本高清无卡一区二区三区| 无码一区二区三区久久精品| 最新69国产精品视频| 亚洲人成人无码www影院| 99re在线视频播放| 亚洲第一女人天堂av| 伊人久久精品无码av一区| 国产乱子伦视频大全| 丰满少妇人妻无码超清| 国产桃色一区二区三区| 东北妇女肥胖bbwbbwbbw| 久久青青草原国产精品最新片| 日韩女优视频网站一区二区三区 |