亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        層級相合性指標(biāo)和噪音的關(guān)系及其在分?jǐn)?shù)減法測驗(yàn)中的應(yīng)用

        2021-08-30 05:19:58毛萌萌
        魅力中國 2021年25期
        關(guān)鍵詞:模擬實(shí)驗(yàn)測驗(yàn)噪音

        毛萌萌

        (南昌大學(xué)公共管理學(xué)院心理學(xué)系,江西 南昌 330031)

        一、引言

        傳統(tǒng)測驗(yàn)只關(guān)注作答結(jié)果,忽視學(xué)生作答的內(nèi)在心理過程,為彌補(bǔ)這一缺陷,以認(rèn)知診斷為核心的新一代測驗(yàn)理論被開發(fā)出來。Leighton 和Gierl[1]認(rèn)為教育認(rèn)知診斷的作用是測量個(gè)體特定的知識結(jié)構(gòu)和加工技能(或稱“屬性”),它通過認(rèn)知診斷模型(cognitive diagnostic models,CDMs)分析被試在測驗(yàn)試題上的反應(yīng)模式來推測該被試對屬性的掌握情況,為教師進(jìn)行有針對性的補(bǔ)救教學(xué)和因材施教提供支持。近年來,基于認(rèn)知診斷理論的教育與心理測驗(yàn)被教師和研究者不斷開發(fā)出來,并應(yīng)用于實(shí)踐以評估學(xué)生或被試。CDM 種類豐富,受噪音[2]干擾而效率不一,這時(shí)就需要通過認(rèn)知診斷擬合指標(biāo)評估診斷模型與數(shù)據(jù)的的擬合程度,為選擇CDM 提供參考。層級相合性指標(biāo)最初是基于屬性層級模型開發(fā)的個(gè)人擬合指標(biāo),由于其計(jì)算簡便、適用性廣而得到廣泛應(yīng)用;現(xiàn)在,該類指標(biāo)除了在個(gè)人擬合指標(biāo)方面不斷發(fā)展外,還拓展到項(xiàng)目擬合指標(biāo)。

        Lai,Gierl 和Cui[3]提出項(xiàng)目相合性指標(biāo)(Item Consistency Index,ICI),該指標(biāo)將猜測和失誤綜合在一起來偵測異常項(xiàng)目,考查模型和項(xiàng)目的擬合程度。但仍有部分問題待解決:首先當(dāng)試題屬性矩陣(該矩陣標(biāo)示測驗(yàn)試題考查的屬性,亦簡稱Q 矩陣)有誤的情況下,ICI 指標(biāo)綜合猜測和失誤信息容易造成Q 矩陣修補(bǔ)指向不明,ICI 指標(biāo)是否可以改進(jìn)以明確猜測和失誤;其次,毛萌萌和丁樹良發(fā)現(xiàn)個(gè)人層級擬合指標(biāo)(MHCI 和NHCI)的大小受噪音、試題倍數(shù)、屬性個(gè)數(shù)影響[2],那么作為原理相似的ICI 指標(biāo),它和噪音等因素的關(guān)系如何;第三,ICI指標(biāo)以0.5作為劃分異常項(xiàng)目的截?cái)帱c(diǎn),這樣做是否合適,是否有更適合的劃分方法;第四,目前已有研究多是將個(gè)人、項(xiàng)目層級相合性指標(biāo)單獨(dú)應(yīng)用,那么在實(shí)踐如何將這兩者結(jié)合使用?

        二、層級相合性指標(biāo)簡介

        第i 個(gè)被試的層級相合性指標(biāo)(the hierarchy consistency index,HCI)

        為[4]:;式中,為被試i 在項(xiàng)目j,上的得分;為項(xiàng)目,,稱項(xiàng)目為項(xiàng)目j 的子項(xiàng)目,j 為父項(xiàng)目,即項(xiàng)目j 的子項(xiàng)目集合(j 除外);是被試i 正確作答的項(xiàng)目的子項(xiàng)目數(shù)總和。其原理是:在0-1 評分情況 下,如果被試i 能對項(xiàng)目j 正確反應(yīng),則必可對其子項(xiàng)目正確反應(yīng);否則則代表出現(xiàn)失擬,用HCI 度量這種失擬的程度,HCI 越大代表模型和數(shù)據(jù)擬合越好,其取值為[-1 1]。

        將HCI 定義中的修改為包含項(xiàng)目j 以彌補(bǔ)HCI 定義中分母可能為零的缺陷,有MHCI 提出;HCI 和MHCI 只考慮失誤,而沒有考慮猜測,為全面衡量被試反應(yīng)的失擬的程度,有NHCI 指標(biāo)的提出[5][6]。

        三、項(xiàng)目相合性指標(biāo)的分解

        ICI 在某些情況下仍然有分母為0 的情況,如第j 題全對卻沒有子項(xiàng)目或者第j 題全錯(cuò)卻沒有父項(xiàng)目,這在現(xiàn)實(shí)中并不罕見(比如測驗(yàn)中最難的項(xiàng)目沒有一位同學(xué)正確作答,或者測驗(yàn)中有一題非常容易,所有同學(xué)在該項(xiàng)目上都正確反應(yīng))。同MHCI 指標(biāo)類似,只需將父項(xiàng)目或子項(xiàng)目的定義更改為包含j 本身,就可以避免無法計(jì)算的情況。

        ICI 針對某一題綜合衡量其猜測和失誤程度,為評估ICI 指標(biāo)的效率,Lai 等人進(jìn)行了模擬實(shí)驗(yàn),結(jié)果顯示隨著失擬項(xiàng)目在測驗(yàn)中的比例升高,失擬項(xiàng)目的ICI均值也升高(Lai et al.,2012,Table.2)[3],這不合邏輯;此外,在Q 矩陣有誤的情況下,它不能像DINA 模型中的s(失誤)參數(shù),g(猜測)參數(shù)那樣為修補(bǔ)Q 矩陣提供明確的指引;當(dāng)項(xiàng)目屬性多標(biāo)時(shí),g 參數(shù)會(huì)升高,當(dāng)項(xiàng)目屬性少標(biāo)時(shí),s 參數(shù)會(huì)升高[7]。

        鑒于此,將ICI 指標(biāo)進(jìn)行拆分如下:

        四、實(shí)驗(yàn)研究

        (一)模擬實(shí)驗(yàn)一

        實(shí)驗(yàn)?zāi)康模和ㄟ^模擬研究尋找影響項(xiàng)目相合性指標(biāo)和噪音的關(guān)系;并基于逆回歸思想(又稱逆預(yù)測)[8],建立起以噪音大小為因變量,項(xiàng)目相合性指標(biāo)大小為主要自變量的逆回歸方程,最終實(shí)現(xiàn)對不可直接觀測的噪音大小的預(yù)測。

        表2 各結(jié)構(gòu)模型對SP 回歸分析表

        (二)模擬實(shí)驗(yàn)二

        實(shí)驗(yàn)?zāi)康模寒?dāng)Q 矩陣存在屬性標(biāo)定錯(cuò)誤的情況下,考查錯(cuò)標(biāo)項(xiàng)目的項(xiàng)目相合性指標(biāo)在所有項(xiàng)目中的百分等級,為合理劃分異常項(xiàng)目提供參考。

        實(shí)驗(yàn)因素:與4.1 相同

        實(shí)驗(yàn)步驟:在4.1 的實(shí)驗(yàn)步驟基礎(chǔ)上,隨機(jī)選取Q 矩陣某題上的某個(gè)屬性進(jìn)行0-1 互換,并且標(biāo)記其變化類型,如果是0 →1,計(jì)算,并返回該項(xiàng)目在試題中的百分等級;同樣如果是1 →0,計(jì)算,返回該項(xiàng)目的百分等級;無論哪種變化均計(jì)算ICI 并返回該項(xiàng)目的百分等級。

        實(shí)驗(yàn)結(jié)果:根據(jù)4.1 的研究結(jié)果,由于SP 是影響這些項(xiàng)目相合性指標(biāo)最主要的原因,因此表3 中只展示統(tǒng)計(jì)量隨SP 的變化情況,以SP=0.1 為例,M=0.19 代表錯(cuò)標(biāo)項(xiàng)目的值的百分等級均值為0.19,25 分位點(diǎn)值=0.09 代表如果以百分等級9 為劃界則只能偵測出25%的錯(cuò)標(biāo)項(xiàng)目,同理75 分位點(diǎn)值=0.26 代表如果以百分等級26 為劃界則能偵測出75%的錯(cuò)標(biāo)項(xiàng)目,同理其它;因?yàn)楸? 中的統(tǒng)計(jì)量值都是百分等級,所以具體值越低越好這樣誤判的可能性就低,比如相同SP=0.1 條件下,同樣要達(dá)到75%的偵測效率,只要以百分等級7 作為劃界。整體來看和普遍好于ICI 的偵測效率,且獨(dú)立型的偵測效率要遠(yuǎn)遠(yuǎn)好于線性型的結(jié)果。

        表3 項(xiàng)目相合性指標(biāo)對錯(cuò)誤標(biāo)定項(xiàng)目的偵測效率

        (三)實(shí)證研究

        實(shí)驗(yàn)?zāi)康模阂灾腡atsuoka[9]分?jǐn)?shù)減法測驗(yàn)數(shù)據(jù)(含536 個(gè)被試,20個(gè)項(xiàng)目)為例,將個(gè)人層級相合性指標(biāo)和項(xiàng)目層級相合性指標(biāo)結(jié)合使用,考查它們對實(shí)測數(shù)據(jù)的效率。

        實(shí)驗(yàn)數(shù)據(jù):該測驗(yàn)的Q 矩陣和數(shù)據(jù)多年以來被眾多研究者不斷討論,主要原因就是測驗(yàn)Q 陣的標(biāo)定非常困難,本研究中使用de la Torre 和Douglas[10]采用的Q陣,該Q陣含有8個(gè)屬性,分別是:A1將整數(shù)轉(zhuǎn)換為分?jǐn)?shù);A2 從分?jǐn)?shù)中分離出一個(gè)整數(shù);A3 先化簡后減法;A4 找到公分母;A5 從整數(shù)部分借出;A6 列借位,用第一個(gè)分子減去第二個(gè)分子;A7 減去分子;A8 簡化為最簡形式[11]。

        實(shí)驗(yàn)結(jié)果:具體結(jié)果如表4 所示,其中使用原始Q 矩陣計(jì)算得到ICI、和均值分別為0.778、0.818 和0.821,使用變更Q 矩陣計(jì)算得到ICI、和均值分別為0.796、0.835 和0.828,可見項(xiàng)目和數(shù)據(jù)的擬合得到全面提高,此外全體被試的NHCI 均值也從0.5876 提升至0.6151,可見整體來看模型和數(shù)據(jù)的擬合得到提升。

        表4 Q 矩陣變動(dòng)對項(xiàng)目相合指標(biāo)影響明細(xì)表

        五、總結(jié)與討論

        本研究在對ICI 指標(biāo)補(bǔ)充定義的基礎(chǔ)上,針對ICI 指標(biāo)不能明確指向Q矩陣錯(cuò)誤標(biāo)定類型的缺陷,將ICI 指標(biāo)進(jìn)行分解提出和,并通過兩個(gè)模擬實(shí)驗(yàn)和一個(gè)實(shí)證研究證明這兩個(gè)指標(biāo)的有效性。其中模擬實(shí)驗(yàn)一在線性型和獨(dú)立型模型下得到ICI、和隨噪音大小SP、試題倍數(shù)L和屬性個(gè)數(shù)K 的變化情況,整體來看,這些項(xiàng)目層級相合性指標(biāo)均有相似的變化,即隨著這些影響因素的變大而減小,這和個(gè)人層級相合性指標(biāo)的變化規(guī)律相同,這點(diǎn)也表明ICI 指標(biāo)以0.5 作為失擬試題的截?cái)帱c(diǎn)并不合理。并且通過逆回歸的思想實(shí)現(xiàn)了以ICI、和均值分別為主要自變量,噪音為因變量的有效預(yù)測。

        模擬實(shí)驗(yàn)二在和模擬實(shí)驗(yàn)一相似的條件下,令Q矩陣的一個(gè)屬性發(fā)生0-1互變,這是一個(gè)比較難偵測的失擬,因?yàn)楸旧頂?shù)據(jù)就有噪音,還要再此基礎(chǔ)上加上一個(gè)微小的錯(cuò)誤,且這個(gè)變動(dòng)屬性可以是任意一題的任意一個(gè)屬性,結(jié)果表明和整體上偵測失擬試題的效率優(yōu)于。但是注意到在獨(dú)立型模型下的偵測效率要遠(yuǎn)遠(yuǎn)由于優(yōu)于線性型,經(jīng)過詳細(xì)分析結(jié)果數(shù)據(jù)發(fā)現(xiàn),在線性條件下其項(xiàng)目最少只有3,且由于其約束條件最多導(dǎo)致作答反應(yīng)的模式類型單一,很多項(xiàng)目的項(xiàng)目層級相合性指標(biāo)值相同,導(dǎo)致偵測效率較差;與此相反獨(dú)立型模型約束最少,作答反應(yīng)模式類型豐富,所以偵測效率較好。實(shí)驗(yàn)二的結(jié)果還為研究者在不同偵測效率情況下合理選擇截?cái)帱c(diǎn)提供參考。

        最后以深受關(guān)注的Tatsuoka 分?jǐn)?shù)減法測驗(yàn)進(jìn)行了實(shí)證研究,通過結(jié)合個(gè)人層級相合性指標(biāo)(NHCI)和項(xiàng)目層級相合性指標(biāo)(和)進(jìn)行分析,修訂Q 矩陣。結(jié)果表明無論是NHCI、ICI、和均值都得到了提升,表明模型和數(shù)據(jù)更加擬合,修改Q 陣有效。但是需要注意,不是項(xiàng)目層級擬合指標(biāo)偵測出的所有試題的Q 陣都有問題,可能僅僅是這題上的噪音較大,Q 矩陣的修補(bǔ)要結(jié)合具體試題來討論,而不能僅僅因?yàn)閿M合程度的上升隨意變動(dòng)Q 矩陣,這也體現(xiàn)出在實(shí)踐中修補(bǔ)Q 矩陣的困難。

        本文存在一些不足,模擬實(shí)驗(yàn)只選取線性型和獨(dú)立型模型這兩類認(rèn)知模型進(jìn)行研究,這是因?yàn)檫@兩模型在約束條件方面最為極端,而在實(shí)際中認(rèn)知模型是豐富多樣的,這時(shí)本文中的研究結(jié)論是否適用有待驗(yàn)證。在模擬實(shí)驗(yàn)二中,以隨機(jī)方式變動(dòng)Q 陣中的一個(gè)屬性,但在實(shí)際情況下,Q 陣的錯(cuò)誤類型更加多樣,此時(shí)和的偵測效率也有待驗(yàn)證。最后,由于層級相合類指標(biāo)其統(tǒng)計(jì)分布不明,所以未給出區(qū)間估計(jì),這也是本文的不足之處。

        猜你喜歡
        模擬實(shí)驗(yàn)測驗(yàn)噪音
        噪音,總是有噪音!
        無法逃避的噪音
        斷塊油藏注采耦合物理模擬實(shí)驗(yàn)
        《新年大測驗(yàn)》大揭榜
        趣味(語文)(2018年7期)2018-06-26 08:13:48
        噪音的小把戲
        白噪音的三種用法
        Coco薇(2017年9期)2017-09-07 22:09:28
        輸氣管道砂沖蝕的模擬實(shí)驗(yàn)
        兩個(gè)處理t測驗(yàn)與F測驗(yàn)的數(shù)學(xué)關(guān)系
        考試周刊(2016年88期)2016-11-24 13:30:50
        射孔井水力壓裂模擬實(shí)驗(yàn)相似準(zhǔn)則推導(dǎo)
        彈道修正模擬實(shí)驗(yàn)裝置的研究
        中文字幕av一区二区三区人妻少妇| 女同另类一区二区三区| 蜜桃精品视频一二三区| 日本熟妇美熟bbw| 国产zzjjzzjj视频全免费| 野外三级国产在线观看| 亚洲综合伊人久久综合| 纯肉无遮挡H肉动漫在线观看国产 国产精品自产拍在线观看免费 | 后入少妇免费在线观看| 人妻少妇偷人精品免费看| 国产卡一卡二卡3卡4乱码| 亚洲av中文无码乱人伦在线播放| 日本肥老妇色xxxxx日本老妇| 亚洲一区二区观看播放| h动漫尤物视频| 亚洲av在线观看播放| 亚洲国产精品久久精品| 乱人伦中文无码视频| 亚洲高潮喷水中文字幕| 亚洲少妇一区二区三区老| 青草久久婷婷亚洲精品| 黑森林福利视频导航| 2019最新国产不卡a| 国产剧情无码中文字幕在线观看不卡视频| 国产精品毛片av一区二区三区 | 色综合久久无码五十路人妻 | 粗大猛烈进出白浆视频| 国产日韩亚洲欧洲一区二区三区| 亚洲AV日韩Av无码久久| 女同恋性吃奶舌吻完整版| 久久久国产打桩机| 久久精品亚洲牛牛影视 | 色欲aⅴ亚洲情无码av| 91久久青青草原免费| 日本黑人人妻一区二区水多多| 日本精品一区二区三区二人码| 国产精品久久毛片av大全日韩| 国色天香精品亚洲精品| 亚洲黄色av一区二区三区| 欧美a级毛欧美1级a大片免费播放| 小12箩利洗澡无码视频网站|