亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于地理核心素養(yǎng)的地理診斷性試卷評(píng)價(jià)

        2024-06-24 17:28:12陸念王曉軍
        新校園 2024年4期
        關(guān)鍵詞:素養(yǎng)模型學(xué)生

        陸念 王曉軍

        現(xiàn)代測(cè)量理論為實(shí)現(xiàn)地理核心素養(yǎng)的有效測(cè)評(píng)提供了測(cè)量模型基礎(chǔ)。地理核心素養(yǎng)的培養(yǎng)應(yīng)該落實(shí)在日常教學(xué)中,而地理核心素養(yǎng)的日常測(cè)評(píng)則落腳于地理診斷性試卷。依據(jù)地理新課標(biāo)對(duì)學(xué)生地理核心素養(yǎng)的評(píng)價(jià)建議和要求、地理核心素養(yǎng)在實(shí)際教學(xué)中的測(cè)評(píng)情況,從現(xiàn)代測(cè)量理論的視角出發(fā),利用Rasch模型對(duì)地理診斷性試卷進(jìn)行定量評(píng)價(jià),對(duì)地理核心素養(yǎng)的科學(xué)測(cè)評(píng)進(jìn)行探索,試圖為核心素養(yǎng)評(píng)價(jià)、診斷性試卷優(yōu)化提供一定的幫助和參考。

        一、理論基礎(chǔ)

        Rasch模型是丹麥數(shù)學(xué)家拉希(Rasch)在20世紀(jì)60年代基于IRT所提出的模型。Rasch模型可以將人的參數(shù)(能力)和項(xiàng)目參數(shù)(難度)放在同一個(gè)緯度上來進(jìn)行比較。

        Rasch模型可以測(cè)算出被試在每一項(xiàng)目上的具體表現(xiàn),地理核心素養(yǎng)的載體就是不同情境的試題,不同試題項(xiàng)目正確與否又間接反映地理核心素養(yǎng)的水平高低。因此,從理論上講,Rasch模型可以較好地滿足現(xiàn)代地理核心素養(yǎng)定量測(cè)評(píng)的要求。基于Rasch模型設(shè)計(jì)的Winsteps軟件,具有能對(duì)試題項(xiàng)目進(jìn)行單維性檢驗(yàn)、擬合度分析、信效度檢驗(yàn)等優(yōu)點(diǎn),對(duì)診斷性試卷質(zhì)量評(píng)價(jià)、核心素養(yǎng)水平及發(fā)展?fàn)顩r評(píng)估能提供較好的指導(dǎo)作用。

        二、診斷性試卷中地理核心素養(yǎng)體現(xiàn)

        從項(xiàng)目反應(yīng)理論的觀點(diǎn)來看,個(gè)體的作答反應(yīng)可以反映出個(gè)體真實(shí)的行為表現(xiàn)。試題本身很難直接測(cè)量出核心素養(yǎng)水平,但可以通過選擇測(cè)試內(nèi)容、創(chuàng)設(shè)情境等來考查學(xué)生在不同情境中綜合運(yùn)用地理概念、知識(shí)、思維模式、探究方法與技能解決地理問題的能力,分別達(dá)到了何種程度與水平等。因此,通過學(xué)生的作答反應(yīng)可體現(xiàn)其地理核心素養(yǎng)水平。

        參考地理新課標(biāo)中的“測(cè)試內(nèi)容、試題情境、地理學(xué)科核心素養(yǎng)水平劃分”等維度,對(duì)某中學(xué)高三年級(jí)第一學(xué)年期中地理考試試卷進(jìn)行梳理與分析,構(gòu)建本次診斷性試題的命題情境、考查內(nèi)容、核心素養(yǎng)及水平考查框架(見表1)。

        三、研究數(shù)據(jù)與方法

        本次研究數(shù)據(jù)來源于某全日制高中高三全體選考地理學(xué)生第一學(xué)年期中考試的地理成績(jī)數(shù)據(jù),樣本數(shù)量共計(jì)為731份。選擇題共15道,共計(jì)45分,主觀題共4道,每道主觀題分值不一,共計(jì)55分。

        根據(jù)學(xué)生的主觀題得分,使用評(píng)分量表對(duì)學(xué)生的考試成績(jī)進(jìn)行分類。

        最后使用Office Excel將處理后的評(píng)分?jǐn)?shù)據(jù)制成表格,再用Rasch軟件Winsteps3.72.3進(jìn)行分析。

        四、Rasch模型檢驗(yàn)結(jié)果與分析

        (一)試題的單維性分析

        單維性檢驗(yàn)的目的是檢驗(yàn)評(píng)估數(shù)據(jù)能否被單一Rasch緯度充分解釋。當(dāng)項(xiàng)目標(biāo)準(zhǔn)殘差系數(shù)值在[-0.4,0.4]之間時(shí),表示對(duì)應(yīng)項(xiàng)目符合單維性要求,Rasch模型能夠?qū)ζ溥M(jìn)行準(zhǔn)確的分析。大部分試題都在可接受范圍[-0.4,0.4]內(nèi),只有項(xiàng)目A(第6題)和項(xiàng)目a(第2題)這兩個(gè)項(xiàng)目沒有通過,超過了標(biāo)準(zhǔn)范圍,需要單獨(dú)分析。總體上本次測(cè)試滿足Rasch單維性檢驗(yàn),可以進(jìn)行進(jìn)一步分析。

        (二)模型數(shù)據(jù)擬合程度分析

        使用Rasch模型進(jìn)行分析時(shí)還需考慮數(shù)據(jù)與模型的擬合情況。Outfit MNSQ和Infit MNSQ這兩個(gè)指標(biāo)分別表示標(biāo)準(zhǔn)殘差的均方和加權(quán)后的殘差均方,Outfit MNSQ和Infit MNSQ的取值若在[0.7,1.3]范圍內(nèi),則表示數(shù)據(jù)與模型擬合。本次測(cè)試的學(xué)生與試題的MNSQ值(表4)均在[0.7,1.3]范圍之間,表明測(cè)試試題與Rasch模型充分?jǐn)M合,測(cè)試結(jié)果具有可信性。

        (三)信效度分析

        信度數(shù)值越接近1說明信度越高,分離指數(shù)越大說明區(qū)分度高。本次期中地理考試測(cè)驗(yàn)試題信度和試題分離指數(shù)(表3)分別是1、39.09,本次測(cè)驗(yàn)試題信度高,區(qū)分度好,說明本次測(cè)試能夠反映學(xué)生真實(shí)水平且能夠很好地對(duì)不同水平的學(xué)生加以區(qū)分。

        效度主要考察指標(biāo)包括單維性、模型-數(shù)據(jù)擬合情況、學(xué)生能力和項(xiàng)目難度的分布。數(shù)據(jù)單維性和擬合程度表現(xiàn)較好,且通過Winsteps軟件生成的項(xiàng)目-被試圖發(fā)現(xiàn),項(xiàng)目難度跨度范圍較大,且分布較為均勻,整體覆蓋了被試的能力范圍,試題結(jié)構(gòu)基本效度合理。

        (四)試題數(shù)據(jù)分析

        Rasch模型可以把學(xué)生考試的原始分?jǐn)?shù)轉(zhuǎn)換為L(zhǎng)ogit分?jǐn)?shù),將學(xué)生水平放在等距量尺上進(jìn)行比較。為了便于統(tǒng)計(jì),將個(gè)體與試題的原始對(duì)分?jǐn)?shù)值轉(zhuǎn)換為[0,100]范圍內(nèi)(表4),轉(zhuǎn)換后不影響統(tǒng)計(jì)結(jié)果。

        試題的擬合數(shù)據(jù)范圍為[0.7,1.3],說明試題與模型擬合較好。試題的難度范圍為[46.81,58.73],跨越范圍較大,表明試題難度能與不同水平的學(xué)生進(jìn)行匹配;模型誤差范圍為[0.15,0.4],測(cè)量誤差很小,在模型可接受范圍之內(nèi);在點(diǎn)-測(cè)量(PTME corr.)方面,第1、2、7、9、11、12、13題的值小于0.3,說明這幾道試題的區(qū)分度較低。

        學(xué)生的能力測(cè)量平均值為45.6,試題難度平均值為49.63,試題測(cè)量值略大于學(xué)生測(cè)量值,說明本次測(cè)試對(duì)學(xué)生來說略難。最難的試題為E、B、A1(第19題、第16題、第1題),最簡(jiǎn)單的試題為D、A6、A9(第18題、第6題、第9題)。

        (五)結(jié)果討論

        由數(shù)據(jù)分析可知,未通過單維性檢驗(yàn)的試題是第2題與第6題;難度過高的試題是第1、6、9題;區(qū)分度較低的試題是第1、2、7、9、11、12、13題。通過觀察學(xué)生在各個(gè)項(xiàng)目中異常表現(xiàn),不僅可以揭示學(xué)生在該地理情境表現(xiàn)不好的原因,還能為未來教學(xué)提供一定的方向。

        五、結(jié)論

        由以上Rasch模型定量分析可知,該診斷性試卷具有良好的信度和區(qū)分度,能較好地反映學(xué)生地理核心素養(yǎng)水平,試卷總體質(zhì)量較好。

        試題難度偏高,學(xué)生整體得分低于項(xiàng)目難度,部分項(xiàng)目水平和被試能力不能完全對(duì)應(yīng),說明本套試題在命題和組卷上還存在問題,應(yīng)結(jié)合學(xué)情對(duì)部分難度較大、區(qū)分度較低的試題酌情替換或優(yōu)化,以便更全面地考查與評(píng)估學(xué)生的能力。

        在試題命制中,通過學(xué)生在創(chuàng)設(shè)的不同情境中的作答反應(yīng)可以反映出學(xué)生的能力水平,不僅可以直觀反映學(xué)生的核心素養(yǎng)水平、具體知識(shí)掌握情況,還能將不同能力學(xué)生放在同一尺度上進(jìn)行比較,一目了然對(duì)比學(xué)生差異。結(jié)果分析表明,本套診斷性試卷對(duì)于學(xué)生地理核心素養(yǎng)的測(cè)量是合理的。

        (作者單位:濟(jì)南大學(xué) 水利與環(huán)境學(xué)院)

        猜你喜歡
        素養(yǎng)模型學(xué)生
        一半模型
        必修上素養(yǎng)測(cè)評(píng) 第四測(cè)
        必修上素養(yǎng)測(cè)評(píng) 第三測(cè)
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        必修上素養(yǎng)測(cè)評(píng) 第八測(cè)
        必修上素養(yǎng)測(cè)評(píng) 第七測(cè)
        趕不走的學(xué)生
        學(xué)生寫話
        3D打印中的模型分割與打包
        久久精品国产福利亚洲av| 免费a级毛片18禁网站app| 亚洲无线一二三四区手机| 亚洲日韩欧洲无码av夜夜摸| 国产精品女同一区二区| 久久亚洲国产精品五月天| 日本一区二区免费看片| 久久久久亚洲av无码专区首| 欧美寡妇xxxx黑人猛交| 美女视频一区| 久久久婷婷综合亚洲av| 亚洲av五月天一区二区| 97久久草草超级碰碰碰| 国产成年无码V片在线| 亚洲国产综合性感三级自拍| 大尺度极品粉嫩嫩模免费| 91九色成人蝌蚪首页| 日韩乱码人妻无码中文字幕久久| 嗯啊哦快使劲呻吟高潮视频| 狠狠亚洲婷婷综合色香五月| 亚洲高清在线视频网站| 久久精品国产色蜜蜜麻豆国语版| 日韩av东京社区男人的天堂| 欧美精品中文字幕亚洲专区| av在线手机中文字幕| 国产一区二区三区毛片| 天堂网在线最新版www| 婷婷丁香五月中文字幕| 91精品91久久久久久| 91久久精品美女高潮喷白浆| 久久99国产精品久久99果冻传媒| 亚洲精品成人片在线观看| av东京热一区二区三区| 国产精品黑丝美女啪啪啪| 无码精品日韩中文字幕| 亚洲免费视频网站在线| 久久最黄性生活又爽又黄特级片| 亚洲av日韩av激情亚洲| 成年午夜无码av片在线观看 | 亚洲精品国偷拍自产在线观看| 日本高清色倩视频在线观看 |