亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于物理情境的九年級學(xué)生科學(xué)思維測試工具編制及驗(yàn)證

        2024-01-01 00:00:00田雪葳尹子娟劉文科王晶瑩
        教學(xué)研究 2024年4期
        關(guān)鍵詞:科學(xué)思維

        摘要:科學(xué)思維是2022版新課程標(biāo)準(zhǔn)中核心素養(yǎng)的重要組成部分。為評估九年級學(xué)生的科學(xué)思維能力,特設(shè)計(jì)了一套測評工具,并基于Rasch模型從評分者信度、單維性、試題評分結(jié)構(gòu)、試題擬合度、分離度、誤差統(tǒng)計(jì)、懷特圖等方面評估工具的整體質(zhì)量。經(jīng)分析,測評工具整體信效度較高,試題擬合度和分離度符合要求,誤差在可接受范圍內(nèi)。懷特圖的分析結(jié)果顯示,學(xué)生們的科學(xué)思維水平普遍有待提高??傮w上看,這套測評工具符合要求,可信度比較強(qiáng)?;赗asch模型的測試質(zhì)量分析也為進(jìn)一步優(yōu)化測試工具提供了參考。

        關(guān)鍵詞:科學(xué)思維;質(zhì)量分析;九年級學(xué)生;Rasch模型

        中圖分類號:G62"文獻(xiàn)標(biāo)識碼:A"文章編號:1005-4634(2024)04-0010-07

        以科學(xué)思維為導(dǎo)向的科學(xué)教育改革受到了西方國家的高度關(guān)注,美國于2013年頒布《新一代科學(xué)課程標(biāo)準(zhǔn)》(Next Generation Science Standards,簡稱NGSS)"[1],明確提出科學(xué)思維導(dǎo)向的課程與教學(xué)目標(biāo),確定了批判性思維、計(jì)算思維、比例推理、定性和定量思維等8種思維能力。我國《義務(wù)教育物理課程標(biāo)準(zhǔn)(2022年版)》(以下簡稱22版物理新課標(biāo))指向核心素養(yǎng),其重要組成部分即科學(xué)思維,并聚焦于科學(xué)高階思維,涉及科學(xué)推理、科學(xué)論證、模型建構(gòu)、質(zhì)疑創(chuàng)新等能力"[2],強(qiáng)調(diào)通過科學(xué)觀察、實(shí)驗(yàn)探究、推理計(jì)算等方法,培養(yǎng)學(xué)生的物理觀念、科學(xué)思維以及科學(xué)態(tài)度與責(zé)任等核心素養(yǎng)。其中,科學(xué)思維主要涵蓋模型建構(gòu)、科學(xué)推理、科學(xué)論證、質(zhì)疑創(chuàng)新等要素,是從物理學(xué)視角對客觀事物的本質(zhì)屬性、內(nèi)在規(guī)律及相互關(guān)系進(jìn)行認(rèn)識的方式,是客觀事物本質(zhì)屬性的反映,是一種認(rèn)識世界的方法。22版物理新課標(biāo)強(qiáng)調(diào)運(yùn)用分析綜合、推理論證等科學(xué)方法,基于事實(shí)證據(jù)和科學(xué)推理進(jìn)行論證、批判和反駁,進(jìn)而提出創(chuàng)造性見解,以提高學(xué)生科學(xué)創(chuàng)新能力、科學(xué)實(shí)踐能力和培養(yǎng)科學(xué)思維習(xí)慣"[2]。由此可見,國內(nèi)外課程標(biāo)準(zhǔn)均強(qiáng)調(diào)科學(xué)思維培育,在國際測評中,我國中學(xué)生雖然屢次在數(shù)學(xué)和科學(xué)方面取得出色的成績,但是諸如科學(xué)推理、協(xié)作式問題解決能力等卻沒有表現(xiàn)出優(yōu)勢,且STEM職業(yè)期望不容樂觀。事實(shí)上,科學(xué)思維能力需要從小培養(yǎng),學(xué)齡前兒童就已展現(xiàn)出識別和測試因果關(guān)系的基礎(chǔ)能力"[3],但這些潛力的充分發(fā)揮仍需依靠學(xué)校的專門課程和系統(tǒng)化教學(xué)"[4]。為了持續(xù)并有效地提升學(xué)生的科學(xué)思維能力,需要通過科學(xué)化的測試來定期評估他們的進(jìn)展,從而及時(shí)調(diào)整和優(yōu)化課程結(jié)構(gòu)與教學(xué)方式。值得注意的是,科學(xué)思維測評在國際上已被視為關(guān)鍵評估領(lǐng)域,但當(dāng)前我國仍缺乏與新課程標(biāo)準(zhǔn)緊密契合的科學(xué)思維測評工具。

        2022版物理新課標(biāo)中的科學(xué)思維是指一種高階能力,不僅包括嚴(yán)密的科學(xué)推理過程,還需要科學(xué)論證進(jìn)行推論,從而加工處理以表征建模的能力,需要一套嚴(yán)密的邏輯體系"[2]。正是由于這種能力的復(fù)雜性,很難直接去考察和測量,需要通過真實(shí)情境下的任務(wù)題來考察。低年齡段兒童的閱讀理解和寫作能力較弱,不宜采用紙筆的書面方式進(jìn)行,以免影響結(jié)果的真實(shí)性。國際學(xué)生測評項(xiàng)目(Programme for International Student Assessment, 簡稱PISA)的測試對象是15歲學(xué)生,在我國正好對應(yīng)為九年級,該學(xué)段學(xué)生的認(rèn)知能力處于形式運(yùn)算階段,思維的可逆性、靈活性和邏輯思維能力均得到快速發(fā)展,也是科學(xué)思維培養(yǎng)的黃金期。因此,本研究聚焦于科學(xué)思維發(fā)展的關(guān)鍵階段——九年級學(xué)生,將其作為測評對象。鑒于學(xué)科內(nèi)容導(dǎo)向的科學(xué)思維測評工具更符合我國的教學(xué)情境和學(xué)習(xí)文化,本研究開發(fā)了基于物理情境的紙筆測試任務(wù)題來評估學(xué)生的科學(xué)思維能力,并對此測評工具進(jìn)行了Rasch模型的檢驗(yàn),旨在準(zhǔn)確測量我國典型地區(qū)九年級學(xué)生的科學(xué)思維水平。最后,對試題的合理性進(jìn)行了驗(yàn)證,以確保評估的準(zhǔn)確性和有效性。

        1研究方法

        1.1研究工具

        本任務(wù)題共有3道大題,每道題分別設(shè)置2~3個(gè)小問",均為簡答論述題。第一題的第一小問主要考察了串聯(lián)電路電流相等,額定電壓相同時(shí)額定功率大電阻小、實(shí)際功率大的相關(guān)電學(xué)知識,考察學(xué)生科學(xué)推理能力中提出問題與做出假設(shè)、解釋數(shù)據(jù)與生成結(jié)論維度,科學(xué)論證能力中觀點(diǎn)、事實(shí)證據(jù)與理論基礎(chǔ)和推理與反駁維度;第二小問主要考察了并聯(lián)電路電壓相等、并聯(lián)電路與串聯(lián)電路的識別與使用的相關(guān)電學(xué)知識,考察了學(xué)生科學(xué)推理能力中的設(shè)計(jì)實(shí)驗(yàn)與生成證據(jù)維度,科學(xué)建模能力中的模型建構(gòu)與使用、模型比較、修正與檢驗(yàn)、建模元認(rèn)知與元建模維度。第二題的第一小問和第二小問主要考察了電路模型中各個(gè)元件的用途、滑動(dòng)變阻器和定值電阻的作用、串聯(lián)電路分壓原理的相關(guān)電學(xué)知識,考察學(xué)生科學(xué)建模能力中的模型建構(gòu)與使用、模型比較、修正與檢驗(yàn)、建模元認(rèn)知與元建模維度。第三小問主要考察了電路中外接法與內(nèi)接法誤差產(chǎn)生的原因、電流表和電壓表的阻值和伏安特性曲線的相關(guān)電學(xué)知識,考察了學(xué)生科學(xué)推理能力中提出問題與作出假設(shè)、設(shè)計(jì)實(shí)驗(yàn)與生成證據(jù)、解釋數(shù)據(jù)與生成結(jié)論維度,科學(xué)論證能力中觀點(diǎn)、事實(shí)證據(jù)與理論基礎(chǔ)和推理與反駁維度。第三題的第一小問主要考察了影響導(dǎo)線電阻大小的因素、電路干路導(dǎo)線粗的原因、并聯(lián)電路中干路電流是支流電流之和/干路電流大于支路電流、焦耳定律和歐姆定律的相關(guān)電學(xué)知識,考察學(xué)生科學(xué)推理能力中提出問題與做出假設(shè)、解釋數(shù)據(jù)與生成結(jié)論維度,科學(xué)論證能力中觀點(diǎn)、事實(shí)證據(jù)與理論基礎(chǔ)和推理與反駁維度;第二小問主要考察了構(gòu)建正確的電路模型、并聯(lián)電路各支路間電壓相等,各支路用電器相互獨(dú)立/互不影響的相關(guān)電學(xué)知識,考察了學(xué)生科學(xué)推理能力中設(shè)計(jì)實(shí)驗(yàn)與生成證據(jù)維度,科學(xué)建模能力中模型建構(gòu)與使用、模型比較、修正與檢驗(yàn)、建模元認(rèn)知與元建模維度。計(jì)分方式按照回答踩分點(diǎn)將等級劃分為水平0、水平1、水平2,共計(jì)得分點(diǎn)17個(gè);該測試滿分為54分,測試時(shí)長為40分鐘。總體而言,測試項(xiàng)目的綜合能力要求符合科學(xué)思維的內(nèi)容水平。

        1.2研究對象

        本次測試對象為九年級學(xué)生,抽取了北京、上海、浙江和山東主要行政區(qū)的中等偏上的學(xué)校,并且對各個(gè)地區(qū)學(xué)校的有效男女人數(shù)進(jìn)行了統(tǒng)計(jì),男生人數(shù)總計(jì)642人,女生為789人。原始測試卷共收集到1 390份,經(jīng)過人工篩選剔除份無效問卷71份,最終保留1 319份有效數(shù)據(jù),有效率達(dá)95%。共有4位評分員進(jìn)行主觀評分。首輪根據(jù)制定的量規(guī)進(jìn)行100份問卷的評定,計(jì)算兩兩之間的一致性,并且組織討論不一致的地方,打磨量規(guī)再次評分,直至達(dá)到80%以上的一致率。第二輪繼續(xù)抽取100份問卷,同第一輪步驟再次進(jìn)行評分。第三輪繼續(xù)抽取100份問卷,持續(xù)磨合量規(guī)并進(jìn)行評分,計(jì)算評分一致性,并在一次評定達(dá)到80%的一致性后進(jìn)行獨(dú)立評定。最后進(jìn)行抽評,抽評的方法也是由兩兩交叉進(jìn)行抽評,抽取有效數(shù)據(jù)的20%,且其一致性均達(dá)到0.8以上,并再次進(jìn)行校對統(tǒng)一得到最終的有效數(shù)據(jù)。

        1.3Rasch模型測量原理

        Rasch模型主要分析被試者能力水平與測驗(yàn)項(xiàng)目之間的關(guān)系,常將學(xué)生能力與項(xiàng)目難度放在同一標(biāo)尺上比較,對于能力型任務(wù)題質(zhì)量的檢測具有廣泛的適用性"[5]。其在能力測評工具開發(fā)方面具有3個(gè)顯著優(yōu)勢:第一,該模型可以將非線性數(shù)據(jù)轉(zhuǎn)化為等距離特征的線性數(shù)據(jù),使得數(shù)據(jù)之間的差異具備客觀性與可比性;第二,Rasch模型可以將被試和項(xiàng)目放在同一個(gè)標(biāo)準(zhǔn)上進(jìn)行測量,這時(shí)項(xiàng)目難度和學(xué)生水平就可以進(jìn)行比較;第三,Rasch模型測量的被試能力和項(xiàng)目難度水平具有獨(dú)立性,不受樣本和項(xiàng)目變化的影響"[6]。項(xiàng)目反應(yīng)理論討論被試的能力水平與測驗(yàn)項(xiàng)目,克服了經(jīng)典測量理論中的樣本依賴問題,能夠使測試過程更加穩(wěn)定和客觀"[7]。

        2數(shù)據(jù)分析

        2.1描述性統(tǒng)計(jì)與分布檢驗(yàn)

        為明晰科學(xué)思維的表現(xiàn),計(jì)算其極大值、極小值、平均值、標(biāo)準(zhǔn)差、方差、偏度和峰度。結(jié)果顯示,1 319名學(xué)生的平均分為16.143 4,最大值為52分,最小值為2分,標(biāo)準(zhǔn)誤為0.067,方差為107.423。"由此可見,學(xué)生能力差距較大,各地區(qū)學(xué)生差距也較為明顯。合格的測評工具測得的結(jié)果應(yīng)該是呈正態(tài)分布的,測試難易合適,即得高分和低分的學(xué)生較少,本測試檢驗(yàn)結(jié)果如圖1所示,學(xué)生科學(xué)思維的成績整體呈正態(tài)分布。其中,得分在7~20分的人數(shù)最多;高分?jǐn)?shù)段的人數(shù)偏少,低分?jǐn)?shù)段的人數(shù)偏多,說明題目對學(xué)生而言比較難,學(xué)生科學(xué)思維能力水平不佳。

        為進(jìn)一步呈現(xiàn)成績分布特征,做出科學(xué)思維累積率(圖2)和趨勢累積率(圖3)示意圖,前者的預(yù)計(jì)累計(jì)率用縱坐標(biāo)表示,后者的實(shí)測累計(jì)率用橫坐標(biāo)表示,兩者相等時(shí)測試結(jié)果呈正態(tài)分布,圖像應(yīng)該是一條直線。另外,在趨勢圖中,如果數(shù)據(jù)呈正態(tài)分布,那么數(shù)據(jù)點(diǎn)應(yīng)該均勻分布在Y=0的直線兩側(cè)"[8]。從圖2可見,實(shí)測累計(jì)概率與預(yù)計(jì)累計(jì)概率比較接近,因此可以認(rèn)為科學(xué)思維成績是正態(tài)分布的。這個(gè)結(jié)果也說明測試項(xiàng)目的區(qū)分度較好,結(jié)合表1數(shù)據(jù),偏態(tài)系數(shù)為0.625,表明學(xué)生成績呈正偏態(tài),即低分學(xué)生比較多,這個(gè)結(jié)果與圖3呈現(xiàn)一致。峰態(tài)系數(shù)為-0.136,接近0,分布峰的形狀較正態(tài)分布更平、分布現(xiàn)狀相對矮胖,基本呈現(xiàn)正態(tài)分布。

        2.2測試信效度

        本研究運(yùn)用SPSS26.0分析該數(shù)據(jù)的信效度水平。通過Kappa系數(shù)考查人工評分者的一致性,以確定評分者信度。當(dāng)Kappa值介于0.75~1時(shí),"較高程度的評分者之間具有一致性"[9]。人工[HJ59x]評分步驟如上文所述,最終達(dá)到總體項(xiàng)目的一致性信度為0.921。說明此測評工具的人工評分信度是可靠的,該測試項(xiàng)目信度良好。通過Winsetps 3.81.0導(dǎo)入了1 319個(gè)觀測值數(shù)據(jù),對全部27個(gè)評價(jià)項(xiàng)目進(jìn)行估算。并從以下5方面統(tǒng)計(jì)整體工具質(zhì)量,即平均難度估計(jì)值(measure)、數(shù)據(jù)與模型擬合指數(shù)(infit與outfit)、誤差(error)、信度(reliability)和分離度(seperation),具體結(jié)果見表1。學(xué)生的measure為-1.26,說明測試項(xiàng)目整體對被試偏難,但測試項(xiàng)目的measure值為0,說明試題難度處于中等水平,評價(jià)項(xiàng)目較好地?cái)M合了被試的能力水平,適合該樣本的評估。items separation為試卷的分離度,數(shù)值為10.10gt;2,說明該試題分離度好,items reliability的值為0.99,說明信度很好。infit與outfit是否擬合主要是看兩者之間的值,理想值為1,0.5~1.5之間屬于可接受范圍"[10]。items infit MNSQ為1.01,items outfit MNSQ為0.99,接近理想值,這說明測試項(xiàng)目整體的擬合度較好。"

        項(xiàng)目單維性分析假設(shè)每個(gè)評價(jià)項(xiàng)目都在同一潛在特質(zhì)上被測量"[11],即被試在項(xiàng)目中的回答僅源自潛在特質(zhì)或能力,其他因素不起作用"[12]。一般使用主成分分析方法來測查項(xiàng)目單維性,標(biāo)準(zhǔn)殘差對比圖通常表明項(xiàng)目難度估計(jì)值與評價(jià)項(xiàng)目載荷系數(shù)之間的關(guān)系"[7]。評價(jià)項(xiàng)目共計(jì)27個(gè),分別用圖4的大小寫字母(A、a)表示,縱坐標(biāo)是項(xiàng)目載荷系數(shù),橫坐標(biāo)是項(xiàng)目難度,理想?yún)^(qū)間為-0.4~+0.4,超出該范圍的,則認(rèn)為不滿足單維性要求"[13]。圖4中所有項(xiàng)目的載荷系數(shù)均在-0.4~+0.4之間,因此本研究開發(fā)的測評工具單維性較好。

        圖5展示了試題評分等級結(jié)構(gòu)的分析結(jié)果。圖中的縱坐標(biāo)(probaility of response)表示被試者得分為0、1和2的概率,橫坐標(biāo)(person [minus] item measure)表示被試者能力與項(xiàng)目難度值之間的差異。在曲線交叉的地方即閾值(threshold)位置,對應(yīng)的縱坐標(biāo)表示被試者獲得兩種分?jǐn)?shù)的概率相同。試題每個(gè)維度的評分等級類別曲線都有明顯的峰且平直,并且在橫坐標(biāo)覆蓋一定的范圍,表現(xiàn)良好。

        誤差分析與項(xiàng)目擬合上,該模型的標(biāo)準(zhǔn)來自項(xiàng)目難度平均估計(jì)值(measure)、標(biāo)準(zhǔn)誤(model S.E.)、擬合指數(shù)(infit與outfit)和點(diǎn)測量相關(guān)(ptmea corr.)。表2中項(xiàng)目序號的估計(jì)值排列即為測試項(xiàng)目的擬合數(shù)據(jù)。Outfit和Infit的取值范圍在0~正無窮大,其最為理想值為1。通常認(rèn)為outfit和infit的值可接受范圍在0.5~1.5,說明擬合度較好"[14]。在擬合指數(shù)中,前者比后者更為重要,outfit MNSQ的值介于0.69~1.43之間,infit MNSQ的值介于0.76~1.39之間,都在可接受范圍內(nèi),ZSTD范圍在-2~2之間,說明被試樣本的實(shí)際作答與rasch模型預(yù)期結(jié)果一致,整體認(rèn)為測試項(xiàng)目數(shù)據(jù)與rasch模型擬合度良好。標(biāo)準(zhǔn)誤(model S.E.)通常表示測試項(xiàng)目與被試能力之間匹配的穩(wěn)定性,誤差值較小表示穩(wěn)定性較高"[15]。本研究所有項(xiàng)目的誤差估計(jì)值非常小均在0.05左右,表明測試項(xiàng)目對學(xué)生能力水平的預(yù)估比較穩(wěn)定,即測評工具具有較高信度。

        點(diǎn)測量相關(guān)(pt-measure corr)通常衡量評價(jià)項(xiàng)目得分與總分的相關(guān)度,可以反映測試項(xiàng)目與所測目標(biāo)的一致程度,即測評工具的聚合效度(convergent validity)。相關(guān)系數(shù)的大小表示測試項(xiàng)目與預(yù)設(shè)目標(biāo)的接近程度,值越高表征符合預(yù)設(shè)目標(biāo)程度越強(qiáng)"[17]。如表2所示,所有測試項(xiàng)目的相關(guān)系數(shù)均為正值,說明所有項(xiàng)目所測量的結(jié)構(gòu)指向是一致的,即符合項(xiàng)目特征曲線單調(diào)性遞增假設(shè)"[16]。除了第11道題的相關(guān)系數(shù)為0.25,略低于可以接受的最低值0.30之外,其余26道項(xiàng)目的相關(guān)系數(shù)均可以接受,點(diǎn)測量相關(guān)較高,表示評價(jià)工具的效度良好。懷特圖可用于檢測測試項(xiàng)目難度與學(xué)生能力水平之間的關(guān)系分布,圖6左側(cè)是學(xué)生能力水平分布,左側(cè)M代表學(xué)生能力平均水平,相鄰兩個(gè)數(shù)字代表之間相差1個(gè)logit值,左側(cè)位置越偏上表明學(xué)生能力水平越好,反之則較弱,中間一條線是logit標(biāo)尺,右側(cè)是測試項(xiàng)目的難度分布,右側(cè)的M代表測試項(xiàng)目難度的平均水平,位置越高代表測試項(xiàng)目越難,相反,位置越低測試項(xiàng)目難度越低"[17]。當(dāng)右邊每一道測試項(xiàng)目都有一定數(shù)量的學(xué)生對應(yīng),則說明懷特圖較好,左邊的每個(gè)“#”表示2名學(xué)生,每個(gè)“.”代表1名學(xué)生。從圖6可見,第2個(gè)維度是難度最大的測試項(xiàng)目,幾乎所有測試項(xiàng)目都在平均水平徘徊。部分學(xué)生的水平分布在測試項(xiàng)目難度平均線以下,說明某些測試項(xiàng)目對于這部分學(xué)生而言偏難,學(xué)生能力水平低于平均水平。測試項(xiàng)目難度水平在平均水平以上的區(qū)域也有一定數(shù)量的學(xué)生,其能力水平高于測試項(xiàng)目難度,科學(xué)思維能力較強(qiáng)。

        3結(jié)論與反思

        通過Winsteps軟件對這套科學(xué)思維能力測試題進(jìn)行Rasch檢驗(yàn),涉及對整體工具質(zhì)量、項(xiàng)目單維性、試題評分結(jié)構(gòu)、項(xiàng)目難度與學(xué)生能力關(guān)系(懷特圖)、項(xiàng)目擬合與誤差分析方面進(jìn)行項(xiàng)目信效度分析。本測試項(xiàng)目難度略高于學(xué)生水平,也說明學(xué)生的科學(xué)思維能力相對不佳。其中,實(shí)驗(yàn)題目難度最大,學(xué)生能力水平范圍大于試題難度分布,且處于試題難度水平之下的學(xué)生較多,學(xué)生的科學(xué)思維能力較弱。在工具質(zhì)量上,項(xiàng)目的outfit MNSQ 值和infit MNSQ值都在可接受范圍0.5~"1.5之間,表明項(xiàng)目與被試之間都能夠很好地?cái)M合,得到有效預(yù)估,能夠充分預(yù)估被試的科學(xué)思維水平,項(xiàng)目的信效度較好。從項(xiàng)目的評分等級結(jié)構(gòu)看,評分等級分布比較良好;從項(xiàng)目擬合指數(shù)和誤差看,該測試工具的擬合度較好,測試項(xiàng)目信度較高。綜上所述,本研究開發(fā)的科學(xué)思維測試任務(wù)題整體信效度較高,區(qū)分度較好,對于學(xué)生而言相對偏難,這也說明九年級學(xué)生的科學(xué)思維相對較弱,還有待深入培養(yǎng)。樣本數(shù)據(jù)與Rasch預(yù)期模型基本符合,能夠比較客觀地考察出學(xué)生的科學(xué)思維水平,也揭露了九年級學(xué)生的科學(xué)思維現(xiàn)狀。

        綜上,本研究基于物理學(xué)的電學(xué)情境設(shè)計(jì)任務(wù)題,開發(fā)出九年級學(xué)生科學(xué)思維的測評工具,能夠較好地評測學(xué)生的科學(xué)思維水平。本研究進(jìn)一步調(diào)查九年級學(xué)生的科學(xué)思維現(xiàn)狀,以為新課程標(biāo)準(zhǔn)中科學(xué)思維教學(xué)的落地見效提供有利參考。根據(jù)Rasch模型的質(zhì)量檢驗(yàn),除設(shè)計(jì)實(shí)驗(yàn)與生成證據(jù)外,測試任務(wù)題各維度的難度與學(xué)生能力水平關(guān)系均符合標(biāo)準(zhǔn)值,這也說明九年級學(xué)生的科學(xué)建模能力不佳,在科學(xué)模型建構(gòu)、科學(xué)證據(jù)提取、批判反駁論證的關(guān)鍵能力方面有待提高。本測評任務(wù)題的開發(fā)有助于監(jiān)測九年級學(xué)生科學(xué)思維的發(fā)展水平,循證設(shè)計(jì)相應(yīng)的課程和教學(xué)模式以有效促進(jìn)學(xué)生的科學(xué)思維能力提升。

        參考文獻(xiàn)

        [1] OSBORNE J, ERDURAN S, SIMON S. Enhancing the quality of argumentation in school science[J]. Journal of Research in Science Teaching, 2004,41(10):994-1020.

        [2] 中華人民共和國教育部.義務(wù)教育物理課程標(biāo)準(zhǔn)(2022年版)[S].北京:北京師范大學(xué)出版社,2022.

        [3] TOLMIE A K,GHAZALI Z,MORRIS S. Children’s science learning: a core skills approach[J]. British Journal of Educational Psychology, 2016,86(3):481-497.

        [4] SANDOVAL W A, SODIAN B, KOERBER S W. Developing children’s early competencies to engage with science[J]. Educational Psychologist, 2014,49(2):139-152.

        [5] 朱文琴.Rasch模型在小學(xué)科學(xué)素養(yǎng)評測質(zhì)量分析中的應(yīng)用[J].考試研究,2022,18(1):38-48.

        [6] 謝娟.Rasch模型在物理試題質(zhì)量分析中的應(yīng)用[D].福州:福建師范大學(xué),2015.

        [7] 張迪.Rasch模型在八年級數(shù)學(xué)學(xué)業(yè)測試卷質(zhì)量分析中的應(yīng)用[J].教育測量與評價(jià),2020(8):34-41.

        [8] 田曉華.基于SPSS的一次物理試卷分析[J].中學(xué)物理,2018,36(19):41-45.

        [9] 王祖浩,楊玉琴.基于Rasch模型的“化學(xué)實(shí)驗(yàn)認(rèn)知能力”測驗(yàn)工具編制及測評研究[J].化學(xué)教育,2012,33(9):95-102,108.

        [10] 趙守盈,何妃霞,陳維,等.Rasch模型在研究生入學(xué)考試質(zhì)量分析中的應(yīng)用[J].教育研究,2012,33(6):61-65.

        [11] 羅照盛.項(xiàng)目反應(yīng)理論基礎(chǔ)[M].北京:北京師范大學(xué)出版社,2012:1-3.

        [12] GUSTAFSSON J E.Testing and obtaining fit of data to the Rasch model[J].British Journal of Mathematical and Statistical Psychology,1980,33(2):205-233.

        [13] 宋歌. 科學(xué)教育中的跨學(xué)科素養(yǎng)測評框架建構(gòu)及應(yīng)用研究[D].上海:華東師范大學(xué),2019.

        [14] 謝云芝,李遠(yuǎn)蓉.基于Rasch模型的高中化學(xué)學(xué)科核心素養(yǎng)測評研究——以“變化觀念與平衡思想”為例[J].化學(xué)教育(中英文),2020,41(21):7-15.

        [15] 高靖寒,柏毅.基于Rasch模型的小學(xué)四年級科學(xué)素養(yǎng)評價(jià)研究[J].東南大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2021,23(增刊1):135-138.

        [16] 徐佳敏,沈甸.基于Rasch模型的上海市某區(qū)化學(xué)高考一模試題分析[J].化學(xué)教育(中英文),2021,42(11):10-17.

        [17] 羅德紅,龔婧.Rasch模型在試卷質(zhì)量分析中的應(yīng)用——基于五六年級學(xué)生閱讀素養(yǎng)前測試卷的質(zhì)量分析[J].教育測量與評價(jià)(理論版),2015(1):18-22.

        Development and validation of a scientificthinking testing tool for ninth grade students basedon physical contexts

        TIAN Xue-wei"1,YIN Zi-juan"1,LIU Wen-ke"1 WANG Jing-ying"2

        (1.Normal College,Qingdao University,Qingdao,Shandong266017,China;

        2.Faculty of Education,Beijing Normal University,Beijing100875,China)

        Abstract

        Scientific thinking is an important component of the core competencies in the 2022 version of the new curriculum standards.This study developed a tool to evaluate the scientific thinking of ninth-grade students.Based on the Rasch model,the overall quality of the tool was evaluated from aspects such as rater reliability,unidimensionality,test scoring structure,test fit,separation,error statistics,and white map.The results show that the overall reliability and validity of the evaluation tool are high,and the fitting and separation of the test questions meet the requirements,with an error within an acceptable range.The white map indicates that the students’scientific thinking level is weak.Overall,this set of evaluation tools meets the requirements,and the reliability is relatively strong.The testing quality analysis based on the Rasch model also provides a reference for optimizing testing tools.

        Keywords

        scientific thinking;quality analysis;9th grade students;Rasch models

        [責(zé)"任編輯孫菊]

        收稿日期:2023-05-13

        基金項(xiàng)目:北京市教育科學(xué)規(guī)劃“十四五”優(yōu)先關(guān)注課題(CDEA22008)

        作者簡介:

        田雪葳(1985—),女,山東青島人。博士,講師,碩士生導(dǎo)師,主要研究方向?yàn)榧夹g(shù)支持的科學(xué)教育。

        *"通信作者:

        王晶瑩(1980—),女,遼寧營口人。博士,教授,博士生導(dǎo)師,教育部基礎(chǔ)教育教學(xué)指導(dǎo)委員會科學(xué)教學(xué)專委會秘書長,北京學(xué)習(xí)科學(xué)學(xué)會科學(xué)教育專委會副主任委員,主要研究方向?yàn)榧夹g(shù)支持的科學(xué)教育、教師教育研究。

        猜你喜歡
        科學(xué)思維
        “自由落體運(yùn)動(dòng)”課堂教學(xué)片段賞析
        用面向科學(xué)思維的教學(xué)方法改進(jìn)計(jì)算機(jī)圖形學(xué)課程教學(xué)
        淺析計(jì)算機(jī)應(yīng)用與科學(xué)思維能力培養(yǎng)
        青春歲月(2016年20期)2016-12-21 19:03:04
        重視科學(xué)實(shí)驗(yàn)課教學(xué)發(fā)展學(xué)生科學(xué)思維探析
        成才之路(2016年34期)2016-12-20 20:27:54
        關(guān)于高中三年級的第二輪復(fù)習(xí)的思考
        南北橋(2016年10期)2016-11-10 17:13:12
        淺談初中物理知識在生活中的應(yīng)用
        基于高中生科學(xué)思維培養(yǎng)的探究式教學(xué)
        科普少兒劇在科學(xué)教學(xué)中的作用探究
        成才之路(2016年5期)2016-03-26 12:39:12
        大數(shù)據(jù)視野下物理實(shí)驗(yàn)教學(xué)的研究
        用科學(xué)思維解密科學(xué)研究中的問題
        五月婷婷开心五月激情| 国产女精品| 精品亚洲一区二区99| 少妇高潮精品正在线播放| 国产大屁股喷水视频在线观看| 黑人巨大无码中文字幕无码| 色丁香色婷婷| 另类人妖在线观看一区二区| 亚洲国产中文字幕无线乱码 | 亚洲一区二区三区色偷偷| 伊人久久大香线蕉av波多野结衣| 好日子在线观看视频大全免费动漫| 精品少妇大屁股白浆无码| 亚洲最大的av在线观看| 国产高清成人在线观看视频| 国产午夜精品理论片| 免费人成在线观看播放国产 | 97精品熟女少妇一区二区三区| 男女性爽大片视频| 人妻激情偷乱一区二区三区| 人妻无码∧V一区二区| 亚洲av成人一区二区| 国产成人精品a视频| 香蕉视频一级片| 能看的网站中文字幕不卡av| 国产av精品一区二区三区久久| 亚洲精品成人网线在线播放va| 欧美性久久| 亚洲国产一区中文字幕| 国产乱人无码伦av在线a| 欧美综合自拍亚洲综合图片区| 久久久久亚洲AV无码专区一区| 人妻精品人妻一区二区三区四区| 亚洲av永久无码精品网址| 欧美日韩国产一区二区三区地区| 日本在线一区二区三区四区 | 国产三级欧美| 国产av三级精品车模| 国产亚洲精品美女久久久m| 成年女人毛片免费视频| 国产一区二区三区高清视频|