郭習(xí)佩 薛亮 古麗茹?吐爾遜馮玨
摘要: 運(yùn)用Rasch模型對(duì)高中學(xué)生的化學(xué)推理能力水平進(jìn)行研究,開發(fā)了測(cè)驗(yàn)工具,同時(shí)進(jìn)行了推理能力測(cè)驗(yàn)、數(shù)據(jù)統(tǒng)計(jì)及數(shù)據(jù)分析。研究結(jié)果顯示,高二比高一學(xué)生進(jìn)行化學(xué)推理時(shí)的思維復(fù)雜程度更高,即隨著年齡增長(zhǎng),學(xué)生的推理能力也提高。
關(guān)鍵詞: 化學(xué)推理; Rasch模型; 測(cè)驗(yàn)編制; 能力分析
文章編號(hào): 10056629(2019)4001807中圖分類號(hào): G633.8文獻(xiàn)標(biāo)識(shí)碼: B
目前世界各國(guó)在科學(xué)教育方面都在強(qiáng)調(diào)學(xué)生需要積極地投入到科學(xué)實(shí)踐中去,例如使用模型建立解釋和基于證據(jù)進(jìn)行論證[1]?;瘜W(xué)學(xué)科核心素養(yǎng)共包括五個(gè)方面,其中一點(diǎn)就是模型認(rèn)知與證據(jù)推理。推理指的是由一個(gè)或幾個(gè)已知判斷推出新判斷的思維形式[2]。推理能力是影響推理活動(dòng)效果,在推理活動(dòng)中形成、體現(xiàn)和發(fā)展,相對(duì)穩(wěn)定的個(gè)性心理特征的綜合[3]。化學(xué)推理能力是學(xué)生在學(xué)習(xí)化學(xué)知識(shí),解決化學(xué)問題時(shí)的一種高級(jí)思維形式。學(xué)生在進(jìn)行復(fù)雜的化學(xué)推理時(shí),需要運(yùn)用物質(zhì)性質(zhì)、概念、原理等核心知識(shí),經(jīng)過多角度分析、多步系統(tǒng)推理解決情境陌生、綜合度高的復(fù)雜問題,分析復(fù)雜的遠(yuǎn)變式活動(dòng)程序的合理性及其原理[4]。
為了解高中生化學(xué)推理能力的發(fā)展現(xiàn)狀,不同年級(jí)的高中學(xué)生在化學(xué)推理類型上的差異,本研究在Hannah Sevian對(duì)學(xué)生的化學(xué)推理模式的水平劃分的基礎(chǔ)上,對(duì)高一高二學(xué)生所能達(dá)到的推理能力的水平進(jìn)行了研究。
1 Rasch模型簡(jiǎn)介
根據(jù)Rasch模型原理,特定的個(gè)體對(duì)特定的題目做出特定反應(yīng)的概率可以用個(gè)體能力與該題目難度的一個(gè)簡(jiǎn)單函數(shù)來表示。個(gè)體回答某一題目正確與否完全取決于個(gè)體能力和題目難度之間的比較。通過個(gè)體在題目上的表現(xiàn)(通常表示為原始分?jǐn)?shù))來測(cè)量不可直接觀察的、潛在的變量[5]。根據(jù)測(cè)量的數(shù)據(jù)類型,可以把Rasch模型劃分為二分模型、部分給分模型和等級(jí)量表模型;根據(jù)維度的多少,可以劃分為單維模型和多維模型;根據(jù)參數(shù)估計(jì)數(shù)目不同,可以劃分為兩面模型和多面模型[6]。針對(duì)不同的測(cè)量量表和測(cè)量心理結(jié)構(gòu)需要選擇相對(duì)應(yīng)的測(cè)量模型。
根據(jù)Rasch模型的測(cè)量原理,Wilson(2008)提出了四個(gè)構(gòu)建模塊作為用于開發(fā)測(cè)量的工具。第一個(gè)模塊為結(jié)構(gòu)圖,結(jié)構(gòu)圖是從發(fā)展的視角來對(duì)要測(cè)量的心理結(jié)構(gòu)由低到高發(fā)展的一種描述。第二個(gè)模塊為項(xiàng)目設(shè)計(jì),項(xiàng)目是學(xué)生心理結(jié)構(gòu)的外在表達(dá),它指的是用系統(tǒng)的任務(wù)設(shè)計(jì)來引出一個(gè)或多個(gè)結(jié)構(gòu)圖所描述的學(xué)生的知識(shí)水平的特定類型的證據(jù)。第三個(gè)模塊為結(jié)果空間,學(xué)生對(duì)項(xiàng)目的反應(yīng)被映射到結(jié)果空間,通過對(duì)各項(xiàng)目反應(yīng)的結(jié)果進(jìn)行評(píng)分分類使其與結(jié)構(gòu)圖中的各水平層次聯(lián)系起來。即在對(duì)個(gè)體反應(yīng)現(xiàn)象分析的基礎(chǔ)上,記錄和評(píng)判個(gè)體在各個(gè)項(xiàng)目上是如何反應(yīng)的。第四個(gè)模塊為結(jié)果空間,用以解釋和評(píng)估學(xué)生在測(cè)驗(yàn)中獲得的分?jǐn)?shù),從而將結(jié)果空間與心理結(jié)構(gòu)聯(lián)系起來[7]。
2 研究過程
2.1 學(xué)生“推理能力”的水平構(gòu)建
Hannah Sevian通過對(duì)8~16年級(jí)的學(xué)生進(jìn)行研究,根據(jù)學(xué)生推理思維復(fù)雜性的不同,提出了一套全新的關(guān)于學(xué)生化學(xué)推理思維的學(xué)習(xí)進(jìn)階模型。
2.2 “推理能力”測(cè)驗(yàn)工具的開發(fā)
根據(jù)所建構(gòu)的“推理能力”的四個(gè)水平及具體的行為表現(xiàn),編制了“推理能力”試測(cè)工具。同時(shí)綜合考慮高一、高二學(xué)生不同的知識(shí)進(jìn)程,編制了高一和高二兩套試題,通過“錨題”將兩套試題連接起來。對(duì)于初測(cè)試題,在試題編制完成之后請(qǐng)化學(xué)教育專家及高中一線化學(xué)教師對(duì)試題進(jìn)行分析,提出建議,并依據(jù)建議對(duì)試題進(jìn)行了調(diào)整和修改。初測(cè)試題調(diào)整完成之后,進(jìn)行了初測(cè),根據(jù)試測(cè)結(jié)果對(duì)試題進(jìn)行了刪減和修改,之后進(jìn)行了二次測(cè)試,確定了最終的測(cè)試量表,具體如表2所示。
2.3 研究對(duì)象
本次測(cè)驗(yàn)共進(jìn)行了三次測(cè)驗(yàn)。第一次測(cè)試旨在測(cè)試量表的質(zhì)量,選取了高一、高二各52名學(xué)生,合計(jì)共104名,根據(jù)Rasch測(cè)量結(jié)果對(duì)量表進(jìn)行修改和調(diào)整之后進(jìn)行第二次試測(cè),二測(cè)選取高一年級(jí)60名、高二年級(jí)55名學(xué)生,試測(cè)結(jié)果顯示調(diào)整之后的量表質(zhì)量較好。之后進(jìn)行了第三次大樣本測(cè)試,在西安的兩個(gè)學(xué)校分別選取高一高二各50多位學(xué)生,組成了第三次大測(cè)試樣本。大樣本測(cè)試的樣本具體組成如表3所示。
3 研究結(jié)果
本研究運(yùn)用Winsteps對(duì)測(cè)試結(jié)果進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析及建模分析,檢驗(yàn)測(cè)試結(jié)果的信度和效度。
3.1 總體統(tǒng)計(jì)
由總體統(tǒng)計(jì)結(jié)果可知,高一測(cè)試的項(xiàng)目難度估計(jì)誤差為0.27,被試的估計(jì)誤差為0.67,均在許可的誤差范圍內(nèi)。高二測(cè)試的項(xiàng)目難度估計(jì)誤差為0.24,被試的估計(jì)誤差為0.59,均在許可的誤差范圍內(nèi)。高一測(cè)試卷和高二測(cè)試卷的項(xiàng)目擬合指數(shù)MNSQ均在標(biāo)準(zhǔn)值1左右,ZSTD均在標(biāo)準(zhǔn)值0左右,說明了兩份試卷的測(cè)驗(yàn)數(shù)據(jù)與理想模型的一致性良好。高一測(cè)試卷的被試分離度為1.36,項(xiàng)目的分離度較高,達(dá)到了6,被試的信度為0.65,項(xiàng)目的信度相對(duì)較高為0.97;高二測(cè)試卷的被試分離度為1.36,項(xiàng)目的分離度較高達(dá)到了3.85,被試的信度為0.65,項(xiàng)目的信度為0.94。這說明學(xué)生的能力選取還是相對(duì)集中,能力分布水平不夠廣,但從總體情況來看,測(cè)驗(yàn)工具的性能還是相對(duì)較好的。
3.2 單維性
從圖1可以看出,對(duì)于高一測(cè)試卷而言,有三個(gè)項(xiàng)目的標(biāo)準(zhǔn)殘差系數(shù)超出了范圍,有一個(gè)項(xiàng)目在邊界處,表明這幾個(gè)項(xiàng)目可能受其他因素干擾還測(cè)有其他的結(jié)構(gòu)或能力,但大多數(shù)項(xiàng)目分布區(qū)間在-0.4~0.4之間,所以說明高一測(cè)試卷測(cè)量的主要是學(xué)生的推理能力,具有單維性。由圖2可以看出,對(duì)于高二測(cè)試卷而言,有三個(gè)項(xiàng)目超出了范圍,有兩個(gè)項(xiàng)目在邊界處,但大多數(shù)項(xiàng)目分布區(qū)間-0.4~0.4之間,故而可以說高二測(cè)試項(xiàng)目從總體來看是在測(cè)量學(xué)生的一種能力,具有單維性。
3.3 項(xiàng)目—被試對(duì)應(yīng)
Rasch分析用懷特圖將項(xiàng)目、被試按其難度、能力高低放置在同一Logit區(qū)間尺度上,以此來反映項(xiàng)目難度與個(gè)體能力之間的關(guān)系,檢測(cè)學(xué)生成績(jī)的有效性。高一懷特圖如圖3所示,從項(xiàng)目整體分布上來看,18個(gè)項(xiàng)目分布比較廣泛,覆蓋的范圍比較大,基本上涵蓋了學(xué)生的能力,且分散基本均勻。學(xué)生的分布情況也比較好,能力分布顯示出中間多兩邊少,大部分學(xué)生能力都集中在0左右,是較為理想的狀況,說明參加測(cè)試的高一學(xué)生代表性好,能力分布比較均勻。圖4為高二測(cè)試懷特圖,從總體來看,高二學(xué)生能力分布比較理想,中間部分人數(shù)居多,兩邊較少且具有一定的跨度,呈正態(tài),19個(gè)項(xiàng)目分布比較均勻。大部分考生水平在0以上,表明高二測(cè)試項(xiàng)目對(duì)于高二樣本來說比較簡(jiǎn)單。對(duì)于高一和高二測(cè)試而言,都存在一些難度較小的項(xiàng)目幾乎沒有可以與之匹配對(duì)應(yīng)的學(xué)生能力。
3.4 項(xiàng)目擬合、誤差
通過對(duì)高一和高二年級(jí)測(cè)試各個(gè)項(xiàng)目的擬合情況及誤差進(jìn)行統(tǒng)計(jì)分析,我們可以看出,對(duì)于高一測(cè)試項(xiàng)目而言,項(xiàng)目難度值在-3.54~3.17之間,除了項(xiàng)目1的項(xiàng)目難度估計(jì)的誤差相較其他項(xiàng)目偏大外,其他項(xiàng)目難度估計(jì)的誤差均較小,除了項(xiàng)目9、 14、 16的ZSTD稍微超出范圍之外,大部分項(xiàng)目擬合指數(shù)都在可允許范圍之內(nèi)。除項(xiàng)目1的點(diǎn)—測(cè)量相關(guān)較低之外,其余項(xiàng)目的點(diǎn)—測(cè)量相關(guān)都較高,表明項(xiàng)目具有較好的鑒別能力。對(duì)于高二測(cè)試項(xiàng)目而言,項(xiàng)目難度值在-2.56~1.75之間,項(xiàng)目難度估計(jì)的誤差均較小,除了項(xiàng)目7的擬合指數(shù)超出范圍之外,其余項(xiàng)目擬合指數(shù)都在可允許范圍之內(nèi)。項(xiàng)目的點(diǎn)—測(cè)量相關(guān)都較高,表明高二測(cè)試項(xiàng)目都具有較好的鑒別能力。
3.5 化學(xué)推理能力測(cè)評(píng)分析
3.5.1 總體分析
采取單因素方差分析對(duì)兩個(gè)年級(jí)學(xué)生的能力差異進(jìn)行檢驗(yàn)。結(jié)果顯示,方差檢驗(yàn)F值為8.94, P值為0.003,小于顯著性水平0.005,故兩個(gè)年級(jí)學(xué)生的能力存在明顯差異。
3.5.2 在各級(jí)水平層次上的比較
由于高一高二測(cè)試題并不完全相同,且高一高二學(xué)生能力不同,故高一、高二年級(jí)的水平劃分并不是絕對(duì)相同的,而是存在一定的差異。高一年級(jí)的各級(jí)水平的難度平均值如表5所示。高一年級(jí)測(cè)試卷的水平1包含5個(gè)題目,難度范圍為-3.54~-1.36,難度平均值為-1.986;水平2包含5個(gè)題目,難度范圍為-0.97~-0.04,難度平均值為-0.564;水平3包含5個(gè)題目,難度范圍為0.56~1.4,難度平均值為0.928;水平4包含3個(gè)題目,難度范圍為2.02~3.17,難度平均值為2.7。即當(dāng)學(xué)生的能力值低于-1.986時(shí)說明學(xué)生的推理能力沒有達(dá)到水平1;當(dāng)學(xué)生的能力值在-1.986~-0.564之間時(shí),表明學(xué)生的推理能力達(dá)到了水平1;當(dāng)學(xué)生的能力值在-0.564~0.928之間時(shí),表明學(xué)生的推理能力達(dá)到了水平2;當(dāng)學(xué)生的能力值在0.928~2.7之間時(shí),表明學(xué)生的推理能力達(dá)到了水平3;當(dāng)學(xué)生的能力值高于2.8時(shí),說明學(xué)生的推理能力達(dá)到了水平4。通過表4我們可以看到,高一年級(jí)學(xué)生的平均能力值為0.27,即高一學(xué)生的推理能力整體上處于水平2。
高二年級(jí)的各級(jí)水平的難度平均值如表6所示。高二年級(jí)測(cè)試卷的水平1包含五個(gè)題目,難度范圍為-2.56~-0.56,難度平均值為-1.268;水平2包含4個(gè)題目,難度范圍為-0.32~-0.02,難度平均值為-0.145;水平3包含7個(gè)題目,難度范圍為0.08~0.72,難度平均值為0.357;水平4包含3個(gè)題目,難度范圍為1.17~1.75,難度平均值為1.48。即當(dāng)學(xué)生的能力值低于-1.268時(shí),認(rèn)為學(xué)生的推理能力未達(dá)到水平1;當(dāng)學(xué)生的能力值在-1.268~-0.145之間時(shí),認(rèn)為學(xué)生的推理能力達(dá)到了水平1;當(dāng)學(xué)生的能力值在-0.145~0.357之間時(shí),認(rèn)為學(xué)生的推理能力達(dá)到了水平2;當(dāng)學(xué)生的能力值在0.357~1.48之間時(shí),認(rèn)為學(xué)生的推理能力達(dá)到了水平3;當(dāng)學(xué)生的能力值大于1.48時(shí),認(rèn)為學(xué)生的推理能力達(dá)到了水平4。通過表4我們可以看到,高二年級(jí)學(xué)生的平均能力值為0.72,即高二學(xué)生的推理能力整體上處于水平3。
從以上分析可以知道,高一年級(jí)學(xué)生整體的推理能力達(dá)到了水平2,即大部分學(xué)生可以根據(jù)日常生活經(jīng)驗(yàn)來推斷某物質(zhì)的物理性質(zhì)或化學(xué)性質(zhì),可以根據(jù)物質(zhì)體現(xiàn)出來的某個(gè)化學(xué)性質(zhì)或物理性質(zhì)來推斷物質(zhì)可能存在的某個(gè)結(jié)構(gòu),也可以依據(jù)已知物質(zhì)的性質(zhì)來對(duì)未知物質(zhì)的性質(zhì)做出自己的假設(shè)和判斷,他們可以通過簡(jiǎn)單的線性分析來進(jìn)行推理,但進(jìn)行連續(xù)性的或綜合性的復(fù)雜分析對(duì)高一年級(jí)學(xué)生而言難度較高。這可能是由于高一年級(jí)學(xué)生學(xué)習(xí)的大部分內(nèi)容都是從宏觀層面來了解物質(zhì)的物理性質(zhì)和化學(xué)性質(zhì),雖然會(huì)有部分內(nèi)容涉及到物質(zhì)發(fā)生變化的微觀層面分析,但由于剛開始接觸物質(zhì)變化的微觀分析,所以學(xué)生對(duì)這一部分內(nèi)容了解得不夠透徹。包括必修2的很多內(nèi)容,例如化學(xué)反應(yīng)速率、化學(xué)能與電能、有機(jī)化合物等內(nèi)容,高一年級(jí)的學(xué)生都只是做一個(gè)初步了解,所以對(duì)高一學(xué)生而言一方面可能是知識(shí)儲(chǔ)備不夠,從而限制了高一年級(jí)在某些方面做深度的分析和推理,他們只能局限于變化發(fā)生的表層來進(jìn)行推理,進(jìn)一步局限了高一學(xué)生的思維的復(fù)雜程度,且學(xué)生的思維復(fù)雜程度是隨著年齡增長(zhǎng)而增強(qiáng)的,對(duì)于高一學(xué)生而言,可能由于年齡影響,導(dǎo)致其對(duì)問題的思考不全面,從而限制了其思維模式。
高二年級(jí)學(xué)生整體的推理能力達(dá)到了水平3,即高二年級(jí)的學(xué)生在遇到需要解決的問題時(shí),能夠?qū)⑺鶎W(xué)的物質(zhì)的若干個(gè)性質(zhì)或物質(zhì)的物理變化或化學(xué)變化聯(lián)系起來思考,形成一個(gè)線性的思維網(wǎng)絡(luò),能夠由已知條件,通過連續(xù)不斷地利用物質(zhì)之間的轉(zhuǎn)化關(guān)系或結(jié)合物質(zhì)在量方面的轉(zhuǎn)化來簡(jiǎn)化自己的推理,得到最終的推理結(jié)果。這可能是因?yàn)楦叨昙?jí)的學(xué)生已經(jīng)開始深入地從微觀變化來分析化學(xué)能與電能、熱能之間的轉(zhuǎn)化,也開始深入地了解物質(zhì)的微觀結(jié)構(gòu)以及微觀結(jié)構(gòu)對(duì)物質(zhì)性質(zhì)所帶來的影響,也開始從多個(gè)角度來進(jìn)一步分析影響化學(xué)平衡和化學(xué)反應(yīng)速率的因素,所以高二學(xué)生在學(xué)習(xí)的過程中已經(jīng)潛移默化地形成了更為復(fù)雜的思維習(xí)慣,他們已經(jīng)可以從宏觀和微觀等多個(gè)方面來看待物質(zhì)變化,也能夠?qū)⒆约核鶎W(xué)習(xí)的知識(shí)聯(lián)系起來思考問題,因此他們也就能夠?qū)⒍鄠€(gè)變量之間的關(guān)系梳理清楚,進(jìn)一步進(jìn)行更為復(fù)雜的線性推理。但對(duì)于高二大部分學(xué)生而言,在涉及由多方面影響因素或作用產(chǎn)生某現(xiàn)象的分析推理方面存在一定的難度,存在思考問題不全面,不能夠?qū)⒍嘀匾蛩刂g的相互作用聯(lián)系起來進(jìn)行綜合思考和推理。這可能是由于高二學(xué)生還沒有經(jīng)過系統(tǒng)化的知識(shí)梳理,沒有能夠形成完整的知識(shí)網(wǎng)絡(luò),故對(duì)于同時(shí)考慮多種復(fù)雜因素的動(dòng)態(tài)推理還存在一定的不足。
4 結(jié)論與啟示
本文的測(cè)量工具具有一定的測(cè)量信度和預(yù)測(cè)效度。它可以用來測(cè)量學(xué)生所能達(dá)到的推理能力的復(fù)雜程度。當(dāng)使用測(cè)量工具對(duì)高一高二年級(jí)進(jìn)行測(cè)試時(shí)發(fā)現(xiàn),高二年級(jí)學(xué)生的推理能力要高于高一年級(jí)學(xué)生,高二年級(jí)學(xué)生的推理能力大多集中在水平3,高一年級(jí)學(xué)生的推理能力大多集中在水平2,雖然兩個(gè)年級(jí)都有未達(dá)到水平1的學(xué)生,但只是極少數(shù)的個(gè)別學(xué)生。兩個(gè)年級(jí)在四個(gè)水平上都有不同比例的學(xué)生,且集中的水平層次差別很明顯。這說明隨著年齡增長(zhǎng)和所學(xué)知識(shí)難度和復(fù)雜性的增加,學(xué)生的推理能力會(huì)有明顯的提升。這說明學(xué)生的推理能力一定程度上是受學(xué)生所學(xué)知識(shí)的難度和年齡增長(zhǎng)影響的。
對(duì)于一線教師而言,可以在鍛煉學(xué)生可達(dá)到的思維水平的基礎(chǔ)上,通過擴(kuò)展學(xué)生的知識(shí)面和視野,讓學(xué)生在學(xué)習(xí)過程中來自主地進(jìn)行探究和發(fā)現(xiàn)知識(shí),從而合理地發(fā)展學(xué)生更復(fù)雜的推理思維,提高學(xué)生的推理能力。同時(shí)要注意培養(yǎng)學(xué)生形成知識(shí)網(wǎng)絡(luò),以使學(xué)生能夠在進(jìn)行推理時(shí)意識(shí)到不同物質(zhì)結(jié)構(gòu)與性質(zhì)、變化之間的多重關(guān)系,從而可以在已有知識(shí)的基礎(chǔ)上進(jìn)行復(fù)雜推理。
參考文獻(xiàn):
[1]M. L. Weinrich & V. Talanquer. Mapping students modes of reasoning when thinking about chemical reactions used to make a desired product [J]. The Royal Society of Chemistry, 2016, (17): 394~406.
[2]陸海燕. 高中學(xué)生的物理推理能力調(diào)查研究[D]. 南京: 南京師范大學(xué)碩士學(xué)位論文, 2015.
[3]吳宏. 推理能力表現(xiàn): 要素、 水平與評(píng)價(jià)指標(biāo)[J]. 教育研究與實(shí)驗(yàn), 2014, (1): 47~51.
[4]王磊, 支瑤. 化學(xué)學(xué)科能力及其表現(xiàn)研究[J]. 教育學(xué)報(bào), 2016, (4): 46~56.
[5]晏子. 心理學(xué)領(lǐng)域內(nèi)的客觀測(cè)量——Rasch模型之特點(diǎn)及發(fā)展趨勢(shì)[J]. 心理科學(xué)進(jìn)展, 2010, (8): 1298~1305.
[6]何鵬. 理科教師課堂教學(xué)表現(xiàn)的測(cè)量與評(píng)價(jià)研究[D]. 哈爾濱: 東北師范大學(xué)碩士學(xué)位論文, 2016.
[7]Linda Morell. A Construct — Modeling Approach to Develop a Learning Progression of How Students Understand the Structure of Matter [J]. Journal of Research in Science Teaching, 2017, (8): 1024~1048.
[8]Hannah Sevian & Vicente Talanquer. Rethinking chemistry: a learning progression on chemical thinking [J]. The Royal Society of Chemistry, 2014, (15): 10~23.