李玉冰 丁格曼,2
(1.華南師范大學(xué)物理與電信工程學(xué)院,廣東 廣州 510006;2.華南師范大學(xué)物理學(xué)科基礎(chǔ)課實(shí)驗(yàn)教學(xué)示范中心,廣東 廣州 510006)
哲學(xué)家基切爾和薩爾蒙曾說過:“為自然現(xiàn)象提供假設(shè)是科學(xué)探究的基本目的”.[1]隨著時(shí)代發(fā)展,科學(xué)的本質(zhì)從探究與實(shí)驗(yàn)逐漸改變?yōu)榻忉屌c論證.[2]這樣的社會(huì)背景下,在《普通高中物理課程標(biāo)準(zhǔn)(2017年版)》中,科學(xué)解釋被納為物理學(xué)科核心素養(yǎng)中科學(xué)探究的一個(gè)重要組成要素.[3]由此可見,基于物理學(xué)科背景,評(píng)價(jià)并診斷學(xué)生的科學(xué)解釋能力發(fā)展情況顯得尤為重要.因此,本研究在Rasch模型的基礎(chǔ)上,開發(fā)物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力測(cè)評(píng)工具,并對(duì)測(cè)評(píng)工具進(jìn)行質(zhì)量檢驗(yàn),嘗試測(cè)評(píng)高一學(xué)生在物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力,并分析其特點(diǎn).
筆者初始分析國(guó)內(nèi)外學(xué)者對(duì)科學(xué)解釋、能力、實(shí)驗(yàn)探究的相關(guān)研究,[4-7]其中黃蕙歡[7](2017)學(xué)者在科學(xué)解釋CER框架的基礎(chǔ)上界定了學(xué)生物理科學(xué)解釋能力.本文沿用該框架,細(xì)化界定物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力,即學(xué)生在物理實(shí)驗(yàn)探究過程中能利用已有的物理知識(shí)和從觀察、實(shí)驗(yàn)或模型中獲取的新證據(jù)、對(duì)問題或現(xiàn)象通過邏輯推理的方式進(jìn)行判斷、說明的能力,具體包括實(shí)驗(yàn)論斷提出能力、證據(jù)提取能力、科學(xué)推理能力和輔助能力,如表1所示將其再進(jìn)行細(xì)分.
表1 物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力
此外,學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力是所界定的各部分能力彼此作用下的綜合情況,不能簡(jiǎn)單地加減各部分能力.
在界定什么是科學(xué)解釋能力后,要想測(cè)評(píng)學(xué)生在物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力,還需要對(duì)該能力進(jìn)行水平劃分.考慮到SOLO分類理論具有較強(qiáng)的可操作性,[8]并且可以將質(zhì)性評(píng)價(jià)與量性評(píng)價(jià)相結(jié)合,[9]本文結(jié)合SOLO分類理論以及《普通高中物理課程標(biāo)準(zhǔn)(2017版)》中學(xué)業(yè)質(zhì)量水平部分關(guān)于科學(xué)解釋的劃分,考慮到抽象拓展水平有時(shí)候連專家都不一定可以達(dá)到,故將科學(xué)解釋能力劃分成4個(gè)水平,具體如表2所示.
表2 物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力水平劃分
物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力是一種內(nèi)隱的、從后天習(xí)得的能力類型.該能力可以依據(jù)學(xué)生回答問題的思維方式進(jìn)行測(cè)量與評(píng)價(jià).在比較訪談法、問卷調(diào)查法、紙筆測(cè)試法等常見且行之有效的測(cè)量方法后,考慮到紙筆測(cè)試法容易獲取大量數(shù)據(jù),并且與學(xué)生的適配性較強(qiáng),測(cè)試時(shí)學(xué)生容易發(fā)揮出正常、真實(shí)的水平,因此本研究采用紙筆測(cè)試法對(duì)學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力進(jìn)行測(cè)評(píng).題目類型選擇開放式問題和封閉式問題相結(jié)合.
而為保證所開發(fā)的測(cè)量工具具有較好的信效度,本文選擇項(xiàng)目反應(yīng)理論作為理論支撐,其基本思想是展現(xiàn)被測(cè)試的對(duì)象在各個(gè)試題上的回答情況與其內(nèi)在的某種品質(zhì)之間的關(guān)系,其項(xiàng)目特征曲線就是用來表示這種關(guān)系的.[10]如圖1項(xiàng)目特征曲線所示,其顯示具有θ能力的被試者答對(duì)某個(gè)項(xiàng)目的概率為P.利用該理論建立起具有固定不變的參數(shù)的測(cè)評(píng)項(xiàng)目,統(tǒng)一對(duì)比不同的測(cè)驗(yàn)量表分?jǐn)?shù).
圖1 IRT理論的項(xiàng)目特征曲線
上文已經(jīng)劃分了學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力水平層次,而科學(xué)解釋在實(shí)驗(yàn)探究過程中主要體現(xiàn)在對(duì)實(shí)驗(yàn)進(jìn)行假設(shè)、分析實(shí)驗(yàn)數(shù)據(jù)、解釋實(shí)驗(yàn)現(xiàn)象和形成實(shí)驗(yàn)結(jié)論等環(huán)節(jié)上.故本研究圍繞科學(xué)地解釋實(shí)驗(yàn)情況、對(duì)實(shí)驗(yàn)中的變化情景做出解釋性假設(shè)、分析實(shí)驗(yàn)證據(jù)和總結(jié)實(shí)驗(yàn)結(jié)論、論證和辯護(hù)自己的實(shí)驗(yàn)觀點(diǎn),通過舉例、使用圖像或模型等方法輔助說明實(shí)驗(yàn)問題等內(nèi)容進(jìn)行試題命制.
根據(jù)測(cè)評(píng)內(nèi)容和要求命制試題后,邀請(qǐng)物理教學(xué)研究者和部分骨干教師對(duì)試題提出修改意見,并邀請(qǐng)部分學(xué)生進(jìn)行試做后提出答題體驗(yàn),結(jié)合兩者的意見對(duì)試題進(jìn)行修改后試測(cè).統(tǒng)計(jì)試測(cè)結(jié)果后運(yùn)用 Winsteps軟件進(jìn)行數(shù)據(jù)分析,基于Rasch模型檢驗(yàn)試題的信度、效度、區(qū)分度以及數(shù)據(jù)—模型擬合參數(shù)等,對(duì)不符合要求的試題進(jìn)行修正后再進(jìn)行實(shí)測(cè).
本文在試測(cè)對(duì)象上選擇高一年級(jí)中選修物理科目的A班、B班兩個(gè)班級(jí)的學(xué)生,其中A班為重點(diǎn)班,B班為平行班,該群體學(xué)生的物理成績(jī)跨越30分到100分,具有較好的代表性.本輪共發(fā)放120份試題,回收的有效試卷為70份,試卷的有效回收率為68%.根據(jù)各個(gè)題目的評(píng)分標(biāo)準(zhǔn),對(duì)學(xué)生的回答進(jìn)行賦分,從而得到本研究的數(shù)據(jù).
由于本測(cè)評(píng)工具具有較多的開放性試題,為保證評(píng)分者賦分的可靠性,本文運(yùn)用Kendall's W(肯德爾和諧系數(shù))考查評(píng)分者評(píng)分的一致性.在評(píng)分過程中隨機(jī)抽取10份試卷,利用SPSS數(shù)據(jù)處理軟件統(tǒng)計(jì)3位評(píng)分者間的肯德爾和諧系數(shù)為0.893,漸近顯著性系數(shù)為0.004,說明此份試題的評(píng)分標(biāo)準(zhǔn)比較公平公正,受主觀因素影響較?。ū?).
表3 初測(cè)評(píng)分者信度統(tǒng)計(jì)表
在此基礎(chǔ)上,將所得到的數(shù)據(jù)輸入Winsteps軟件,檢測(cè)所編制的測(cè)評(píng)工具是否符合Rasch模型.結(jié)果表明,該測(cè)評(píng)工具的整體信度為0.97,分離度為5.70(正常需要大于2),總體的數(shù)據(jù)—模型擬合參數(shù)MNSQ接近1、ZSTD接近0,說明該試題的信度比較理想,同時(shí)分離度也較好,符合Rasch模型的要求,可進(jìn)一步進(jìn)行分析.而從單維性檢驗(yàn)上看,試題的總體單維性較好,但有4道試題不符合單維性要求,需要進(jìn)行調(diào)整.而對(duì)各道試題進(jìn)行單獨(dú)分析發(fā)現(xiàn),只有項(xiàng)目7的數(shù)據(jù)與模型不擬合,說明有部分能力水平低的測(cè)試對(duì)象回答正確,部分能力較好的測(cè)試對(duì)象卻在此題上回答錯(cuò)誤.
實(shí)測(cè)選擇了廣州市某高中高一年級(jí)的5個(gè)物理班級(jí),其中2個(gè)為重點(diǎn)班,3個(gè)為平行班.本次共回收130份測(cè)評(píng)試題,有效份數(shù)為112份,有效回收率為86.2%,其中男生樣本57份,女生樣本55份.首先,再次檢驗(yàn)該試題的有效性和可靠性,其中利用SPSS計(jì)算其評(píng)分者信度為0.952,漸近顯著性系數(shù)為0.002,符合要求.而利用Winsteps軟件計(jì)算其信度為0.98,區(qū)分度為6.52,除項(xiàng)目9和項(xiàng)目1的非加權(quán)標(biāo)準(zhǔn)差均方略超出-2到2的可接受區(qū)間外,其余均符合Rasch模型的使用要求.然后繼續(xù)檢驗(yàn)單維性、項(xiàng)目—被試反應(yīng)、點(diǎn)—測(cè)相關(guān)系數(shù)、模擬標(biāo)準(zhǔn)誤差均大致滿足Rasch模型的使用要求,適合用此模型進(jìn)行后續(xù)分析.
Rasch模型可以通過將原始分轉(zhuǎn)換為logit得分,將被試能力、項(xiàng)目難度放在同一把量尺上進(jìn)行比較.表4是實(shí)測(cè)學(xué)生科學(xué)解釋能力分布情況的統(tǒng)計(jì)數(shù)據(jù),樣本學(xué)生的最高logit得分和最低logit得分相差3.14,說明測(cè)試對(duì)象具有較廣的科學(xué)解釋能力水平分布;而標(biāo)準(zhǔn)差為0.64,說明測(cè)試對(duì)象的科學(xué)解釋能力水平存在較為顯著的差異.如圖2,依據(jù)學(xué)生的logit得分繪制各個(gè)分?jǐn)?shù)的頻率分布直方圖,可以發(fā)現(xiàn)所測(cè)對(duì)象的科學(xué)解釋能力整體呈正態(tài)分布.
圖2 學(xué)生logit得分的頻率分布直方圖
表4 學(xué)生logit得分的描述性統(tǒng)計(jì)
另外,本研究根據(jù)整體懷特圖來劃分樣本學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力,劃定的水平分界值具體如下:處于水平4的學(xué)生應(yīng)該是大部分項(xiàng)目得3分的,logit≥1;處于水平3的學(xué)生應(yīng)該大部分項(xiàng)目得2分,-0.67≤logit<1;處于水平2的學(xué)生應(yīng)該是大部分項(xiàng)目得1分的,-1.88≤logit<-0.67;處于水平1的學(xué)生,logit<-1.88.
根據(jù)劃定的能力值范圍,統(tǒng)計(jì)樣本學(xué)生數(shù),得到學(xué)生在各個(gè)能力水平上的百分比如圖3所示.由圖可發(fā)現(xiàn),學(xué)生的科學(xué)解釋能力水平集中在水平2和水平3,占總?cè)藬?shù)的94.64%.
圖3 學(xué)生實(shí)驗(yàn)探究過程中的科學(xué)解釋能力水平分布情況
將所測(cè)學(xué)生的科學(xué)解釋能力得分和其物理成績(jī)進(jìn)行相關(guān)分析,運(yùn)用學(xué)生高一上學(xué)期期末考試的物理成績(jī)作為本次物理成績(jī)的衡量標(biāo)準(zhǔn),該階段學(xué)生已經(jīng)具備此份科學(xué)解釋能力測(cè)評(píng)試題所需的全部知識(shí),且高一上學(xué)期期末考試學(xué)生相對(duì)比較重視,故用此份成績(jī)作為學(xué)生的物理成績(jī)進(jìn)行分析.
根據(jù)圖4的散點(diǎn)圖可以大致看出學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力與物理成績(jī)之間存在線性相關(guān)關(guān)系.在此基礎(chǔ)上進(jìn)行科學(xué)解釋能力和物理成績(jī)間的雙變量相關(guān)分析.表5、表6為皮爾遜相關(guān)的分析結(jié)果.
表5 描述性統(tǒng)計(jì)資料
表6 相關(guān)性統(tǒng)計(jì)數(shù)據(jù)
續(xù)表
圖4 科學(xué)解釋能力得分與物理成績(jī)的相關(guān)散點(diǎn)圖
從表中可以看出,學(xué)生物理成績(jī)平均分為60.46,能力測(cè)評(píng)平均分為12.13,雙變量相關(guān)性檢驗(yàn)得到的皮爾遜相關(guān)系數(shù)為0.475,在0.01水平上顯著相關(guān),說明學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力與學(xué)生的物理成績(jī)具有正相關(guān)性,平時(shí)物理成績(jī)較好的學(xué)生在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力也比較好.這是因?yàn)檫M(jìn)行科學(xué)解釋其實(shí)是需要一定的科學(xué)知識(shí)作為依托的,但兩者間的相關(guān)性系數(shù)小于0.5,說明并不具備強(qiáng)烈相關(guān)性,也就是并不是平時(shí)物理成績(jī)好的學(xué)生就一定具備良好的科學(xué)解釋能力.
將男生和女生的科學(xué)解釋能力進(jìn)行獨(dú)立樣本T檢驗(yàn),看看兩者之間是否存在顯著性差異.
從表7中數(shù)據(jù)上看,男生的科學(xué)解釋能力平均值為12.44分,女生的科學(xué)解釋能力平均值為11.82分,男生的能力均值比女生高0.62分,說明男生的表現(xiàn)比女生稍微要好.但從方差齊次檢驗(yàn)結(jié)果顯示,如表8中數(shù)據(jù),對(duì)于學(xué)生的能力水平,其F值為0.942,顯著性概率為0.334,大于顯著性水平0.05,符合方差齊次.而均值方程的t檢驗(yàn)結(jié)果顯示,雙側(cè)顯著性概率為0.417,大于0.05,說明男生和女生之間在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力無顯著性差異.
表7 不同性別學(xué)生實(shí)驗(yàn)探究過程中科學(xué)解釋能力的描述性統(tǒng)計(jì)
表8 獨(dú)立樣本T檢驗(yàn)
考慮到物理課堂是學(xué)生實(shí)驗(yàn)探究過程中的科學(xué)解釋能力的主要培養(yǎng)陣地,本研究設(shè)計(jì)了針對(duì)教師的科學(xué)解釋能力培養(yǎng)調(diào)查問卷.該問卷涉及對(duì)科學(xué)解釋的認(rèn)識(shí)和科學(xué)解釋的培養(yǎng)現(xiàn)狀兩方面的內(nèi)容,經(jīng)過一周的網(wǎng)絡(luò)問卷發(fā)放后,共回收81份有效問卷,其中教齡10年以上的教師占69.51%,35.37%的調(diào)查對(duì)象是高級(jí)教師,40.24%的調(diào)查對(duì)象是中學(xué)一級(jí)教師.他們多是教學(xué)經(jīng)驗(yàn)豐富的教師,對(duì)中學(xué)物理教學(xué)較為熟悉.
將調(diào)查結(jié)果回收統(tǒng)計(jì)發(fā)現(xiàn),高達(dá)91.36%的教師認(rèn)為在實(shí)驗(yàn)探究過程中很需要科學(xué)解釋能力,肯定了培養(yǎng)學(xué)生科學(xué)解釋能力的重要性,但實(shí)際上仍有54.32%的教師對(duì)科學(xué)解釋了解甚少.而在培養(yǎng)現(xiàn)狀上,61.73%的教師認(rèn)為自己在日常教學(xué)中會(huì)較為注重學(xué)生科學(xué)解釋能力的發(fā)展,但仍會(huì)因考學(xué)壓力、課時(shí)緊張、系統(tǒng)性理論指導(dǎo)的匱乏以及沒有具體的實(shí)施方案等多種影響因素,無法順利培養(yǎng)學(xué)生的科學(xué)解釋能力.
本文以測(cè)評(píng)學(xué)生在物理實(shí)驗(yàn)探究過程中的科學(xué)解釋能力為目標(biāo),構(gòu)建測(cè)評(píng)框架并開發(fā)相應(yīng)的測(cè)評(píng)工具,通過檢驗(yàn)發(fā)現(xiàn)設(shè)計(jì)的測(cè)評(píng)工具符合Rasch模型的相關(guān)質(zhì)量指標(biāo),具有可信度.而分析被試在實(shí)測(cè)過程中的科學(xué)解釋能力表現(xiàn)可發(fā)現(xiàn),總體來看被試在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力得分呈正態(tài)分布,絕大多數(shù)學(xué)生都處于水平2和水平3,并且其能力與物理成績(jī)具有正相關(guān)性,但并不是強(qiáng)烈相關(guān).雖然男生被試在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力測(cè)試得分略高于女生被試,但不同性別的被試在實(shí)驗(yàn)探究過程中的科學(xué)解釋能力無顯著性差異.而從被試的答題情況上分析發(fā)現(xiàn)具有3點(diǎn)不足:一是被試在解釋過程中依賴于定性分析,定量解釋上欠缺明顯;二是部分學(xué)生在科學(xué)解釋過程中難以抓住關(guān)鍵研究量,避開干擾量;三是部分學(xué)生在嘗試解釋過程中存在證據(jù)與推理混亂的現(xiàn)象,無法準(zhǔn)確獲取證據(jù)信息并運(yùn)用其進(jìn)行推理解釋.
科學(xué)解釋能力作為物理核心素養(yǎng)中的重要組成部分,將會(huì)影響學(xué)生的未來成長(zhǎng)以及對(duì)復(fù)雜問題的應(yīng)對(duì)情況.而物理課堂是學(xué)生實(shí)驗(yàn)探究過程中的科學(xué)解釋能力的主要培養(yǎng)陣地,在剖析教師調(diào)查數(shù)據(jù)后可察覺,部分教師不太了解科學(xué)解釋,自身對(duì)于科學(xué)解釋的知識(shí)儲(chǔ)備也不足,雖能意識(shí)到科學(xué)解釋的重要性但缺乏實(shí)踐,因此提出以下建議.
(1)吸納相關(guān)知識(shí),聯(lián)動(dòng)互補(bǔ)共建.
培養(yǎng)學(xué)生的科學(xué)解釋能力首先需要教師具備充足的科學(xué)解釋知識(shí),筆者認(rèn)為可以從教師的繼續(xù)教育出發(fā):一方面是可以利用線上、線下等多種形式進(jìn)行科學(xué)解釋的相關(guān)研討,疫情期間各大線上會(huì)議軟件的頻繁使用,無疑也給現(xiàn)階段的教學(xué)研討提供新的方式,通過組織線上的分享會(huì)、研討會(huì)聯(lián)系教師們進(jìn)行科學(xué)解釋材料的相關(guān)分享與研讀;線下則可以參與各地的名師工作室、教師培養(yǎng)計(jì)劃等,從中汲取相關(guān)知識(shí),使科學(xué)解釋培養(yǎng)有法可施、有路可循;另一方面是教育主管部門或?qū)W??梢赃m當(dāng)召開關(guān)于科學(xué)解釋培養(yǎng)、核心素養(yǎng)解讀的相關(guān)教育培訓(xùn),有意識(shí)地為提高學(xué)生的科學(xué)解釋能力出謀劃策,落實(shí)立德樹人的培養(yǎng)目標(biāo).
(2)顯化科學(xué)解釋,營(yíng)造解釋氛圍.
要想培養(yǎng)學(xué)生的科學(xué)解釋能力,最先要在課堂上顯化科學(xué)解釋,讓學(xué)生知道科學(xué)解釋包括論斷、證據(jù)、推理等三要素,并且要嘗試運(yùn)用教學(xué)語言為學(xué)生們示范如何進(jìn)行科學(xué)解釋,引導(dǎo)學(xué)生在之后的實(shí)驗(yàn)探究環(huán)節(jié)中如何形成有依據(jù)的論斷、如何獲取證據(jù)、如何從證據(jù)中總結(jié)規(guī)律、如何基于有效的邏輯推理解釋實(shí)驗(yàn)現(xiàn)象或結(jié)論等,在實(shí)驗(yàn)探究的過程中落到實(shí)處、強(qiáng)化培養(yǎng)學(xué)生的科學(xué)解釋能力.此外,在教學(xué)中,教師可以適當(dāng)改變以往傳統(tǒng)的命題方式,創(chuàng)設(shè)情景設(shè)計(jì)結(jié)構(gòu)不良試題,引導(dǎo)學(xué)生在解決真實(shí)物理問題的過程中鍛煉科學(xué)解釋.