夏小俊 柏毅
(東南大學(xué)兒童發(fā)展與學(xué)習(xí)科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,江蘇南京 210096)
在科學(xué)教育的諸多相關(guān)領(lǐng)域中,對學(xué)生科學(xué)素養(yǎng)的研究成為了現(xiàn)在最熱門的話題之一。無論是對學(xué)生科學(xué)素養(yǎng)的培養(yǎng),還是對學(xué)生科學(xué)素養(yǎng)的測評,都對各個(gè)國家的長期發(fā)展和民族素質(zhì)的提高有著根本的意義。目前國際上的主流科學(xué)素養(yǎng)測評框架包括了美國國家教育評測中心推出的NAEP項(xiàng)目、國際教育成就評價(jià)協(xié)會(huì)推出的TIMSS項(xiàng)目、世界經(jīng)濟(jì)合作與發(fā)展組織(簡稱OECD)推出的PISA項(xiàng)目以及澳大利亞的NAP項(xiàng)目,而我國也在2007年頒布了《全民科學(xué)素質(zhì)行動(dòng)計(jì)劃綱要》[1],為提高公民科學(xué)素質(zhì)指出了宏觀的發(fā)展方向。
最初的測評方案都是基于紙筆測試的,為了符合時(shí)代發(fā)展潮流,NAEP在2011年起引入了基于計(jì)算機(jī)情境的測試試題[2],PISA也在2012年首次嘗試引入了基于計(jì)算機(jī)的問題解決測試[3]。這些試題往往通過計(jì)算機(jī)化的虛擬情境(如動(dòng)畫、聲音和圖片等)來貼近真實(shí)生活。這些虛擬化的情境經(jīng)過精心設(shè)計(jì)之后,可供學(xué)生在計(jì)算機(jī)上進(jìn)行自主的科學(xué)探究,采集并分析相關(guān)虛擬實(shí)驗(yàn)數(shù)據(jù)。但完整的科學(xué)素養(yǎng)評測還必須考慮到其實(shí)用性和操作性,僅僅使用計(jì)算機(jī)的虛擬情境和工具是不足夠的。為了更好的評估學(xué)生的實(shí)際操作水平,本文將信息技術(shù)、網(wǎng)絡(luò)技術(shù)和傳感器技術(shù)等相結(jié)合構(gòu)建評測方案,并構(gòu)建相應(yīng)的網(wǎng)絡(luò)平臺(tái),為后續(xù)的數(shù)據(jù)分析及合作研究提供支持。
本文中設(shè)計(jì)素養(yǎng)評測方案的理論基礎(chǔ)是ECD模型(Evidence-Centered Assessment Design)[4]。如圖1所示,ECD模式通常分為5個(gè)自模式:學(xué)生模式、證據(jù)模式、任務(wù)模式、組合模式和呈現(xiàn)模式[5]。
圖1 ECD 模型
以NAEP為例,從2003年起在評估方案中加入了富技術(shù)環(huán)境下的學(xué)生模式和證據(jù)模式[6],將要考察的能力重點(diǎn)分為探索能力、綜合推理能力和計(jì)算機(jī)能力。與此類似的是,在本文的方案中針對不同的知識(shí)點(diǎn),設(shè)計(jì)不同的能力評測要求,其中在探索能力部分特別增加了對傳感器以及實(shí)驗(yàn)器材操作的考核要求。
如圖2所示,本文的評測方案考慮了虛擬情境和實(shí)際動(dòng)手操作的結(jié)合。首先在正式評測之前,學(xué)生會(huì)進(jìn)行PISA2006科學(xué)素養(yǎng)樣題的預(yù)評測,以用作實(shí)驗(yàn)數(shù)據(jù)的對比研究分析。正式評測開始之后,由計(jì)算機(jī)構(gòu)建的任務(wù)情境會(huì)呈現(xiàn)在學(xué)生面前,學(xué)生根據(jù)任務(wù)提示進(jìn)行對應(yīng)的操作,如填寫客觀題、主觀題答案以及選擇合理的實(shí)驗(yàn)器材。在實(shí)驗(yàn)過程當(dāng)中,傳感器會(huì)將數(shù)據(jù)通過對應(yīng)的數(shù)字化采集器傳送到計(jì)算機(jī)窗口。實(shí)驗(yàn)結(jié)束之后,除了由計(jì)算機(jī)對客觀題進(jìn)行自動(dòng)評分之外,還將由主試對主觀題以及被試的操作能力進(jìn)行綜合評分。
圖2 基于計(jì)算機(jī)和傳感器的實(shí)驗(yàn)評測方案
在實(shí)驗(yàn)過程當(dāng)中,所有的主客觀評測數(shù)據(jù)都需要進(jìn)行存儲(chǔ)以備后續(xù)分析使用,因此需要對整個(gè)評測設(shè)計(jì)一套合理、靈活而健壯的數(shù)據(jù)庫系統(tǒng)。根據(jù)前述的評測全過程要求,需要在數(shù)據(jù)庫當(dāng)中保存的數(shù)據(jù)包括:主試的相關(guān)信息、被試的人口學(xué)數(shù)據(jù)、PISA預(yù)評測試題內(nèi)容、不同的具體評測方案內(nèi)容以及被試所進(jìn)行的預(yù)評測和實(shí)測的數(shù)據(jù)結(jié)果。
因?yàn)椴煌脑u測方案涉及到的學(xué)科背景可能完全不同,所采用的ECD模型的設(shè)計(jì)思路也由很大的區(qū)別,因此必須對每個(gè)方案進(jìn)行獨(dú)立的數(shù)據(jù)表設(shè)計(jì)。一套完整的評測方案應(yīng)該包括主觀題(如問答題)、客觀題(如選擇題)以及數(shù)值填空題等基本題型,在數(shù)據(jù)庫的設(shè)計(jì)中分別用對應(yīng)的數(shù)據(jù)類型匹配即可。當(dāng)被試開始評測時(shí),從數(shù)據(jù)庫當(dāng)中讀取對應(yīng)的評測內(nèi)容頁面,并逐步完成評測表單的填寫。
考慮到不可能所有的評分都由計(jì)算機(jī)自動(dòng)完成(如傳感器操作能力、實(shí)驗(yàn)中的科學(xué)探究能力等),在被試進(jìn)行評測的過程中,主試應(yīng)密切觀察并適當(dāng)紀(jì)錄,在評測完成之后,通過主試專用的管理入口完成數(shù)據(jù)的添加補(bǔ)充。
在默認(rèn)情況下,系統(tǒng)可以通過Web的方式進(jìn)行遠(yuǎn)程訪問,但一旦大規(guī)模展開評測之后就很可能會(huì)面臨各種客觀條件的影響。具體可能的限制因素包括:評測現(xiàn)場沒有計(jì)算機(jī)或者數(shù)量有限、無Internet連接或者連接非常不穩(wěn)定等,為了解決這些實(shí)際的問題,在系統(tǒng)中增加對移動(dòng)客戶端版本以及硬件接口的支持,并與Web系統(tǒng)一起構(gòu)建起了科學(xué)素養(yǎng)評測的云平臺(tái)。
如圖3所示,在缺乏PC或者網(wǎng)絡(luò)的情況下,基于安卓系統(tǒng)的平板電腦可充分代替計(jì)算機(jī)的作用。在這其中,有2個(gè)關(guān)鍵的技術(shù)問題:首先,平板電腦缺乏必要的硬件接口,因此在和數(shù)據(jù)采集器的通訊當(dāng)中,使用了藍(lán)牙協(xié)議進(jìn)行數(shù)據(jù)的讀取,從而保證了系統(tǒng)的便攜性;其次,使用安卓平板進(jìn)行的素養(yǎng)評測方案使用了JAVA+SQLite離線數(shù)據(jù)庫的暫時(shí)寄存方式,而之前使用的WEB平臺(tái)采用的是PHP+MYSQL的架構(gòu),因此當(dāng)評測結(jié)束回到網(wǎng)絡(luò)良好的狀態(tài)時(shí),可通過應(yīng)用中預(yù)先編寫的JDBC接口將平板中的評測數(shù)據(jù)自動(dòng)遷移到服務(wù)器上,使得所有的數(shù)據(jù)始終保持在“云端”,從而避免了數(shù)據(jù)分散或丟失的麻煩。
圖3 基于安卓客戶端的便攜式評測平臺(tái)
目前本平臺(tái)已經(jīng)被投入到了初步的實(shí)際評測工作當(dāng)中,選擇了某所本科院校的近200名大一學(xué)生(分別來自3個(gè)不同的專業(yè)),并進(jìn)行了2種方案的交叉評測。
PISA問卷預(yù)評測的數(shù)據(jù)分析:對樣本的測驗(yàn)得分制進(jìn)行Shapiro-Wilk(w檢驗(yàn)),其顯著性得分Sig.為0.069(>0.05),滿足正態(tài)性分布的要求;對學(xué)生性別、年齡、高中文理分科、戶籍和是否獨(dú)生子女5個(gè)變量進(jìn)行獨(dú)立樣本t檢驗(yàn),其得分均不造成顯著差異。因?yàn)槲覀兊臄?shù)據(jù)來源比較集中(均為同一學(xué)校的大一新生),出現(xiàn)這樣的情況是正常的。
某實(shí)際評測方案(金屬比熱容的比較)的數(shù)據(jù)分析:在相關(guān)性分析當(dāng)中,可得到如下的結(jié)果:①PISA問卷中的物質(zhì)主題暨科學(xué)探究和科學(xué)解釋部分的得分交集,與實(shí)驗(yàn)總得分在0.05水平上呈現(xiàn)正相關(guān),這個(gè)分析可以證明本方案可以有效地評測學(xué)生有關(guān)物質(zhì)系統(tǒng)的知識(shí)以及相關(guān)的科學(xué)探究能力;②PISA問卷中的物質(zhì)主題暨科學(xué)探究和科學(xué)解釋部分的得分交集,與實(shí)驗(yàn)部分的理論知識(shí)得分也在0.05水平上呈現(xiàn)正相關(guān),這個(gè)分析可以證明本方案和PISA在評測學(xué)生的理論知識(shí)效果是吻合的;③實(shí)驗(yàn)理論題得分和實(shí)驗(yàn)操作題得分在0.05水平上呈現(xiàn)正相關(guān),這也證明了本實(shí)驗(yàn)設(shè)計(jì)的內(nèi)部一致性;④PISA問卷中的物質(zhì)主題暨科學(xué)探究和科學(xué)解釋部分的得分交集,與實(shí)驗(yàn)操作題得分并不呈現(xiàn)相關(guān),這也充分證明了PISA評測對實(shí)際操作能力考察的不足。
綜上所述,無論是平臺(tái)采集到的實(shí)測數(shù)據(jù)進(jìn)行的分析,還是與PISA預(yù)評測數(shù)據(jù)的結(jié)果進(jìn)行的對比分析,都證實(shí)了該平臺(tái)的可靠性和有效性。
科學(xué)素養(yǎng)的評測工作任重而道遠(yuǎn),本文的工作也處于剛剛起步的階段。在后續(xù)的工作當(dāng)中,將逐步解決以下的幾個(gè)問題:在Web平臺(tái)上直接進(jìn)行數(shù)據(jù)的閱讀和處理工作,并可通過數(shù)據(jù)挖掘的手段發(fā)現(xiàn)潛在的數(shù)據(jù)聯(lián)系;利用云計(jì)算技術(shù),保障數(shù)據(jù)的安全性和完整性,為數(shù)據(jù)共享提供了可靠的技術(shù)支撐;面向更多人群(如中小學(xué)生)、更多主題(物質(zhì)科學(xué)、生命科學(xué)、地球與空間科學(xué)和技術(shù)系統(tǒng))、更多的應(yīng)用場合(學(xué)校和科普活動(dòng))等進(jìn)行科學(xué)的方案設(shè)計(jì)等。
針對學(xué)生科學(xué)素養(yǎng)的評測目前在國內(nèi)仍然主要處于理論研究階段,而如果想要真正地投入實(shí)踐,除了需要對教育理論本身的研究,更多地需要的是充分的ICT技術(shù)力量的支持。本文在該領(lǐng)域當(dāng)中做出了嘗試性的工作,并取得了初步的有效成果,為進(jìn)一步深入研究我國學(xué)生科學(xué)素養(yǎng)的情況打下了良好的基礎(chǔ)。
[1]袁汝兵,吳 循.各省(市)公眾科學(xué)素養(yǎng)調(diào)查綜述[J].中國科技論壇,2007(5):98-100.
[2]West Ed.Technology and Engineering Literacy Framework for the 2014 National Assessment of Educational Progress(Pre-Publication Edition)[J].CiteSeerX,2014.
[3]黃 華.PISA2012 基于計(jì)算機(jī)的數(shù)學(xué)素養(yǎng)測評分析[J].上海教育科研,2015(2):20-23.
[4]Mislevy R J,Almond R G,Lukas J F.A brief introduction to evidence‐centered design[J].ETS Research Report Series,2003(1):19-29.
[5]馮翠典.“以證據(jù)為中心”的教育評價(jià)設(shè)計(jì)模式簡介[J].上海教育科研,2012(8):12-16.
[6]Bennett R E,Persky H,Weiss A R,et al.Problem Solving in Technology-Rich Environments.A Report from the NAEP Technology-Based Assessment Project,Research and Development Series.NCES 2007-466[M].National Center for Education Statistics,2007.