張 潔 楊向東 郭少陽
在信息社會(huì),知識(shí)與技能更替速度加快,如果學(xué)校還像原來一樣局限于傳授一些具體學(xué)科內(nèi)容,將導(dǎo)致學(xué)生在離開校園后難以適應(yīng)社會(huì)[1][2]。為改變這一困境,早在20世紀(jì)70年代,聯(lián)合國(guó)教育科學(xué)文化組織就提出“學(xué)會(huì)學(xué)習(xí)”的口號(hào),并將其確立為教育的四大支柱之一[3]。跨入21世紀(jì)后,學(xué)會(huì)學(xué)習(xí)作為新世紀(jì)人才的必備素養(yǎng),獲得了更為廣泛的重視[4][5]。然而,學(xué)會(huì)學(xué)習(xí)所受到的廣泛關(guān)注與該研究領(lǐng)域的進(jìn)展不相稱。盡管當(dāng)前幾乎找不到反對(duì)學(xué)會(huì)學(xué)習(xí)的聲音,但它至今沒有一個(gè)統(tǒng)一的定義[6][7]!
學(xué)會(huì)學(xué)習(xí)的概念有廣義和狹義之分[8][9][10]。狹義的學(xué)會(huì)學(xué)習(xí)是指學(xué)習(xí)者通過掌握學(xué)習(xí)策略、技巧、方法等來改善學(xué)業(yè)成績(jī)。這類學(xué)會(huì)學(xué)習(xí)通常由教師主導(dǎo),且面向低年級(jí)或成績(jī)差的學(xué)生。[11][12]而廣義的學(xué)會(huì)學(xué)習(xí)是指學(xué)習(xí)者掌握了可以適用于未來學(xué)習(xí)的更一般、更高階的能力,目的是使學(xué)生成為終身學(xué)習(xí)者。廣義的學(xué)會(huì)學(xué)習(xí)要求所有學(xué)習(xí)者探索自身的學(xué)習(xí)過程[13][14][15],教師只是扮演促進(jìn)者的角色。進(jìn)入21世紀(jì),越來越多的研究者開始關(guān)注廣義的學(xué)會(huì)學(xué)習(xí)。然而對(duì)于學(xué)會(huì)學(xué)習(xí)應(yīng)該包含哪些能力,研究者有多種看法。有研究者從認(rèn)知角度出發(fā),認(rèn)為學(xué)會(huì)學(xué)習(xí)像智力一樣,是一種通用能力,在其他的技能和能力背后,控制著更具體的結(jié)構(gòu)系統(tǒng)(如空間想象、數(shù)量關(guān)系等)的運(yùn)作。[16]有研究者把學(xué)會(huì)學(xué)習(xí)看作元認(rèn)知,認(rèn)為其是提高對(duì)學(xué)習(xí)的覺察和監(jiān)控能力。[17]另有研究者將學(xué)會(huì)學(xué)習(xí)與自我調(diào)節(jié)學(xué)習(xí)等同起來[18],認(rèn)為學(xué)會(huì)學(xué)習(xí)是學(xué)習(xí)者能夠采取策略管理自身的學(xué)習(xí)過程,從而更好地實(shí)現(xiàn)學(xué)習(xí)目標(biāo)[19][20]。從這些爭(zhēng)議可見,由于所依據(jù)的理論不同,研究者們提出的學(xué)會(huì)學(xué)習(xí)內(nèi)涵差異很大。不過,隨著研究進(jìn)展,目前越來越多的研究者認(rèn)同學(xué)會(huì)學(xué)習(xí)是一個(gè)包含認(rèn)知、情感、元認(rèn)知等多個(gè)維度的復(fù)雜概念[21][22]。
測(cè)評(píng)是學(xué)會(huì)學(xué)習(xí)研究的重點(diǎn)問題,也是教育質(zhì)量監(jiān)測(cè)的難點(diǎn)問題[23]。由于缺乏統(tǒng)一的定義,學(xué)會(huì)學(xué)習(xí)的測(cè)評(píng)工具十分混亂。當(dāng)前許多以學(xué)會(huì)學(xué)習(xí)為名的測(cè)評(píng)工具所評(píng)估的并不是學(xué)會(huì)學(xué)習(xí)本身,而只是與之相關(guān)的一些概念,如學(xué)習(xí)風(fēng)格、學(xué)習(xí)概念、學(xué)科成績(jī)、學(xué)業(yè)表現(xiàn)等[24][25][26][27]。學(xué)會(huì)學(xué)習(xí)的復(fù)雜性還帶來了測(cè)評(píng)內(nèi)容代表性的問題。一些學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)盡管測(cè)量了學(xué)會(huì)學(xué)習(xí),但僅憑經(jīng)驗(yàn)或需要選取了幾個(gè)成分,如學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)重要性、學(xué)習(xí)場(chǎng)所、學(xué)習(xí)策略[28],或成就動(dòng)機(jī)、學(xué)習(xí)問題、理解性學(xué)習(xí)、意義取向、運(yùn)用邏輯操作[29]等,來指代學(xué)會(huì)學(xué)習(xí)。然而,由于缺乏對(duì)學(xué)會(huì)學(xué)習(xí)概念領(lǐng)域的系統(tǒng)分析,難以保證所選取成分的代表性。類似地,PISA中也有一部分測(cè)驗(yàn)涉及學(xué)會(huì)學(xué)習(xí)[30],但由于其內(nèi)容僅涉及學(xué)生參與、學(xué)習(xí)方法和學(xué)習(xí)習(xí)慣等方面,因而也不是一個(gè)完整的學(xué)會(huì)學(xué)習(xí)測(cè)評(píng)[31]。目前,基于對(duì)學(xué)會(huì)學(xué)習(xí)研究的系統(tǒng)分析以及學(xué)會(huì)學(xué)習(xí)的多個(gè)維度開發(fā)的綜合性學(xué)會(huì)學(xué)習(xí)測(cè)評(píng)工具包括:大學(xué)生學(xué)會(huì)學(xué)習(xí)能力問卷(QELtLCUS questionnaire)[32]、學(xué)會(huì)學(xué)習(xí)能力問卷[33]、歐洲學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)(European learning to learn test)[34]、芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)(Finnish learning to learn test)[35]。
西班牙瓦倫西亞大學(xué)的加加洛-洛佩斯(Gargallo-López)等人開發(fā)的大學(xué)生學(xué)會(huì)學(xué)習(xí)能力問卷經(jīng)過理論論證和實(shí)證檢驗(yàn),是比較可信的學(xué)會(huì)學(xué)習(xí)測(cè)評(píng)工具。該問卷包括認(rèn)知、元認(rèn)知、情感動(dòng)機(jī)、社會(huì)關(guān)系、倫理等5個(gè)主維度,共包括85個(gè)問題。所有問題均采用五點(diǎn)李克特測(cè)驗(yàn)形式,從“完全不同意”到“完全同意”。目前該問卷已在西班牙采用1237人的大學(xué)生樣本做了測(cè)量學(xué)檢驗(yàn),驗(yàn)證性因素分析顯示這五個(gè)維度的模型擬合良好,信度系數(shù)在0.86—0.90之間。[36]不過,該問卷針對(duì)的是大學(xué)生群體,無法適用于基礎(chǔ)教育階段的學(xué)會(huì)學(xué)習(xí)測(cè)評(píng)。
我國(guó)孫妍妍等人開發(fā)了一個(gè)適用中小學(xué)生的學(xué)會(huì)學(xué)習(xí)能力問卷。該問卷借鑒已有學(xué)會(huì)學(xué)習(xí)評(píng)估框架,將學(xué)會(huì)學(xué)習(xí)分成認(rèn)知、情感和元認(rèn)知三個(gè)維度,并基于美國(guó)國(guó)家研究中心的NCRIFFAL問卷和密歇根大學(xué)的動(dòng)機(jī)策略測(cè)驗(yàn)[37],構(gòu)造了一個(gè)包含36個(gè)題目自我報(bào)告問卷。所有題目采用五點(diǎn)李克特形式,從“完全不符合”到“完全符合”。盡管該問卷的信度和效度經(jīng)過檢驗(yàn)均達(dá)到了可接受水平,但由于缺乏堅(jiān)實(shí)的理論基礎(chǔ),其測(cè)評(píng)框架存在一定的問題。如“學(xué)習(xí)過程”被列為認(rèn)知維度下的子維度,但按照其定義“學(xué)生對(duì)學(xué)習(xí)中認(rèn)知過程的把控能力”,該維度應(yīng)該歸屬于元認(rèn)知,這從其參考文獻(xiàn)[38]中也能一瞥端倪。再如其將“自我調(diào)節(jié)”和“學(xué)習(xí)習(xí)慣”作為元認(rèn)知維度下的兩個(gè)子維度,與已有研究不符[39][40][41]。因此,盡管該問卷的主要維度具有一定的綜合性,但其具體框架的合理性仍有待考察。
歐盟終身學(xué)習(xí)委員會(huì)專家組在借鑒歐盟多國(guó)已有研究的基礎(chǔ)上,開發(fā)出包含認(rèn)知、情感和元認(rèn)知三個(gè)維度的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)。其認(rèn)知維度來源于芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的認(rèn)知維度以及荷蘭的跨學(xué)科測(cè)驗(yàn),包含識(shí)別假設(shè)、運(yùn)用規(guī)則、測(cè)試規(guī)則和假設(shè)、運(yùn)用思維工具等四個(gè)子維度。其情感維度來源于芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的情感維度以及英國(guó)的學(xué)習(xí)能量測(cè)評(píng),包含學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)策略、有關(guān)變化的取向、學(xué)業(yè)自我概念和自尊、學(xué)習(xí)環(huán)境等五個(gè)子維度。其元認(rèn)知維度借鑒了西班牙馬德里大學(xué)的元認(rèn)知測(cè)驗(yàn),包含問題解決、元認(rèn)知精確性和元認(rèn)知自信三個(gè)子維度。該測(cè)驗(yàn)全部采用自我報(bào)告問卷形式,但對(duì)歐盟國(guó)家14歲學(xué)生的試測(cè)發(fā)現(xiàn),其測(cè)量學(xué)水平有限,仍需進(jìn)一步調(diào)整[42]。
芬蘭赫爾辛基大學(xué)教育評(píng)估中心的豪塔邁基等人在對(duì)已有文獻(xiàn)進(jìn)行廣泛分析的基礎(chǔ)上,開發(fā)了適用中小學(xué)生的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)。該測(cè)驗(yàn)把學(xué)會(huì)學(xué)習(xí)分成學(xué)習(xí)能力、我相關(guān)的信念、環(huán)境相關(guān)的信念三個(gè)方面。學(xué)習(xí)能力對(duì)應(yīng)認(rèn)知和元認(rèn)知維度,而自我和環(huán)境相關(guān)的信念對(duì)應(yīng)學(xué)習(xí)的情感維度。信念部分的測(cè)驗(yàn)共有93題,采用七點(diǎn)李克特形式的自我報(bào)告問卷。但與前述三個(gè)測(cè)驗(yàn)全部采用問卷形式不同,芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中的學(xué)習(xí)能力測(cè)驗(yàn)采用了認(rèn)知測(cè)驗(yàn)任務(wù)的形式。為適應(yīng)不同學(xué)段的需要,芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的認(rèn)知任務(wù)包含多個(gè)版本,分別適用于6、9、12年級(jí)。在1996—2017年,芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)在芬蘭國(guó)內(nèi)進(jìn)行過多次測(cè)試,信度0.5—0.9[43][44],且效標(biāo)效度良好;該測(cè)驗(yàn)的高中版也在瑞典得以驗(yàn)證[45]。
學(xué)會(huì)學(xué)習(xí)是一個(gè)復(fù)雜概念,因此其測(cè)驗(yàn)開發(fā)的時(shí)間及人力成本巨大。相比之下,對(duì)測(cè)驗(yàn)進(jìn)行編譯更為可行。從上述分析可知,芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)是目前適用基礎(chǔ)教育階段的最為可信的學(xué)會(huì)學(xué)習(xí)測(cè)評(píng)工具。為此,本研究對(duì)芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)加以本土化,以期為我國(guó)基礎(chǔ)教育階段的學(xué)會(huì)學(xué)習(xí)測(cè)評(píng)提供可靠工具。
為響應(yīng)國(guó)家教育改革號(hào)召,豪塔邁基等人將學(xué)會(huì)學(xué)習(xí)放在了教育結(jié)果評(píng)估的中心位置并將其定義為“適應(yīng)新任務(wù)的能力和意愿”。能力指將一般程序和已有知識(shí)應(yīng)用于新的情境和任務(wù)中,意愿指一種希望觀;能力和意愿分別對(duì)應(yīng)心理學(xué)中的認(rèn)知和情感維度。認(rèn)知維度測(cè)量能夠用于解決新任務(wù)的一般能力,包括學(xué)習(xí)和推理兩個(gè)領(lǐng)域。考慮到學(xué)會(huì)學(xué)習(xí)是學(xué)生面對(duì)新任務(wù)時(shí)的表現(xiàn),為保證任務(wù)新穎性,認(rèn)知測(cè)驗(yàn)考察的內(nèi)容雖與學(xué)校教學(xué)有關(guān),但采用的形式與學(xué)校任務(wù)不同。情感維度分為自我有關(guān)的信念和與環(huán)境有關(guān)的信念,它們是多層次、多水平的。其中,與自我有關(guān)的信念中比較核心的是動(dòng)機(jī)信念、控制信念、自我評(píng)價(jià)等,與環(huán)境有關(guān)的信念中比較核心的是重要他人支持等(見表1)。
表1 芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的結(jié)構(gòu)
根據(jù)這一評(píng)估框架,豪塔邁基等人構(gòu)建起了英文版學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn),包括背景信息、認(rèn)知測(cè)驗(yàn)和情感問卷三大部分。背景信息用于了解被試的性別、年齡、社會(huì)經(jīng)濟(jì)狀況、父母和個(gè)人教育期待、自評(píng)學(xué)業(yè)成績(jī)等。認(rèn)知測(cè)驗(yàn)任務(wù)涉及學(xué)習(xí)和推理兩個(gè)領(lǐng)域:學(xué)習(xí)領(lǐng)域包括閱讀和數(shù)學(xué)等與學(xué)校學(xué)習(xí)內(nèi)容有關(guān)但形式不同的任務(wù);推理領(lǐng)域測(cè)量對(duì)學(xué)校學(xué)習(xí)有影響但并不涉及學(xué)校學(xué)習(xí)的內(nèi)容。所有認(rèn)知任務(wù)的問題都采用單項(xiàng)選擇題形式。情感問卷采用七級(jí)李克特自我報(bào)告問卷,評(píng)分等級(jí)從1(完全不符合)到7(完全符合)。
芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的評(píng)估框架是一個(gè)一般性框架,針對(duì)不同學(xué)段設(shè)計(jì)了不同的認(rèn)知任務(wù)。自開發(fā)后,其各學(xué)段版本經(jīng)過了多次修改和測(cè)試,在實(shí)際測(cè)試過程中需根據(jù)學(xué)段選擇相應(yīng)量表開展評(píng)估。考慮到義務(wù)教育涉及面廣,關(guān)系著我國(guó)國(guó)民的基礎(chǔ)學(xué)力,本研究選取芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)初中學(xué)段的最新版本,用于測(cè)評(píng)接受義務(wù)教育后學(xué)生的學(xué)會(huì)學(xué)習(xí)水平。在該版本中,認(rèn)知測(cè)驗(yàn)包括:兩個(gè)不同形式的閱讀理解測(cè)驗(yàn)“在旅行社”(At the Travel Agency)和“美國(guó)”(USA);兩個(gè)數(shù)量關(guān)系理解測(cè)驗(yàn)“算術(shù)運(yùn)算”(Arithmetical Operations)和“數(shù)學(xué)概念”(Mathematical Concepts),分別考察基本數(shù)學(xué)運(yùn)算能力和數(shù)學(xué)規(guī)則概括能力;一個(gè)考察控制變量法的推理測(cè)驗(yàn)“一級(jí)方程式賽車”(Formula 1)。情感測(cè)驗(yàn)共有93個(gè)問題,分成了兩部分:第一部分主題為“我、學(xué)校和學(xué)習(xí)1”,包含48道題;第二部分主題為“我、學(xué)校和學(xué)習(xí)2”,包含45道題。
由于內(nèi)容較多,原版芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)分兩次施測(cè),其間需要間隔一段時(shí)間,本研究也遵循這一實(shí)施方式。第一次測(cè)驗(yàn)主題包括:“背景信息”“數(shù)學(xué)概念”“一級(jí)方程式賽車”“我、學(xué)校和學(xué)習(xí)1”;第二次測(cè)驗(yàn)主題包括“美國(guó)”“算數(shù)運(yùn)算”“我、學(xué)校和學(xué)習(xí)2”。
測(cè)驗(yàn)本土化的第一階段是將原版測(cè)驗(yàn)編譯為對(duì)應(yīng)的中文版,包括測(cè)驗(yàn)翻譯和目標(biāo)群認(rèn)知訪談兩個(gè)步驟。
為確保測(cè)驗(yàn)的目標(biāo)版本和原版本之間的對(duì)應(yīng),測(cè)驗(yàn)翻譯按照順譯、回譯、評(píng)審這三個(gè)環(huán)節(jié)實(shí)施[46][47][48]。首先,兩名熟悉測(cè)驗(yàn)開發(fā)、雅思英語在6.0以上的翻譯人員遵循先單獨(dú)翻譯、后討論差異之處的步驟,將原版學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)翻譯成中文版。其間,為保證測(cè)驗(yàn)的內(nèi)容效度,兩名翻譯人員對(duì)原版測(cè)驗(yàn)中的人名、地名或句子形式等進(jìn)行了必要的本土化調(diào)整(見表2)。然后,為保證回譯過程的客觀、準(zhǔn)確,一名來自第三方機(jī)構(gòu)、具有英語專業(yè)學(xué)位和資質(zhì)的翻譯人員將上一階段的中文版測(cè)驗(yàn)回譯成英文。最后,由母語為英語、對(duì)研究?jī)?nèi)容不熟悉的一名評(píng)審人員對(duì)原版和回譯版加以比較。評(píng)審結(jié)果表明,原版與回譯版的大部分內(nèi)容保持一致,僅有個(gè)別句子表述存在差異。根據(jù)評(píng)審者的建議,本研究對(duì)這些句子做了調(diào)整。
表2 芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)在翻譯為中文過程中所做調(diào)整
研究通過對(duì)目標(biāo)群體開展試測(cè)和認(rèn)知訪談,初步檢驗(yàn)編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版項(xiàng)目的質(zhì)量。目標(biāo)群體的確定分兩條路線:一是教師審查。研究選取5名來自語文、數(shù)學(xué)、物理學(xué)科的中學(xué)教師評(píng)價(jià)測(cè)驗(yàn)所適用的目標(biāo)群體。二是學(xué)生試測(cè)。學(xué)生試測(cè)共經(jīng)歷了兩輪。為與原版測(cè)驗(yàn)的目標(biāo)群體一致,研究第一輪試測(cè)選取了剛完成義務(wù)教育不久的30名高一學(xué)生作為試測(cè)對(duì)象。測(cè)驗(yàn)結(jié)果表明,高一學(xué)生平均能夠答對(duì)3/4的題目。這與原版測(cè)驗(yàn)所設(shè)定的“具有一些挑戰(zhàn)性”的要求[49]不一致。第二輪試測(cè)選擇了26名八年級(jí)學(xué)生作為試測(cè)對(duì)象。測(cè)評(píng)結(jié)果表明,除“在旅行社”仍過于簡(jiǎn)單外,其他任務(wù)難度中等。綜合教師審查和學(xué)生試測(cè)結(jié)果,本研究目標(biāo)群體確定為八年級(jí)學(xué)生,并在后繼測(cè)驗(yàn)中刪除“在旅行社”這一閱讀任務(wù)。
認(rèn)知訪談旨在從思考過程的角度深入探查學(xué)生對(duì)測(cè)驗(yàn)的反應(yīng)是否符合預(yù)期。研究根據(jù)上述26名八年級(jí)學(xué)生的作答情況,抽取作答錯(cuò)誤有一定代表性的8名學(xué)生作為訪談對(duì)象。認(rèn)知訪談結(jié)果顯示,學(xué)生能夠正確理解各個(gè)任務(wù)和問題,具備完成該任務(wù)的已有知識(shí);同時(shí),學(xué)生感到任務(wù)比較新穎。這與原版測(cè)驗(yàn)的設(shè)計(jì)的初衷一致。此外,學(xué)生對(duì)題目格式和表述問題提出了修改意見。根據(jù)訪談結(jié)果,本研究對(duì)測(cè)驗(yàn)做了相應(yīng)的調(diào)整(見表3)。
表3 認(rèn)知訪談主要結(jié)果及其推論
為了檢驗(yàn)編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的測(cè)量學(xué)質(zhì)量,本研究選取我國(guó)東部和中部地區(qū)的初中和職業(yè)高中358名學(xué)生進(jìn)行了施測(cè)。其中初中學(xué)生327名,職業(yè)高中學(xué)生31名;初中學(xué)生中7年級(jí)學(xué)生105名,8年級(jí)學(xué)生222名。施測(cè)學(xué)生年齡跨度在11—18歲,平均年齡13.51歲,男生占比56.7%。
采用驗(yàn)證性因素分析來檢驗(yàn)編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版與原版測(cè)驗(yàn)的理論模型的一致性。采用穩(wěn)健加權(quán)最小二乘法(WLSMV)估計(jì)模型參數(shù)[50]。同時(shí),參考集約校正(RMSEA等)、相對(duì)擬合(CFI等)和絕對(duì)擬合(SRMR等)方面的多個(gè)指標(biāo)來確定模型擬合情況[51]。
有必要指出的是,在模型擬合過程中刪除了不符合模型假設(shè)的項(xiàng)目。其中,文本理解維度有4個(gè)題目(題3、10、15、16);算數(shù)運(yùn)算有一個(gè)題目(題10)因子負(fù)荷不顯著;動(dòng)機(jī)信念和控制信念各有3個(gè)題目(“我、學(xué)校和學(xué)習(xí)2”的題3、8、15以及題21、39、45)存在跨因子負(fù)荷。
最終的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的模型擬合情況如表4所示,學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的總體擬合情況良好(χ2/df=2.08,RMSEA=0.06,CFI=0.98,TLI=0.97,SRMR=0.06)。除科學(xué)推理(χ2/df=8.81,RMSEA=0.27,CFI=0.84,TLI=0.74,SRMR=0.29)外,學(xué)習(xí)能力和學(xué)習(xí)信念兩個(gè)子領(lǐng)域及其分測(cè)驗(yàn)的模型均基本擬合。
表4 編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的模型擬合情況
表5顯示了編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的內(nèi)部一致性信度。可以看出,編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版具有較高的整體信度(克隆巴赫α系數(shù)0.94),學(xué)習(xí)能力和學(xué)習(xí)信念這兩個(gè)子領(lǐng)域也具有較好的信度(克隆巴赫α系數(shù)0.79,克隆巴赫α系數(shù)0.93)。除文本理解分測(cè)驗(yàn)的信度(克隆巴赫α系數(shù)0.53)低于一般測(cè)驗(yàn)所要求的最低范圍[52][53][54],有必要予以修訂。
表5 編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的信度
綜上,編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版整體及大部分測(cè)驗(yàn)的效度和信度符合相應(yīng)的測(cè)量學(xué)要求,但有兩個(gè)維度存在問題,其中文本理解測(cè)驗(yàn)的信度低于可接受水平,科學(xué)推理測(cè)驗(yàn)無法擬合原模型,因而需要進(jìn)一步加以修訂。
為保證修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版與原版的一致性,本研究在原版測(cè)驗(yàn)的測(cè)量建構(gòu)基礎(chǔ)上,結(jié)合編譯后的中文版測(cè)驗(yàn)的測(cè)量學(xué)分析結(jié)果,制定測(cè)驗(yàn)修訂方案。請(qǐng)來自語文、數(shù)學(xué)和科學(xué)方向的三位命題專家根據(jù)方案進(jìn)行題目命制,新命制的題目共55題。隨后,選取學(xué)業(yè)成績(jī)具有一定跨度的133名八年級(jí)學(xué)生對(duì)新命制的題目進(jìn)行試測(cè),結(jié)果表明測(cè)驗(yàn)的修訂符合預(yù)期方向。根據(jù)試測(cè)數(shù)據(jù)分析結(jié)果選取38個(gè)新命制的題目,與編譯后的中文版加以整合形成了修訂后的中文版測(cè)驗(yàn)。為確定修訂后的中文版測(cè)驗(yàn)的測(cè)量學(xué)特征,選取我國(guó)東部地區(qū)919名八年級(jí)學(xué)生進(jìn)行正式測(cè)試。正式測(cè)試樣本男女比例基本均等(男生比例51.53%),年齡在12.33—14.92歲(平均13.71歲)。
與編譯后的中文版測(cè)驗(yàn)一樣,采用驗(yàn)證性因素分析來檢驗(yàn)修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版與理論框架之間的一致性。表6顯示了學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的驗(yàn)證性因素分析的結(jié)果,可以看出修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)整體擬合較好(χ2/df=4.44,RMSEA=0.061,CFI=0.98,TLI=0.97,SRMR=0.04),學(xué)習(xí)能力和學(xué)習(xí)信念這兩個(gè)領(lǐng)域以及各分測(cè)驗(yàn)的模型均擬合較好。
表6 修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的模型擬合情況
表7顯示了學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)各個(gè)維度之間的相關(guān)關(guān)系,可以看出,除閱讀理解外,學(xué)會(huì)學(xué)習(xí)各測(cè)驗(yàn)之間存在顯著相關(guān),這與預(yù)期一致。但閱讀理解只與其他認(rèn)知測(cè)驗(yàn)相關(guān),與大部分信念測(cè)驗(yàn)的相關(guān)均不顯著。
以認(rèn)知、非認(rèn)知學(xué)習(xí)結(jié)果及人格測(cè)驗(yàn)為效標(biāo),檢驗(yàn)修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的效標(biāo)效度。已有研究認(rèn)為,學(xué)會(huì)學(xué)習(xí)對(duì)改善學(xué)業(yè)成就——包括認(rèn)知和非認(rèn)知兩個(gè)方面[55]——具有重要作用[56][57]。此外,人格也影響學(xué)業(yè)成就,大五人格中的盡責(zé)性和開放性人格與學(xué)業(yè)成就間的關(guān)系最為密切,與學(xué)業(yè)成就之間存在正相關(guān)[58]。在本研究中,認(rèn)知學(xué)習(xí)結(jié)果采用學(xué)生的語文、數(shù)學(xué)和英語三門學(xué)科成績(jī)的平均值表示;非認(rèn)知學(xué)習(xí)結(jié)果采用學(xué)生幸福感問卷中的學(xué)校情感測(cè)驗(yàn)[59];人格測(cè)驗(yàn)采用與學(xué)業(yè)成就最為密切的盡責(zé)性和開放性兩個(gè)方面[60]。學(xué)校情感測(cè)驗(yàn)和人格測(cè)驗(yàn)的題目形式均為五點(diǎn)李克特,評(píng)分等級(jí)從1(“完全不同意”)到5(“完全同意”)這四個(gè)效標(biāo)的信度依次為學(xué)業(yè)成績(jī)0.90,學(xué)校幸福感測(cè)驗(yàn)0.83,盡責(zé)性0.86、開放性0.82。
表7 修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的各維度與效標(biāo)的相關(guān)關(guān)系
從表7中各學(xué)會(huì)學(xué)習(xí)分測(cè)驗(yàn)與效標(biāo)的相關(guān)可以看出,除閱讀理解外,其余各分測(cè)驗(yàn)與學(xué)業(yè)成績(jī)、學(xué)校情感、盡責(zé)性人格和開放性人格均存在顯著相關(guān)。由此,修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的效標(biāo)效度得以基本驗(yàn)證。
表8顯示了修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的信度,可以看到,學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)總體信度、學(xué)習(xí)能力和學(xué)習(xí)信念的信度均極好,各個(gè)維度的信度均可接受水平,且大多在0.8以上。
表8 修訂后的中文版學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的信度
本研究選擇芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)加以本土化,通過對(duì)測(cè)驗(yàn)翻譯、確定目標(biāo)群體、開展認(rèn)知訪談等,獲得了與原版相應(yīng)的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版。與原版相比,編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版有多處調(diào)整。首先,在測(cè)驗(yàn)翻譯過程中,對(duì)測(cè)驗(yàn)題目的名稱、內(nèi)容、形式加以調(diào)整,以保證中文版測(cè)驗(yàn)的內(nèi)容與原版測(cè)驗(yàn)所考察的建構(gòu)保持一致,不受無關(guān)因素干擾。其次,通過對(duì)目標(biāo)群體試測(cè)發(fā)現(xiàn),閱讀任務(wù)“在旅行社”過于簡(jiǎn)單,故在隨后測(cè)試中刪除。另外,在模型擬合過程中,刪除了多個(gè)因子負(fù)荷過低或存在跨因子負(fù)荷的題目。
對(duì)編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的測(cè)試分析結(jié)果表明,除科學(xué)推理分測(cè)驗(yàn)外,編譯后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版與原版測(cè)驗(yàn)的理論模型基本擬合;除閱讀理解分測(cè)驗(yàn)外,測(cè)驗(yàn)整體及各維度的信度均達(dá)到可接受水平,且大部分在0.7以上,信度較好。由于原版學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)對(duì)各分測(cè)驗(yàn)的結(jié)構(gòu)缺少實(shí)證檢驗(yàn)(1)這一點(diǎn)經(jīng)文獻(xiàn)檢索以及與學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的開發(fā)團(tuán)隊(duì)(芬蘭赫爾辛基大學(xué)教育評(píng)估中心)的負(fù)責(zé)人里斯托·霍圖萊寧(Risto Hotulainen)教授的郵件溝通得以確認(rèn)。,因此,在編譯后的中文版測(cè)驗(yàn)中,科學(xué)推理分測(cè)驗(yàn)結(jié)構(gòu)與假設(shè)的不同既有可能是由兩國(guó)文化不同導(dǎo)致的,也有可能是原版測(cè)驗(yàn)題目本身的問題。不過,芬蘭于2001年和2012年對(duì)九年級(jí)學(xué)生開展了測(cè)評(píng),閱讀理解任務(wù)的信度分別為0.67和0.68[61],這一結(jié)果顯然優(yōu)于編譯后的中文版。因此,閱讀理解測(cè)驗(yàn)信度不足的問題更有可能是文化差異所致。
基于這種考慮,本研究對(duì)編譯后的中文版測(cè)驗(yàn)進(jìn)行了修訂,并對(duì)修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)的測(cè)量學(xué)質(zhì)量進(jìn)行了測(cè)試和分析。測(cè)試結(jié)果表明,修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的整體及各分測(cè)驗(yàn)的模型均擬合良好,所有分測(cè)驗(yàn)的信度都達(dá)到可接受水平,且大部分都在0.8以上,信度較好。由此,修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版可以為我國(guó)義務(wù)教育階段評(píng)價(jià)、科研和實(shí)際應(yīng)用提供工具基礎(chǔ)。
需要指出的是,芬蘭學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)有小學(xué)、初中和高中學(xué)段三個(gè)版本,本研究?jī)H探究了初中版本,另兩個(gè)版本在我國(guó)的適用性有待進(jìn)一步檢驗(yàn)。此外,用于修訂學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版的學(xué)生群體樣本僅限于我國(guó)東部的部分城市,在推廣到我國(guó)其他地區(qū)時(shí),需要進(jìn)一步驗(yàn)證其適用性。雖然如此,修訂后的學(xué)會(huì)學(xué)習(xí)測(cè)驗(yàn)中文版對(duì)于開展基礎(chǔ)教育階段學(xué)生學(xué)會(huì)學(xué)習(xí)能力方面的相關(guān)研究,進(jìn)行本土教育教學(xué)實(shí)踐以及開展相關(guān)方面的跨文化比較,奠定了一定的研究基礎(chǔ)。