范曉玲 伍 慧 李添韻
學(xué)習(xí)能力傾向測(cè)驗(yàn)主要用于評(píng)估個(gè)體獲得新知識(shí)或新技能的可能性,預(yù)測(cè)個(gè)體在將來(lái)可能獲得的學(xué)業(yè)成就或職業(yè)成就。[1]英語(yǔ)學(xué)習(xí)能力傾向是個(gè)體能否成功學(xué)習(xí)英語(yǔ)的一種特殊能力。[2][3]英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)則是通過(guò)測(cè)量學(xué)生的基本英語(yǔ)學(xué)習(xí)能力,評(píng)估其英語(yǔ)學(xué)習(xí)能力各個(gè)層面、不同程度(強(qiáng)、中、弱)的分布,從而預(yù)測(cè)其未來(lái)在新學(xué)習(xí)情境中英語(yǔ)水平提高的可能性。英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)可以為教師制定具有針對(duì)性、個(gè)性化、符合學(xué)生發(fā)展特征的輔導(dǎo)或干預(yù)方案提供依據(jù),同時(shí)能幫助學(xué)生更清晰、更準(zhǔn)確地了解自己的英語(yǔ)學(xué)習(xí)能力,從而更積極、主動(dòng)地思考、應(yīng)用英語(yǔ)學(xué)習(xí)策略。
學(xué)習(xí)能力傾向測(cè)驗(yàn)是目前國(guó)內(nèi)外廣泛應(yīng)用的能力測(cè)驗(yàn)之一。西方國(guó)家在學(xué)習(xí)能力傾向測(cè)驗(yàn)的編制、使用及后續(xù)研究上已成規(guī)模,并在其教育及相關(guān)領(lǐng)域產(chǎn)生了積極影響,推動(dòng)了各自國(guó)家教育的發(fā)展、人才的培養(yǎng)與選拔。我國(guó)關(guān)于學(xué)習(xí)能力傾向測(cè)驗(yàn)的研究主要集中在語(yǔ)文和數(shù)學(xué)學(xué)科領(lǐng)域,英語(yǔ)學(xué)科領(lǐng)域關(guān)注較少。隨著社會(huì)信息化、經(jīng)濟(jì)全球化、文化多樣化的深入發(fā)展,英語(yǔ)已廣泛用于國(guó)際政治、軍事、科技、醫(yī)療、文化、貿(mào)易等領(lǐng)域。不僅如此,很多基于二語(yǔ)習(xí)得理論的實(shí)證研究也指出,小學(xué)階段的英語(yǔ)學(xué)習(xí)在很大程度上影響著學(xué)生最終的英語(yǔ)水平。[4]然而,目前來(lái)看,國(guó)內(nèi)有關(guān)英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)的研究存在幾點(diǎn)不足:一是在測(cè)量對(duì)象上,主要針對(duì)的是中學(xué)生、大學(xué)生、軍人等人群,對(duì)于處于學(xué)習(xí)敏感期和關(guān)鍵期的小學(xué)生則少有涉獵;二是在研究方法上,國(guó)內(nèi)主要是綜述性文獻(xiàn)或調(diào)查性測(cè)驗(yàn),缺乏標(biāo)準(zhǔn)化的實(shí)證研究;三是在測(cè)驗(yàn)的理論依據(jù)上,已經(jīng)編制出來(lái)的測(cè)驗(yàn)大多以經(jīng)典測(cè)量理論(CTT)為基礎(chǔ),很少有測(cè)驗(yàn)以結(jié)果更精確、受抽樣影響小的項(xiàng)目反應(yīng)理論(IRT)為指導(dǎo)。本研究以CTT和IRT 為基礎(chǔ),編制3~6 年級(jí)英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn),其目的是檢測(cè)學(xué)生個(gè)體的英語(yǔ)學(xué)習(xí)能力,為教師的教學(xué)和學(xué)生的學(xué)習(xí)咨詢、輔導(dǎo)、干預(yù)等,提供科學(xué)、有效的評(píng)估工具。
在已有文獻(xiàn)分析的基礎(chǔ)上,本研究根據(jù)Carroll 和Sapon[5]的外語(yǔ)學(xué)習(xí)能力傾向理論,構(gòu)建了小學(xué)生英語(yǔ)學(xué)習(xí)能力的4 個(gè)維度,即語(yǔ)言編碼能力(f1)、記憶聯(lián)結(jié)能力(f2)、語(yǔ)法敏感性(f3)和歸納語(yǔ)言能力(f4)。研究者采用借鑒和自編相結(jié)合的策略,編制了3~4 年級(jí)和5~6 年級(jí)各2 套試卷(A 卷和B 卷),共計(jì)4 套試卷,每套試卷各50個(gè)項(xiàng)目。經(jīng)3~6 年級(jí)532 名學(xué)生預(yù)測(cè)結(jié)果的項(xiàng)目分析,根據(jù)項(xiàng)目難度和區(qū)分度標(biāo)準(zhǔn)對(duì)項(xiàng)目進(jìn)行刪除和修改,最終形成3~4 年級(jí)、5~6 年級(jí)正式測(cè)驗(yàn)各1 套,項(xiàng)目數(shù)分別為34 題和40 題,其中自編項(xiàng)目分別為33 題和39 題,自編率分別為97.06%和98.00%。正式測(cè)驗(yàn)的結(jié)構(gòu)、內(nèi)容與項(xiàng)目分布如表1 所示。
表1 正式測(cè)驗(yàn)的結(jié)構(gòu)、內(nèi)容與項(xiàng)目分布
本研究采用方便抽樣法,在湖南省長(zhǎng)沙市的5 所小學(xué),以班級(jí)為單位進(jìn)行團(tuán)體施測(cè),統(tǒng)一播放測(cè)驗(yàn)的指導(dǎo)語(yǔ)和聽(tīng)力材料,測(cè)驗(yàn)時(shí)限30 分鐘。1965 名學(xué)生參與作答,排除胡亂作答、漏答超過(guò)7 題的問(wèn)卷,有效問(wèn)卷1898 份,有效率96.59%。其中,3~4 年級(jí)卷941 份,5~6 年級(jí)卷957 份。有效樣本的人口學(xué)統(tǒng)計(jì)如表2 所示。
表2 各年級(jí)抽樣分布
(1)基于CTT 的項(xiàng)目分析
如表3 所示,3~4 年級(jí)、5~6 年級(jí)卷的項(xiàng)目難度分別為[0.24,0.79]和[0.24,0.82];3~4 年級(jí)卷的平均難度為0.53,各分測(cè)驗(yàn)的平均難度分別為0.71,0.47,0.45 和0.44;5~6 年級(jí)卷的平均難度為0.60,各分測(cè)驗(yàn)的平均難度分別為0.66,0.54,0.68 和0.59。3~4 年級(jí)、5~6 年級(jí)卷的項(xiàng)目區(qū)分度分別為[0.21,0.75]和[0.27,0.51];3~4 年級(jí)卷的平均區(qū)分度為0.41,各分測(cè)驗(yàn)的平均區(qū)分度分別為0.57,0.40,0.30 和0.27;5~6 年級(jí)卷的平均區(qū)分度為0.40,各分測(cè)驗(yàn)的平均區(qū)分度分別為0.32,0.44,0.44 和0.40。
表3 基于CTT 的項(xiàng)目分析
(2)基于IRT 的項(xiàng)目分析
根據(jù)IRT 的相關(guān)理論,一個(gè)有效的測(cè)驗(yàn)需要滿足以下3 個(gè)假設(shè):一是單維性假設(shè),即測(cè)驗(yàn)對(duì)同一潛在特質(zhì)進(jìn)行測(cè)量;二是獨(dú)立性假設(shè),要求被試與測(cè)驗(yàn)項(xiàng)目之間獨(dú)立,包括測(cè)驗(yàn)項(xiàng)目不會(huì)影響被試作答、被試之間的作答不會(huì)產(chǎn)生交互影響;三是測(cè)驗(yàn)未被加速假設(shè),要求被試在規(guī)定的時(shí)間內(nèi)完成測(cè)驗(yàn)。
本研究采用探索性因素分析,得出了3~4 年級(jí)、5~6 年級(jí)卷的第一特征值和第二特征值的比值分別為3.201 和2.725(見(jiàn)表4),同時(shí)從圖1 和圖2 的碎石圖也可以看出,兩個(gè)測(cè)驗(yàn)的第一主成分顯著突出,第二主成分為拐點(diǎn),滿足了單維性假設(shè)。[6]在施測(cè)過(guò)程中,主試和班主任教師共同監(jiān)考,在最大程度上排除了被試之間的干擾,滿足了獨(dú)立性假設(shè)。主試測(cè)驗(yàn)記錄顯示,所有被試完成測(cè)驗(yàn)項(xiàng)目的時(shí)間為20~26 分鐘,而測(cè)驗(yàn)時(shí)限為30 分鐘,滿足了測(cè)驗(yàn)未被加速假設(shè)。[7]因此,本測(cè)驗(yàn)符合IRT 分析的前提條件。
表4 測(cè)驗(yàn)單維性假設(shè)結(jié)果
圖1 3~4 年級(jí)卷碎石圖
圖2 5~6 年級(jí)卷碎石圖
表5 基于IRT 的項(xiàng)目分析
本研究采用IRT 的三參數(shù)模型對(duì)測(cè)驗(yàn)的難度、區(qū)分度、猜測(cè)度進(jìn)行分析,結(jié)果如表5 所示:3~4 年級(jí)、5~6 年級(jí)卷的項(xiàng)目難度參數(shù)分別為[-1.803,2.490]和[-1.787,1.517],區(qū)分度參數(shù)分別為[0.320,4.879]和[0.370,1.316],猜測(cè)參數(shù)分別為[0.031,0.404]和[0.049,0.374]。3~4 年級(jí)、5~6 年級(jí)卷各項(xiàng)目的平均難度均為-0.07,平均區(qū)分度分別為1.14 和0.78,平均猜測(cè)度分別為0.19和0.20。
兩套試卷的被試能力分布如圖3 和圖4 所示,結(jié)果表明,被試的能力水平平均趨近于0,標(biāo)準(zhǔn)差趨近于1,抽取的樣本質(zhì)量較好,接近正態(tài)分布。
圖3 3~4 年級(jí)卷被試能力分布
圖4 5~6 年級(jí)卷被試能力分布
(1)測(cè)驗(yàn)的信度
首先,基于IRT 的測(cè)驗(yàn)信息函數(shù)如圖5、圖6和表6 所示:3~4 年級(jí)卷和5~6 年級(jí)卷的最大信息函數(shù)分別為27 和10,其對(duì)應(yīng)的能力值分別為-0.20 和0.60。
圖5 3~4 年級(jí)卷的總體信息函數(shù)
圖6 5~6 年級(jí)卷的總體信息函數(shù)
其次,基于內(nèi)部一致性信度的分析結(jié)果如表6所示:3~4 年級(jí)卷和5~6 年級(jí)卷的Cronbach’s α系數(shù)分別為0.84 和0.87;分半信度分別為0.69和0.76。
表6 測(cè)驗(yàn)的信度
(2)測(cè)驗(yàn)的效度
本研究采用相關(guān)法分析測(cè)驗(yàn)總體與各分測(cè)驗(yàn)間的相關(guān)情況。如表7 所示:3~4 年級(jí)卷各分測(cè)驗(yàn)與測(cè)驗(yàn)總體的相關(guān)系數(shù)為0.58~0.84,5~6 年級(jí)卷各分測(cè)驗(yàn)與測(cè)驗(yàn)總體的相關(guān)系數(shù)為0.69~0.83;3~4 年級(jí)卷各分測(cè)驗(yàn)之間的相關(guān)系數(shù)為0.28~0.52,5~6 年級(jí)卷各分測(cè)驗(yàn)之間的相關(guān)系數(shù)為0.33~0.55。
表7 各分測(cè)驗(yàn)與測(cè)驗(yàn)總體的相關(guān)系數(shù)
表8 測(cè)驗(yàn)因子模型擬合指數(shù)
本研究采用驗(yàn)證性因素分析,探討兩個(gè)學(xué)段英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)的結(jié)構(gòu)。如表8 所示:一、二階模型中,3~4 年級(jí)、5~6 年級(jí)卷的RMSEA 均小于0.05,模型擬合指數(shù)CFI 和TLI 均大于0.90。圖7 和圖8 為兩個(gè)測(cè)驗(yàn)的二階模型擬合圖。
圖7 3~4 年級(jí)卷模型擬合圖(二階)
圖8 5~6 年級(jí)卷模型擬合圖(二階)
本研究以取樣學(xué)生的英語(yǔ)期末考試成績(jī)?yōu)樾?biāo),進(jìn)行預(yù)測(cè)效度的分析。在正式施測(cè)結(jié)束的兩個(gè)月后,研究者收集了參與測(cè)試的某一所學(xué)校295 名學(xué)生的英語(yǔ)期末考試成績(jī),結(jié)果如表9 所示。取樣學(xué)生的3~4 年級(jí)、5~6 年級(jí)卷總分與其英語(yǔ)期末考試成績(jī)的相關(guān)分別為0.45 和0.31,且在0.01 水平相關(guān)顯著。
表9 測(cè)驗(yàn)總分與英語(yǔ)統(tǒng)考成績(jī)的相關(guān)
本研究編制的3~6 年級(jí)英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)主要用于測(cè)量小學(xué)生學(xué)習(xí)英語(yǔ)的最初準(zhǔn)備狀態(tài)和能力,評(píng)估其英語(yǔ)學(xué)習(xí)的潛力,同時(shí)為教師在教學(xué)過(guò)程中以發(fā)展的眼光多維度地評(píng)價(jià)學(xué)生、調(diào)整教學(xué)方式等提供依據(jù)。
通過(guò)查閱國(guó)內(nèi)外有關(guān)學(xué)習(xí)能力傾向測(cè)驗(yàn),筆者發(fā)現(xiàn)大多數(shù)能力傾向測(cè)驗(yàn)是以流體智力和能力的層級(jí)結(jié)構(gòu)為理論基礎(chǔ)的,大多數(shù)言語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)包括了語(yǔ)言的編碼、理解和應(yīng)用能力。[8][9]鑒于目前國(guó)內(nèi)中小學(xué)校普遍重視學(xué)生思維品質(zhì)的培養(yǎng),本研究基于文獻(xiàn)查閱的結(jié)果,初步構(gòu)建了測(cè)驗(yàn)結(jié)構(gòu),確定了項(xiàng)目形式和項(xiàng)目?jī)?nèi)容,之后再與7 名教齡在5 年以上的小學(xué)英語(yǔ)骨干教師和1 名心理學(xué)測(cè)量專家進(jìn)行訪談,最終形成了3~6 年級(jí)英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)的4 個(gè)維度:語(yǔ)音編碼能力、記憶聯(lián)結(jié)能力、語(yǔ)法敏感性和歸納語(yǔ)言能力。測(cè)驗(yàn)內(nèi)容包括尋找音韻、數(shù)字學(xué)習(xí)、匹配詞語(yǔ)和歸納詞組??紤]到測(cè)驗(yàn)為團(tuán)體施測(cè)的紙筆測(cè)驗(yàn),研究者將尋找音韻、數(shù)字學(xué)習(xí)連同指導(dǎo)語(yǔ)一起錄制。
從測(cè)量結(jié)果來(lái)看,兩個(gè)測(cè)驗(yàn)與其分測(cè)驗(yàn)的相關(guān)均較高,各個(gè)分測(cè)驗(yàn)之間的相關(guān)達(dá)到中度相關(guān),且分測(cè)驗(yàn)與測(cè)驗(yàn)總體的相關(guān)明顯高于各分測(cè)驗(yàn)之間的相關(guān),一方面說(shuō)明各分測(cè)驗(yàn)均對(duì)測(cè)驗(yàn)總體做出了貢獻(xiàn),另一方面說(shuō)明各個(gè)分測(cè)驗(yàn)之間又具有相對(duì)的獨(dú)立性。測(cè)驗(yàn)的一階驗(yàn)證性因素分析和二階驗(yàn)證性因素分析結(jié)果表明:RMSEA<0.05,CFI 和TLI 均>0.90,結(jié)構(gòu)模型擬合優(yōu)良[10],說(shuō)明兩個(gè)測(cè)驗(yàn)的理論結(jié)構(gòu)理想。
根據(jù)CTT 理論,難度為0.50 左右的項(xiàng)目具有最大的鑒別力,但實(shí)際編制測(cè)驗(yàn)時(shí),卻不能使測(cè)驗(yàn)的所有項(xiàng)目難度都在0.50 左右,因?yàn)檫@樣做會(huì)使整個(gè)測(cè)驗(yàn)的區(qū)分能力降低,測(cè)驗(yàn)所能提供的信息量減少。[11]因此,在編制測(cè)驗(yàn)時(shí),研究者應(yīng)盡量使項(xiàng)目難度分布廣泛,最好為常態(tài)分布。本研究中,基于CTT 的3~4 年級(jí)、5~6 年級(jí)卷的項(xiàng)目難度分布為[0.24,0.79]和[0.24,0.82],符合最高行為測(cè)驗(yàn)難度在[0.20,0.80]之間[12]的分布要求,且難度在[0.30,0.70]之間的項(xiàng)目分別占項(xiàng)目總數(shù)的70%和58%,平均難度分別為0.53 和0.60,符合最高行為測(cè)驗(yàn)的項(xiàng)目難度為0.50 左右[13]的要求。關(guān)于測(cè)驗(yàn)項(xiàng)目的區(qū)分度,美國(guó)測(cè)量學(xué)家Aken認(rèn)為項(xiàng)目的鑒別指數(shù)應(yīng)在0.30 以上,但對(duì)于偏離平均難度較大的項(xiàng)目,其鑒別指數(shù)稍低于0.30 也可以接受。[14]本研究中,3~4 年級(jí)、5~6 年級(jí)卷的項(xiàng)目區(qū)分度分別為[0.21,0.75]和[0.27,0.51],測(cè)驗(yàn)的區(qū)分度分別為0.41 和0.40,達(dá)到區(qū)分度可以接受水平[14]以上。
根據(jù)IRT 理論,項(xiàng)目三參數(shù)模型的可接受范圍是難度為[-3.00,3.00]、區(qū)分度大于0.70、猜測(cè)度小于0.30。[15]本研究中,基于IRT 的3~4 年級(jí)、5~6 年級(jí)卷的項(xiàng)目難度參數(shù)分別為[-1.803,2.490]和[-1.787,1.517],平均難度均為-0.07;區(qū)分度參數(shù)分別為[0.320,4.879]和[0.370,1.316],大于0.70 的項(xiàng)目分別占67.60%和65.00%,平均區(qū)分度分別為1.14 和0.78,且猜測(cè)參數(shù)分別為[0.031,0.404]和[0.049,0.374],猜測(cè)度大于0.30的項(xiàng)目數(shù)分別是4 個(gè)(11.80%)和3 個(gè)(7.50%),平均猜測(cè)系數(shù)分別為0.19 和0.20,基本滿足難度、區(qū)分度和猜測(cè)度的可接受水平。
本研究基于CTT 的3~4 年級(jí)、5~6 年級(jí)卷的Cronbach’s α 系數(shù)分別為0.84 和0.87,分半信度分別為0.69 和0.76,與同類測(cè)驗(yàn)[16][17]相當(dāng),且達(dá)到良好信度[18]的標(biāo)準(zhǔn)。IRT 通常以測(cè)驗(yàn)的信息函數(shù)作為信度指標(biāo),通過(guò)衡量標(biāo)準(zhǔn)誤、測(cè)驗(yàn)信息量來(lái)檢驗(yàn)信度的高低。[19]漆書青認(rèn)為,具有良好信度的測(cè)驗(yàn),其標(biāo)準(zhǔn)誤應(yīng)小于或等于0.20,即測(cè)驗(yàn)的總信息量要大于25。[20]測(cè)驗(yàn)信息函數(shù)受項(xiàng)目數(shù)量、項(xiàng)目質(zhì)量和被試能力水平的影響。本研究3~4年級(jí)卷的測(cè)驗(yàn)信息函數(shù)為27,5~6 年級(jí)卷的測(cè)驗(yàn)信息函數(shù)10,說(shuō)明有些項(xiàng)目仍需修改??赡艿脑蛴袃蓚€(gè)。一是個(gè)別分測(cè)驗(yàn)項(xiàng)目較少。考慮到學(xué)生的注意力、耐心、課時(shí)等因素,部分題型題量較少,再經(jīng)過(guò)預(yù)測(cè)篩選,項(xiàng)目數(shù)就更少了,如語(yǔ)法敏感性和歸納語(yǔ)言能力分測(cè)驗(yàn)項(xiàng)目只保留了6~8個(gè),未來(lái)的測(cè)驗(yàn)修訂可以適量增加題量。二是項(xiàng)目的評(píng)分等級(jí)較少,如部分項(xiàng)目只有3 個(gè)選項(xiàng),致使猜測(cè)系數(shù)較高。有研究指出,測(cè)驗(yàn)信息函數(shù)受項(xiàng)目的評(píng)分等級(jí)數(shù)影響,評(píng)分等級(jí)越少,信息損失越大,總體信息函數(shù)越小。[21]未來(lái)的測(cè)驗(yàn)修訂可以考慮通過(guò)增加選項(xiàng)來(lái)降低猜測(cè)系數(shù),進(jìn)而提高總體信息函數(shù)。
結(jié)構(gòu)效度方面,各分測(cè)驗(yàn)之間以及各分測(cè)驗(yàn)與總分的相關(guān)均較高且相關(guān)顯著,說(shuō)明測(cè)驗(yàn)的內(nèi)部一致性較好。驗(yàn)證性因素分析結(jié)果表明,模型擬合成立,測(cè)驗(yàn)結(jié)構(gòu)合理。預(yù)測(cè)效度方面,本研究收集了正式施測(cè)兩個(gè)月后部分被試的英語(yǔ)期末考試成績(jī)來(lái)考驗(yàn)預(yù)測(cè)效度。從考驗(yàn)的結(jié)果來(lái)看,3~4 年級(jí)、5~6 年級(jí)卷的量表總分與英語(yǔ)期末考試成績(jī)的相關(guān)均顯著,相關(guān)系數(shù)分別為0.45 和0.31,與同類研究結(jié)果[22]一致。
綜上所述,本研究編制的3~6 年級(jí)英語(yǔ)學(xué)習(xí)能力傾向測(cè)驗(yàn)的項(xiàng)目質(zhì)量和測(cè)驗(yàn)質(zhì)量均符合測(cè)量學(xué)的基本要求,可以有效評(píng)估學(xué)生的英語(yǔ)學(xué)習(xí)能力現(xiàn)狀,其評(píng)估結(jié)果可以為英語(yǔ)教育教學(xué)的質(zhì)量評(píng)估以及英語(yǔ)學(xué)習(xí)的咨詢、輔導(dǎo)和干預(yù)提供參考。
教育測(cè)量與評(píng)價(jià)2020年11期