胡一平 高佳佳 陸 宏(山東師范大學(xué) 傳媒學(xué)院,山東濟(jì)南 250014)
?
英語詞匯自適應(yīng)測試系統(tǒng)中詞匯難度的判定*
胡一平高佳佳陸宏[通訊作者]
(山東師范大學(xué) 傳媒學(xué)院,山東濟(jì)南 250014)
摘要:針對英語詞匯自適應(yīng)測試系統(tǒng)中詞匯難度如何量化的現(xiàn)實需求,文章提出了從詞頻、長度、語音書寫和諧程度這三個維度來量化英語詞匯難度的具體方法,并以普通高中英語詞匯為例展示了其量化過程。經(jīng)過對各個難度子區(qū)間的詞匯頻次進(jìn)行統(tǒng)計后發(fā)現(xiàn),其結(jié)果近似呈現(xiàn)正態(tài)分布。
關(guān)鍵詞:英語詞匯;自適應(yīng)測試;詞匯難度;項目反應(yīng)理論
任何一門語言的掌握和應(yīng)用都離不開詞匯。詞匯學(xué)習(xí)是英語學(xué)習(xí)的一個重要組成部分,是進(jìn)行語言交際的前提和核心。并且,詞匯能力對語言能力有很強(qiáng)的預(yù)測性,因為詞匯能力的發(fā)展與語言能力的發(fā)展是緊密相關(guān)的[1]?;诖?,對詞匯能力的測試成為了語言學(xué)研究的重點。
隨著計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,以及項目反應(yīng)理論(IRT)在測試領(lǐng)域受到的廣泛關(guān)注,英語詞匯能力測試可借助基于IRT的計算機(jī)自適應(yīng)測試(CAT)得以高效、便捷地實現(xiàn)?;贗RT的英語詞匯自適應(yīng)測試系統(tǒng)最重要的部分就是題庫建設(shè),而一個優(yōu)質(zhì)的題庫系統(tǒng)是CAT系統(tǒng)得以成功實施的前提。但題庫系統(tǒng)是否優(yōu)質(zhì),在很大程度上取決于對英語詞匯難度的量化是否合理,這關(guān)系到整個CAT系統(tǒng)的性能。在自適應(yīng)測試的過程中,CAT系統(tǒng)作為測試的“決策者”,不論它采用何種選題策略(如最大信息量選題法、a分層選題法等),其最終目的都是從題庫系統(tǒng)中選出與被試能力相匹配的試題,因為只有這樣的試題對于被試來說才有價值,而對最終選題結(jié)果起決定性作用的正是詞匯難度值。此外,詞匯難度值對后續(xù)估計被試的詞匯能力也起到了至關(guān)重要的作用,它會對被試最終能力水平的判定產(chǎn)生直接影響,而這關(guān)系到測試的可靠性。因此,如何合理地量化英語詞匯難度值,就成為了研究者們關(guān)注的焦點。
基于IRT的英語詞匯自適應(yīng)測試具有廣闊的前景,這一點毋庸置疑。然而,由于采用的新型教育測量理論涉及相對繁雜的數(shù)學(xué)運算,且其測驗理念并未完全深入人心,故目前相關(guān)的自適應(yīng)測試系統(tǒng)仍處于一種相對匱乏的狀態(tài)。但通過分析有限的案例,可以幫助研究者理清研究脈絡(luò),從中發(fā)現(xiàn)問題以便改進(jìn)。
趙傳海等[2]設(shè)計了一個基于IRT的大學(xué)英語詞匯在線自適應(yīng)測試系統(tǒng),并依據(jù)相關(guān)理論研究成果,提出英語詞匯自適應(yīng)測試應(yīng)在廣度測試的基礎(chǔ)上進(jìn)行深度測試——然而在廣度測試中,起決定性作用的詞匯難度值卻未得到充分重視。臺灣學(xué)者Chen等[3]基于IRT和學(xué)習(xí)記憶周期理論,設(shè)計了個性化英語詞匯移動學(xué)習(xí)系統(tǒng),并在系統(tǒng)建設(shè)中對每個單詞的難度系數(shù)進(jìn)行標(biāo)度時,對影響詞匯難度的長度因子和發(fā)音因子的權(quán)重指定為0.7和0.3——但文中對這種標(biāo)度的科學(xué)性和理論依據(jù),卻未加解釋。此外,陸宏等[4]開發(fā)的高中英語詞匯自適應(yīng)學(xué)習(xí)系統(tǒng)對詞匯難度的量化進(jìn)行了改進(jìn)——然而在對具體的難度影響因子參數(shù)的計算上過于簡單,如在統(tǒng)計單詞字母與音節(jié)的不和諧程度時,簡單地將其劃分為三個不同的等級,不能較好地體現(xiàn)不同詞匯間不和諧程度的差異,進(jìn)而直接影響到詞匯最終難度值的合理性。
在詞匯難度定義方面的缺陷,必然會導(dǎo)致整個詞匯自適應(yīng)測試系統(tǒng)在為用戶選詞、對用戶能力進(jìn)行評價時不夠精確和科學(xué),其實用價值也會大打折扣。基于此,本研究在文獻(xiàn)查閱的基礎(chǔ)上,提出了一個量化英語詞匯難度的具體方法,使其更具科學(xué)性和實用性,并以普通高中英語詞匯為例展示了其量化過程。
本研究選用普通高中英語詞匯作為題庫目標(biāo)詞。《全日制高級中學(xué)英語教學(xué)大綱》和《普通高中英語課程標(biāo)準(zhǔn)(實驗)》中規(guī)定了高中階段學(xué)生應(yīng)該學(xué)習(xí)和掌握的詞匯,經(jīng)統(tǒng)計共3823個,去除129個暫不予以考慮的詞匯(包括body-building等合成詞51個、AIDS等縮寫詞12個、table manners等短語66個),共得題庫目標(biāo)詞3694個。
1詞匯難度影響因子
一般來說,一個詞匯的難度取決于它是否易于被學(xué)習(xí)者記憶或認(rèn)出。對于將英語作為第二外語(ESL)的學(xué)習(xí)者來說,詞匯的難度受很多因素的影響,如詞頻、單詞的長度、語音與書寫的和諧程度、學(xué)習(xí)者心理特質(zhì)、文化影響以及母語的負(fù)遷移等。這些因素可歸納為兩大類:詞內(nèi)因素和詞外因素。由于本研究關(guān)注的僅僅是詞匯自身的一些特征對詞匯難度產(chǎn)生的作用,而詞外因素具有難把握性、個體差異性和不可操作性,故本研究將重點放在了影響詞匯難度的客觀詞內(nèi)因素上。本研究試圖通過文獻(xiàn)查閱的方式,抽取出對詞匯難度影響較大的因子,從而為量化英語詞匯難度奠定理論基礎(chǔ)。
詞匯難度一直是語言學(xué)研究者們關(guān)注的重點。研究表明,對于ESL學(xué)習(xí)者來說,難詞在很大程度上是指詞形上難的詞,即容易造成拼寫錯誤的詞[5]。而引起拼寫困難的主要原因,是字母或字母組合與其發(fā)音間的不一致、誤讀以及單詞過長[6]。呂文澎[7]針對我國英語學(xué)習(xí)者的特征,指出一些固有的長詞以及那些至少包含一個不發(fā)音字母的單詞都可被視為難詞。Carroll[8]早在2000年就通過音素監(jiān)察法,驗證了詞頻對于詞匯掌握和理解的重要作用。此外,李永康[9]在對詞匯難度因素的分級研究中指出,詞匯的難易可以用詞匯頻率、雙語語義共享、上下文限制、語音/書寫特征和諧等四種因素來表征??v觀國內(nèi)外學(xué)者的觀點,同時考慮到最終的詞匯難度值需要依據(jù)各個影響因子進(jìn)行具體量化,故本研究最終提取出最具代表性且同時具有可操作性的三大影響因子:詞頻、單詞的長度、語音與書寫的和諧程度。
(1)詞頻
詞頻可以被看作是詞匯難度的統(tǒng)計學(xué)特征,即在一定數(shù)量的真實語料中詞匯重復(fù)出現(xiàn)的次數(shù)。它決定了詞匯的常用程度和學(xué)習(xí)者對詞匯的熟悉程度,因此是量化詞匯難度的重要影響因子。一般來說,單詞的使用頻率越高,對學(xué)習(xí)者來說就越常見,在記憶時的難度就會減??;相反,單詞的使用頻率越低,學(xué)習(xí)者對它的熟悉程度就會越低,在記憶時的難度就會增加。早在20世紀(jì)40年代中期,桑代克等語言學(xué)家就開始評估詞頻和詞匯難度之間的關(guān)系,在計算機(jī)技術(shù)成熟之前經(jīng)過人工分析,他們于1944年首次提供了大規(guī)模的詞匯頻次表。自那時起,許多詞匯表都是基于單詞的詞頻來設(shè)計的,用來指導(dǎo)第二語言詞匯及課程的編纂。目前,以大規(guī)模語料庫為基礎(chǔ)的詞頻表已如雨后春筍般出現(xiàn),并且借助于人工智能技術(shù)日漸繁榮。如西方的American Heritage Word Frequency Book、COBUILD Wordlist等詞頻表在國外應(yīng)用十分廣泛,國內(nèi)的《新世紀(jì)大學(xué)英語四、六級詞典》也同樣基于詞頻編纂;我國臺灣地區(qū)著名的General English Proficiency Test(GEPT)共分為初級、中級、中高級、高級、優(yōu)級等五級測驗,且每一級測驗都規(guī)定了詞匯考察范圍,而這五個等級的詞匯劃分也參考了詞匯的使用頻率。由此可見,詞頻對詞匯難度的影響不容忽視。
(2)單詞的長度
單詞的長度是單詞的主要內(nèi)部特征之一,對單詞的認(rèn)知與記憶影響很大——認(rèn)知與拼寫單詞時,單詞越長,初學(xué)者越容易犯錯誤,母語為非拼音文字者尤其如此。量化英語詞匯的長度可從組成詞匯的字母的個數(shù)、音節(jié)的數(shù)量、詞素的數(shù)量等三個角度進(jìn)行,其中字母個數(shù)產(chǎn)生的影響較大[10]?;诖?,本研究選用單詞中所含字母的個數(shù)來表征單詞的長度。一般而言,單詞越長,音節(jié)的結(jié)構(gòu)和拼寫變化就越多、越復(fù)雜,學(xué)習(xí)者的記憶負(fù)擔(dān)就會相應(yīng)加重,出錯的可能性也較大,出錯的次數(shù)也會增多——這也就是我們通常所說的“詞長效應(yīng)”。如果將詞長與其它影響詞匯難度的因素妥當(dāng)分離,那么詞長效應(yīng)將會更加明顯。
(3)語音與書寫的和諧程度
語音與書寫的和諧程度是指單詞的發(fā)音與拼寫之間的一致程度,而單詞發(fā)音的正確程度與學(xué)習(xí)者對單詞的理解、記憶和表述直接相關(guān)。呂文澎[7]在對詞匯難度進(jìn)行研究時指出,至少包含一個不發(fā)音字母、易引起吞音現(xiàn)象是難詞的重要特征,這樣的單詞語音與書寫的和諧程度較低。如單詞“accident”和“straight”,兩者均含8個字母,前者讀作/'?ks?d?nt/,后者讀作/stre?t/,而“straight”中的“gh”是不發(fā)音的,這對于利用發(fā)音記憶單詞的學(xué)習(xí)者來說無疑增加了難度。相對而言,語音與書寫和諧程度較高的“accident”更容易記憶。
2詞匯難度判定公式
本研究確定了影響詞匯難度的三大因子為詞頻、詞匯長度、語音與書寫的和諧程度,就可借助數(shù)學(xué)的方法來定義詞匯難度判定公式(見公式1),進(jìn)而可定量計算出每一個詞匯的難度值。
其中,b是詞匯難度值,F(xiàn)是詞頻參數(shù),L是詞匯的長度參數(shù),H是詞匯的語音書寫和諧程度參數(shù);W1、W2、W3分別是這三個參數(shù)的權(quán)重,其計算運用了層次分析法——這種用于決策的新方法由美國運籌學(xué)家Saaty提出[11],該方法在處理復(fù)雜決策問題時所具有的優(yōu)越性使得它的應(yīng)用遍及教育、管理等眾多領(lǐng)域。本研究邀請了20位從事英語教學(xué)和研究的專家參與其中,他們根據(jù)自身的專業(yè)知識和經(jīng)驗,按照這三大影響因子兩兩之間的相對重要程度,并依循1—9標(biāo)度法在權(quán)重評議表上打分。研究者對評議表回收、審核后進(jìn)行匯總,計算出三大影響因子中某一因子相對于其它因子的相對重要性權(quán)重值,得出詞頻、長度、語音書寫和諧程度這三個因子的權(quán)重分別為0.44、0.30、0.26。為確保最終權(quán)重結(jié)果的可靠性,還需進(jìn)行一致性檢驗,求得隨機(jī)一致性比例CR=CI/RI=0.093<0.1(CI代表判斷矩陣一致性指標(biāo),RI代表隨機(jī)一致性指標(biāo)),說明權(quán)重結(jié)果可靠且合理有效。因此,本研究得出的詞匯難度判定公式見公式2:
3 各因子參數(shù)的計算方法
(1)英語詞匯詞頻參數(shù)F的計算
本研究中詞頻參數(shù)的計算與英國國家語料庫(BNC)常用15000詞詞頻排序表(以下簡稱詞頻表)中相應(yīng)單詞的詞頻密切相關(guān)。BNC由牛津大學(xué)出版社、大英圖書館等合作開發(fā)建立,是迄今為止最具代表性的現(xiàn)代語料庫之一。BNC取樣的文章類型十分廣泛,對文本的來源、語言的難易層次均有明確的規(guī)定與比例限制,其詞頻排序頗具代表性和科學(xué)性。詞頻表按照單詞的使用頻率高低對單詞進(jìn)行排序,它所收錄的每一個單詞都有一個詞頻序號,使用頻率最高的單詞詞頻序號為1;隨著使用頻率的降低,單詞的詞頻序號不斷增大。
如前文所述,本研究的題庫目標(biāo)詞有3694個,然而在詞頻表中檢索后發(fā)現(xiàn)gruel等328個單詞并沒有收錄在詞頻表中,故應(yīng)去除這328個詞,而將剩余的3366個單詞作為最終的題庫目標(biāo)詞。為了計算詞頻參數(shù),需要在詞頻表中檢索所有目標(biāo)詞的詞頻序號。根據(jù)詞頻序號的查詢結(jié)果,將詞頻序號最小的單詞的詞頻參數(shù)定義為0,將詞頻序號處于中間水平的單詞的詞頻參數(shù)定義為50,而將詞頻序號最大的單詞的詞頻參數(shù)定義為100。然后按照一定的映射關(guān)系,就可計算出所有單詞的詞頻參數(shù),具體的計算公式見公式3:
其中,F(xiàn)是詞頻參數(shù),VF是詞頻序號,VFmin代表目標(biāo)詞中詞頻序號最小的值,VFmid是指目標(biāo)詞中處于中間水平的詞頻序號值,VFmax是指目標(biāo)詞中詞頻序號最大的值。
(2)英語詞匯長度參數(shù)L的計算
在進(jìn)行長度參數(shù)計算之前,首先要做的準(zhǔn)備工作是將目標(biāo)詞的長度分別統(tǒng)計出來。定義長度參數(shù)的方法與之前定義詞頻參數(shù)的方法類似,即將所含字母個數(shù)最少的單詞的長度參數(shù)定義為0,將所含字母個數(shù)處于中間水平的單詞的長度參數(shù)定義為50,將所含字母個數(shù)最多的單詞的長度參數(shù)定義為100。同樣經(jīng)過一定的轉(zhuǎn)換,每一個目標(biāo)詞的長度參數(shù)就可通過公式4得到:
其中,L是詞匯的長度參數(shù),VL是單詞所含的字母個數(shù),VLmin、VLmid、VLmax分別代表目標(biāo)詞中最短、長度居中、最長的單詞所包含的字母個數(shù)。
(3)英語詞匯語音書寫和諧程度參數(shù)H的計算
語音書寫和諧程度參數(shù)可顯示一個單詞讀音與形態(tài)的一致性程度,這里用H來表示。為了計算H的值,需首先定義一個單詞的長度與該單詞音標(biāo)長度的比,表達(dá)式見公式5:
其中,PR是單詞的字母個數(shù)與音標(biāo)個數(shù)的比,VL是單詞包含的字母個數(shù),PN代表單詞包含的音標(biāo)個數(shù)。根據(jù)PR的定義,可以計算出所有目標(biāo)詞的PR值。顯然,當(dāng)PR=1時,該單詞讀音與形態(tài)的一致性程度最高;不論是PR>1還是PR<1,都表明該單詞的字母與音標(biāo)不能一一對應(yīng),這樣勢必會造成拼寫困難。在所有目標(biāo)詞中將PR值與1差值的絕對值最小的單詞H值定義為0,差值的絕對值處于中間水平的單詞H值定義為50,差值的絕對值最大的單詞H值定義為100,每一個目標(biāo)詞的語音書寫和諧程度參數(shù)就可通過公式6計算得出:
其中,H是單詞的語音書寫和諧程度參數(shù),PR是單詞的字母個數(shù)與音標(biāo)符號個數(shù)的比,|PR-1|代表PR與1差值的絕對值,|PR-1|min、|PR-1|mid、|PR-1|max分別是所有目標(biāo)詞中PR與1差值的絕對值的最小值、中間值、最大值。
需要說明的一點是,由于各因子參數(shù)的定義范圍均為[0,100],因此按照難度判定公式直接計算出的詞匯難度取值范圍同樣是[0,100]。而在IRT中,一般情況下詞匯難度取值范圍是[-3,3],所以為了獲得相應(yīng)范圍的難度值,就需做進(jìn)一步轉(zhuǎn)換,即將詞匯難度從[0,100]映射到[-3,3]的范圍中。具體的轉(zhuǎn)換方式見公式7:
其中,b’是指取值范圍在[-3,3]上的詞匯難度,即最終難度值;b是指利用難度公式直接計算出來的詞匯難度,即初始難度值;bmin、bmax分別是指初始難度值的最小值、最大值。
前文已經(jīng)定義了詞匯難度的判定公式以及各因子參數(shù)的計算方法,下文將通過舉例使計算過程更加清晰明了——以單詞climb/kla?m/為例,來說明其詞頻參數(shù)F、長度參數(shù)L、語音書寫和諧程度參數(shù)H、初始難度值b以及最終難度值b’的計算過程。
1詞頻參數(shù)的計算
通過對本研究中3366個高中英語詞匯在詞頻表中的詞頻信息進(jìn)行統(tǒng)計后可知:VFmin=1,VFmid=3000,VFmax=14958。單詞climb的詞頻序號VF=3882>VFmid,那么它的詞頻參數(shù)F的計算過程如下:
2長度參數(shù)的計算
通過對目標(biāo)詞的長度信息進(jìn)行統(tǒng)計后可知:VLmin=1,VLmid=8,VLmax=15。單詞climb的長度VL=5 3語音書寫和諧程度參數(shù)的計算 4初始難度值的計算 計算出單詞climb的詞頻參數(shù)F、長度參數(shù)L、語音書寫和諧程度參數(shù)H后,就可以根據(jù)詞匯難度判定公式來計算climb的初始難度值b: 5最終難度值的計算 對climb的初始難度值b進(jìn)行一定轉(zhuǎn)換后,就可以獲得難度范圍在[-3,3]間的最終難度值b’。統(tǒng)計完所有目標(biāo)詞的初始難度值后可知:初始難度值的最小值為bmin=0.029343114、最大值為bmax=78.23107603,那么最終難度值b’的計算過程如下: 根據(jù)以上詞匯難度計算公式和計算過程,就可得出本研究所涉及的3366個詞匯的詞頻參數(shù)、長度參數(shù)、語音書寫和諧程度參數(shù)以及每個詞匯的難度值。將詞匯難度取值范圍[-3,3]平均劃分為12個子區(qū)間,分別統(tǒng)計在各個難度子區(qū)間上目標(biāo)詞出現(xiàn)的頻次,結(jié)果如圖1所示。從圖1可以看出,詞匯難度頻次近似呈現(xiàn)正態(tài)分布,這就驗證了本研究提出的詞匯難度計算方法的科學(xué)性。 圖1 詞匯難度頻次分布 基于IRT的CAT系統(tǒng)為英語詞匯測試注入了新鮮血液,其優(yōu)勢突出。系統(tǒng)的科學(xué)性、高效性是CAT得以大規(guī)模推廣的前提之一,而在英語詞匯CAT系統(tǒng)中,對系統(tǒng)科學(xué)性起決定作用的正是詞匯難度值。本研究結(jié)合文獻(xiàn)梳理結(jié)果及我國英語詞匯的教學(xué)實際,提出了從詞頻、長度、語音書寫和諧程度這三個維度來量化英語詞匯難度的具體方法,其量化過程不涉及繁雜的數(shù)學(xué)運算,具有實用價值。 參考文獻(xiàn) [1]段士平.二語詞匯能力及其測試[J].解放軍外國語學(xué)院學(xué)報,2009,(2):51-54. [2]趙傳海,吳敏,葉艷.基于IRT的大學(xué)英語詞匯在線自適應(yīng)測試系統(tǒng)的設(shè)計[J].現(xiàn)代教育技術(shù),2008,(12):87-90. [3]Chen C M,Chung C J.Personalized mobile English vocabulary learning system based on item response theory and learning memory cycle[J].Computers & Education,2008,(2):624-645. [4]陸宏,趙艷萍.高中英語詞匯自適應(yīng)學(xué)習(xí)系統(tǒng)的研制[J].現(xiàn)代教育技術(shù),2014,(11):47-52. [5]Nation I S P.Beginning to learn foreign language vocabulary: A review of the research[J].RELC Journal,1982,(1):14-36. [6]侯寧海.常考易混英語疑難對詞手冊[M].南京:河海大學(xué)出版社,1994:15-17. [7]呂文澎.英語難詞記憶法:調(diào)查與分析[J].外語教學(xué),2001,(3):75-80. [8]Carroll D W.Psychology of language[M].Beijing: The Foreign Language Teaching and Research Press,2000:34-36. [9]李永康.第二語言詞匯難度定義的整合研究[J].安徽工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2003,(5):122-123. [10]陳士法,彭建武,楊洪娟,等.英漢心理詞典中英語單詞存儲的詞長效應(yīng)研究[J].外語教學(xué),2011,(5):45-51. [11]郭金玉,張忠彬,孫慶云.層次分析法的研究與應(yīng)用[J].中國安全科學(xué)學(xué)報,2008,(5):148-153. 編輯:小米 Assessing Lexical Difficulty in English Vocabulary Adaptive Testing System HU Yi-pingGAO Jia-jiaLU Hong[Corresponding Author] Abstract:Focusing on realistic demand how to quantify lexical difficulty in English vocabulary adaptive testing system,the paper put forward a new approach to assess lexical difficulty in terms of word frequency,word length as well as harmony degree of phonetic and orthographic features and displayed the quantization process of high school English vocabularies.According to the statistically analysis of the vocabulary frequency at each difficulty subinterval,the result shown a normal distribution. Keywords:English vocabulary; adaptive testing; lexical difficulty; item response theory 收稿日期:2015年9月29日 作者簡介:胡一平,在讀碩士,研究方向為計算機(jī)教育應(yīng)用,郵箱為hypfamily@163.com。 *基金項目:本文為2013年山東省高等學(xué)校科技計劃項目“基于項目反應(yīng)理論的英語詞匯自適應(yīng)學(xué)習(xí)系統(tǒng)的研制”(課題編號:J13LN12)的階段性研究成果。 【中圖分類號】G40-057 【文獻(xiàn)標(biāo)識碼】A 【論文編號】1009—8097(2016)03—0100—07 【DOI】10.3969/j.issn.1009-8097.2016.03.015
(School of Communication,Shandong Normal University,Jinan,Shandong,China 250014)