【摘要】該文從建立基礎(chǔ)型英語(yǔ)閱讀語(yǔ)料庫(kù)(English Reading Corpus, ERC),然后采用結(jié)構(gòu)方程模型(Structural Equation Modeling, SEM)及語(yǔ)言統(tǒng)計(jì)學(xué)方法,從英語(yǔ)閱讀語(yǔ)料庫(kù)的語(yǔ)篇復(fù)雜度、學(xué)習(xí)者個(gè)體的信息獲取水平及情感因素三方面進(jìn)行了建模及相關(guān)關(guān)系的探索性研究,在數(shù)據(jù)統(tǒng)計(jì)和分析的基礎(chǔ)上,找到了滿(mǎn)足置信度及可擬合的數(shù)學(xué)模型,以期能對(duì)英語(yǔ)閱讀教學(xué)和學(xué)習(xí)有所啟示。在通過(guò)對(duì)SEM的ERC建模之后的數(shù)據(jù)進(jìn)行全面、準(zhǔn)確的統(tǒng)計(jì)分析,能夠?yàn)樘岣哂⒄Z(yǔ)閱讀教學(xué)質(zhì)量提供有價(jià)值的統(tǒng)計(jì)數(shù)據(jù)和分析資料。
【關(guān)鍵詞】結(jié)構(gòu)方程模型;語(yǔ)料庫(kù);英語(yǔ)閱讀;數(shù)值擬合
【中圖分類(lèi)號(hào)】G420 【文獻(xiàn)標(biāo)識(shí)碼】B 【論文編號(hào)】1009—8097(2010)05—0106—04
引言
探索影響英語(yǔ)閱讀能力的各種因素及其關(guān)系是英語(yǔ)閱讀教學(xué)的一個(gè)重要環(huán)節(jié),結(jié)合語(yǔ)料庫(kù)與結(jié)構(gòu)方程模型的英語(yǔ)閱讀分析方法為研究這一問(wèn)題提供了可能。
近幾年來(lái),語(yǔ)料庫(kù)的相關(guān)研究[1,2]已經(jīng)得到了快速發(fā)展,并成為語(yǔ)言學(xué)實(shí)證研究[3,4]的一個(gè)重要手段。文中,語(yǔ)料庫(kù)將作為測(cè)試和驗(yàn)證的基礎(chǔ)輔助材料,采用結(jié)構(gòu)方程模型充分利用建好的語(yǔ)料庫(kù)建模與驗(yàn)證是核心。
結(jié)構(gòu)方程模型(Structural Equation Models,SEM),其主要的目的是驗(yàn)證潛在變量與觀測(cè)變量之間的關(guān)系。概念涉及因素分析、路徑分析、典型相關(guān)、判別分析、多元方差分析以及多元回歸分析等。Bock等[5]于1966年最早提出了驗(yàn)證性因素分析這一理論,后經(jīng)演變[6],使之成為一個(gè)更通用的模型,即協(xié)方差結(jié)構(gòu)方程模型,結(jié)構(gòu)方程模型可同時(shí)分析一組具有相互關(guān)系的方程式,這種可同時(shí)處理多組變量之間的關(guān)系的能力,有助于研究者開(kāi)展探索性分析和驗(yàn)證性分析[7]。
一 英語(yǔ)閱讀研究概述
通過(guò)對(duì)英語(yǔ)類(lèi)文章的信息加工形成可塑的閱讀模式,其本身包括了對(duì)詞匯、語(yǔ)句、段落和篇章的合理理解。英語(yǔ)閱讀以閱讀能力的培養(yǎng)和提高為重點(diǎn),根據(jù)閱讀對(duì)象的變化及時(shí)調(diào)整自己的閱讀方法。閱讀方法的調(diào)整并非易事,需要合理的理論方法結(jié)合實(shí)踐來(lái)驗(yàn)證,SEM能夠?yàn)榻鉀Q這一問(wèn)題帶來(lái)方便。
針對(duì)于英語(yǔ)閱讀的教學(xué)特點(diǎn)和目前學(xué)習(xí)者參與考核的現(xiàn)狀,本文以SEM與基礎(chǔ)型語(yǔ)料庫(kù)為依據(jù)建立有效的英語(yǔ)閱讀訓(xùn)練方法,采用結(jié)構(gòu)方程模型,對(duì)英語(yǔ)閱讀理解認(rèn)知、個(gè)體遇到的阻礙因素進(jìn)行統(tǒng)計(jì)研究,以期能為英語(yǔ)閱讀理解提供更為全面的有效方法和科學(xué)依據(jù)。
二 研究方法
1 英語(yǔ)閱讀語(yǔ)料收集
本文將1999年至2008年非英語(yǔ)專(zhuān)業(yè)四、六級(jí)英語(yǔ)閱讀文本資料分類(lèi)整理,共收集閱讀材料160篇,從而構(gòu)建一個(gè)基礎(chǔ)型英語(yǔ)閱讀語(yǔ)料庫(kù)。
2 英語(yǔ)閱讀語(yǔ)料庫(kù)研究方法
本文采用Wordsmith Tools 5.0作為檢索工具,主要借助該檢索工具分析語(yǔ)料庫(kù)語(yǔ)篇文本的總體信息,如文本的形符數(shù)、長(zhǎng)詞數(shù)、句子長(zhǎng)度、被動(dòng)語(yǔ)態(tài)、從句結(jié)構(gòu)等,并間接獲取語(yǔ)料文本的復(fù)雜度信息和難易程度估計(jì)。
現(xiàn)以2005年6月大學(xué)英語(yǔ)六級(jí)試題第二篇閱讀理解為例來(lái)進(jìn)行基本的統(tǒng)計(jì)分析,利用Wordsmith Tools工具的WordList分析該語(yǔ)篇的基本信息如表1所示。
根據(jù)表1數(shù)據(jù)計(jì)算出該語(yǔ)篇的復(fù)雜度系數(shù)及難易程度估計(jì)系數(shù),對(duì)于所有語(yǔ)料進(jìn)行同類(lèi)操作之后將其數(shù)據(jù)編入基礎(chǔ)型英語(yǔ)閱讀語(yǔ)料庫(kù)復(fù)雜及難易程度表中,以便于在后續(xù)SEM中觀測(cè)變量中使用。
3 研究變量分析
本文首先圍繞學(xué)習(xí)者信息獲取水平、語(yǔ)料庫(kù)中語(yǔ)篇復(fù)雜度和學(xué)習(xí)者情感因素三個(gè)方面展開(kāi)。由于學(xué)習(xí)者的英語(yǔ)閱讀水平實(shí)際上是無(wú)法直接觀測(cè)的,只有通過(guò)適當(dāng)?shù)目捎^測(cè)變量加以反映,才能將代表學(xué)習(xí)者真實(shí)的閱讀水平體現(xiàn)出來(lái),這里采用表2所示的可觀測(cè)變量來(lái)反映其內(nèi)涵。
表2中信息獲取水平依賴(lài)的觀測(cè)變量這樣劃分是有一定依據(jù)的,不過(guò)更為詳細(xì)和完善的劃分還需要更多更好的實(shí)驗(yàn)作支撐,加拿大學(xué)者F. Smith[8]指出:“閱讀的技巧實(shí)際上在于盡量少用眼睛,當(dāng)我們成為熟練的讀者時(shí)(接觸過(guò)),我們就學(xué)會(huì)了較多地依靠已有的知識(shí)(背景知識(shí)程度)、依靠我們的頭腦(智力程度)而較少地依賴(lài)于文字符號(hào)”。
在上表2中設(shè)計(jì)的三組潛變量后對(duì)應(yīng)的觀測(cè)變量均需要通過(guò)相應(yīng)的測(cè)試或工具度量而進(jìn)行量化,所有的觀測(cè)變量均采用十分制統(tǒng)計(jì)。測(cè)試成績(jī)是測(cè)試對(duì)象隨機(jī)從語(yǔ)料庫(kù)中抽出語(yǔ)篇答完題之后的真實(shí)成績(jī),語(yǔ)篇不重復(fù)抽取。
4 結(jié)構(gòu)方程模型的語(yǔ)料庫(kù)研究
結(jié)構(gòu)方程模型由測(cè)量模型和結(jié)構(gòu)模型兩部分組成,測(cè)量模型主要用于表示觀測(cè)變量與潛變量之間的關(guān)系,而結(jié)構(gòu)方程模型主要用于表示潛變量之間的關(guān)系。其相應(yīng)的統(tǒng)計(jì)分析軟件主要有SPSS結(jié)合AMOS、LISREL,本文采用AMOS 18.0進(jìn)行數(shù)值統(tǒng)計(jì)和驗(yàn)證分析。結(jié)合本文的研究,從以下四個(gè)方面闡述SEM的建模過(guò)程。
(1)模型設(shè)定
結(jié)構(gòu)方程模型由測(cè)量模型和結(jié)構(gòu)模型兩部分構(gòu)成:對(duì)于顯變量與潛變量間的關(guān)系,即測(cè)量模型部分;對(duì)于潛在變量之間的關(guān)系,即結(jié)構(gòu)模型部分。根據(jù)已有的研究成果設(shè)定模型的內(nèi)部變量結(jié)構(gòu)關(guān)系,并通過(guò)抽取的數(shù)據(jù)對(duì)模型所有路徑系數(shù)的總體參數(shù)進(jìn)行估計(jì)。為了便于繪制模型的結(jié)構(gòu)圖,本文采用AMOS Graphics進(jìn)行建模(如圖1),AMOS Graphics提供了完全圖形化的操作界面,用戶(hù)友好且易于操作,在結(jié)構(gòu)模型路徑圖中,觀測(cè)變量在AMOS Graphics結(jié)構(gòu)模型路徑圖中用正方形或長(zhǎng)方形來(lái)表示,潛在變量用圓形或橢圓形表示;對(duì)別的變量產(chǎn)生影響的變量稱(chēng)作外生變量,而受到別的變量影響的變量稱(chēng)作內(nèi)生變量;用單箭頭直線表示假設(shè)一個(gè)變量對(duì)另一個(gè)變量產(chǎn)生影響,而用雙箭頭曲線表示假設(shè)兩個(gè)變量之間未必有因果關(guān)系的相關(guān)。模型建好之后,通過(guò)抽樣數(shù)據(jù)對(duì)模型所有路徑系數(shù)的總體參數(shù)進(jìn)行估計(jì)。
(2)模型估計(jì)
通過(guò)上面設(shè)定的模型,現(xiàn)在可以根據(jù)觀測(cè)變量的方差協(xié)方差對(duì)模型中的參數(shù)進(jìn)行估計(jì)。在結(jié)構(gòu)方程模型的參數(shù)估計(jì)過(guò)程中,常使用極大似然估計(jì)法(Maximum Likelihood, ML)進(jìn)行參數(shù)的估計(jì)。其實(shí),觀測(cè)變量的方差協(xié)方差矩陣是一套參數(shù)的函數(shù),在結(jié)構(gòu)方程中,包含了固定參數(shù)及自由參數(shù),通過(guò)ML估計(jì)使得方差協(xié)方差矩陣中每一個(gè)元素都盡可能地接近樣本觀測(cè)變量的方差協(xié)方差矩陣中相應(yīng)的元素。
(3)模型檢驗(yàn)
模型檢驗(yàn)是檢驗(yàn)結(jié)構(gòu)模型在多大程度上擬合了數(shù)據(jù),也即模型擬合優(yōu)度的檢驗(yàn),并為后續(xù)模型參數(shù)的修正提供依據(jù)。在建立各種統(tǒng)計(jì)模型或數(shù)學(xué)模型時(shí),常會(huì)遇到模型擬合優(yōu)度不高的問(wèn)題,這個(gè)時(shí)候也不必為迎合統(tǒng)計(jì)數(shù)值結(jié)果改掉模型,而是要考慮整個(gè)系統(tǒng)的理論框架是否在實(shí)踐中有效,在實(shí)踐檢驗(yàn)中適用就可以了。
檢驗(yàn)?zāi)P蛿M合度指標(biāo)有擬合優(yōu)度指數(shù)(Goodness-of-fit index,GFI)、調(diào)整的擬合優(yōu)度指數(shù)(Adjusted-goodness-of-fit index,AGFI)、比較擬合指數(shù)(Comparative fit index,CFI)等形式,模型擬合度檢驗(yàn)本身是一個(gè)相對(duì)復(fù)雜的問(wèn)題,一般認(rèn)為GFI、AGFI、CFI的值在0~1之間,其值越趨近于1,表明整體模型擬合度越好。在AMOS Graphics結(jié)構(gòu)模型中,常采用卡方(Chi-square)值、擬合指數(shù)(Fit indices)、標(biāo)準(zhǔn)殘差值(Standardized residuals,RMSEA)等對(duì)結(jié)構(gòu)模型的擬合情況進(jìn)行判斷。AMOS Graphics通過(guò)計(jì)算估計(jì)工具可以對(duì)模型參數(shù)估計(jì)進(jìn)行計(jì)算,當(dāng)計(jì)算完成后,再通過(guò)查閱報(bào)表可以查閱參數(shù)估計(jì)結(jié)果。
(4)模型修正
如果擬合指數(shù)沒(méi)有達(dá)到可接受的水平或者需要對(duì)某種理論進(jìn)行修正,我們就要對(duì)已有的結(jié)構(gòu)模型進(jìn)行修正,對(duì)其中變量之間的關(guān)系重新設(shè)定。AMOS本身提供了輸出修正指數(shù)(Modification indices)的功能,我們可以通過(guò)修正指數(shù)來(lái)判斷需要修正模型中的哪些變量關(guān)系。通過(guò)AMOS工具欄中View的Analysis Properties按鈕,在對(duì)話窗口中選擇Output標(biāo)簽,并勾選Modification indices,AMOS的輸出結(jié)果將包含修正指數(shù)內(nèi)容。
三 應(yīng)用結(jié)果分析
實(shí)際應(yīng)用測(cè)試過(guò)程分為三步,首先了解樣本數(shù)據(jù)的描述性統(tǒng)計(jì)量,為了直觀反映各個(gè)內(nèi)生觀測(cè)變量的分布情況,先計(jì)算其描述性統(tǒng)計(jì)量,在SPSS軟件中直接通過(guò)分析項(xiàng)中的描述統(tǒng)計(jì)工具獲取統(tǒng)計(jì)信息,并利用分析項(xiàng)中的可靠性分析度量計(jì)算克朗巴哈α系數(shù)(如表3所示)。從表3可知,其值均大于0.7,表明觀測(cè)變量的三類(lèi)研究的信度可以接受。
其次,通過(guò)上述在AMOS Graphic結(jié)構(gòu)方程模型中建好的模型,在導(dǎo)入數(shù)據(jù)后可以進(jìn)一步對(duì)模型參數(shù)進(jìn)行估算,然后進(jìn)行模型檢驗(yàn)。單擊工具欄中的“Calculate estimates”按鈕,AMOS即開(kāi)始模型參數(shù)估計(jì)計(jì)算。計(jì)算完成后,單擊“View text”按鈕,查看模型檢驗(yàn)結(jié)果。根據(jù)AMOS報(bào)告的該研究各項(xiàng)擬合指數(shù),發(fā)現(xiàn)該模型數(shù)據(jù)擬合并不理想(見(jiàn)表4)。
這里參照AMOS提供的模型修正指數(shù)對(duì)模型進(jìn)行修正,修正指數(shù)報(bào)表見(jiàn)表5。
根據(jù)表5,一共有四組誤差之間修正指數(shù)值顯著高于其他修正指數(shù),分別是(e10<-->e11)、(e5<-->e5)、(e2<-->e12)和(e9<-->e10),這表明它們之間具有顯著相關(guān)關(guān)系,因此可以利用雙箭頭曲線將這四組誤差連接來(lái)修正模型,修正后的結(jié)果如圖2所示,其中圖2(a)為非標(biāo)準(zhǔn)化結(jié)果,而圖2(b)為標(biāo)準(zhǔn)化結(jié)果。
最后,再次驗(yàn)證對(duì)修正后的模型,實(shí)驗(yàn)結(jié)果表明,該模型中各指標(biāo)在潛變量上有很好的負(fù)載,路徑系數(shù)均達(dá)到顯著水平,修正后的模型擬合指數(shù)達(dá)到了可以接受的水平(如表6所示)。這一顯著擬合的模型表明將英語(yǔ)閱讀能力的影響因素按照該模型表示是合理的,并進(jìn)一步闡明了其內(nèi)在的實(shí)質(zhì)和存在的關(guān)系。其中,CMIN/DF表示差異與自由度的比值,IFI表示增量適合度指標(biāo),TLI表示Tucker-Lewis指標(biāo),CFI表示比較適合度指標(biāo),RMSEA表示平均平方誤差平方根。
Byrne[9]在1994年提出了一種SEM擬合指數(shù)的標(biāo)準(zhǔn),表7為其中的部分?jǐn)M合指數(shù)的標(biāo)準(zhǔn)參數(shù)。
事實(shí)上,SEM擬合指數(shù)的基本要求只是個(gè)經(jīng)驗(yàn)性的參考值,并非硬性指標(biāo),沒(méi)有哪個(gè)指標(biāo)是最重要的,要想確定模型與數(shù)據(jù)是否擬合,主要看絕大多數(shù)擬合指數(shù)是否接近或者達(dá)到基本標(biāo)準(zhǔn)。從表6結(jié)合表7的數(shù)據(jù)中可以看出,CMIN/DF 為1.166,CFI、RMSEA均滿(mǎn)足指標(biāo),模型擬合度令人滿(mǎn)意。因此,可以認(rèn)為該模型能較好地解釋語(yǔ)篇復(fù)雜度、學(xué)習(xí)者獲取信息水平和學(xué)習(xí)者情感因素三者之間的關(guān)系。
圖2(b)的分析結(jié)果顯示,信息獲取水平的因素負(fù)荷量依次為0.93、0.87、0.60、0.90、0.82、0.72,其表達(dá)了各自的相對(duì)影響力。語(yǔ)篇復(fù)雜度的新概念多少的標(biāo)準(zhǔn)回歸系數(shù)是0.22,標(biāo)準(zhǔn)回歸系數(shù)表示預(yù)測(cè)變量改變一個(gè)單位因變量的改變單位量。圖2(b)標(biāo)準(zhǔn)化結(jié)果的回歸系數(shù)是一個(gè)無(wú)量綱數(shù)值,其絕對(duì)值小于1,大于零為正相關(guān),小于零為負(fù)相關(guān),絕對(duì)值越接近1相關(guān)性越好,越接近零相關(guān)性越差,絕對(duì)值小于等于0.4為弱相關(guān),0.4到0.8之間為中等相關(guān),大于0.8為強(qiáng)相關(guān),這里的結(jié)果反映情感因素與學(xué)習(xí)者信息獲取水平呈強(qiáng)相關(guān),而語(yǔ)篇復(fù)雜度與學(xué)習(xí)者信息獲取水平呈弱負(fù)相關(guān),語(yǔ)篇復(fù)雜度與情感因素也呈弱負(fù)相關(guān)。
四 結(jié)束語(yǔ)
本文將語(yǔ)料庫(kù)分析與結(jié)構(gòu)方程模型的基本理論結(jié)合起來(lái)應(yīng)用于英語(yǔ)閱讀可能存在的問(wèn)題進(jìn)行實(shí)質(zhì)性探索,以其期得出其所受影響的因素及其存在的關(guān)系。首先從語(yǔ)料庫(kù)入手,整理并按類(lèi)按難易程度等因素入庫(kù),并將其作為學(xué)習(xí)者獲取信息水平的一項(xiàng)重要指標(biāo);然后建立結(jié)構(gòu)方程模型,找出基本能概括影響英語(yǔ)閱讀水平的三項(xiàng)潛在變量及其相對(duì)應(yīng)的觀測(cè)變量;最后驗(yàn)證所建立的結(jié)構(gòu)方程模型合理。
總之,將語(yǔ)料庫(kù)與結(jié)構(gòu)方程模型應(yīng)用于英語(yǔ)閱讀這一領(lǐng)域尚屬初步探索,其它易于影響該模型的因素還需進(jìn)一步研究,不管怎樣,有了SEM和ERC的前期研究,一定會(huì)得到更多研究者的注意,同時(shí)推動(dòng)該研究領(lǐng)域的發(fā)展。
參考文獻(xiàn)
[1] Hanna Skorczynska Sznajder. A corpus-based evaluation of metaphors in a business English textbook English for Specific Purposes[J].2010,29(1):30-42.
[2] Greg Kessler. Virtual business: An Enron email corpus study.[J].Journal of Pragmatics.2010, 42(1):262-270.
[3] Anna Trebits. The most frequent phrasal verbs in English language EU documents – A corpus-based analysis and its implications. System[J].2009, 37(3):470-481.
[4] 劉曉玲,劉鑫鑫.基于語(yǔ)料庫(kù)的大學(xué)生書(shū)面語(yǔ)詞塊結(jié)構(gòu)類(lèi)型和語(yǔ)用功能研究[J].中國(guó)外語(yǔ), 2009, 6(2):48-53.
[5] Bock, R. Bargmann,R.Analysis of covariance structures. [J].Psychometrika.1966, 31(4):507-534.
[6] Nian-Sheng Tang, Xing Chen, Ying-Zi Fu. Bayesian analysis of non-linear structural equation models with non-ignorable missing outcomes from reproductive dispersion models. Journal of Multivariate Analysis[J]. 2009, 100(9):2031-2043.
[7] 文秋芳.“作文內(nèi)容”的構(gòu)念效度研究—運(yùn)用結(jié)構(gòu)方程軟件AMOS 5的嘗試[J].外語(yǔ)研究, 2007, (3):66-71.
[8] Smith.F. Understanding Reading—A Psycholinguistic Analysis of Reading and Learning to Read. Second Edition, Holt, Rinehartand Winston.1978, 82:9.
[9] Barbara M. Byrne, Structural Equation Modeling with EQS and EQS-Windows: Basic Concepts, Applications, and Programming, Sage Publications, Inc., Thousand Oaks, CA, [D].1994.