中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量研究
——以L2SCA和D-level Analyzer為工具

2016-06-22 07:36:09張麗麗

廣西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版) 2016年2期

張麗麗

(1.貴州大學(xué) 外國(guó)語(yǔ)學(xué)院，貴州貴陽(yáng) 550025；2. 浙江大學(xué) 外國(guó)語(yǔ)學(xué)院，浙江杭州 310058)

中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量研究

——以L2SCA和D-level Analyzer為工具

張麗麗1,2

(1.貴州大學(xué) 外國(guó)語(yǔ)學(xué)院，貴州貴陽(yáng) 550025；2. 浙江大學(xué) 外國(guó)語(yǔ)學(xué)院，浙江杭州 310058)

[摘要]以L2SCA(二語(yǔ)句法復(fù)雜度分析器)和D-level Analyzer(句法發(fā)展水平分析器)為工具，對(duì)某省高校間英語(yǔ)寫作競(jìng)賽作文語(yǔ)料進(jìn)行句法復(fù)雜度的自動(dòng)測(cè)量實(shí)驗(yàn)研究，所測(cè)15個(gè)指標(biāo)中有4項(xiàng)顯示與作文整體得分相關(guān)。作文句法復(fù)雜度人工分組單因素方差分析發(fā)現(xiàn)，議論文10個(gè)指標(biāo)、記敘文7個(gè)指標(biāo)呈顯著差異，工具對(duì)于議論文體裁的測(cè)量表現(xiàn)總體優(yōu)于記敘文。研究結(jié)果證實(shí)，體裁是影響中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度的重要因素。絕大部分指標(biāo)測(cè)量值表現(xiàn)為組間線性發(fā)展趨勢(shì)，數(shù)據(jù)分析結(jié)果顯示支持L2SCA和D-level Analyzer用作中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量工具。

[關(guān)鍵詞]句法復(fù)雜度；自動(dòng)測(cè)量；EFL；二語(yǔ)作文

二語(yǔ)句法復(fù)雜度研究始于20世紀(jì)70年代，至今已積累各種測(cè)量指標(biāo)40有余，但由于語(yǔ)料、方法以及指標(biāo)定義差別等原因，有關(guān)各指標(biāo)的測(cè)量效度，此前多項(xiàng)研究結(jié)果不一致。進(jìn)入21世紀(jì)，國(guó)外興起開(kāi)發(fā)或借助計(jì)算工具對(duì)大規(guī)模語(yǔ)料進(jìn)行一次性多個(gè)指標(biāo)測(cè)量的研究，有效避免了上述因素造成的研究結(jié)果不具可比性的問(wèn)題。相比之下，國(guó)內(nèi)相關(guān)研究大都停留在手工測(cè)量階段，缺乏采用自動(dòng)工具的嘗試性研究。

鑒于此，本文介紹兩種句法復(fù)雜度測(cè)量專門工具——L2SCA(L2 syntactic complexity analyzer)和D-level Analyzer①*[收稿日期] 2015-10-25[基金項(xiàng)目] 貴州省教育廳高校人文社科研究項(xiàng)目“大學(xué)英語(yǔ)多媒體教學(xué)策略整合研究”(11ZC037)[作者簡(jiǎn)介] 張麗麗(1974- )，女，貴州湄潭人，貴州大學(xué)副教授，浙江大學(xué)博士研究生，研究方向：語(yǔ)料庫(kù)語(yǔ)言學(xué)、二語(yǔ)習(xí)得。①兩項(xiàng)測(cè)量工具均由美國(guó)賓夕法尼亞州立大學(xué)應(yīng)用語(yǔ)言系陸小飛開(kāi)發(fā)。下載網(wǎng)址：http://www.personal.psu.edu/xxl13/downloads(Syntactic developmental level analyzer)，報(bào)告其應(yīng)用于某省高校間英語(yǔ)作文競(jìng)賽語(yǔ)料句法復(fù)雜度測(cè)量研究的結(jié)果，希望對(duì)國(guó)內(nèi)本領(lǐng)域相關(guān)研究發(fā)揮一些拋磚引玉的作用。

一、研究背景

句法是決定語(yǔ)言輸出形式的重要方面，是決定語(yǔ)言總體水平和質(zhì)量的基礎(chǔ)，一直是二語(yǔ)習(xí)得領(lǐng)域的研究熱點(diǎn)。句法復(fù)雜度，又稱句法復(fù)雜性或句法成熟度，被定義為 “語(yǔ)言產(chǎn)出形式的范圍和形式復(fù)雜化的程度”，[1][2]主要考查句法的變化和結(jié)構(gòu)的復(fù)雜性。[3]

句法復(fù)雜度指標(biāo)大致可分為兩類，即以T單位*T單位是一個(gè)句子能夠被縮減、表達(dá)完整意義的最短單位，包括一個(gè)主句及它所附帶的任何從句。最初Hunt(1965)用于研究?jī)和刚Z(yǔ)句法復(fù)雜度，后被廣泛用于二語(yǔ)句法復(fù)雜度研究。為代表的表層指標(biāo)和以名詞短語(yǔ)結(jié)構(gòu)為代表的深層指標(biāo)。由于深層指標(biāo)的測(cè)量計(jì)算不如表層指標(biāo)直觀便捷，研究者們使用的二語(yǔ)常用指標(biāo)以表層指標(biāo)為主，缺乏對(duì)深層指標(biāo)的測(cè)量研究，對(duì)語(yǔ)料整體句法結(jié)構(gòu)等級(jí)的量化研究幾近為零。

目前國(guó)外句法復(fù)雜度研究領(lǐng)域興起自動(dòng)測(cè)量研究，并漸成風(fēng)尚。[4][5][6]自動(dòng)測(cè)量克服了以往由于人工和時(shí)間成本太高、研究廣度受限的不足，但國(guó)內(nèi)相關(guān)研究大都停留在手工測(cè)量階段集中于英語(yǔ)專業(yè)學(xué)習(xí)者議論文語(yǔ)料，未見(jiàn)針對(duì)中國(guó)EFL學(xué)習(xí)者整體、對(duì)多種體裁語(yǔ)料進(jìn)行的研究。[2][7][8][9][10][11]

大數(shù)據(jù)時(shí)代，研究者可以輕松建立自己的語(yǔ)料庫(kù)，通往國(guó)外語(yǔ)料庫(kù)也只需幾次鏈接，但材料和工具缺一不可。如今國(guó)外學(xué)者紛紛借助計(jì)算機(jī)帶來(lái)的先進(jìn)研究方法捷足先登，在二語(yǔ)習(xí)得多個(gè)研究領(lǐng)域游刃有余，包括句法復(fù)雜度測(cè)量研究。國(guó)內(nèi)公開(kāi)發(fā)表的學(xué)術(shù)論文已有利用Coh-Metrix進(jìn)行的研究，但重點(diǎn)都不在句法復(fù)雜度研究。[12][13][14][15]此外，Coh-Metrix是以語(yǔ)篇連貫和詞匯指標(biāo)為主，意在文本易讀性測(cè)量，句法復(fù)雜度指標(biāo)主要有句長(zhǎng)、主動(dòng)詞前單詞數(shù)、否定表達(dá)密度和句子句法相似度等?？梢?jiàn)，除句長(zhǎng)以外，均非嚴(yán)格意義上的句法復(fù)雜度指標(biāo)，因此，不適于用作專門句法復(fù)雜度測(cè)量工具。

除Coh-Metrix以外，可用于句法復(fù)雜度自動(dòng)測(cè)量的工具還有MacWhinney 開(kāi)發(fā)的CLAN(Computerized Language Analysis Program)[16]，Long et al.開(kāi)發(fā)的Computerized Profiling[17]，但句法復(fù)雜度測(cè)量在上述工具中都不占主要地位，所以該功能的使用通常較為復(fù)雜。相比之下，L2SCA和D-level Analyzer專注于句法復(fù)雜度測(cè)量，近年來(lái)在國(guó)外相關(guān)研究中表現(xiàn)出色；[4][5][6][18][19][20]國(guó)內(nèi)未見(jiàn)運(yùn)用上述兩種工具開(kāi)展的相關(guān)研究。

二、工具介紹及相關(guān)研究

(一) L2SCA

L2SCA是Lu在兩位學(xué)者的研究成果[1][3]基礎(chǔ)上自主開(kāi)發(fā)的二語(yǔ)句法復(fù)雜度測(cè)量工具，集成5類、共14個(gè)常用指標(biāo)(見(jiàn)表1)。[5]兩位學(xué)者綜合比較了共40余項(xiàng)二語(yǔ)寫作研究結(jié)果，“盡管已是十年前，但即便今天也足以代表二語(yǔ)或外語(yǔ)研究者們所使用的大部分句法復(fù)雜度測(cè)量指標(biāo)”。[21]

表1　L2SCA所測(cè)句法復(fù)雜度指標(biāo)信息

測(cè)量指標(biāo)所涉概念均采用開(kāi)發(fā)者使用的定義[21]，其重要概念簡(jiǎn)單介紹如下：

小句(Clause)：任何帶有一個(gè)主語(yǔ)和一個(gè)限定性謂語(yǔ)動(dòng)詞的結(jié)構(gòu)，包括獨(dú)立句，形容詞性、副詞性或名詞性子句，不包括非限定性動(dòng)詞短語(yǔ)。

復(fù)雜T單位(Complex T-unit)：有一個(gè)或多個(gè)從句的T單位。

并列短語(yǔ)(Coordinate phrase)：僅限并列形容詞短語(yǔ)、名詞短語(yǔ)或動(dòng)詞短語(yǔ)。

復(fù)雜名詞性短語(yǔ)(Complex nominal)：被形容詞、物主代詞、介詞詞組、定語(yǔ)從句或分詞所修飾的名詞；帶有同位語(yǔ)的名詞；名詞性小句；充當(dāng)主語(yǔ)的動(dòng)名詞或不定式。

動(dòng)詞短語(yǔ)(Verb phrase)：限定性或非限定性動(dòng)詞短語(yǔ)。

L2SCA基于Stanford Parser*斯坦福大學(xué)自然語(yǔ)言處理研究所于2003年研制開(kāi)發(fā)的句法分析器；下載網(wǎng)址：http://nlp.stanford.edu/software/lex-parser.shtml。自動(dòng)句法標(biāo)注技術(shù)，內(nèi)置有斷句、分詞、詞性賦碼等程序，使用方便，無(wú)需對(duì)文本進(jìn)行預(yù)處理，以純文本格式輸入即可。在類UNIX操作系統(tǒng)下，用命令行方式運(yùn)行，除UNIX外, 還適用于Linux和Mac OS等操作系統(tǒng)。

L2SCA自動(dòng)計(jì)算9個(gè)語(yǔ)言單位的頻數(shù)：?jiǎn)卧~、句子、子句、從句、T單位、復(fù)雜 T單位、并列詞組、復(fù)雜名詞性短語(yǔ)、動(dòng)詞短語(yǔ)，以此為依據(jù)計(jì)算14個(gè)指標(biāo)測(cè)量值。工具使用效度報(bào)告稱語(yǔ)言單位識(shí)別準(zhǔn)確率達(dá)83%-100%，自動(dòng)測(cè)量與人工測(cè)量相關(guān)度達(dá)83.4%-94.1%，系統(tǒng)可靠。[21]每篇作文14個(gè)指標(biāo)的人工時(shí)間成本報(bào)告約2小時(shí)，而L2SCA的速度，不計(jì)前期處理時(shí)間，每秒大約400個(gè)平均長(zhǎng)度14詞的句子，相當(dāng)于20多篇作文。[5]經(jīng)研究者試驗(yàn)，實(shí)際處理平均長(zhǎng)度500詞的作文時(shí)間不超過(guò)10秒/篇。

就本文研究者所知，L2SCA是目前最高效的二語(yǔ)句法復(fù)雜度測(cè)量工具，但其開(kāi)發(fā)者同時(shí)指出，該系統(tǒng)是針對(duì)二語(yǔ)高級(jí)學(xué)習(xí)者句法研究設(shè)計(jì)，不能應(yīng)用于有大量語(yǔ)法錯(cuò)誤、不規(guī)范嵌套結(jié)構(gòu)或不完整句子的語(yǔ)料，如初級(jí)學(xué)習(xí)者語(yǔ)料。[21]Lu的研究語(yǔ)料也取自WECCL 1.0英語(yǔ)專業(yè)大學(xué)生作文。[6]使用該工具的另兩項(xiàng)研究，一項(xiàng)以TOEFL iBT為語(yǔ)料[19]，另一項(xiàng)測(cè)量口語(yǔ)，僅以其測(cè)量值為參照，檢驗(yàn)另一測(cè)量方法的效果。[20]目前未見(jiàn)L2SCA用于有少量語(yǔ)法錯(cuò)誤的二語(yǔ)作文測(cè)量，標(biāo)點(diǎn)、大小寫、單詞拼寫、限定詞、單復(fù)數(shù)、主謂一致、搭配等語(yǔ)法錯(cuò)誤不會(huì)影響分析結(jié)果。

(二)D-level analyzer

從表1可見(jiàn)，L2SCA測(cè)量指標(biāo)大都從傳統(tǒng)單位入手，如單詞、句子、T單位、子句，3項(xiàng)深層指標(biāo)觸及復(fù)雜名詞短語(yǔ)和動(dòng)詞短語(yǔ)密度，但并未做到對(duì)句子結(jié)構(gòu)模式的量化，因此，L2SCA仍然只是對(duì)表層結(jié)構(gòu)的測(cè)量，我們需要深入句子結(jié)構(gòu)內(nèi)部的測(cè)量，D-level analyzer(以下簡(jiǎn)稱D分析器)可以幫助我們嘗試。

D分析器原本用于兒童語(yǔ)言句法發(fā)展水平測(cè)量，將其用于二語(yǔ)測(cè)量實(shí)驗(yàn)主要有如下幾點(diǎn)考慮：1)二語(yǔ)句法復(fù)雜度測(cè)量研究，源自對(duì)母語(yǔ)的相關(guān)研究，既然兩者采用同樣的表層測(cè)量單位(如句子、T單位和子句等)，也可以采用同樣的深層測(cè)量單位；2)雖然二語(yǔ)習(xí)得與兒童語(yǔ)言習(xí)得遵循不同的發(fā)展規(guī)律，但本研究焦點(diǎn)不在習(xí)得發(fā)展，而是該工具能否區(qū)分不同句法復(fù)雜度語(yǔ)料；3)國(guó)內(nèi)學(xué)者曾指出，我國(guó)英語(yǔ)學(xué)習(xí)者造句水平還停留在語(yǔ)言學(xué)習(xí)初級(jí)階段[22]，桂詩(shī)春先生更認(rèn)為我們的學(xué)生在寫口語(yǔ)[23]。

D分析器的測(cè)量基準(zhǔn)是D-level Scale——兒童語(yǔ)言習(xí)得發(fā)展量表，最初由Rosenberg & Abbeduto提出，后經(jīng)Covington等學(xué)者進(jìn)一步完善 (見(jiàn)表2)，被認(rèn)為是“目前使用的唯一基于習(xí)得的句子復(fù)雜度量表”[4]。因此，D分析器學(xué)習(xí)者語(yǔ)料測(cè)量所得值并非對(duì)應(yīng)其二語(yǔ)習(xí)得水平，但可以大致對(duì)應(yīng)母語(yǔ)為英語(yǔ)者的不同年齡階段。

表2　Covington et al. (2006) 兒童語(yǔ)言習(xí)得發(fā)展量表(修訂版)

D分析器不計(jì)算文本表面指標(biāo)，而是根據(jù)句子結(jié)構(gòu)分類，每個(gè)句子對(duì)應(yīng)一個(gè)等級(jí)值，最后綜合所有句子得出樣本均值,代碼為ML。D分析器的實(shí)驗(yàn)報(bào)告稱對(duì)來(lái)自CHILDES和賓州樹(shù)庫(kù)華爾街日?qǐng)?bào)語(yǔ)料測(cè)量準(zhǔn)確率分別高達(dá)93.2%和94%，實(shí)驗(yàn)結(jié)果顯示4-5歲兒童語(yǔ)言句法結(jié)構(gòu)均值為1.156，測(cè)量值與兒童年齡相關(guān)系數(shù)為0.648。[4]D分析器的使用相對(duì)L2SCA較為復(fù)雜，語(yǔ)料須經(jīng)Stanford POS tagger*斯坦福大學(xué)自然語(yǔ)言處理研究所于2004年研制開(kāi)發(fā)的詞性賦碼器;下載網(wǎng)址：http://nlp.stanford.edu/software/lex-parser.shtml。賦碼后，用Collins’Parser*Collins, M. 1999年在賓夕法尼亞州州立大學(xué)為寫作博士論文而開(kāi)發(fā)的自然語(yǔ)言句法分析統(tǒng)計(jì)模型。進(jìn)行句法標(biāo)注,之后才能交由D分析器處理。輸出結(jié)果除樣本均值外，還有0-7各級(jí)結(jié)構(gòu)所含句子數(shù)量。

三、研究設(shè)計(jì)

(一) 研究對(duì)象

所用語(yǔ)料為某省高校間英語(yǔ)寫作大賽決賽作文，不限專業(yè)、層次，49名學(xué)生兩小時(shí)內(nèi)電腦輸入完成兩種體裁寫作各一篇，得到98篇作文語(yǔ)料。5位作文閱卷經(jīng)驗(yàn)豐富的教師參與了評(píng)分，其中1名是英語(yǔ)為母語(yǔ)的外籍教師。評(píng)委按如下比例用百分制打分：思想內(nèi)容(40%)、寫作技巧(30%)、語(yǔ)言質(zhì)量(30%)，去掉最高分和最低分，取其余三個(gè)分?jǐn)?shù)平均分為作文整體質(zhì)量最終得分。

本研究?jī)H關(guān)注句法復(fù)雜度測(cè)量，因此，為避免學(xué)生計(jì)算機(jī)操作不熟而導(dǎo)致“問(wèn)題”語(yǔ)料，對(duì)數(shù)據(jù)結(jié)果造成影響，研究者對(duì)語(yǔ)料作了預(yù)處理，統(tǒng)一文本輸入格式，包括全半角等技術(shù)問(wèn)題，標(biāo)點(diǎn)、大小寫、單詞拼寫等不影響句法測(cè)量結(jié)果的錯(cuò)誤被糾正。

檢驗(yàn)工具的測(cè)量效度是本研究的重要內(nèi)容，須關(guān)注工具對(duì)語(yǔ)料句法復(fù)雜度的識(shí)別效能。作文得分受諸多因素影響，不能作為檢驗(yàn)工具效能的唯一參照。因此，研究者根據(jù)主觀經(jīng)驗(yàn)判斷，將預(yù)處理后的兩種體裁語(yǔ)料分別按句法復(fù)雜度歸入高、中、低3組；有爭(zhēng)議的作文經(jīng)討論后達(dá)成一致，最終議論文各組份數(shù)為17、21、11，記敘文各組份數(shù)為17、17、15。

(二)研究問(wèn)題

本研究主要回答以下問(wèn)題：

1) 中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量數(shù)據(jù)結(jié)果呈現(xiàn)什么特點(diǎn)？哪些測(cè)量值與作文質(zhì)量相關(guān)？

2) 體裁因素對(duì)中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度的影響如何？哪些指標(biāo)測(cè)量值在高、中、低3組間呈顯著差異？?jī)煞N體裁結(jié)果是否一致？

(三) 研究方法

用SPSS 20.0對(duì)15個(gè)指標(biāo)測(cè)量值與作文整體得分作皮爾遜相關(guān)分析；以體裁為變量，對(duì)15個(gè)指標(biāo)測(cè)量值作均值差異顯著性分析；控制體裁變量，分別對(duì)議論文和記敘文高、中、低3組測(cè)量值進(jìn)行描述統(tǒng)計(jì)及ANOVA分析；對(duì)D分析器1-7級(jí)測(cè)量值進(jìn)行描述統(tǒng)計(jì)及組間ANOVA分析。

四、研究結(jié)果與討論

所有數(shù)據(jù)分析結(jié)果見(jiàn)表3至表6。

表3　作文整體質(zhì)量與測(cè)量值皮爾遜相關(guān)分析結(jié)果

說(shuō)明：** 在 0.01 水平(雙側(cè))上顯著相關(guān)；* 在 0.05 水平(雙側(cè))上顯著相關(guān)。

15個(gè)句法復(fù)雜度測(cè)量值與作文整體得分的皮爾遜相關(guān)分析結(jié)果見(jiàn)表3，至少4個(gè)指標(biāo)表現(xiàn)為正相關(guān)：平均句長(zhǎng)MLS、子句密度C/S、復(fù)雜名詞密度CN/T和平均句法結(jié)構(gòu)等級(jí)ML，前兩項(xiàng)是表層指標(biāo)，后兩項(xiàng)是深層指標(biāo)。ML為 D分析器測(cè)量所得，相關(guān)系數(shù)最大，初步顯示支持D分析器在二語(yǔ)測(cè)量中的應(yīng)用。此前的研究大多顯示作文整體質(zhì)量與句法復(fù)雜度沒(méi)有統(tǒng)計(jì)意義上的相關(guān)關(guān)系[3]，本研究結(jié)果與之相反，證明作文整體得分與句法結(jié)構(gòu)確實(shí)存在關(guān)系，這一現(xiàn)象或與評(píng)分標(biāo)準(zhǔn)中“語(yǔ)言質(zhì)量”強(qiáng)調(diào)句法結(jié)構(gòu)多樣性和準(zhǔn)確性有關(guān)。該研究結(jié)果初步表明L2SCA的測(cè)量范圍不應(yīng)限于高級(jí)英語(yǔ)學(xué)習(xí)者語(yǔ)料。

表4　兩種體裁15個(gè)指標(biāo)描述統(tǒng)計(jì)與差異檢驗(yàn)結(jié)果

兩種體裁獨(dú)立樣本T檢驗(yàn)(見(jiàn)表4)發(fā)現(xiàn)，平均句子結(jié)構(gòu)等級(jí)值ML出現(xiàn)明顯差異，已超過(guò)1，說(shuō)明體裁對(duì)學(xué)習(xí)者句子結(jié)構(gòu)的影響非常大，與L2SCA測(cè)量結(jié)果一致，再次表明D分析器適用于二語(yǔ)句法復(fù)雜度測(cè)量。L2SCA測(cè)量所得句法復(fù)雜度14個(gè)指標(biāo)，除C/S和T/S外，均呈顯著差異。Lu用L2SCA對(duì)中國(guó)英語(yǔ)專業(yè)學(xué)習(xí)者的作文開(kāi)展的同類研究發(fā)現(xiàn)T/S也呈顯著差異[6]；本研究中T/S指標(biāo)的體裁間差異檢驗(yàn)值為0.067，接近邊緣顯著，因此，兩項(xiàng)研究結(jié)果趨于一致，支持該工具用于中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度測(cè)量。研究結(jié)果再次證明子句密度指標(biāo)之一C/S對(duì)體裁變量不敏感，考慮其與作文質(zhì)量的相關(guān)關(guān)系，研究者認(rèn)為C/S不失為一個(gè)較穩(wěn)定的句法復(fù)雜度測(cè)量指標(biāo)。

鑒于對(duì)同一組數(shù)據(jù)進(jìn)行了15次重復(fù)測(cè)量，句法復(fù)雜度人工分組自動(dòng)測(cè)量值A(chǔ)NOVA分析(見(jiàn)表5)顯著水平調(diào)整為0.05/15≈0.003。兩種體裁均表現(xiàn)出顯著差異的4個(gè)指標(biāo)如下：平均句法結(jié)構(gòu)等級(jí)ML、平均句長(zhǎng)MLS、平均T單位長(zhǎng)MLT和復(fù)雜名詞密度CN/T，與表3分析結(jié)果相似，側(cè)面說(shuō)明句法復(fù)雜度與作文整體質(zhì)量得分的相關(guān)關(guān)系。

表5　句法復(fù)雜度人工分組組間測(cè)量值A(chǔ)NOVA分析結(jié)果

續(xù)表5

DC/C議論文0.4460.0880.3510.0720.3040.09111.3780.000記敘文0.3580.1120.3070.0900.2560.0914.2720.020DC/T議論文0.9520.4410.5950.1960.4950.2668.8970.001記敘文0.6760.4380.5000.2190.3850.1793.7250.032T/S議論文1.1100.1031.0630.0501.0880.0991.4800.238記敘文1.1190.1091.0950.0741.1470.1091.1390.329CT/T議論文0.5990.1320.4410.1050.3900.15211.3940.000記敘文0.4630.1300.3910.1450.3160.1224.8050.013CP/T議論文0.4970.2740.3520.1710.3560.3361.8000.177記敘文0.3510.1790.1710.0990.1610.1638.4020.001CP/C議論文0.2450.1360.2140.1080.2550.2920.2560.775記敘文0.1950.0850.1110.0640.1090.0916.2340.004CN/T議論文3.0111.5341.9120.4641.6280.8347.7580.001記敘文1.8231.0371.0120.3570.8810.3169.5610.000CN/C議論文1.4080.3561.1610.2841.0800.6932.4100.101記敘文0.9820.3150.6390.1740.6040.17613.2370.000

除上述4個(gè)指標(biāo)外，議論文另有6個(gè)、記敘文另有3個(gè)呈顯著差異，工具對(duì)議論文測(cè)量的整體表現(xiàn)優(yōu)于記敘文。此前對(duì)英語(yǔ)專業(yè)學(xué)習(xí)者的相關(guān)研究認(rèn)為單位長(zhǎng)度能較好地反映句法復(fù)雜度[2][10][24]，與本研究結(jié)論大致吻合。國(guó)內(nèi)手工測(cè)量關(guān)于常用單位密度指標(biāo)C/T和DC/C的研究結(jié)論不盡相同，鮑貴認(rèn)為兩指標(biāo)對(duì)不同句法復(fù)雜度區(qū)別力有限[2]，本研究結(jié)果支持秦曉晴、文秋芳和徐曉燕等的研究結(jié)論，認(rèn)為C/T和DC/C能有效區(qū)分中國(guó)EFL學(xué)習(xí)者議論文語(yǔ)料句法復(fù)雜度。[24] [10]

兩種體裁并列度指標(biāo)T/S及議論文另兩個(gè)并列度指標(biāo)CP/T和CP/C均呈非線性發(fā)展趨勢(shì)，句法復(fù)雜度中級(jí)組出現(xiàn)谷值，說(shuō)明用并列度指標(biāo)測(cè)量中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度效果不佳，與Lu的研究結(jié)論不合[6]；或因本研究語(yǔ)料取自競(jìng)賽語(yǔ)料，學(xué)習(xí)者經(jīng)過(guò)初賽選拔，大致處于同一句法習(xí)得水平，并列結(jié)構(gòu)的使用頻率和習(xí)慣趨于同質(zhì)性。

除上述3個(gè)指標(biāo)以外，其余各指標(biāo)雖未呈組間顯著差異，但均呈線性發(fā)展，Lu用L2SCA對(duì)英語(yǔ)專業(yè)學(xué)習(xí)者議論文進(jìn)行的同類研究也僅發(fā)現(xiàn)7個(gè)指標(biāo)呈顯著線性發(fā)展。[6]本研究議論文大部分指標(biāo)、記敘文近一半指標(biāo)呈顯著差異，研究結(jié)果支持兩種自動(dòng)測(cè)量工具對(duì)中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度研究的應(yīng)用。

D分析器測(cè)量結(jié)果(見(jiàn)表6)發(fā)現(xiàn)大部分句子落入0級(jí)和7級(jí)，其次是2、3、5級(jí)，這一結(jié)果與Lu對(duì)該工具的實(shí)驗(yàn)研究報(bào)告基本一致。[4]報(bào)告稱D分析器在識(shí)別0、1、3、5、7級(jí)結(jié)構(gòu)上面表現(xiàn)最佳，2級(jí)次之，4級(jí)和6級(jí)表現(xiàn)不佳。該工具對(duì)難以判定的中間等級(jí)結(jié)構(gòu)，處理方法是僅區(qū)分為簡(jiǎn)單句或復(fù)雜句，分別歸入0級(jí)或7級(jí)，所以本研究測(cè)量值呈兩極分化。另外，研究語(yǔ)料雖取自全省高校間寫作大賽，但競(jìng)賽條件下，學(xué)習(xí)者對(duì)較為復(fù)雜的句式使用回避策略，采用熟悉的簡(jiǎn)單句式也是導(dǎo)致相當(dāng)量的句子落入0級(jí)的原因之一。綜上所述，本研究顯示，D分析器對(duì)二語(yǔ)語(yǔ)料的測(cè)量實(shí)驗(yàn)效果總體令人滿意。

表 6　D分析器測(cè)量值組間描述統(tǒng)計(jì)數(shù)據(jù)

續(xù)表6

Level21171.531.62173.181.782211.671.28172.181.513111.271.35152.601.92Level31172.711.53173.062.112214.482.27173.411.803113.363.01152.672.23Level41170.350.61170.350.612210.670.91170.941.033110.450.93150.871.13Level51172.121.05172.181.632212.951.88172.411.423111.912.26151.931.16Level61170.590.87170.531.072210.901.09170.240.443110.550.69150.530.83Level711713.062.14178.412.9622111.103.03175.942.753117.003.44153.872.92ML1174.920.78173.741.072213.810.69172.840.803113.041.00152.380.86

組間ANOVA分析發(fā)現(xiàn)，議論文0級(jí)、7級(jí)和平均等級(jí)結(jié)構(gòu)值ML呈顯著差異，記敘文7級(jí)和ML呈顯著差異。高級(jí)組的中間等級(jí)結(jié)構(gòu)測(cè)量值大都居中，而中級(jí)組卻往往出現(xiàn)峰值，這并非表明中級(jí)組句法復(fù)雜度強(qiáng)于高級(jí)組，而是印證了此前關(guān)于二語(yǔ)學(xué)習(xí)者句法發(fā)展次序的討論[3][22][25]，支持高水平學(xué)習(xí)者更多使用緊縮句的研究結(jié)論。[10]

五、結(jié)論

應(yīng)用兩種工具L2SCA和D分析器對(duì)中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量實(shí)驗(yàn)研究的結(jié)果顯示，15項(xiàng)測(cè)量指標(biāo)中有4項(xiàng)與作文質(zhì)量相關(guān)：平均句長(zhǎng)MLS、子句密度C/S、復(fù)雜名詞密度CN/T和平均句子結(jié)構(gòu)等級(jí)ML。兩種體裁獨(dú)立樣本T檢驗(yàn)結(jié)果發(fā)現(xiàn)，除C/S外，所有指標(biāo)均呈顯著或臨界顯著差異，體裁對(duì)學(xué)習(xí)者語(yǔ)料句法復(fù)雜度的影響非常明顯。句法復(fù)雜度人工分組的單因素方差分析顯示，議論文10個(gè)指標(biāo)、記敘文7個(gè)指標(biāo)呈顯著差異，4項(xiàng)指標(biāo)出現(xiàn)交集：平均句法結(jié)構(gòu)等級(jí)ML、平均句長(zhǎng)MLS、平均T單位長(zhǎng)MLT和復(fù)雜名詞密度CN/T，與測(cè)量值和作文分?jǐn)?shù)相關(guān)分析的結(jié)果非常接近，側(cè)面說(shuō)明句法復(fù)雜度與作文整體質(zhì)量的相關(guān)關(guān)系。D分析器測(cè)量值顯示，句法復(fù)雜度高級(jí)組僅有最高等級(jí)(7級(jí))和平均句子結(jié)構(gòu)等級(jí)出現(xiàn)峰值，其余峰值大多出現(xiàn)于中級(jí)組，說(shuō)明高級(jí)學(xué)習(xí)者更多使用緊縮句，與此前的研究結(jié)論一致。如不考慮顯著水平，則除并列結(jié)構(gòu)指標(biāo)以外，組間所有指標(biāo)測(cè)量值均呈線性發(fā)展趨勢(shì)。實(shí)驗(yàn)結(jié)果顯示兩種測(cè)量工具應(yīng)用于議論文測(cè)量的整體效果優(yōu)于記敘文，研究結(jié)果支持L2SCA和D分析器用作中國(guó)EFL學(xué)習(xí)者語(yǔ)料句法復(fù)雜度測(cè)量工具或二語(yǔ)句法復(fù)雜度測(cè)量工具。

[參考文獻(xiàn)]

[1]Ortega, L. Syntactic complexity measures and their relationship to L2 proficiency: A research synthesis of college-level L2 writing[J].Applied Linguistics, 2003(24):492.

[2]鮑貴.英語(yǔ)學(xué)習(xí)者作文句法復(fù)雜性變化研究[J].外語(yǔ)教學(xué)與研究，2009(4):291-297.

[3]Wolfe-Quintero, K., Inagaki S. & H. Y. Kim. Second Language Development in Writing: Measures of Fluency, Accuracy, and Complexity[M].Honolulu:University of Hawaii Press,1998:69-73.

[4]Lu, X. Automatic measurement of syntactic complexity in child language acquisition[J]. International Journal of Corpus Linguistics,2009(14): 3-28.

[5]Lu, X. Automatic analysis of syntactic complexity in second language writing[J].International Journal of Corpus Linguistics, 2010(15): 474-496.

[6]Lu, X. A corpus-based evaluation of syntactic complexity measures as indices of college-level ESL writers’ language development[J].TESOL Quarterly ,2011(45):36-62.

[7]紀(jì)小凌.英語(yǔ)學(xué)習(xí)者書面語(yǔ)發(fā)展研究[J].現(xiàn)代外語(yǔ)，2009(2):178-185.

[8]鮑貴.英語(yǔ)學(xué)習(xí)者語(yǔ)言復(fù)雜性變化對(duì)比研究[J].現(xiàn)代外語(yǔ)，2010(2):166-176.

[9]曾祥敏.英語(yǔ)專業(yè)學(xué)生限時(shí)作文與平時(shí)作文句法復(fù)雜性之比較[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)，2011(5): 69-74.

[10]趙俊海,陳慧媛.英語(yǔ)學(xué)習(xí)者書面語(yǔ)語(yǔ)法復(fù)雜度的測(cè)量研究[J].外語(yǔ)教學(xué)理論與實(shí)踐，2012(1): 27-32.

[11]徐曉燕,王維民,等.中國(guó)英語(yǔ)專業(yè)學(xué)生英語(yǔ)議論文句法復(fù)雜性研究[J].外語(yǔ)教學(xué)與研究，2013(2): 264-275.

[12]梁茂成.學(xué)習(xí)者書面語(yǔ)語(yǔ)篇連貫性的研究[J].現(xiàn)代外語(yǔ),2006(3): 284.

[13]桂林.基于計(jì)算機(jī)評(píng)估的L1和L2語(yǔ)言詞匯水平對(duì)比研究[J].外語(yǔ)教學(xué)與研究，2010(6): 445.

[14]鮑貴.不同課程水平英語(yǔ)學(xué)習(xí)者詞匯復(fù)雜性研究[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)，2011(2): 55.

[15]杜慧穎,蔡金亭.基于Coh-Metrix的中國(guó)英語(yǔ)學(xué)習(xí)者議論文寫作質(zhì)量預(yù)測(cè)模型研究[J].現(xiàn)代外語(yǔ)，2013(3): 293.

[16]MacWhinney, B. The CHILDES Project: Tools for Analyzing Talk[CP].Mahwah NJ: Lawrence Erlbaum Associates, 2000.

[17]Long, S. H., Fey M. E. & R. W. Channell. Computerized Profiling (Version 9.7.0)[CP]. Cleve- land, OH: Case Western Reserve University, 2008.

[18]Steven, L., Thorne I. F. & X. Lu. The semiotic ecology and linguistic complexity of an online game world[J].ReCALL, 2012(24):279-301.

[19]Yang, W., Lu X. & S. Weigle. Different topics, different discourse: Relationships among writing topic, measures of syntactic complexity, and judgments of writing quality[J].Journal of Second Language Writing, 2015(28):53-67.

[20]Bhat, S. & S.-Y. Yoon. Automatic assessment of syntactic complexity for spontaneous speech scoring[J].Speech Communication,2015(67):42-57.[21]Lu, X. Computational Methods for Corpus Annotation and Analysis[M].Dordrecht: Springer, 2014:95-142.

[22]徐曉燕,王維民,等.子句成分與名詞詞組成分——評(píng)測(cè)二語(yǔ)學(xué)習(xí)者英語(yǔ)句法復(fù)雜性的兩個(gè)新視角[J]. 中國(guó)外語(yǔ)教育，2014(2): 49-57.

[23]孫有中.英語(yǔ)專業(yè)寫作教學(xué)與思辨能力培養(yǎng)座談[J].外語(yǔ)教學(xué)與研究，2011(4)：605.

[24]秦曉晴,文秋芳.中國(guó)大學(xué)生英語(yǔ)寫作能力發(fā)展規(guī)律與特點(diǎn)研究[M].北京:中國(guó)社會(huì)科學(xué)出版社，2007:27-53.

[25]Biber, D., Gray B. & K. Poonpon. Should we use characteristics of conversation to measure grammatical complexity in L2 writing development?[J]. TESOL Quarterly ,2011(45): 5-35.

[責(zé)任編輯劉文俊]

Automatic Measurement of Syntactic Complexity for Chinese EFL Learners:L2SCA and D-level Analyzer as the Tools

ZHANG Li-li1,2

(1.School of Foreign Languages,Guizhou University, Guiyang 550025; 2. School of International Studies,Zhejiang University, Hangzhou 310058, China)

Abstract:This article reports the experimental automatic measurement for syntactic complexity of L2 written data from a provincial between-college English writing contest with L2SCA and D-level analyzer as the tools. 4 out of the 15 indices are found related to holistic essay score. ANOVA analysis shows significant difference on 10 indices in argumentative essays and 7 in narrative ones, suggesting the tools’ general better performance on argumentative writing. It confirms that genre is an important factor influencing syntactic complexity for Chinese EFL learners. Almost all the indices present linear progression tendency, which shows the support of using L2SCA and D-level as tools for syntactic complexity measurement.

Key words:syntactic complexity; automatic measurement; Chinese EFL learners; L2 writing

doi:10.16088/j.issn.1001-6597.2016.02.019

[中圖分類號(hào)]H319

[文獻(xiàn)標(biāo)識(shí)碼]A

[文章編號(hào)]1001-6597(2016)02-0128-08

廣西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)2016年2期

廣西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)的其它文章: 民國(guó)時(shí)期留學(xué)生群體與中國(guó)比較教育學(xué)科的創(chuàng)建; 莎劇中的Paradox與Oxymoron比較研究*; 珠江
—西江經(jīng)濟(jì)帶經(jīng)濟(jì)重心偏移特征及區(qū)域經(jīng)濟(jì)差異研究; 珠江
—西江經(jīng)濟(jì)帶城市旅游結(jié)構(gòu)體系優(yōu)化研究; 珠江
—西江經(jīng)濟(jì)帶城鎮(zhèn)化協(xié)調(diào)度分析; 雙重史觀的透視：拉鐵摩爾的中國(guó)邊疆研究

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量研究——以L2SCA和D-level Analyzer為工具

中國(guó)EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量研究
——以L2SCA和D-level Analyzer為工具