——以L2SCA和D-level Analyzer為工具"/>

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中國EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量研究
        ——以L2SCA和D-level Analyzer為工具

        2016-06-22 07:36:09張麗麗

        張麗麗

        (1.貴州大學(xué) 外國語學(xué)院,貴州 貴陽 550025;2. 浙江大學(xué) 外國語學(xué)院,浙江 杭州 310058)

        中國EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量研究

        ——以L2SCA和D-level Analyzer為工具

        張麗麗1,2

        (1.貴州大學(xué) 外國語學(xué)院,貴州 貴陽 550025;2. 浙江大學(xué) 外國語學(xué)院,浙江 杭州 310058)

        [摘要]以L2SCA(二語句法復(fù)雜度分析器)和D-level Analyzer(句法發(fā)展水平分析器)為工具,對(duì)某省高校間英語寫作競(jìng)賽作文語料進(jìn)行句法復(fù)雜度的自動(dòng)測(cè)量實(shí)驗(yàn)研究,所測(cè)15個(gè)指標(biāo)中有4項(xiàng)顯示與作文整體得分相關(guān)。作文句法復(fù)雜度人工分組單因素方差分析發(fā)現(xiàn),議論文10個(gè)指標(biāo)、記敘文7個(gè)指標(biāo)呈顯著差異,工具對(duì)于議論文體裁的測(cè)量表現(xiàn)總體優(yōu)于記敘文。研究結(jié)果證實(shí),體裁是影響中國EFL學(xué)習(xí)者句法復(fù)雜度的重要因素。絕大部分指標(biāo)測(cè)量值表現(xiàn)為組間線性發(fā)展趨勢(shì),數(shù)據(jù)分析結(jié)果顯示支持L2SCA和D-level Analyzer用作中國EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量工具。

        [關(guān)鍵詞]句法復(fù)雜度;自動(dòng)測(cè)量;EFL;二語作文

        二語句法復(fù)雜度研究始于20世紀(jì)70年代,至今已積累各種測(cè)量指標(biāo)40有余,但由于語料、方法以及指標(biāo)定義差別等原因,有關(guān)各指標(biāo)的測(cè)量效度,此前多項(xiàng)研究結(jié)果不一致。進(jìn)入21世紀(jì),國外興起開發(fā)或借助計(jì)算工具對(duì)大規(guī)模語料進(jìn)行一次性多個(gè)指標(biāo)測(cè)量的研究,有效避免了上述因素造成的研究結(jié)果不具可比性的問題。相比之下,國內(nèi)相關(guān)研究大都停留在手工測(cè)量階段,缺乏采用自動(dòng)工具的嘗試性研究。

        鑒于此,本文介紹兩種句法復(fù)雜度測(cè)量專門工具——L2SCA(L2 syntactic complexity analyzer)和D-level Analyzer①*[收稿日期] 2015-10-25[基金項(xiàng)目] 貴州省教育廳高校人文社科研究項(xiàng)目“大學(xué)英語多媒體教學(xué)策略整合研究”(11ZC037)[作者簡(jiǎn)介] 張麗麗(1974- ),女,貴州湄潭人,貴州大學(xué)副教授,浙江大學(xué)博士研究生,研究方向:語料庫語言學(xué)、二語習(xí)得。①兩項(xiàng)測(cè)量工具均由美國賓夕法尼亞州立大學(xué)應(yīng)用語言系陸小飛開發(fā)。下載網(wǎng)址:http://www.personal.psu.edu/xxl13/downloads(Syntactic developmental level analyzer),報(bào)告其應(yīng)用于某省高校間英語作文競(jìng)賽語料句法復(fù)雜度測(cè)量研究的結(jié)果,希望對(duì)國內(nèi)本領(lǐng)域相關(guān)研究發(fā)揮一些拋磚引玉的作用。

        一、研究背景

        句法是決定語言輸出形式的重要方面,是決定語言總體水平和質(zhì)量的基礎(chǔ),一直是二語習(xí)得領(lǐng)域的研究熱點(diǎn)。句法復(fù)雜度,又稱句法復(fù)雜性或句法成熟度,被定義為 “語言產(chǎn)出形式的范圍和形式復(fù)雜化的程度”,[1][2]主要考查句法的變化和結(jié)構(gòu)的復(fù)雜性。[3]

        句法復(fù)雜度指標(biāo)大致可分為兩類,即以T單位*T單位是一個(gè)句子能夠被縮減、表達(dá)完整意義的最短單位,包括一個(gè)主句及它所附帶的任何從句。最初Hunt(1965)用于研究兒童母語句法復(fù)雜度,后被廣泛用于二語句法復(fù)雜度研究。為代表的表層指標(biāo)和以名詞短語結(jié)構(gòu)為代表的深層指標(biāo)。由于深層指標(biāo)的測(cè)量計(jì)算不如表層指標(biāo)直觀便捷,研究者們使用的二語常用指標(biāo)以表層指標(biāo)為主,缺乏對(duì)深層指標(biāo)的測(cè)量研究,對(duì)語料整體句法結(jié)構(gòu)等級(jí)的量化研究幾近為零。

        目前國外句法復(fù)雜度研究領(lǐng)域興起自動(dòng)測(cè)量研究,并漸成風(fēng)尚。[4][5][6]自動(dòng)測(cè)量克服了以往由于人工和時(shí)間成本太高、研究廣度受限的不足,但國內(nèi)相關(guān)研究大都停留在手工測(cè)量階段集中于英語專業(yè)學(xué)習(xí)者議論文語料,未見針對(duì)中國EFL學(xué)習(xí)者整體、對(duì)多種體裁語料進(jìn)行的研究。[2][7][8][9][10][11]

        大數(shù)據(jù)時(shí)代,研究者可以輕松建立自己的語料庫,通往國外語料庫也只需幾次鏈接,但材料和工具缺一不可。如今國外學(xué)者紛紛借助計(jì)算機(jī)帶來的先進(jìn)研究方法捷足先登,在二語習(xí)得多個(gè)研究領(lǐng)域游刃有余,包括句法復(fù)雜度測(cè)量研究。國內(nèi)公開發(fā)表的學(xué)術(shù)論文已有利用Coh-Metrix進(jìn)行的研究,但重點(diǎn)都不在句法復(fù)雜度研究。[12][13][14][15]此外,Coh-Metrix是以語篇連貫和詞匯指標(biāo)為主,意在文本易讀性測(cè)量,句法復(fù)雜度指標(biāo)主要有句長、主動(dòng)詞前單詞數(shù)、否定表達(dá)密度和句子句法相似度等??梢姡溟L以外,均非嚴(yán)格意義上的句法復(fù)雜度指標(biāo),因此,不適于用作專門句法復(fù)雜度測(cè)量工具。

        除Coh-Metrix以外,可用于句法復(fù)雜度自動(dòng)測(cè)量的工具還有MacWhinney 開發(fā)的CLAN(Computerized Language Analysis Program)[16],Long et al.開發(fā)的Computerized Profiling[17],但句法復(fù)雜度測(cè)量在上述工具中都不占主要地位,所以該功能的使用通常較為復(fù)雜。相比之下,L2SCA和D-level Analyzer專注于句法復(fù)雜度測(cè)量,近年來在國外相關(guān)研究中表現(xiàn)出色;[4][5][6][18][19][20]國內(nèi)未見運(yùn)用上述兩種工具開展的相關(guān)研究。

        二、 工具介紹及相關(guān)研究

        (一) L2SCA

        L2SCA是Lu在兩位學(xué)者的研究成果[1][3]基礎(chǔ)上自主開發(fā)的二語句法復(fù)雜度測(cè)量工具,集成5類、共14個(gè)常用指標(biāo)(見表1)。[5]兩位學(xué)者綜合比較了共40余項(xiàng)二語寫作研究結(jié)果,“盡管已是十年前,但即便今天也足以代表二語或外語研究者們所使用的大部分句法復(fù)雜度測(cè)量指標(biāo)”。[21]

        表1 L2SCA所測(cè)句法復(fù)雜度指標(biāo)信息

        測(cè)量指標(biāo)所涉概念均采用開發(fā)者使用的定義[21],其重要概念簡(jiǎn)單介紹如下:

        小句(Clause):任何帶有一個(gè)主語和一個(gè)限定性謂語動(dòng)詞的結(jié)構(gòu),包括獨(dú)立句,形容詞性、副詞性或名詞性子句,不包括非限定性動(dòng)詞短語。

        復(fù)雜T單位(Complex T-unit):有一個(gè)或多個(gè)從句的T單位。

        并列短語(Coordinate phrase):僅限并列形容詞短語、名詞短語或動(dòng)詞短語。

        復(fù)雜名詞性短語(Complex nominal):被形容詞、物主代詞、介詞詞組、定語從句或分詞所修飾的名詞;帶有同位語的名詞;名詞性小句;充當(dāng)主語的動(dòng)名詞或不定式。

        動(dòng)詞短語(Verb phrase):限定性或非限定性動(dòng)詞短語。

        L2SCA基于Stanford Parser*斯坦福大學(xué)自然語言處理研究所于2003年研制開發(fā)的句法分析器;下載網(wǎng)址:http://nlp.stanford.edu/software/lex-parser.shtml。自動(dòng)句法標(biāo)注技術(shù),內(nèi)置有斷句、分詞、詞性賦碼等程序,使用方便,無需對(duì)文本進(jìn)行預(yù)處理,以純文本格式輸入即可。在類UNIX操作系統(tǒng)下,用命令行方式運(yùn)行,除UNIX外, 還適用于Linux和Mac OS等操作系統(tǒng)。

        L2SCA自動(dòng)計(jì)算9個(gè)語言單位的頻數(shù):?jiǎn)卧~、句子、子句、從句、T單位、復(fù)雜 T單位、并列詞組、復(fù)雜名詞性短語、動(dòng)詞短語,以此為依據(jù)計(jì)算14個(gè)指標(biāo)測(cè)量值。工具使用效度報(bào)告稱語言單位識(shí)別準(zhǔn)確率達(dá)83%-100%,自動(dòng)測(cè)量與人工測(cè)量相關(guān)度達(dá)83.4%-94.1%,系統(tǒng)可靠。[21]每篇作文14個(gè)指標(biāo)的人工時(shí)間成本報(bào)告約2小時(shí),而L2SCA的速度,不計(jì)前期處理時(shí)間,每秒大約400個(gè)平均長度14詞的句子,相當(dāng)于20多篇作文。[5]經(jīng)研究者試驗(yàn),實(shí)際處理平均長度500詞的作文時(shí)間不超過10秒/篇。

        就本文研究者所知,L2SCA是目前最高效的二語句法復(fù)雜度測(cè)量工具,但其開發(fā)者同時(shí)指出,該系統(tǒng)是針對(duì)二語高級(jí)學(xué)習(xí)者句法研究設(shè)計(jì),不能應(yīng)用于有大量語法錯(cuò)誤、不規(guī)范嵌套結(jié)構(gòu)或不完整句子的語料,如初級(jí)學(xué)習(xí)者語料。[21]Lu的研究語料也取自WECCL 1.0英語專業(yè)大學(xué)生作文。[6]使用該工具的另兩項(xiàng)研究,一項(xiàng)以TOEFL iBT為語料[19],另一項(xiàng)測(cè)量口語,僅以其測(cè)量值為參照,檢驗(yàn)另一測(cè)量方法的效果。[20]目前未見L2SCA用于有少量語法錯(cuò)誤的二語作文測(cè)量,標(biāo)點(diǎn)、大小寫、單詞拼寫、限定詞、單復(fù)數(shù)、主謂一致、搭配等語法錯(cuò)誤不會(huì)影響分析結(jié)果。

        (二)D-level analyzer

        從表1可見,L2SCA測(cè)量指標(biāo)大都從傳統(tǒng)單位入手,如單詞、句子、T單位、子句,3項(xiàng)深層指標(biāo)觸及復(fù)雜名詞短語和動(dòng)詞短語密度,但并未做到對(duì)句子結(jié)構(gòu)模式的量化,因此,L2SCA仍然只是對(duì)表層結(jié)構(gòu)的測(cè)量,我們需要深入句子結(jié)構(gòu)內(nèi)部的測(cè)量,D-level analyzer(以下簡(jiǎn)稱D分析器)可以幫助我們嘗試。

        D分析器原本用于兒童語言句法發(fā)展水平測(cè)量,將其用于二語測(cè)量實(shí)驗(yàn)主要有如下幾點(diǎn)考慮:1)二語句法復(fù)雜度測(cè)量研究,源自對(duì)母語的相關(guān)研究,既然兩者采用同樣的表層測(cè)量單位(如句子、T單位和子句等),也可以采用同樣的深層測(cè)量單位;2)雖然二語習(xí)得與兒童語言習(xí)得遵循不同的發(fā)展規(guī)律,但本研究焦點(diǎn)不在習(xí)得發(fā)展,而是該工具能否區(qū)分不同句法復(fù)雜度語料;3)國內(nèi)學(xué)者曾指出,我國英語學(xué)習(xí)者造句水平還停留在語言學(xué)習(xí)初級(jí)階段[22],桂詩春先生更認(rèn)為我們的學(xué)生在寫口語[23]。

        D分析器的測(cè)量基準(zhǔn)是D-level Scale——兒童語言習(xí)得發(fā)展量表,最初由Rosenberg & Abbeduto提出,后經(jīng)Covington等學(xué)者進(jìn)一步完善 (見表2),被認(rèn)為是“目前使用的唯一基于習(xí)得的句子復(fù)雜度量表”[4]。因此,D分析器學(xué)習(xí)者語料測(cè)量所得值并非對(duì)應(yīng)其二語習(xí)得水平,但可以大致對(duì)應(yīng)母語為英語者的不同年齡階段。

        表2 Covington et al. (2006) 兒童語言習(xí)得發(fā)展量表(修訂版)

        D分析器不計(jì)算文本表面指標(biāo),而是根據(jù)句子結(jié)構(gòu)分類,每個(gè)句子對(duì)應(yīng)一個(gè)等級(jí)值,最后綜合所有句子得出樣本均值,代碼為ML。D分析器的實(shí)驗(yàn)報(bào)告稱對(duì)來自CHILDES和賓州樹庫華爾街日?qǐng)?bào)語料測(cè)量準(zhǔn)確率分別高達(dá)93.2%和94%,實(shí)驗(yàn)結(jié)果顯示4-5歲兒童語言句法結(jié)構(gòu)均值為1.156,測(cè)量值與兒童年齡相關(guān)系數(shù)為0.648。[4]D分析器的使用相對(duì)L2SCA較為復(fù)雜,語料須經(jīng)Stanford POS tagger*斯坦福大學(xué)自然語言處理研究所于2004年研制開發(fā)的詞性賦碼器;下載網(wǎng)址:http://nlp.stanford.edu/software/lex-parser.shtml。賦碼后,用Collins’Parser*Collins, M. 1999年在賓夕法尼亞州州立大學(xué)為寫作博士論文而開發(fā)的自然語言句法分析統(tǒng)計(jì)模型。進(jìn)行句法標(biāo)注,之后才能交由D分析器處理。輸出結(jié)果除樣本均值外,還有0-7各級(jí)結(jié)構(gòu)所含句子數(shù)量。

        三、 研究設(shè)計(jì)

        (一) 研究對(duì)象

        所用語料為某省高校間英語寫作大賽決賽作文,不限專業(yè)、層次,49名學(xué)生兩小時(shí)內(nèi)電腦輸入完成兩種體裁寫作各一篇,得到98篇作文語料。5位作文閱卷經(jīng)驗(yàn)豐富的教師參與了評(píng)分,其中1名是英語為母語的外籍教師。評(píng)委按如下比例用百分制打分:思想內(nèi)容(40%)、寫作技巧(30%)、語言質(zhì)量(30%),去掉最高分和最低分,取其余三個(gè)分?jǐn)?shù)平均分為作文整體質(zhì)量最終得分。

        本研究僅關(guān)注句法復(fù)雜度測(cè)量,因此,為避免學(xué)生計(jì)算機(jī)操作不熟而導(dǎo)致“問題”語料,對(duì)數(shù)據(jù)結(jié)果造成影響,研究者對(duì)語料作了預(yù)處理,統(tǒng)一文本輸入格式,包括全半角等技術(shù)問題,標(biāo)點(diǎn)、大小寫、單詞拼寫等不影響句法測(cè)量結(jié)果的錯(cuò)誤被糾正。

        檢驗(yàn)工具的測(cè)量效度是本研究的重要內(nèi)容,須關(guān)注工具對(duì)語料句法復(fù)雜度的識(shí)別效能。作文得分受諸多因素影響,不能作為檢驗(yàn)工具效能的唯一參照。因此,研究者根據(jù)主觀經(jīng)驗(yàn)判斷,將預(yù)處理后的兩種體裁語料分別按句法復(fù)雜度歸入高、中、低3組;有爭(zhēng)議的作文經(jīng)討論后達(dá)成一致,最終議論文各組份數(shù)為17、21、11,記敘文各組份數(shù)為17、17、15。

        (二)研究問題

        本研究主要回答以下問題:

        1) 中國EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量數(shù)據(jù)結(jié)果呈現(xiàn)什么特點(diǎn)?哪些測(cè)量值與作文質(zhì)量相關(guān)?

        2) 體裁因素對(duì)中國EFL學(xué)習(xí)者句法復(fù)雜度的影響如何?哪些指標(biāo)測(cè)量值在高、中、低3組間呈顯著差異?兩種體裁結(jié)果是否一致?

        (三) 研究方法

        用SPSS 20.0對(duì)15個(gè)指標(biāo)測(cè)量值與作文整體得分作皮爾遜相關(guān)分析;以體裁為變量,對(duì)15個(gè)指標(biāo)測(cè)量值作均值差異顯著性分析;控制體裁變量,分別對(duì)議論文和記敘文高、中、低3組測(cè)量值進(jìn)行描述統(tǒng)計(jì)及ANOVA分析;對(duì)D分析器1-7級(jí)測(cè)量值進(jìn)行描述統(tǒng)計(jì)及組間ANOVA分析。

        四、 研究結(jié)果與討論

        所有數(shù)據(jù)分析結(jié)果見表3至表6。

        表3  作文整體質(zhì)量與測(cè)量值皮爾遜相關(guān)分析結(jié)果

        說明:** 在 0.01 水平(雙側(cè))上顯著相關(guān);* 在 0.05 水平(雙側(cè))上顯著相關(guān)。

        15個(gè)句法復(fù)雜度測(cè)量值與作文整體得分的皮爾遜相關(guān)分析結(jié)果見表3,至少4個(gè)指標(biāo)表現(xiàn)為正相關(guān):平均句長MLS、子句密度C/S、復(fù)雜名詞密度CN/T和平均句法結(jié)構(gòu)等級(jí)ML,前兩項(xiàng)是表層指標(biāo),后兩項(xiàng)是深層指標(biāo)。ML為 D分析器測(cè)量所得,相關(guān)系數(shù)最大,初步顯示支持D分析器在二語測(cè)量中的應(yīng)用。此前的研究大多顯示作文整體質(zhì)量與句法復(fù)雜度沒有統(tǒng)計(jì)意義上的相關(guān)關(guān)系[3],本研究結(jié)果與之相反,證明作文整體得分與句法結(jié)構(gòu)確實(shí)存在關(guān)系,這一現(xiàn)象或與評(píng)分標(biāo)準(zhǔn)中“語言質(zhì)量”強(qiáng)調(diào)句法結(jié)構(gòu)多樣性和準(zhǔn)確性有關(guān)。該研究結(jié)果初步表明L2SCA的測(cè)量范圍不應(yīng)限于高級(jí)英語學(xué)習(xí)者語料。

        表4  兩種體裁15個(gè)指標(biāo)描述統(tǒng)計(jì)與差異檢驗(yàn)結(jié)果

        兩種體裁獨(dú)立樣本T檢驗(yàn)(見表4)發(fā)現(xiàn),平均句子結(jié)構(gòu)等級(jí)值ML出現(xiàn)明顯差異,已超過1,說明體裁對(duì)學(xué)習(xí)者句子結(jié)構(gòu)的影響非常大,與L2SCA測(cè)量結(jié)果一致,再次表明D分析器適用于二語句法復(fù)雜度測(cè)量。L2SCA測(cè)量所得句法復(fù)雜度14個(gè)指標(biāo),除C/S和T/S外,均呈顯著差異。Lu用L2SCA對(duì)中國英語專業(yè)學(xué)習(xí)者的作文開展的同類研究發(fā)現(xiàn)T/S也呈顯著差異[6];本研究中T/S指標(biāo)的體裁間差異檢驗(yàn)值為0.067,接近邊緣顯著,因此,兩項(xiàng)研究結(jié)果趨于一致,支持該工具用于中國EFL學(xué)習(xí)者句法復(fù)雜度測(cè)量。研究結(jié)果再次證明子句密度指標(biāo)之一C/S對(duì)體裁變量不敏感,考慮其與作文質(zhì)量的相關(guān)關(guān)系,研究者認(rèn)為C/S不失為一個(gè)較穩(wěn)定的句法復(fù)雜度測(cè)量指標(biāo)。

        鑒于對(duì)同一組數(shù)據(jù)進(jìn)行了15次重復(fù)測(cè)量,句法復(fù)雜度人工分組自動(dòng)測(cè)量值A(chǔ)NOVA分析(見表5)顯著水平調(diào)整為0.05/15≈0.003。兩種體裁均表現(xiàn)出顯著差異的4個(gè)指標(biāo)如下:平均句法結(jié)構(gòu)等級(jí)ML、平均句長MLS、平均T單位長MLT和復(fù)雜名詞密度CN/T,與表3分析結(jié)果相似,側(cè)面說明句法復(fù)雜度與作文整體質(zhì)量得分的相關(guān)關(guān)系。

        表5 句法復(fù)雜度人工分組組間測(cè)量值A(chǔ)NOVA分析結(jié)果

        續(xù)表5

        DC/C議論文0.4460.0880.3510.0720.3040.09111.3780.000記敘文0.3580.1120.3070.0900.2560.0914.2720.020DC/T議論文0.9520.4410.5950.1960.4950.2668.8970.001記敘文0.6760.4380.5000.2190.3850.1793.7250.032T/S議論文1.1100.1031.0630.0501.0880.0991.4800.238記敘文1.1190.1091.0950.0741.1470.1091.1390.329CT/T議論文0.5990.1320.4410.1050.3900.15211.3940.000記敘文0.4630.1300.3910.1450.3160.1224.8050.013CP/T議論文0.4970.2740.3520.1710.3560.3361.8000.177記敘文0.3510.1790.1710.0990.1610.1638.4020.001CP/C議論文0.2450.1360.2140.1080.2550.2920.2560.775記敘文0.1950.0850.1110.0640.1090.0916.2340.004CN/T議論文3.0111.5341.9120.4641.6280.8347.7580.001記敘文1.8231.0371.0120.3570.8810.3169.5610.000CN/C議論文1.4080.3561.1610.2841.0800.6932.4100.101記敘文0.9820.3150.6390.1740.6040.17613.2370.000

        除上述4個(gè)指標(biāo)外,議論文另有6個(gè)、記敘文另有3個(gè)呈顯著差異,工具對(duì)議論文測(cè)量的整體表現(xiàn)優(yōu)于記敘文。此前對(duì)英語專業(yè)學(xué)習(xí)者的相關(guān)研究認(rèn)為單位長度能較好地反映句法復(fù)雜度[2][10][24],與本研究結(jié)論大致吻合。國內(nèi)手工測(cè)量關(guān)于常用單位密度指標(biāo)C/T和DC/C的研究結(jié)論不盡相同,鮑貴認(rèn)為兩指標(biāo)對(duì)不同句法復(fù)雜度區(qū)別力有限[2],本研究結(jié)果支持秦曉晴、文秋芳和徐曉燕等的研究結(jié)論,認(rèn)為C/T和DC/C能有效區(qū)分中國EFL學(xué)習(xí)者議論文語料句法復(fù)雜度。[24] [10]

        兩種體裁并列度指標(biāo)T/S及議論文另兩個(gè)并列度指標(biāo)CP/T和CP/C均呈非線性發(fā)展趨勢(shì),句法復(fù)雜度中級(jí)組出現(xiàn)谷值,說明用并列度指標(biāo)測(cè)量中國EFL學(xué)習(xí)者句法復(fù)雜度效果不佳,與Lu的研究結(jié)論不合[6];或因本研究語料取自競(jìng)賽語料,學(xué)習(xí)者經(jīng)過初賽選拔,大致處于同一句法習(xí)得水平,并列結(jié)構(gòu)的使用頻率和習(xí)慣趨于同質(zhì)性。

        除上述3個(gè)指標(biāo)以外,其余各指標(biāo)雖未呈組間顯著差異,但均呈線性發(fā)展,Lu用L2SCA對(duì)英語專業(yè)學(xué)習(xí)者議論文進(jìn)行的同類研究也僅發(fā)現(xiàn)7個(gè)指標(biāo)呈顯著線性發(fā)展。[6]本研究議論文大部分指標(biāo)、記敘文近一半指標(biāo)呈顯著差異,研究結(jié)果支持兩種自動(dòng)測(cè)量工具對(duì)中國EFL學(xué)習(xí)者句法復(fù)雜度研究的應(yīng)用。

        D分析器測(cè)量結(jié)果(見表6)發(fā)現(xiàn)大部分句子落入0級(jí)和7級(jí),其次是2、3、5級(jí),這一結(jié)果與Lu對(duì)該工具的實(shí)驗(yàn)研究報(bào)告基本一致。[4]報(bào)告稱D分析器在識(shí)別0、1、3、5、7級(jí)結(jié)構(gòu)上面表現(xiàn)最佳,2級(jí)次之,4級(jí)和6級(jí)表現(xiàn)不佳。該工具對(duì)難以判定的中間等級(jí)結(jié)構(gòu),處理方法是僅區(qū)分為簡(jiǎn)單句或復(fù)雜句,分別歸入0級(jí)或7級(jí),所以本研究測(cè)量值呈兩極分化。另外,研究語料雖取自全省高校間寫作大賽,但競(jìng)賽條件下,學(xué)習(xí)者對(duì)較為復(fù)雜的句式使用回避策略,采用熟悉的簡(jiǎn)單句式也是導(dǎo)致相當(dāng)量的句子落入0級(jí)的原因之一。綜上所述,本研究顯示,D分析器對(duì)二語語料的測(cè)量實(shí)驗(yàn)效果總體令人滿意。

        表 6 D分析器測(cè)量值組間描述統(tǒng)計(jì)數(shù)據(jù)

        續(xù)表6

        Level21171.531.62173.181.782211.671.28172.181.513111.271.35152.601.92Level31172.711.53173.062.112214.482.27173.411.803113.363.01152.672.23Level41170.350.61170.350.612210.670.91170.941.033110.450.93150.871.13Level51172.121.05172.181.632212.951.88172.411.423111.912.26151.931.16Level61170.590.87170.531.072210.901.09170.240.443110.550.69150.530.83Level711713.062.14178.412.9622111.103.03175.942.753117.003.44153.872.92ML1174.920.78173.741.072213.810.69172.840.803113.041.00152.380.86

        組間ANOVA分析發(fā)現(xiàn),議論文0級(jí)、7級(jí)和平均等級(jí)結(jié)構(gòu)值ML呈顯著差異,記敘文7級(jí)和ML呈顯著差異。高級(jí)組的中間等級(jí)結(jié)構(gòu)測(cè)量值大都居中,而中級(jí)組卻往往出現(xiàn)峰值,這并非表明中級(jí)組句法復(fù)雜度強(qiáng)于高級(jí)組,而是印證了此前關(guān)于二語學(xué)習(xí)者句法發(fā)展次序的討論[3][22][25],支持高水平學(xué)習(xí)者更多使用緊縮句的研究結(jié)論。[10]

        五、 結(jié)論

        應(yīng)用兩種工具L2SCA和D分析器對(duì)中國EFL學(xué)習(xí)者句法復(fù)雜度自動(dòng)測(cè)量實(shí)驗(yàn)研究的結(jié)果顯示,15項(xiàng)測(cè)量指標(biāo)中有4項(xiàng)與作文質(zhì)量相關(guān):平均句長MLS、子句密度C/S、復(fù)雜名詞密度CN/T和平均句子結(jié)構(gòu)等級(jí)ML。兩種體裁獨(dú)立樣本T檢驗(yàn)結(jié)果發(fā)現(xiàn),除C/S外,所有指標(biāo)均呈顯著或臨界顯著差異,體裁對(duì)學(xué)習(xí)者語料句法復(fù)雜度的影響非常明顯。句法復(fù)雜度人工分組的單因素方差分析顯示,議論文10個(gè)指標(biāo)、記敘文7個(gè)指標(biāo)呈顯著差異,4項(xiàng)指標(biāo)出現(xiàn)交集:平均句法結(jié)構(gòu)等級(jí)ML、平均句長MLS、平均T單位長MLT和復(fù)雜名詞密度CN/T,與測(cè)量值和作文分?jǐn)?shù)相關(guān)分析的結(jié)果非常接近,側(cè)面說明句法復(fù)雜度與作文整體質(zhì)量的相關(guān)關(guān)系。D分析器測(cè)量值顯示,句法復(fù)雜度高級(jí)組僅有最高等級(jí)(7級(jí))和平均句子結(jié)構(gòu)等級(jí)出現(xiàn)峰值,其余峰值大多出現(xiàn)于中級(jí)組,說明高級(jí)學(xué)習(xí)者更多使用緊縮句,與此前的研究結(jié)論一致。如不考慮顯著水平,則除并列結(jié)構(gòu)指標(biāo)以外,組間所有指標(biāo)測(cè)量值均呈線性發(fā)展趨勢(shì)。實(shí)驗(yàn)結(jié)果顯示兩種測(cè)量工具應(yīng)用于議論文測(cè)量的整體效果優(yōu)于記敘文,研究結(jié)果支持L2SCA和D分析器用作中國EFL學(xué)習(xí)者語料句法復(fù)雜度測(cè)量工具或二語句法復(fù)雜度測(cè)量工具。

        [參考文獻(xiàn)]

        [1]Ortega, L. Syntactic complexity measures and their relationship to L2 proficiency: A research synthesis of college-level L2 writing[J].Applied Linguistics, 2003(24):492.

        [2]鮑貴.英語學(xué)習(xí)者作文句法復(fù)雜性變化研究[J].外語教學(xué)與研究,2009(4):291-297.

        [3]Wolfe-Quintero, K., Inagaki S. & H. Y. Kim. Second Language Development in Writing: Measures of Fluency, Accuracy, and Complexity[M].Honolulu:University of Hawaii Press,1998:69-73.

        [4]Lu, X. Automatic measurement of syntactic complexity in child language acquisition[J]. International Journal of Corpus Linguistics,2009(14): 3-28.

        [5]Lu, X. Automatic analysis of syntactic complexity in second language writing[J].International Journal of Corpus Linguistics, 2010(15): 474-496.

        [6]Lu, X. A corpus-based evaluation of syntactic complexity measures as indices of college-level ESL writers’ language development[J].TESOL Quarterly ,2011(45):36-62.

        [7]紀(jì)小凌.英語學(xué)習(xí)者書面語發(fā)展研究[J].現(xiàn)代外語,2009(2):178-185.

        [8]鮑貴.英語學(xué)習(xí)者語言復(fù)雜性變化對(duì)比研究[J].現(xiàn)代外語,2010(2):166-176.

        [9]曾祥敏.英語專業(yè)學(xué)生限時(shí)作文與平時(shí)作文句法復(fù)雜性之比較[J].解放軍外國語學(xué)院學(xué)報(bào),2011(5): 69-74.

        [10]趙俊海,陳慧媛.英語學(xué)習(xí)者書面語語法復(fù)雜度的測(cè)量研究[J].外語教學(xué)理論與實(shí)踐,2012(1): 27-32.

        [11]徐曉燕,王維民,等.中國英語專業(yè)學(xué)生英語議論文句法復(fù)雜性研究[J].外語教學(xué)與研究,2013(2): 264-275.

        [12]梁茂成.學(xué)習(xí)者書面語語篇連貫性的研究[J].現(xiàn)代外語,2006(3): 284.

        [13]桂林.基于計(jì)算機(jī)評(píng)估的L1和L2語言詞匯水平對(duì)比研究[J].外語教學(xué)與研究,2010(6): 445.

        [14]鮑貴.不同課程水平英語學(xué)習(xí)者詞匯復(fù)雜性研究[J].解放軍外國語學(xué)院學(xué)報(bào),2011(2): 55.

        [15]杜慧穎,蔡金亭.基于Coh-Metrix的中國英語學(xué)習(xí)者議論文寫作質(zhì)量預(yù)測(cè)模型研究[J].現(xiàn)代外語,2013(3): 293.

        [16]MacWhinney, B. The CHILDES Project: Tools for Analyzing Talk[CP].Mahwah NJ: Lawrence Erlbaum Associates, 2000.

        [17]Long, S. H., Fey M. E. & R. W. Channell. Computerized Profiling (Version 9.7.0)[CP]. Cleve- land, OH: Case Western Reserve University, 2008.

        [18]Steven, L., Thorne I. F. & X. Lu. The semiotic ecology and linguistic complexity of an online game world[J].ReCALL, 2012(24):279-301.

        [19]Yang, W., Lu X. & S. Weigle. Different topics, different discourse: Relationships among writing topic, measures of syntactic complexity, and judgments of writing quality[J].Journal of Second Language Writing, 2015(28):53-67.

        [20]Bhat, S. & S.-Y. Yoon. Automatic assessment of syntactic complexity for spontaneous speech scoring[J].Speech Communication,2015(67):42-57.[21]Lu, X. Computational Methods for Corpus Annotation and Analysis[M].Dordrecht: Springer, 2014:95-142.

        [22]徐曉燕,王維民,等.子句成分與名詞詞組成分——評(píng)測(cè)二語學(xué)習(xí)者英語句法復(fù)雜性的兩個(gè)新視角[J]. 中國外語教育,2014(2): 49-57.

        [23]孫有中.英語專業(yè)寫作教學(xué)與思辨能力培養(yǎng)座談[J].外語教學(xué)與研究,2011(4):605.

        [24]秦曉晴,文秋芳.中國大學(xué)生英語寫作能力發(fā)展規(guī)律與特點(diǎn)研究[M].北京:中國社會(huì)科學(xué)出版社,2007:27-53.

        [25]Biber, D., Gray B. & K. Poonpon. Should we use characteristics of conversation to measure grammatical complexity in L2 writing development?[J]. TESOL Quarterly ,2011(45): 5-35.

        [責(zé)任編輯劉文俊]

        Automatic Measurement of Syntactic Complexity for Chinese EFL Learners:L2SCA and D-level Analyzer as the Tools

        ZHANG Li-li1,2

        (1.School of Foreign Languages,Guizhou University, Guiyang 550025; 2. School of International Studies,Zhejiang University, Hangzhou 310058, China)

        Abstract:This article reports the experimental automatic measurement for syntactic complexity of L2 written data from a provincial between-college English writing contest with L2SCA and D-level analyzer as the tools. 4 out of the 15 indices are found related to holistic essay score. ANOVA analysis shows significant difference on 10 indices in argumentative essays and 7 in narrative ones, suggesting the tools’ general better performance on argumentative writing. It confirms that genre is an important factor influencing syntactic complexity for Chinese EFL learners. Almost all the indices present linear progression tendency, which shows the support of using L2SCA and D-level as tools for syntactic complexity measurement.

        Key words:syntactic complexity; automatic measurement; Chinese EFL learners; L2 writing

        doi:10.16088/j.issn.1001-6597.2016.02.019

        [中圖分類號(hào)]H319

        [文獻(xiàn)標(biāo)識(shí)碼]A

        [文章編號(hào)]1001-6597(2016)02-0128-08

        国内国外日产一区二区| 老少交欧美另类| 亚洲区日韩精品中文字幕| 久久精品国产亚洲av高清蜜臀| 国产精品一区av在线| 亚洲av无码片vr一区二区三区| 久久久久亚洲av无码专区| 天天澡天天揉揉AV无码人妻斩| 亚洲精品美女中文字幕久久| 国产爆乳无码一区二区麻豆| 精品欧洲av无码一区二区三区| 日韩欧美国产亚洲中文| 国产精品精品| 精品中文字幕手机在线| 亚洲网站一区在线播放| 国产成人精品午夜视频| 欧美伊人久久大香线蕉在观 | 在线播放中文字幕一区二区三区| 自拍视频在线观看首页国产| 成人免费xxxxx在线观看| 波多野结衣av手机在线观看| 亚洲AV肉丝网站一区二区无码| 亚洲精品乱码久久麻豆| 九九九免费观看视频| 免费观看黄网站在线播放| 被欺辱的高贵人妻被中出| 伊人久久一区二区三区无码| 成人性生交c片免费看| 日本人妻免费在线播放| 久激情内射婷内射蜜桃人妖| 亚洲电影中文字幕| 国产一区精品二区三区四区| 美女张开腿黄网站免费| 免费无码成人av在线播放不卡| 亚洲人成网站在线播放小说| 日本一二三四区在线观看| 中文亚洲av片在线观看| 国产免费一级高清淫日本片| 麻豆av毛片在线观看| 国产精品永久久久久久久久久| 久久精品亚洲乱码伦伦中文|