亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

文本量化特征與漢譯英機(jī)評(píng)分?jǐn)?shù)的關(guān)系研究

2020-07-24 01:09:12西南交通大學(xué)希望學(xué)院益陽(yáng)廣播電視大學(xué)

外文研究 2020年1期

西南交通大學(xué)希望學(xué)院王建益陽(yáng)廣播電視大學(xué) 方舟

一、引言

國(guó)內(nèi)英語(yǔ)水平測(cè)試(如公共英語(yǔ)四、六級(jí)及英語(yǔ)專(zhuān)業(yè)八級(jí)考試)大多包括翻譯與寫(xiě)作兩種題型。然而，翻譯和寫(xiě)作測(cè)試最棘手的問(wèn)題就是分?jǐn)?shù)的評(píng)定，往往需要招募大批的人工評(píng)閱者參與評(píng)卷工作，而人工評(píng)閱往往費(fèi)時(shí)費(fèi)力，效率低下，成本偏高，且因其主觀(guān)性因素，人工評(píng)閱者無(wú)法嚴(yán)格地運(yùn)用同一把“尺子”衡量作文或譯文的質(zhì)量。(白麗芳、王建 2019)面對(duì)此類(lèi)問(wèn)題，自動(dòng)評(píng)閱工具應(yīng)運(yùn)而生。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展，主觀(guān)題的自動(dòng)評(píng)價(jià)在語(yǔ)言測(cè)試領(lǐng)域的運(yùn)用被越來(lái)越多的測(cè)評(píng)機(jī)構(gòu)及研究機(jī)構(gòu)所關(guān)注，成為近年來(lái)測(cè)試領(lǐng)域較為熱門(mén)的話(huà)題。(江進(jìn)林、文秋芳 2012；郭蕾 2019)

目前，針對(duì)寫(xiě)作的評(píng)分系統(tǒng)日趨成熟且運(yùn)用較廣。自動(dòng)作文評(píng)分系統(tǒng)的研究可追溯到20世紀(jì)60年代，最初旨在解決大規(guī)模考試的作文評(píng)分問(wèn)題，因此被稱(chēng)為AES(Automated Essay Scoring)系統(tǒng)，后來(lái)發(fā)展為AWE(Automated Writing Evaluation system)系統(tǒng)，被應(yīng)用到寫(xiě)作課堂。這些系統(tǒng)依托自然語(yǔ)言處理、人工智能及潛勢(shì)語(yǔ)義分析(latent semantic analysis)等技術(shù)的發(fā)展，模擬人工從量(分?jǐn)?shù))和質(zhì)(反饋)兩方面評(píng)閱作文，較之人工評(píng)閱者在及時(shí)性、高效性和客觀(guān)性等方面更有優(yōu)勢(shì)。(白麗芳、王建 2018)國(guó)外著名的評(píng)閱系統(tǒng)包括Criterion、My Access!及WritingRoad-map等(Dikli 2006)，國(guó)內(nèi)自主研發(fā)的句酷批改網(wǎng)、iWrite和冰果作文智能評(píng)閱系統(tǒng)等也已廣泛應(yīng)用于高校英語(yǔ)寫(xiě)作教學(xué)中。

國(guó)內(nèi)針對(duì)AWE或AES系統(tǒng)的相關(guān)研究較為全面，包括對(duì)系統(tǒng)原理的介紹(如陳瀟瀟、葛詩(shī)利 2008)、AWE模型的建立(如梁茂成 2005)、機(jī)器評(píng)分的效度研究(如白麗芳、王建 2018)及使用者對(duì)系統(tǒng)的認(rèn)知和自動(dòng)反饋研究(如Bai & Hu 2017)，這些研究對(duì)翻譯機(jī)器評(píng)分的研究具有借鑒意義。相比之下，翻譯自動(dòng)評(píng)分系統(tǒng)的研究十分匱乏、滯后，不過(guò)近年來(lái)部分研究者開(kāi)始關(guān)注此領(lǐng)域。下一節(jié)將對(duì)翻譯自動(dòng)評(píng)分的相關(guān)研究進(jìn)行概括和梳理。

二、翻譯自動(dòng)評(píng)分的相關(guān)研究概述

翻譯自動(dòng)評(píng)價(jià)的核心原理是比較譯文在句長(zhǎng)、用詞和詞序等方面與參考譯文間的匹配度，具有代表性的評(píng)價(jià)方法包括基于測(cè)試點(diǎn)的評(píng)價(jià)方法、基于句子相似度的方法(主要依據(jù)N元組模型)、完全匹配法和編輯距離法(劉芳華等 2013；王金銓、文秋芳 2010)。目前國(guó)內(nèi)外翻譯自動(dòng)評(píng)分仍處于探索階段，尚無(wú)成熟的、可用于評(píng)價(jià)大規(guī)模測(cè)試中人工譯文的自動(dòng)評(píng)分系統(tǒng)?？v觀(guān)國(guó)內(nèi)文獻(xiàn)，與該領(lǐng)域相關(guān)的研究熱點(diǎn)主要涉及以下3個(gè)方面：

1) 介紹：這一方面的相關(guān)研究主要回顧國(guó)外AWE系統(tǒng)所具備的特點(diǎn)和運(yùn)用的自動(dòng)評(píng)分技術(shù)(文秋芳等 2009)，關(guān)注AWE系統(tǒng)對(duì)開(kāi)發(fā)中國(guó)學(xué)生翻譯自動(dòng)評(píng)分系統(tǒng)的啟示，介紹國(guó)內(nèi)外翻譯自動(dòng)評(píng)分系統(tǒng)的發(fā)展與應(yīng)用(王金銓、文秋芳 2010；江進(jìn)林 2013；王金銓、朱周曄 2017)。

2) 評(píng)分模型構(gòu)建：一些研究探討了翻譯機(jī)評(píng)模型的構(gòu)建，包括英譯漢和漢譯英評(píng)分系統(tǒng)，但這些系統(tǒng)并未投入大規(guī)模使用。王金銓、文秋芳(2009)利用文本分析工具提取與譯文質(zhì)量相關(guān)的文本形式及語(yǔ)義特征項(xiàng)(具體的特征未見(jiàn)詳盡報(bào)道)，分別利用50篇、100篇和150篇譯文作為構(gòu)建模型的訓(xùn)練集。結(jié)果顯示，3種模型的人機(jī)評(píng)分高度相關(guān)(系數(shù)大于0.85)，說(shuō)明評(píng)分模型能較為準(zhǔn)確地預(yù)測(cè)中國(guó)英語(yǔ)二語(yǔ)學(xué)習(xí)者的漢譯英成績(jī)。江進(jìn)林、文秋芳(2012)以說(shuō)明文、記敘文及敘譯混合文3種文體各300篇譯文為訓(xùn)練集，提取學(xué)生譯文與參考譯文間的N元組匹配數(shù)量、詞對(duì)齊數(shù)量、評(píng)分點(diǎn)對(duì)齊數(shù)量及語(yǔ)義相似度等語(yǔ)義特征，構(gòu)建出來(lái)的英譯漢機(jī)評(píng)模型與人工評(píng)分高度一致，且評(píng)分效率更高。王金銓、朱周曄(2017)提取了3種不同文體(敘事文、說(shuō)明文和議論文)的學(xué)生譯文在詞匯、句子、篇章及語(yǔ)義層面的54個(gè)量化特征，構(gòu)建了性能良好的、適合中國(guó)英語(yǔ)二語(yǔ)學(xué)習(xí)者的漢譯英自動(dòng)評(píng)分系統(tǒng)。郭蕾(2019)設(shè)計(jì)了一種基于自然語(yǔ)言處理的英語(yǔ)翻譯計(jì)算機(jī)智能評(píng)分系統(tǒng)，結(jié)果表明：該系統(tǒng)實(shí)用性較強(qiáng)，且整體性能優(yōu)于傳統(tǒng)系統(tǒng)。

3) 機(jī)器評(píng)分信度研究：專(zhuān)門(mén)針對(duì)該方面的研究較少。田艷(2008)對(duì)一個(gè)名為YanFa的課程測(cè)試系統(tǒng)的評(píng)分信度進(jìn)行了研究，該自動(dòng)測(cè)評(píng)系統(tǒng)采用關(guān)鍵詞匹配技術(shù)對(duì)英譯漢文本進(jìn)行評(píng)分。該研究以人工方式構(gòu)建譯文數(shù)據(jù)庫(kù)，預(yù)先標(biāo)記所有評(píng)分點(diǎn)，同時(shí)為每個(gè)評(píng)分點(diǎn)搜集4個(gè)同義或近義的譯文。結(jié)果顯示，人機(jī)評(píng)分顯著相關(guān)，但機(jī)器分?jǐn)?shù)略高于人工分?jǐn)?shù)。

翻譯機(jī)器評(píng)價(jià)系統(tǒng)主要通過(guò)文本中的1到4元組來(lái)比較被測(cè)譯文和參考譯文之間的距離。(王金銓、文秋芳 2010)因此，從嚴(yán)格意義上來(lái)講，機(jī)器評(píng)價(jià)系統(tǒng)更偏重于意義的評(píng)測(cè)，因?yàn)镹元組的匹配率主要反映意義。然而，無(wú)論是在評(píng)價(jià)翻譯還是寫(xiě)作文本的質(zhì)量時(shí)，意義和形式都是不可分割的，不能偏廢其一。好的譯文除了應(yīng)忠實(shí)于原文，文本的語(yǔ)言質(zhì)量也十分關(guān)鍵，尤其是將漢語(yǔ)轉(zhuǎn)換為英語(yǔ)的過(guò)程中，語(yǔ)言的復(fù)雜性、流利性和準(zhǔn)確性將勢(shì)必影響譯文的質(zhì)量。所以，在構(gòu)建中國(guó)學(xué)生英語(yǔ)作文自動(dòng)評(píng)分模型時(shí)，梁茂成(2005)從語(yǔ)言、內(nèi)容和結(jié)構(gòu)3個(gè)方面衡量作文質(zhì)量，這對(duì)翻譯自動(dòng)評(píng)價(jià)系統(tǒng)的開(kāi)發(fā)有一定的啟示作用。

近年來(lái)，國(guó)內(nèi)自主研發(fā)的自動(dòng)評(píng)價(jià)系統(tǒng)也增加了翻譯服務(wù)。類(lèi)似于作文評(píng)閱，該系統(tǒng)不僅可以對(duì)譯文進(jìn)行及時(shí)評(píng)分，還提供詳細(xì)的反饋，提高了翻譯評(píng)閱效率，因此，許多高校一線(xiàn)教師通過(guò)該平臺(tái)發(fā)布翻譯任務(wù)，強(qiáng)化學(xué)生的練習(xí)。然而值得一提的是，開(kāi)發(fā)者并未對(duì)系統(tǒng)評(píng)閱譯文的過(guò)程進(jìn)行詳細(xì)說(shuō)明，比如系統(tǒng)是否從詞匯、句法、文章結(jié)構(gòu)或內(nèi)容等方面考察譯文質(zhì)量尚不得而知。因此，本文將利用語(yǔ)料庫(kù)研究工具Coh-Metrix分析英語(yǔ)二語(yǔ)學(xué)習(xí)者的譯文在詞匯、句法和篇章銜接等層面的量化特征值，推斷譯文量化特征與機(jī)器分?jǐn)?shù)的關(guān)系。

三、研究設(shè)計(jì)

(一)研究問(wèn)題

本研究擬回答的問(wèn)題如下：

1) 譯文在詞匯、句法及篇章銜接等層面的哪些量化特征與機(jī)評(píng)分?jǐn)?shù)相關(guān)？

2) 譯文量化特征對(duì)機(jī)評(píng)分?jǐn)?shù)是否具有預(yù)測(cè)能力？程度如何？

(二)語(yǔ)料選擇

本研究的研究語(yǔ)料來(lái)自西南某應(yīng)用型大學(xué)本科二年級(jí)3個(gè)教學(xué)班于國(guó)內(nèi)某自動(dòng)系統(tǒng)提交的一次漢譯英作業(yè)，內(nèi)容為某年英語(yǔ)四級(jí)真題，分值設(shè)置為15分，學(xué)生在系統(tǒng)上完成翻譯任務(wù)的時(shí)間為35分鐘，與英語(yǔ)四級(jí)考試時(shí)間相當(dāng)。因數(shù)據(jù)分析過(guò)程需要，要求學(xué)生根據(jù)系統(tǒng)的提示檢查拼寫(xiě)錯(cuò)誤再進(jìn)行提交，以最大程度地控制數(shù)據(jù)誤差(具體原因見(jiàn)下一節(jié))。最終獲得語(yǔ)料153篇，所有譯文的機(jī)器分?jǐn)?shù)都被導(dǎo)入Excel表中。

(三)研究工具及量化特征選取

Coh-Metrix是由美國(guó)孟菲斯大學(xué)McNamara等人研發(fā)的基于網(wǎng)絡(luò)的文本分析工具。目前，Coh-Metrix 3.0在線(xiàn)版本(http://www.cohmetrix.com/)借助CELEX數(shù)據(jù)庫(kù)、潛勢(shì)語(yǔ)義分析(Latent Semantic Analysis)、MRC(Medical Research Council)心理語(yǔ)言學(xué)數(shù)據(jù)庫(kù)、詞網(wǎng)(WordNet)、Charniak句法分析器等對(duì)106項(xiàng)描述性統(tǒng)計(jì)量及詞匯、句法和語(yǔ)篇銜接的淺層及深層語(yǔ)言量化特征進(jìn)行自動(dòng)分析。(杜慧穎、蔡金亭 2013；許家金 2016)

本研究去除Coh-Metrix計(jì)算的6項(xiàng)指標(biāo)，包括段落數(shù)、段落長(zhǎng)度及標(biāo)準(zhǔn)差、句子數(shù)和相鄰段落語(yǔ)義相似度平均數(shù)及標(biāo)準(zhǔn)差。首先，英語(yǔ)四級(jí)漢譯英試題篇幅通常為一個(gè)段落，故段落長(zhǎng)度與譯文長(zhǎng)度重合；其次，段落及句子數(shù)較為固定，對(duì)譯文的機(jī)器評(píng)分影響不大，因此，這幾項(xiàng)不作為研究的自變量。剩余量化特征包括詞匯、句法和語(yǔ)篇3個(gè)層面以及譯文長(zhǎng)度，共11個(gè)模塊100項(xiàng)特征(見(jiàn)表1)，利用Coh-Metrix 3.0自動(dòng)文本分析軟件進(jìn)行計(jì)算。為避免軟件將拼寫(xiě)錯(cuò)誤的單詞誤判為復(fù)雜詞或新詞，且本研究量化特征不涉及準(zhǔn)確性，除要求學(xué)生控制詞匯拼寫(xiě)錯(cuò)誤率外，筆者還進(jìn)行人工校對(duì)，將拼寫(xiě)錯(cuò)誤的單詞一一糾正。

表1 譯文量化指標(biāo)及數(shù)量

(四)統(tǒng)計(jì)分析

本研究利用SPSS 20.0分析所獲取的量化數(shù)據(jù)，具體的統(tǒng)計(jì)分析過(guò)程如下：1)任何與因變量(譯文機(jī)器分?jǐn)?shù))相關(guān)性不具有統(tǒng)計(jì)學(xué)意義(r<0.1)的指標(biāo)均被剔除，不做下一步分析(Kyle & Crossley 2015)； 2)相互高度相關(guān)(r≥0.8)的指標(biāo)被標(biāo)注，每個(gè)共線(xiàn)對(duì)中，與分?jǐn)?shù)相關(guān)性最高的指標(biāo)被保留，另一個(gè)被剔除(Tabachnick & Fidell 2001)；此外利用容差(tolerance)對(duì)剩余變量做多重共線(xiàn)性診斷分析，如果一個(gè)自變量的容差小于1-調(diào)整R2，則表明該自變量與其他變量存在多重共線(xiàn)性問(wèn)題，需要被剔除(許宏晨 2013)； 3)剩余指標(biāo)作為自變量，作文機(jī)器分?jǐn)?shù)作為因變量，進(jìn)行逐步回歸分析(stepwise regression analysis)，選擇p值小于0.05，決定系數(shù)調(diào)整R2最高、擬合優(yōu)度最高的模型。

四、結(jié)果及討論

(一)統(tǒng)計(jì)結(jié)果

在假設(shè)檢驗(yàn)中，71項(xiàng)指標(biāo)與作文分?jǐn)?shù)的相關(guān)性未能達(dá)到統(tǒng)計(jì)學(xué)上的意義(r絕對(duì)值<0.1)，因此被剔除，不做進(jìn)一步分析。相關(guān)分析結(jié)果顯示，29項(xiàng)指標(biāo)與機(jī)器分?jǐn)?shù)呈弱相關(guān)或中等相關(guān)，r絕對(duì)值介于0.100～0.420(見(jiàn)下頁(yè)表2)。17項(xiàng)指標(biāo)與譯文機(jī)器分?jǐn)?shù)間顯著相關(guān)，其他12項(xiàng)與分?jǐn)?shù)不顯著相關(guān)，但由于這12項(xiàng)與分?jǐn)?shù)的相關(guān)系數(shù)達(dá)到了統(tǒng)計(jì)學(xué)意義，故保留。其中機(jī)器分?jǐn)?shù)與名詞上義度平均數(shù)(r=0.420，p=0.000)、譯文長(zhǎng)度(r=0.406，p=0.000)相關(guān)性最高，呈顯著正相關(guān)。其次，多重共線(xiàn)性診斷結(jié)果顯示，剩余29項(xiàng)變量之間不存在共線(xiàn)性問(wèn)題，因此均被保留以做進(jìn)一步分析。

表2 譯文機(jī)器分?jǐn)?shù)與各指標(biāo)的相關(guān)性矩陣

然后我們將29項(xiàng)預(yù)測(cè)變量導(dǎo)入SPSS 20.0做逐步回歸分析?；貧w分析獲得7個(gè)模型，比較分析發(fā)現(xiàn)模型7的擬合優(yōu)度最佳，因此被選入機(jī)器打分模型(見(jiàn)表3)。該模型包含7項(xiàng)預(yù)測(cè)變量，能解釋47.3%的差異(調(diào)整R2=0.473，F(xiàn)<1 144>=18.051，p=0.011)，逐步分析發(fā)現(xiàn)名詞上義度平均數(shù)(Hypernymy for nouns, mean)和譯文長(zhǎng)度兩項(xiàng)預(yù)測(cè)變量的預(yù)測(cè)力最大，分別能解釋17.1%和12.2%的分?jǐn)?shù)差異。進(jìn)入回歸方程的7項(xiàng)量化指標(biāo)與機(jī)器分?jǐn)?shù)均顯著相關(guān)(見(jiàn)表2)，但除名詞上義度及譯文長(zhǎng)度與譯文分?jǐn)?shù)的相關(guān)性呈中度相關(guān)外，其余5項(xiàng)相關(guān)性都較弱。

表3 多元線(xiàn)性回歸結(jié)果摘要表

模型7的標(biāo)準(zhǔn)化回歸方程為：機(jī)器分?jǐn)?shù)=4.639+(0.765×名詞上義度平均數(shù))+(0.0308×譯文長(zhǎng)度)-(3.991×所有句子實(shí)詞重疊平均比例)+(1.405×所有句子潛勢(shì)語(yǔ)義重合)-(0.280×第三人稱(chēng)單數(shù)代詞比)+(0.029×單位句子長(zhǎng)度)+(0.014×?xí)r序連詞率)。從摘要表和回歸方程可以看出，名詞上義度、譯文長(zhǎng)度、所有句子潛勢(shì)語(yǔ)義重合、單位句子長(zhǎng)度和時(shí)序連詞率與機(jī)器評(píng)分呈正相關(guān)，即名詞上義度值越高，譯文越長(zhǎng)，單位句子越長(zhǎng)，時(shí)序連詞率越高，譯文的機(jī)器分就越高，而其他兩項(xiàng)與分?jǐn)?shù)呈負(fù)相關(guān)。

(二)討論

1) 量化特征值與譯文機(jī)評(píng)分?jǐn)?shù)關(guān)系的解釋

本研究發(fā)現(xiàn)29項(xiàng)指標(biāo)與譯文機(jī)器分?jǐn)?shù)相關(guān)，但只有7項(xiàng)對(duì)機(jī)器分?jǐn)?shù)具有預(yù)測(cè)力，其中相關(guān)性最高、解釋力最大的是名詞上義度和譯文長(zhǎng)度。本研究名詞上義度與機(jī)器分?jǐn)?shù)呈正相關(guān)，說(shuō)明名詞上義度值越高，機(jī)器分?jǐn)?shù)越高。上義度指的是詞匯間的語(yǔ)義層次關(guān)系，上義度值高的單詞具有更多的上義詞，如animal的上義詞包括organism、animate thing等。與詞匯具體度(concreteness)類(lèi)似，詞匯的上義度在本質(zhì)上反映的是詞匯在具體-抽象連續(xù)體(continuum)中的漸變性。(杜慧穎、蔡金亭 2013)Coh-Metrix利用詞網(wǎng)(WordNet)計(jì)算詞匯上義度，在詞網(wǎng)中，每個(gè)單詞都位于一個(gè)等級(jí)尺度上，用于測(cè)量目標(biāo)單詞的下級(jí)單詞和上級(jí)單詞數(shù)量。一般而言，單詞的上義度越高，表達(dá)的概念越具體，將會(huì)產(chǎn)生的歧義越少，對(duì)讀者造成的認(rèn)知努力就越低。本研究選取的英語(yǔ)四級(jí)翻譯語(yǔ)料屬于說(shuō)明文題材，對(duì)語(yǔ)言的形象性和生動(dòng)性較之?dāng)⑹鑫囊?，高質(zhì)量的譯文自然需要在概念表達(dá)上更為具體，避免語(yǔ)義的模糊。

其次，研究發(fā)現(xiàn)系統(tǒng)評(píng)判譯文的第二大標(biāo)準(zhǔn)是譯文的長(zhǎng)度，譯文越長(zhǎng)得分越高。國(guó)內(nèi)翻譯測(cè)試主要強(qiáng)調(diào)的是“信”“達(dá)”和“切”，在人工評(píng)閱中，譯者只要能做到忠實(shí)原文、通順達(dá)意、表達(dá)準(zhǔn)確，就能得到較為理想的成績(jī)，并非寫(xiě)得越多譯文質(zhì)量就越高。但是，因水平不夠的緣故，譯者有可能漏譯一些細(xì)節(jié)或省譯某些不會(huì)的部分，這樣將減損原文的含義，致使其譯文得分較低。(江進(jìn)林 2016)而高水平的譯者傾向于使用較長(zhǎng)的詞組及復(fù)合句使譯文表達(dá)更為豐富，比如在翻譯“強(qiáng)調(diào)”一詞時(shí)，研究語(yǔ)料中有直接處理為動(dòng)詞emphasize的，也有處理為lay emphasis on的；在翻譯“結(jié)合”時(shí)有直接譯為combine的，也有譯為is a combination of的，詞性的轉(zhuǎn)換及詞組的使用加長(zhǎng)了譯文的長(zhǎng)度。雖然兩種處理在翻譯中都做到了忠實(shí)于原文，但是機(jī)器較之人工評(píng)閱者更機(jī)械，機(jī)器評(píng)分主要是通過(guò)統(tǒng)計(jì)詞頻、詞數(shù)、目標(biāo)詞數(shù)量等淺層特征，對(duì)比與語(yǔ)料庫(kù)中的文章在各方面的相似度賦予分?jǐn)?shù)。(白麗芳、王建 2018)關(guān)于譯文長(zhǎng)度，由美國(guó)國(guó)際商用機(jī)器公司IBM提出的BLUE(Bilingual Evaluation Understudy)翻譯測(cè)評(píng)方法針對(duì)過(guò)短的機(jī)器譯文引入了BP(Brevity Penalty)罰分，以降低機(jī)器譯文的得分，(王金銓、朱周曄 2017)這同樣可以部分地解釋本研究中系統(tǒng)的評(píng)分方式。

單位句子長(zhǎng)度也與譯文分?jǐn)?shù)呈正相關(guān)，句子越長(zhǎng)，分?jǐn)?shù)越高。在完成翻譯任務(wù)時(shí)，譯者要考慮譯文與原文的對(duì)等關(guān)系，(文秋芳等 2009)即要忠實(shí)于原文，但具有創(chuàng)造性的、高水平的譯者可能會(huì)利用復(fù)雜的句法關(guān)系完成任務(wù)，比如將兩個(gè)關(guān)系緊密的漢語(yǔ)句子合二為一，這些句法結(jié)構(gòu)的使用往往會(huì)增長(zhǎng)譯文句子的長(zhǎng)度。

與譯文分?jǐn)?shù)呈正相關(guān)的量化指標(biāo)還包括所有句子潛勢(shì)語(yǔ)義重合及時(shí)序連詞率，這與江進(jìn)林(2016)對(duì)翻譯人工評(píng)閱的研究結(jié)果一致。該研究指出，高分譯文的語(yǔ)義空間更為緊湊，譯文內(nèi)部的語(yǔ)義聯(lián)系更為緊密；高分譯文使用的時(shí)序連詞顯著多于低分譯文，通過(guò)更多的時(shí)序連詞來(lái)展現(xiàn)文章的結(jié)構(gòu)。

本研究還發(fā)現(xiàn)，所有句子實(shí)詞重疊與譯文機(jī)器分呈負(fù)相關(guān)，即句子間實(shí)詞重疊比例越高，譯文分?jǐn)?shù)越低。實(shí)詞重疊是指稱(chēng)銜接中的一項(xiàng)指標(biāo)，實(shí)詞重疊越多，說(shuō)明文本緊扣主題，語(yǔ)義越連貫。(Graesser & McNamara 2011)但詞匯重合越多，也可以推算出譯者積累的替換詞越少，即譯者的縱聚合聯(lián)想詞匯網(wǎng)構(gòu)建不完善，詞匯豐富性不夠。低水平譯者限于詞匯水平較低、翻譯實(shí)踐較少，其英語(yǔ)譯文更容易受漢語(yǔ)信息的影響，譯文的呈現(xiàn)方式和順序更加程式化，(江進(jìn)林 2016)在讀到某個(gè)漢語(yǔ)詞匯時(shí)會(huì)條件反射出最常用的單詞，而且往往是高頻詞。相比而言，高水平譯者會(huì)利用更多的詞匯語(yǔ)義資源，擺脫單一的詞匯及結(jié)構(gòu)，聯(lián)想詞匯也更為豐富，因此能與低水平譯者區(qū)分開(kāi)來(lái)。第三人稱(chēng)單數(shù)代詞比例也與機(jī)器分?jǐn)?shù)呈負(fù)相關(guān)，比例越高，分?jǐn)?shù)越低。筆者發(fā)現(xiàn)，翻譯語(yǔ)料中低分譯文濫用代詞it的現(xiàn)象比較嚴(yán)重，有的譯文除第一句用名詞做主語(yǔ)外，其他所有句子的主語(yǔ)均為代詞it，主語(yǔ)過(guò)于單一，自然導(dǎo)致譯文分?jǐn)?shù)低。梁茂成(2006)指出，過(guò)多使用人稱(chēng)代詞等淺層的銜接手段會(huì)嚴(yán)重影響文本的連貫性。

總之，Coh-Metrix計(jì)算出的大部分量化指標(biāo)與譯文機(jī)器分之間的相關(guān)性不存在顯著差異，且進(jìn)入機(jī)器分?jǐn)?shù)回歸方程的變量較少，名詞上義度與譯文長(zhǎng)度對(duì)分?jǐn)?shù)的預(yù)測(cè)力最強(qiáng)，其他變量的解釋力相對(duì)較弱。

2) 研究結(jié)果對(duì)教學(xué)的啟示

目前自動(dòng)評(píng)閱系統(tǒng)提供的翻譯評(píng)估服務(wù)，不但增加了學(xué)生練習(xí)的機(jī)會(huì)，同時(shí)也緩解了許多教師的評(píng)閱壓力，學(xué)生可以及時(shí)獲得機(jī)評(píng)分?jǐn)?shù)及修改反饋，因此也被多數(shù)教師直接運(yùn)用到教學(xué)過(guò)程中，助力形成性評(píng)價(jià)的實(shí)現(xiàn)。但值得注意的問(wèn)題是：目前系統(tǒng)究竟采取何種過(guò)程評(píng)閱譯文？機(jī)器評(píng)分是否兼顧形式和意義？本研究的量化指標(biāo)僅能小部分地回答這些問(wèn)題，機(jī)器評(píng)閱的面紗仍有待更多的研究來(lái)層層揭開(kāi)。

為進(jìn)一步解釋自動(dòng)評(píng)閱系統(tǒng)對(duì)譯文的評(píng)閱過(guò)程，筆者對(duì)系統(tǒng)提供的翻譯反饋進(jìn)行了仔細(xì)研究，結(jié)果發(fā)現(xiàn)反饋中主要涉及淺層的文本特征，如文章的寫(xiě)作規(guī)范(如大小寫(xiě)、拼寫(xiě)及標(biāo)點(diǎn)等)、簡(jiǎn)單句法的錯(cuò)誤使用以及近義詞的辨析等等。盡管本研究發(fā)現(xiàn)語(yǔ)義關(guān)系及指稱(chēng)銜接等深層量化值特征(如名詞上義度及所有句子語(yǔ)義重合)能預(yù)測(cè)譯文的質(zhì)量，但系統(tǒng)的反饋中幾乎未涉及相關(guān)方面的指導(dǎo)。

鑒于此，必須引起重視的是，在機(jī)器評(píng)分性能尚未得到普遍認(rèn)可的情況下，已有不少教師直接將譯文機(jī)器分?jǐn)?shù)納入形成性考核中，這可能導(dǎo)致公平性問(wèn)題，尤其是當(dāng)翻譯任務(wù)占平時(shí)成績(jī)比重較大從而關(guān)系到學(xué)生最終的成績(jī)、評(píng)優(yōu)甚至保送研究生等高風(fēng)險(xiǎn)決策時(shí)，學(xué)生會(huì)嘗試故意寫(xiě)長(zhǎng)句子、利用低頻詞去取悅機(jī)器，而譯文質(zhì)量不一定高。此外，譯文機(jī)器評(píng)分的信度研究還較為匱乏，人工評(píng)閱者與機(jī)器評(píng)分間的一致性尚未得到廣泛論證。因此，一線(xiàn)教師需更加謹(jǐn)慎地融入機(jī)評(píng)分?jǐn)?shù)。當(dāng)然，教師也不可完全否定機(jī)器評(píng)閱的作用，在“互聯(lián)網(wǎng)+”及教育信息技術(shù)發(fā)展的大背景下，教師應(yīng)充分挖掘“人機(jī)合作”，順應(yīng)時(shí)代的需要，充分利用教育信息技術(shù)的優(yōu)勢(shì)作為教學(xué)的補(bǔ)充。比如在形成性評(píng)價(jià)中，譯文的評(píng)閱工作不應(yīng)過(guò)分依賴(lài)機(jī)器，而應(yīng)借鑒作文自動(dòng)評(píng)價(jià)的做法，使評(píng)價(jià)主體朝著“系統(tǒng)評(píng)估+教師評(píng)估+同伴評(píng)估”三位一體的方向發(fā)展，(唐錦蘭、吳一安 2012)以彌補(bǔ)系統(tǒng)的缺陷。

五、結(jié)語(yǔ)

本研究利用文本處理軟件Coh-Metrix分析了153篇譯文的量化特征，初步探討了量化特征與譯文機(jī)評(píng)分?jǐn)?shù)的關(guān)系。研究結(jié)果表明，少數(shù)量化特征對(duì)機(jī)評(píng)分?jǐn)?shù)具有預(yù)測(cè)力。文章最后對(duì)結(jié)果進(jìn)行了分析并指出了對(duì)教學(xué)的啟示。但是本研究也存在不足之處：1)僅以Coh-Metrix分析的量化特征作為自變量，未考慮其他指標(biāo)如N元組的數(shù)量，也未分析詞匯、句法及篇章3個(gè)層次的準(zhǔn)確性量化數(shù)據(jù)，而這些量化特征可能會(huì)對(duì)機(jī)評(píng)分?jǐn)?shù)產(chǎn)生較大影響；2)本研究的語(yǔ)料均為說(shuō)明文，研究結(jié)果能否推廣到議論文、敘述文或其他文體的譯文尚不得而知。因此，未來(lái)的研究可以充分考慮更多的量化指標(biāo)，涉及更多的文體。此外，譯文機(jī)器評(píng)分的信度、效度也需要更多研究者進(jìn)行充分的驗(yàn)證。