亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文本量化特征與漢譯英機(jī)評(píng)分?jǐn)?shù)的關(guān)系研究

        2020-07-24 01:09:12西南交通大學(xué)希望學(xué)院益陽(yáng)廣播電視大學(xué)
        外文研究 2020年1期
        關(guān)鍵詞:譯文機(jī)器語(yǔ)義

        西南交通大學(xué)希望學(xué)院 王 建 益陽(yáng)廣播電視大學(xué) 方 舟

        一、引言

        國(guó)內(nèi)英語(yǔ)水平測(cè)試(如公共英語(yǔ)四、六級(jí)及英語(yǔ)專(zhuān)業(yè)八級(jí)考試)大多包括翻譯與寫(xiě)作兩種題型。然而,翻譯和寫(xiě)作測(cè)試最棘手的問(wèn)題就是分?jǐn)?shù)的評(píng)定,往往需要招募大批的人工評(píng)閱者參與評(píng)卷工作,而人工評(píng)閱往往費(fèi)時(shí)費(fèi)力,效率低下,成本偏高,且因其主觀(guān)性因素,人工評(píng)閱者無(wú)法嚴(yán)格地運(yùn)用同一把“尺子”衡量作文或譯文的質(zhì)量。(白麗芳、王建 2019)面對(duì)此類(lèi)問(wèn)題,自動(dòng)評(píng)閱工具應(yīng)運(yùn)而生。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,主觀(guān)題的自動(dòng)評(píng)價(jià)在語(yǔ)言測(cè)試領(lǐng)域的運(yùn)用被越來(lái)越多的測(cè)評(píng)機(jī)構(gòu)及研究機(jī)構(gòu)所關(guān)注,成為近年來(lái)測(cè)試領(lǐng)域較為熱門(mén)的話(huà)題。(江進(jìn)林、文秋芳 2012;郭蕾 2019)

        目前,針對(duì)寫(xiě)作的評(píng)分系統(tǒng)日趨成熟且運(yùn)用較廣。自動(dòng)作文評(píng)分系統(tǒng)的研究可追溯到20世紀(jì)60年代,最初旨在解決大規(guī)模考試的作文評(píng)分問(wèn)題,因此被稱(chēng)為AES(Automated Essay Scoring)系統(tǒng),后來(lái)發(fā)展為AWE(Automated Writing Evaluation system)系統(tǒng),被應(yīng)用到寫(xiě)作課堂。這些系統(tǒng)依托自然語(yǔ)言處理、人工智能及潛勢(shì)語(yǔ)義分析(latent semantic analysis)等技術(shù)的發(fā)展,模擬人工從量(分?jǐn)?shù))和質(zhì)(反饋)兩方面評(píng)閱作文,較之人工評(píng)閱者在及時(shí)性、高效性和客觀(guān)性等方面更有優(yōu)勢(shì)。(白麗芳、王建 2018)國(guó)外著名的評(píng)閱系統(tǒng)包括Criterion、My Access!及WritingRoad-map等(Dikli 2006),國(guó)內(nèi)自主研發(fā)的句酷批改網(wǎng)、iWrite和冰果作文智能評(píng)閱系統(tǒng)等也已廣泛應(yīng)用于高校英語(yǔ)寫(xiě)作教學(xué)中。

        國(guó)內(nèi)針對(duì)AWE或AES系統(tǒng)的相關(guān)研究較為全面,包括對(duì)系統(tǒng)原理的介紹(如陳瀟瀟、葛詩(shī)利 2008)、AWE模型的建立(如梁茂成 2005)、機(jī)器評(píng)分的效度研究(如白麗芳、王建 2018)及使用者對(duì)系統(tǒng)的認(rèn)知和自動(dòng)反饋研究(如Bai & Hu 2017),這些研究對(duì)翻譯機(jī)器評(píng)分的研究具有借鑒意義。相比之下,翻譯自動(dòng)評(píng)分系統(tǒng)的研究十分匱乏、滯后,不過(guò)近年來(lái)部分研究者開(kāi)始關(guān)注此領(lǐng)域。下一節(jié)將對(duì)翻譯自動(dòng)評(píng)分的相關(guān)研究進(jìn)行概括和梳理。

        二、翻譯自動(dòng)評(píng)分的相關(guān)研究概述

        翻譯自動(dòng)評(píng)價(jià)的核心原理是比較譯文在句長(zhǎng)、用詞和詞序等方面與參考譯文間的匹配度,具有代表性的評(píng)價(jià)方法包括基于測(cè)試點(diǎn)的評(píng)價(jià)方法、基于句子相似度的方法(主要依據(jù)N元組模型)、完全匹配法和編輯距離法(劉芳華等 2013;王金銓、文秋芳 2010)。目前國(guó)內(nèi)外翻譯自動(dòng)評(píng)分仍處于探索階段,尚無(wú)成熟的、可用于評(píng)價(jià)大規(guī)模測(cè)試中人工譯文的自動(dòng)評(píng)分系統(tǒng)??v觀(guān)國(guó)內(nèi)文獻(xiàn),與該領(lǐng)域相關(guān)的研究熱點(diǎn)主要涉及以下3個(gè)方面:

        1) 介紹:這一方面的相關(guān)研究主要回顧國(guó)外AWE系統(tǒng)所具備的特點(diǎn)和運(yùn)用的自動(dòng)評(píng)分技術(shù)(文秋芳等 2009),關(guān)注AWE系統(tǒng)對(duì)開(kāi)發(fā)中國(guó)學(xué)生翻譯自動(dòng)評(píng)分系統(tǒng)的啟示,介紹國(guó)內(nèi)外翻譯自動(dòng)評(píng)分系統(tǒng)的發(fā)展與應(yīng)用(王金銓、文秋芳 2010;江進(jìn)林 2013;王金銓、朱周曄 2017)。

        2) 評(píng)分模型構(gòu)建:一些研究探討了翻譯機(jī)評(píng)模型的構(gòu)建,包括英譯漢和漢譯英評(píng)分系統(tǒng),但這些系統(tǒng)并未投入大規(guī)模使用。王金銓、文秋芳(2009)利用文本分析工具提取與譯文質(zhì)量相關(guān)的文本形式及語(yǔ)義特征項(xiàng)(具體的特征未見(jiàn)詳盡報(bào)道),分別利用50篇、100篇和150篇譯文作為構(gòu)建模型的訓(xùn)練集。結(jié)果顯示,3種模型的人機(jī)評(píng)分高度相關(guān)(系數(shù)大于0.85),說(shuō)明評(píng)分模型能較為準(zhǔn)確地預(yù)測(cè)中國(guó)英語(yǔ)二語(yǔ)學(xué)習(xí)者的漢譯英成績(jī)。江進(jìn)林、文秋芳(2012)以說(shuō)明文、記敘文及敘譯混合文3種文體各300篇譯文為訓(xùn)練集,提取學(xué)生譯文與參考譯文間的N元組匹配數(shù)量、詞對(duì)齊數(shù)量、評(píng)分點(diǎn)對(duì)齊數(shù)量及語(yǔ)義相似度等語(yǔ)義特征,構(gòu)建出來(lái)的英譯漢機(jī)評(píng)模型與人工評(píng)分高度一致,且評(píng)分效率更高。王金銓、朱周曄(2017)提取了3種不同文體(敘事文、說(shuō)明文和議論文)的學(xué)生譯文在詞匯、句子、篇章及語(yǔ)義層面的54個(gè)量化特征,構(gòu)建了性能良好的、適合中國(guó)英語(yǔ)二語(yǔ)學(xué)習(xí)者的漢譯英自動(dòng)評(píng)分系統(tǒng)。郭蕾(2019)設(shè)計(jì)了一種基于自然語(yǔ)言處理的英語(yǔ)翻譯計(jì)算機(jī)智能評(píng)分系統(tǒng),結(jié)果表明:該系統(tǒng)實(shí)用性較強(qiáng),且整體性能優(yōu)于傳統(tǒng)系統(tǒng)。

        3) 機(jī)器評(píng)分信度研究:專(zhuān)門(mén)針對(duì)該方面的研究較少。田艷(2008)對(duì)一個(gè)名為YanFa的課程測(cè)試系統(tǒng)的評(píng)分信度進(jìn)行了研究,該自動(dòng)測(cè)評(píng)系統(tǒng)采用關(guān)鍵詞匹配技術(shù)對(duì)英譯漢文本進(jìn)行評(píng)分。該研究以人工方式構(gòu)建譯文數(shù)據(jù)庫(kù),預(yù)先標(biāo)記所有評(píng)分點(diǎn),同時(shí)為每個(gè)評(píng)分點(diǎn)搜集4個(gè)同義或近義的譯文。結(jié)果顯示,人機(jī)評(píng)分顯著相關(guān),但機(jī)器分?jǐn)?shù)略高于人工分?jǐn)?shù)。

        翻譯機(jī)器評(píng)價(jià)系統(tǒng)主要通過(guò)文本中的1到4元組來(lái)比較被測(cè)譯文和參考譯文之間的距離。(王金銓、文秋芳 2010)因此,從嚴(yán)格意義上來(lái)講,機(jī)器評(píng)價(jià)系統(tǒng)更偏重于意義的評(píng)測(cè),因?yàn)镹元組的匹配率主要反映意義。然而,無(wú)論是在評(píng)價(jià)翻譯還是寫(xiě)作文本的質(zhì)量時(shí),意義和形式都是不可分割的,不能偏廢其一。好的譯文除了應(yīng)忠實(shí)于原文,文本的語(yǔ)言質(zhì)量也十分關(guān)鍵,尤其是將漢語(yǔ)轉(zhuǎn)換為英語(yǔ)的過(guò)程中,語(yǔ)言的復(fù)雜性、流利性和準(zhǔn)確性將勢(shì)必影響譯文的質(zhì)量。所以,在構(gòu)建中國(guó)學(xué)生英語(yǔ)作文自動(dòng)評(píng)分模型時(shí),梁茂成(2005)從語(yǔ)言、內(nèi)容和結(jié)構(gòu)3個(gè)方面衡量作文質(zhì)量,這對(duì)翻譯自動(dòng)評(píng)價(jià)系統(tǒng)的開(kāi)發(fā)有一定的啟示作用。

        近年來(lái),國(guó)內(nèi)自主研發(fā)的自動(dòng)評(píng)價(jià)系統(tǒng)也增加了翻譯服務(wù)。類(lèi)似于作文評(píng)閱,該系統(tǒng)不僅可以對(duì)譯文進(jìn)行及時(shí)評(píng)分,還提供詳細(xì)的反饋,提高了翻譯評(píng)閱效率,因此,許多高校一線(xiàn)教師通過(guò)該平臺(tái)發(fā)布翻譯任務(wù),強(qiáng)化學(xué)生的練習(xí)。然而值得一提的是,開(kāi)發(fā)者并未對(duì)系統(tǒng)評(píng)閱譯文的過(guò)程進(jìn)行詳細(xì)說(shuō)明,比如系統(tǒng)是否從詞匯、句法、文章結(jié)構(gòu)或內(nèi)容等方面考察譯文質(zhì)量尚不得而知。因此,本文將利用語(yǔ)料庫(kù)研究工具Coh-Metrix分析英語(yǔ)二語(yǔ)學(xué)習(xí)者的譯文在詞匯、句法和篇章銜接等層面的量化特征值,推斷譯文量化特征與機(jī)器分?jǐn)?shù)的關(guān)系。

        三、研究設(shè)計(jì)

        (一)研究問(wèn)題

        本研究擬回答的問(wèn)題如下:

        1) 譯文在詞匯、句法及篇章銜接等層面的哪些量化特征與機(jī)評(píng)分?jǐn)?shù)相關(guān)?

        2) 譯文量化特征對(duì)機(jī)評(píng)分?jǐn)?shù)是否具有預(yù)測(cè)能力?程度如何?

        (二)語(yǔ)料選擇

        本研究的研究語(yǔ)料來(lái)自西南某應(yīng)用型大學(xué)本科二年級(jí)3個(gè)教學(xué)班于國(guó)內(nèi)某自動(dòng)系統(tǒng)提交的一次漢譯英作業(yè),內(nèi)容為某年英語(yǔ)四級(jí)真題,分值設(shè)置為15分,學(xué)生在系統(tǒng)上完成翻譯任務(wù)的時(shí)間為35分鐘,與英語(yǔ)四級(jí)考試時(shí)間相當(dāng)。因數(shù)據(jù)分析過(guò)程需要,要求學(xué)生根據(jù)系統(tǒng)的提示檢查拼寫(xiě)錯(cuò)誤再進(jìn)行提交,以最大程度地控制數(shù)據(jù)誤差(具體原因見(jiàn)下一節(jié))。最終獲得語(yǔ)料153篇,所有譯文的機(jī)器分?jǐn)?shù)都被導(dǎo)入Excel表中。

        (三)研究工具及量化特征選取

        Coh-Metrix是由美國(guó)孟菲斯大學(xué)McNamara等人研發(fā)的基于網(wǎng)絡(luò)的文本分析工具。目前,Coh-Metrix 3.0在線(xiàn)版本(http://www.cohmetrix.com/)借助CELEX數(shù)據(jù)庫(kù)、潛勢(shì)語(yǔ)義分析(Latent Semantic Analysis)、MRC(Medical Research Council)心理語(yǔ)言學(xué)數(shù)據(jù)庫(kù)、詞網(wǎng)(WordNet)、Charniak句法分析器等對(duì)106項(xiàng)描述性統(tǒng)計(jì)量及詞匯、句法和語(yǔ)篇銜接的淺層及深層語(yǔ)言量化特征進(jìn)行自動(dòng)分析。(杜慧穎、蔡金亭 2013;許家金 2016)

        本研究去除Coh-Metrix計(jì)算的6項(xiàng)指標(biāo),包括段落數(shù)、段落長(zhǎng)度及標(biāo)準(zhǔn)差、句子數(shù)和相鄰段落語(yǔ)義相似度平均數(shù)及標(biāo)準(zhǔn)差。首先,英語(yǔ)四級(jí)漢譯英試題篇幅通常為一個(gè)段落,故段落長(zhǎng)度與譯文長(zhǎng)度重合;其次,段落及句子數(shù)較為固定,對(duì)譯文的機(jī)器評(píng)分影響不大,因此,這幾項(xiàng)不作為研究的自變量。剩余量化特征包括詞匯、句法和語(yǔ)篇3個(gè)層面以及譯文長(zhǎng)度,共11個(gè)模塊100項(xiàng)特征(見(jiàn)表1),利用Coh-Metrix 3.0自動(dòng)文本分析軟件進(jìn)行計(jì)算。為避免軟件將拼寫(xiě)錯(cuò)誤的單詞誤判為復(fù)雜詞或新詞,且本研究量化特征不涉及準(zhǔn)確性,除要求學(xué)生控制詞匯拼寫(xiě)錯(cuò)誤率外,筆者還進(jìn)行人工校對(duì),將拼寫(xiě)錯(cuò)誤的單詞一一糾正。

        表1 譯文量化指標(biāo)及數(shù)量

        (四)統(tǒng)計(jì)分析

        本研究利用SPSS 20.0分析所獲取的量化數(shù)據(jù),具體的統(tǒng)計(jì)分析過(guò)程如下:1)任何與因變量(譯文機(jī)器分?jǐn)?shù))相關(guān)性不具有統(tǒng)計(jì)學(xué)意義(r<0.1)的指標(biāo)均被剔除,不做下一步分析(Kyle & Crossley 2015); 2)相互高度相關(guān)(r≥0.8)的指標(biāo)被標(biāo)注,每個(gè)共線(xiàn)對(duì)中,與分?jǐn)?shù)相關(guān)性最高的指標(biāo)被保留,另一個(gè)被剔除(Tabachnick & Fidell 2001);此外利用容差(tolerance)對(duì)剩余變量做多重共線(xiàn)性診斷分析,如果一個(gè)自變量的容差小于1-調(diào)整R2,則表明該自變量與其他變量存在多重共線(xiàn)性問(wèn)題,需要被剔除(許宏晨 2013); 3)剩余指標(biāo)作為自變量,作文機(jī)器分?jǐn)?shù)作為因變量,進(jìn)行逐步回歸分析(stepwise regression analysis),選擇p值小于0.05,決定系數(shù)調(diào)整R2最高、擬合優(yōu)度最高的模型。

        四、結(jié)果及討論

        (一)統(tǒng)計(jì)結(jié)果

        在假設(shè)檢驗(yàn)中,71項(xiàng)指標(biāo)與作文分?jǐn)?shù)的相關(guān)性未能達(dá)到統(tǒng)計(jì)學(xué)上的意義(r絕對(duì)值<0.1),因此被剔除,不做進(jìn)一步分析。相關(guān)分析結(jié)果顯示,29項(xiàng)指標(biāo)與機(jī)器分?jǐn)?shù)呈弱相關(guān)或中等相關(guān),r絕對(duì)值介于0.100~0.420(見(jiàn)下頁(yè)表2)。17項(xiàng)指標(biāo)與譯文機(jī)器分?jǐn)?shù)間顯著相關(guān),其他12項(xiàng)與分?jǐn)?shù)不顯著相關(guān),但由于這12項(xiàng)與分?jǐn)?shù)的相關(guān)系數(shù)達(dá)到了統(tǒng)計(jì)學(xué)意義,故保留。其中機(jī)器分?jǐn)?shù)與名詞上義度平均數(shù)(r=0.420,p=0.000)、譯文長(zhǎng)度(r=0.406,p=0.000)相關(guān)性最高,呈顯著正相關(guān)。其次,多重共線(xiàn)性診斷結(jié)果顯示,剩余29項(xiàng)變量之間不存在共線(xiàn)性問(wèn)題,因此均被保留以做進(jìn)一步分析。

        表2 譯文機(jī)器分?jǐn)?shù)與各指標(biāo)的相關(guān)性矩陣

        然后我們將29項(xiàng)預(yù)測(cè)變量導(dǎo)入SPSS 20.0做逐步回歸分析?;貧w分析獲得7個(gè)模型,比較分析發(fā)現(xiàn)模型7的擬合優(yōu)度最佳,因此被選入機(jī)器打分模型(見(jiàn)表3)。該模型包含7項(xiàng)預(yù)測(cè)變量,能解釋47.3%的差異(調(diào)整R2=0.473,F(xiàn)<1 144>=18.051,p=0.011),逐步分析發(fā)現(xiàn)名詞上義度平均數(shù)(Hypernymy for nouns, mean)和譯文長(zhǎng)度兩項(xiàng)預(yù)測(cè)變量的預(yù)測(cè)力最大,分別能解釋17.1%和12.2%的分?jǐn)?shù)差異。進(jìn)入回歸方程的7項(xiàng)量化指標(biāo)與機(jī)器分?jǐn)?shù)均顯著相關(guān)(見(jiàn)表2),但除名詞上義度及譯文長(zhǎng)度與譯文分?jǐn)?shù)的相關(guān)性呈中度相關(guān)外,其余5項(xiàng)相關(guān)性都較弱。

        表3 多元線(xiàn)性回歸結(jié)果摘要表

        模型7的標(biāo)準(zhǔn)化回歸方程為:機(jī)器分?jǐn)?shù)=4.639+(0.765×名詞上義度平均數(shù))+(0.0308×譯文長(zhǎng)度)-(3.991×所有句子實(shí)詞重疊平均比例)+(1.405×所有句子潛勢(shì)語(yǔ)義重合)-(0.280×第三人稱(chēng)單數(shù)代詞比)+(0.029×單位句子長(zhǎng)度)+(0.014×?xí)r序連詞率)。從摘要表和回歸方程可以看出,名詞上義度、譯文長(zhǎng)度、所有句子潛勢(shì)語(yǔ)義重合、單位句子長(zhǎng)度和時(shí)序連詞率與機(jī)器評(píng)分呈正相關(guān),即名詞上義度值越高,譯文越長(zhǎng),單位句子越長(zhǎng),時(shí)序連詞率越高,譯文的機(jī)器分就越高,而其他兩項(xiàng)與分?jǐn)?shù)呈負(fù)相關(guān)。

        (二)討論

        1) 量化特征值與譯文機(jī)評(píng)分?jǐn)?shù)關(guān)系的解釋

        本研究發(fā)現(xiàn)29項(xiàng)指標(biāo)與譯文機(jī)器分?jǐn)?shù)相關(guān),但只有7項(xiàng)對(duì)機(jī)器分?jǐn)?shù)具有預(yù)測(cè)力,其中相關(guān)性最高、解釋力最大的是名詞上義度和譯文長(zhǎng)度。本研究名詞上義度與機(jī)器分?jǐn)?shù)呈正相關(guān),說(shuō)明名詞上義度值越高,機(jī)器分?jǐn)?shù)越高。上義度指的是詞匯間的語(yǔ)義層次關(guān)系,上義度值高的單詞具有更多的上義詞,如animal的上義詞包括organism、animate thing等。與詞匯具體度(concreteness)類(lèi)似,詞匯的上義度在本質(zhì)上反映的是詞匯在具體-抽象連續(xù)體(continuum)中的漸變性。(杜慧穎、蔡金亭 2013)Coh-Metrix利用詞網(wǎng)(WordNet)計(jì)算詞匯上義度,在詞網(wǎng)中,每個(gè)單詞都位于一個(gè)等級(jí)尺度上,用于測(cè)量目標(biāo)單詞的下級(jí)單詞和上級(jí)單詞數(shù)量。一般而言,單詞的上義度越高,表達(dá)的概念越具體,將會(huì)產(chǎn)生的歧義越少,對(duì)讀者造成的認(rèn)知努力就越低。本研究選取的英語(yǔ)四級(jí)翻譯語(yǔ)料屬于說(shuō)明文題材,對(duì)語(yǔ)言的形象性和生動(dòng)性較之?dāng)⑹鑫囊?,高質(zhì)量的譯文自然需要在概念表達(dá)上更為具體,避免語(yǔ)義的模糊。

        其次,研究發(fā)現(xiàn)系統(tǒng)評(píng)判譯文的第二大標(biāo)準(zhǔn)是譯文的長(zhǎng)度,譯文越長(zhǎng)得分越高。國(guó)內(nèi)翻譯測(cè)試主要強(qiáng)調(diào)的是“信”“達(dá)”和“切”,在人工評(píng)閱中,譯者只要能做到忠實(shí)原文、通順達(dá)意、表達(dá)準(zhǔn)確,就能得到較為理想的成績(jī),并非寫(xiě)得越多譯文質(zhì)量就越高。但是,因水平不夠的緣故,譯者有可能漏譯一些細(xì)節(jié)或省譯某些不會(huì)的部分,這樣將減損原文的含義,致使其譯文得分較低。(江進(jìn)林 2016)而高水平的譯者傾向于使用較長(zhǎng)的詞組及復(fù)合句使譯文表達(dá)更為豐富,比如在翻譯“強(qiáng)調(diào)”一詞時(shí),研究語(yǔ)料中有直接處理為動(dòng)詞emphasize的,也有處理為lay emphasis on的;在翻譯“結(jié)合”時(shí)有直接譯為combine的,也有譯為is a combination of的,詞性的轉(zhuǎn)換及詞組的使用加長(zhǎng)了譯文的長(zhǎng)度。雖然兩種處理在翻譯中都做到了忠實(shí)于原文,但是機(jī)器較之人工評(píng)閱者更機(jī)械,機(jī)器評(píng)分主要是通過(guò)統(tǒng)計(jì)詞頻、詞數(shù)、目標(biāo)詞數(shù)量等淺層特征,對(duì)比與語(yǔ)料庫(kù)中的文章在各方面的相似度賦予分?jǐn)?shù)。(白麗芳、王建 2018)關(guān)于譯文長(zhǎng)度,由美國(guó)國(guó)際商用機(jī)器公司IBM提出的BLUE(Bilingual Evaluation Understudy)翻譯測(cè)評(píng)方法針對(duì)過(guò)短的機(jī)器譯文引入了BP(Brevity Penalty)罰分,以降低機(jī)器譯文的得分,(王金銓、朱周曄 2017)這同樣可以部分地解釋本研究中系統(tǒng)的評(píng)分方式。

        單位句子長(zhǎng)度也與譯文分?jǐn)?shù)呈正相關(guān),句子越長(zhǎng),分?jǐn)?shù)越高。在完成翻譯任務(wù)時(shí),譯者要考慮譯文與原文的對(duì)等關(guān)系,(文秋芳等 2009)即要忠實(shí)于原文,但具有創(chuàng)造性的、高水平的譯者可能會(huì)利用復(fù)雜的句法關(guān)系完成任務(wù),比如將兩個(gè)關(guān)系緊密的漢語(yǔ)句子合二為一,這些句法結(jié)構(gòu)的使用往往會(huì)增長(zhǎng)譯文句子的長(zhǎng)度。

        與譯文分?jǐn)?shù)呈正相關(guān)的量化指標(biāo)還包括所有句子潛勢(shì)語(yǔ)義重合及時(shí)序連詞率,這與江進(jìn)林(2016)對(duì)翻譯人工評(píng)閱的研究結(jié)果一致。該研究指出,高分譯文的語(yǔ)義空間更為緊湊,譯文內(nèi)部的語(yǔ)義聯(lián)系更為緊密;高分譯文使用的時(shí)序連詞顯著多于低分譯文,通過(guò)更多的時(shí)序連詞來(lái)展現(xiàn)文章的結(jié)構(gòu)。

        本研究還發(fā)現(xiàn),所有句子實(shí)詞重疊與譯文機(jī)器分呈負(fù)相關(guān),即句子間實(shí)詞重疊比例越高,譯文分?jǐn)?shù)越低。實(shí)詞重疊是指稱(chēng)銜接中的一項(xiàng)指標(biāo),實(shí)詞重疊越多,說(shuō)明文本緊扣主題,語(yǔ)義越連貫。(Graesser & McNamara 2011)但詞匯重合越多,也可以推算出譯者積累的替換詞越少,即譯者的縱聚合聯(lián)想詞匯網(wǎng)構(gòu)建不完善,詞匯豐富性不夠。低水平譯者限于詞匯水平較低、翻譯實(shí)踐較少,其英語(yǔ)譯文更容易受漢語(yǔ)信息的影響,譯文的呈現(xiàn)方式和順序更加程式化,(江進(jìn)林 2016)在讀到某個(gè)漢語(yǔ)詞匯時(shí)會(huì)條件反射出最常用的單詞,而且往往是高頻詞。相比而言,高水平譯者會(huì)利用更多的詞匯語(yǔ)義資源,擺脫單一的詞匯及結(jié)構(gòu),聯(lián)想詞匯也更為豐富,因此能與低水平譯者區(qū)分開(kāi)來(lái)。第三人稱(chēng)單數(shù)代詞比例也與機(jī)器分?jǐn)?shù)呈負(fù)相關(guān),比例越高,分?jǐn)?shù)越低。筆者發(fā)現(xiàn),翻譯語(yǔ)料中低分譯文濫用代詞it的現(xiàn)象比較嚴(yán)重,有的譯文除第一句用名詞做主語(yǔ)外,其他所有句子的主語(yǔ)均為代詞it,主語(yǔ)過(guò)于單一,自然導(dǎo)致譯文分?jǐn)?shù)低。梁茂成(2006)指出,過(guò)多使用人稱(chēng)代詞等淺層的銜接手段會(huì)嚴(yán)重影響文本的連貫性。

        總之,Coh-Metrix計(jì)算出的大部分量化指標(biāo)與譯文機(jī)器分之間的相關(guān)性不存在顯著差異,且進(jìn)入機(jī)器分?jǐn)?shù)回歸方程的變量較少,名詞上義度與譯文長(zhǎng)度對(duì)分?jǐn)?shù)的預(yù)測(cè)力最強(qiáng),其他變量的解釋力相對(duì)較弱。

        2) 研究結(jié)果對(duì)教學(xué)的啟示

        目前自動(dòng)評(píng)閱系統(tǒng)提供的翻譯評(píng)估服務(wù),不但增加了學(xué)生練習(xí)的機(jī)會(huì),同時(shí)也緩解了許多教師的評(píng)閱壓力,學(xué)生可以及時(shí)獲得機(jī)評(píng)分?jǐn)?shù)及修改反饋,因此也被多數(shù)教師直接運(yùn)用到教學(xué)過(guò)程中,助力形成性評(píng)價(jià)的實(shí)現(xiàn)。但值得注意的問(wèn)題是:目前系統(tǒng)究竟采取何種過(guò)程評(píng)閱譯文?機(jī)器評(píng)分是否兼顧形式和意義?本研究的量化指標(biāo)僅能小部分地回答這些問(wèn)題,機(jī)器評(píng)閱的面紗仍有待更多的研究來(lái)層層揭開(kāi)。

        為進(jìn)一步解釋自動(dòng)評(píng)閱系統(tǒng)對(duì)譯文的評(píng)閱過(guò)程,筆者對(duì)系統(tǒng)提供的翻譯反饋進(jìn)行了仔細(xì)研究,結(jié)果發(fā)現(xiàn)反饋中主要涉及淺層的文本特征, 如文章的寫(xiě)作規(guī)范(如大小寫(xiě)、拼寫(xiě)及標(biāo)點(diǎn)等)、簡(jiǎn)單句法的錯(cuò)誤使用以及近義詞的辨析等等。盡管本研究發(fā)現(xiàn)語(yǔ)義關(guān)系及指稱(chēng)銜接等深層量化值特征(如名詞上義度及所有句子語(yǔ)義重合)能預(yù)測(cè)譯文的質(zhì)量,但系統(tǒng)的反饋中幾乎未涉及相關(guān)方面的指導(dǎo)。

        鑒于此,必須引起重視的是,在機(jī)器評(píng)分性能尚未得到普遍認(rèn)可的情況下,已有不少教師直接將譯文機(jī)器分?jǐn)?shù)納入形成性考核中,這可能導(dǎo)致公平性問(wèn)題,尤其是當(dāng)翻譯任務(wù)占平時(shí)成績(jī)比重較大從而關(guān)系到學(xué)生最終的成績(jī)、評(píng)優(yōu)甚至保送研究生等高風(fēng)險(xiǎn)決策時(shí),學(xué)生會(huì)嘗試故意寫(xiě)長(zhǎng)句子、利用低頻詞去取悅機(jī)器,而譯文質(zhì)量不一定高。此外,譯文機(jī)器評(píng)分的信度研究還較為匱乏,人工評(píng)閱者與機(jī)器評(píng)分間的一致性尚未得到廣泛論證。因此,一線(xiàn)教師需更加謹(jǐn)慎地融入機(jī)評(píng)分?jǐn)?shù)。當(dāng)然,教師也不可完全否定機(jī)器評(píng)閱的作用,在“互聯(lián)網(wǎng)+”及教育信息技術(shù)發(fā)展的大背景下,教師應(yīng)充分挖掘“人機(jī)合作”,順應(yīng)時(shí)代的需要,充分利用教育信息技術(shù)的優(yōu)勢(shì)作為教學(xué)的補(bǔ)充。比如在形成性評(píng)價(jià)中,譯文的評(píng)閱工作不應(yīng)過(guò)分依賴(lài)機(jī)器,而應(yīng)借鑒作文自動(dòng)評(píng)價(jià)的做法,使評(píng)價(jià)主體朝著“系統(tǒng)評(píng)估+教師評(píng)估+同伴評(píng)估”三位一體的方向發(fā)展,(唐錦蘭、吳一安 2012)以彌補(bǔ)系統(tǒng)的缺陷。

        五、結(jié)語(yǔ)

        本研究利用文本處理軟件Coh-Metrix分析了153篇譯文的量化特征,初步探討了量化特征與譯文機(jī)評(píng)分?jǐn)?shù)的關(guān)系。研究結(jié)果表明,少數(shù)量化特征對(duì)機(jī)評(píng)分?jǐn)?shù)具有預(yù)測(cè)力。文章最后對(duì)結(jié)果進(jìn)行了分析并指出了對(duì)教學(xué)的啟示。但是本研究也存在不足之處:1)僅以Coh-Metrix分析的量化特征作為自變量,未考慮其他指標(biāo)如N元組的數(shù)量,也未分析詞匯、句法及篇章3個(gè)層次的準(zhǔn)確性量化數(shù)據(jù),而這些量化特征可能會(huì)對(duì)機(jī)評(píng)分?jǐn)?shù)產(chǎn)生較大影響;2)本研究的語(yǔ)料均為說(shuō)明文,研究結(jié)果能否推廣到議論文、敘述文或其他文體的譯文尚不得而知。因此,未來(lái)的研究可以充分考慮更多的量化指標(biāo),涉及更多的文體。此外,譯文機(jī)器評(píng)分的信度、效度也需要更多研究者進(jìn)行充分的驗(yàn)證。

        猜你喜歡
        譯文機(jī)器語(yǔ)義
        Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
        機(jī)器狗
        機(jī)器狗
        語(yǔ)言與語(yǔ)義
        譯文摘要
        未來(lái)機(jī)器城
        電影(2018年8期)2018-09-21 08:00:06
        I Like Thinking
        “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
        無(wú)敵機(jī)器蛛
        認(rèn)知范疇模糊與語(yǔ)義模糊
        国产亚洲日韩欧美一区二区三区| 亚洲天堂色婷婷一区二区| 精品一区二区三区国产av| 亚洲成a∨人片在线观看无码 | 第一九区另类中文字幕| 色五月丁香五月综合五月| 大又大粗又爽又黄少妇毛片| 亚洲网站地址一地址二| 欧美三级免费网站| 亚洲二区三区在线播放| 成人国产激情自拍视频| 色avav色av爱avav亚洲色拍 | 日韩精品无码中文字幕电影| 欧美成人精品一区二区综合| 亚洲国产成人精品激情资源9| 亚洲一区二区岛国高清| www国产亚洲精品| 国产av电影区二区三区曰曰骚网| 91久久福利国产成人精品| 操国产丝袜露脸在线播放| 国产老熟妇精品观看| 亚洲av无码一区二区三区系列| 99精品国产闺蜜国产在线闺蜜| 日韩人妖干女同二区三区| 又湿又紧又大又爽a视频国产| 色偷偷av男人的天堂| 亚洲第一成人网站| 国产91对白在线观看| 国产三级三级三级看三级日本| 国产精品高清视亚洲乱码| 区二区三区玖玖玖| 久久久久欧洲AV成人无码国产| 人妖系列在线免费观看| 性av一区二区三区免费| 日本精品αv中文字幕| 国产在线视频国产永久视频| 国内精品极品久久免费看| 杨幂一区二区系列在线| 狠狠噜狠狠狠狠丁香五月| 日韩精品大片在线观看| 亚洲一区二区三区av色婷婷|