亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        應(yīng)急語言服務(wù)漢英雙語語料庫的構(gòu)建及其應(yīng)用研究

        2022-03-18 09:12:05賈春巍
        關(guān)鍵詞:詞匯語言學(xué)生

        ■賈春巍

        (長春大學(xué)旅游學(xué)院外國語學(xué)院,吉林 長春 130607)

        一、語料庫的國內(nèi)外研究現(xiàn)狀與問題

        語料庫來自拉丁詞corpus,意為“匯總”。認(rèn)為語料庫一般用來指“電子形式的可以進(jìn)行自動或者半自動分析的文本”。在國外,MonaBaker是第一個倡導(dǎo)將語料庫應(yīng)用于探索翻譯現(xiàn)象的學(xué)者。20世紀(jì)90年代初,世界上第一個雙語庫在加拿大建成。雙語庫應(yīng)用于語言和翻譯研究,在國外起步較早。經(jīng)過20年左右的發(fā)展,國外建立了一批有代表性的雙語平行語料庫,其中有建于20世紀(jì)90年代初的加拿大議會會議錄英-法平行語料庫,它被認(rèn)為是世界上第一個雙語平行語料庫;始于1993年的克姆尼茨英-德語料庫;英語-瑞典語雙向平行語料庫等雙語語料庫;建于2004年的歐洲議會口譯語料庫,以口譯素材為主。日本自2006年開始研發(fā)應(yīng)急語言支援系統(tǒng),2014年起開始構(gòu)建多語種平行語料庫,但語種極為有限[1-2]。

        我國語料庫的研究始于20世紀(jì)70年代末并在逐步發(fā)展。我國第一個英語語料庫是1986年由上海交通大學(xué)建成的科技英語語料庫;北京大學(xué)計算語言學(xué)研究所建設(shè)的雙語語料庫;1998年哈爾濱工業(yè)大學(xué)建成了有三萬詞條的英漢雙語語料庫;與翻譯結(jié)合起來研究的語料庫有北京外國語大學(xué)中國外語教育研究中心所建立的通用漢英對比語料庫[3-5];王克非主持的中英雙語在線;廈門大學(xué)盧偉建立的英漢雙語對應(yīng)語料庫、燕山大學(xué)建立的《紅樓夢》英文語料庫、胡開寶和鄒頌兵建立的莎士比亞漢譯語料庫、董娜建立的研究林語堂作品的語料庫等。

        就目前語料庫建設(shè)的情況來看,語料庫的研究應(yīng)用已經(jīng)非常廣泛,將語料庫與翻譯相結(jié)合的教學(xué)研究也積累了不少成果,但大多數(shù)語料庫的建設(shè)都是用來進(jìn)行某種語言現(xiàn)象的研究,針對突發(fā)事件的應(yīng)急語料庫的建設(shè)還極其薄弱,有關(guān)應(yīng)急語言的英漢雙語語料庫建設(shè)也幾乎沒有。在當(dāng)下疫情肆虐的特殊時代背景下,建設(shè)應(yīng)急語言漢英雙語語料庫,助力應(yīng)急外語人才培養(yǎng)已經(jīng)成為時代的呼聲。

        二、創(chuàng)建應(yīng)急語言漢英雙語語料庫的必要性和可行性

        隨著2020年WHO宣布本次疫情構(gòu)成“全球大流行”,全球新冠肺炎確診病例數(shù)一直在快速攀升。在此全球疫情背景下,中國一直堅(jiān)持兩條戰(zhàn)線作戰(zhàn),即持續(xù)國內(nèi)防疫和努力防范外部輸入。在此背景下,對外應(yīng)急服務(wù)人才短缺和應(yīng)急外語服務(wù)中英文表述不準(zhǔn)確的問題愈發(fā)凸顯,這也揭示了應(yīng)急語言服務(wù)漢英雙語語料庫的建設(shè)刻不容緩。

        創(chuàng)建應(yīng)急語言漢英雙語語料庫具有方向性。黨的十九屆四中全會明確要求要“推進(jìn)數(shù)字化建設(shè)”。語料庫的建設(shè)充分響應(yīng)了“數(shù)字社會建設(shè)”和“數(shù)據(jù)共享”的號召。

        創(chuàng)建應(yīng)急語言漢英雙語語料庫具有可行性。隨著互聯(lián)網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)技術(shù)不斷突破。目前國內(nèi)外已開展了互聯(lián)網(wǎng)疾病監(jiān)測系統(tǒng)及其語料庫的構(gòu)建研究,這些成功的經(jīng)驗(yàn),也為應(yīng)急外語服務(wù)語料庫的建設(shè)提供了可行性方案。

        創(chuàng)建應(yīng)急語言漢英雙語語料庫具有稀缺性。目前,針對突發(fā)事件的應(yīng)急語言的語料庫建設(shè)極其薄弱。在國內(nèi),應(yīng)急語言服務(wù)概念剛被提出,上海大學(xué)雖構(gòu)建有突發(fā)事件語料庫但2015年后停止更新,且語料僅為漢語新聞。構(gòu)建應(yīng)急語言漢英雙語語料庫,能夠填補(bǔ)目前國內(nèi)在相關(guān)領(lǐng)域的研究空白。

        三、應(yīng)急語言漢英雙語語料庫的構(gòu)建

        (一)應(yīng)急語言漢英雙語語料庫的設(shè)計與語料的采集和分類

        語料庫選取漢語和英語作為源語言與目標(biāo)語言的語料語種。語料素材的應(yīng)急場景選為“疫情防控”。語料來源主要是政府官網(wǎng)、《中國日報》(China Daily)、《柳葉刀》(Lancet)、《自然》(Nature)和《科學(xué)》(Science)等知名期刊等。語料素材應(yīng)包含盡可能多的題材類型。考慮到語料庫建設(shè)的實(shí)用性、專業(yè)性、指導(dǎo)性和便捷性,語料重點(diǎn)選取與抗疫相關(guān)的新聞報道、學(xué)術(shù)研究報告、政策法規(guī)、公示導(dǎo)覽等多個題材類型。

        將“應(yīng)急語言漢英雙語平行語料庫”進(jìn)行主題分類,每種題材采取抽樣形式進(jìn)行文本分析。提取有關(guān)醫(yī)學(xué)專有名詞、政策舉措、臨床表現(xiàn)、日常防護(hù)、治療方案和社會生活等相關(guān)詞匯,同時設(shè)有中藥專欄,囊括一些常見的中醫(yī)的主題英文表達(dá),以有效地宣傳“中國抗疫模式”和中國傳統(tǒng)中醫(yī)的價值。

        (二)應(yīng)急語言漢英雙語語料的文字識別與校對

        在語料采集的過程中,由于搜集的材料包括網(wǎng)頁版內(nèi)容、紙質(zhì)文檔和圖片等多種形式的資料,而選取入庫的語料需要是電子文件,因此,選擇入庫的材料必須先經(jīng)過電腦錄入和整理,即進(jìn)行文本的數(shù)字化轉(zhuǎn)換。先將紙質(zhì)版的文本進(jìn)行掃描,生成圖片或者PDF格式,再利用OCR文字識別軟件進(jìn)行文字識別。文字識別后生成的Word文檔需要轉(zhuǎn)換成TXT文本,這就是初期的“生語料”。生語料中可能存在著很多錯誤,比如標(biāo)點(diǎn)符號錯誤、個別數(shù)字字母識別的錯誤、亂碼、空格換行錯誤等,需要對其進(jìn)行非常詳細(xì)的校對工作;另外,頁眉、頁腳、頁碼、注釋等不符合建庫規(guī)范的格式和內(nèi)容也需要進(jìn)行降噪處理。語料庫作為學(xué)生學(xué)習(xí)和參考的重要資源,必須保證其規(guī)范性和準(zhǔn)確性。為了增強(qiáng)語料的時效性,需要在收集的文本上標(biāo)注其來源及時間信息。

        (三)應(yīng)急語言漢英雙語語料的對齊和調(diào)整

        平行語料庫的構(gòu)建中最重要的一個環(huán)節(jié)就是語料的對齊加工。語料的對齊包括詞塊、句子、段落和篇章。本語料庫的建設(shè)主要是以詞塊和句子為對齊單位。語料對齊工作極其繁瑣復(fù)雜,因此,對齊工具是專門用來創(chuàng)建雙語平行語料庫的利器??晒┻x擇的國外對齊工具有ABBYY Aligner、SDL Trados Studio、memoQ、Déjà Vu 和Wordfast,國內(nèi)也有很多對齊工具軟件可供使用,例如雪人 CAT、Transmate和 Tmxmall等。

        SDL Trados是市場占有率比較高的一款計算機(jī)輔助軟件。因此,本語料庫選擇使用WinAlign來進(jìn)行文件對齊。創(chuàng)建WinAlign項(xiàng)目,設(shè)置源語言和目標(biāo)語言,根據(jù)實(shí)際需求選擇原文和譯文的斷句規(guī)則,選擇合適的文件類型,將校對好的源語文件和目標(biāo)語文件上傳到WinAlign項(xiàng)目里,進(jìn)行文件匹配,之后需要人工審核匹配結(jié)果,修正匹配錯誤的句段,同時將需要合并、分割和編輯的句段進(jìn)行人工處理。句段匹配檢查、編輯無誤后,即可以導(dǎo)出匹配結(jié)果TMX文件。

        四、應(yīng)急語言漢英雙語語料庫的主要應(yīng)用

        (一)應(yīng)急語言漢英雙語語料庫在翻譯語言教學(xué)中的應(yīng)用

        翻譯教學(xué)離不開雙語語料庫。王克非指出所謂雙語對應(yīng)語料庫輔助翻譯教學(xué),是指借助大規(guī)模原文及其對應(yīng)譯文的電子文本,輔以計算機(jī)統(tǒng)計手段的翻譯教學(xué)模式,該模式旨在從翻譯產(chǎn)品入手,通過觀摩、對比、分析、借鑒的方式發(fā)揮學(xué)生的主觀能動性[6-8],培養(yǎng)學(xué)生的翻譯意識,再評估他人譯作和自我實(shí)踐的基礎(chǔ)上提高學(xué)生的翻譯技能。Bernardidni指出,將雙語語料庫應(yīng)用于翻譯教學(xué)中,有助于學(xué)生形成一種翻譯反射和反應(yīng)。Zanettin也例證了雙語對應(yīng)語料庫有助于提高學(xué)生對原文的理解及翻譯能力。王克非、王海霞的一項(xiàng)基于語料庫的翻譯自主學(xué)習(xí)實(shí)驗(yàn)也表明雙語語料庫能激發(fā)學(xué)生的學(xué)習(xí)興趣。因此,雙語語料庫可以有效地輔助翻譯教學(xué),這一點(diǎn)是毫無疑問的[9]。

        翻譯活動包括詞匯的選擇、搭配、句式結(jié)構(gòu)、語義等多個層面。普通外語專業(yè)學(xué)生日常所學(xué)內(nèi)容與流行病調(diào)查這樣專業(yè)性極強(qiáng)的工作是對接不上的,比如在病情描述、醫(yī)學(xué)詞匯、應(yīng)急處理等主題詞匯表達(dá)方面,精準(zhǔn)翻譯難度較大。此時,學(xué)生們就可以通過應(yīng)急語言漢英雙語語料庫這樣專業(yè)的搜索平臺進(jìn)行更準(zhǔn)確的翻譯活動,避免造詞創(chuàng)詞的情況出現(xiàn),與此同時還可以分析和觀察醫(yī)療詞匯的搭配和語義韻等,通過分析歸納更好地把握特定應(yīng)急領(lǐng)域文本的語言特征,非常有利于應(yīng)急領(lǐng)域文本翻譯語言特征的教學(xué)。

        TimJones曾指出,在課堂教學(xué)中使用語料庫索引技術(shù)對英語專業(yè)教學(xué)有很大的幫助?;凇皵?shù)據(jù)驅(qū)動學(xué)習(xí)”教學(xué)模式,在翻譯理論與實(shí)踐課程的教學(xué)過程中,教師一方面可以指導(dǎo)學(xué)生學(xué)習(xí)語料庫的檢索,這是翻譯人才必備的專業(yè)技能;另一方面,也可以帶領(lǐng)學(xué)生參與到語料庫的建設(shè)中來。將學(xué)生分成小組并根據(jù)主題進(jìn)行任務(wù)分配。在整個語料庫的構(gòu)建過程中,學(xué)生參與話題語料的整理和后期的語料校對,可以加深學(xué)生對抗疫漢英對應(yīng)文本的認(rèn)知度和敏感度。其次,在此活動中,學(xué)生成為了教學(xué)活動的主體,學(xué)生主動進(jìn)行對語料的觀察、對比和分析,激發(fā)了學(xué)生主動思考的意識,促進(jìn)了學(xué)生的自主性和探索性學(xué)習(xí),也加強(qiáng)了小組合作學(xué)習(xí);同時在進(jìn)行漢英兩種語言的語料對比過程中,感受中國抗疫力量與理念,既培養(yǎng)了學(xué)生的翻譯者素養(yǎng),也增強(qiáng)了學(xué)生傳播中國聲音的責(zé)任感和使命感,實(shí)現(xiàn)了課程思政與專業(yè)課的同向同行。

        (二)應(yīng)急語言漢英雙語語料庫在翻譯語言特征研究中的應(yīng)用

        具體語言對翻譯語言特征的研究主要包括翻譯語言詞匯特征、句法特征和搭配特征等?;趹?yīng)急語言漢英雙語語料庫,對比分析翻譯英語和原創(chuàng)英語的對應(yīng)詞塊的詞匯特征,由此發(fā)現(xiàn)英譯文本中使用的簡單詞匯更多。通過句法特征分析,對比翻譯英語和原創(chuàng)英語語料平均句長和句法結(jié)構(gòu),發(fā)現(xiàn)翻譯英文文本的語句長度要較短一些,并且簡單句的使用更加頻繁。

        通過對語料庫語料的對比分析,發(fā)現(xiàn)China Daily里翻譯英文文章的單詞選詞難度和句子的復(fù)雜程度較原創(chuàng)英文語料要低。

        (三)應(yīng)急語言漢英雙語語料庫在翻譯實(shí)踐研究中的應(yīng)用

        在翻譯實(shí)證研究過程中,雙語平行語料庫的作用極其強(qiáng)大。利用平行語料庫,基于對翻譯實(shí)例的分析,來確定源于詞匯的目的語的對應(yīng)詞。鑒于語料囊括的專業(yè)領(lǐng)域里的實(shí)例多和具有較強(qiáng)的時效性的優(yōu)點(diǎn),應(yīng)用雙語平行語料庫特別適合對具體對應(yīng)詞的翻譯進(jìn)行研究。構(gòu)建一個經(jīng)過對齊的漢英雙語平行語料庫來發(fā)現(xiàn)應(yīng)急語言領(lǐng)域內(nèi)的一系列語言相等的翻譯對應(yīng)項(xiàng),主要是從詞匯和短語對比入手,可以充分地進(jìn)行語言對比研究?,F(xiàn)階段語料庫已經(jīng)抽樣整理了China Daily的108篇文章,包括臨床表現(xiàn)15篇,社會生活15篇,政策舉措20篇,醫(yī)學(xué)研究52篇和中醫(yī)治療6篇等,總計54169字,提取出540個醫(yī)療專有英漢雙語詞匯和短語表達(dá),應(yīng)急語言雙語平行語料庫能夠?qū)崿F(xiàn)漢英平行詞塊的動態(tài)語境共現(xiàn),通過檢索能更準(zhǔn)確地找到專業(yè)醫(yī)療術(shù)語和短語表達(dá),尤其是醫(yī)療機(jī)構(gòu)、疾病名稱和病毒名稱等[10]。

        五、應(yīng)急語言漢英雙語語料庫創(chuàng)建的意義

        應(yīng)急語言漢英雙語語料庫的創(chuàng)建服務(wù)于時代需求。在當(dāng)下全球新冠肺炎疫情大背景下,應(yīng)急外語服務(wù)成為重要的語言橋梁,建設(shè)一個應(yīng)急漢英雙語語料庫勢在必行。

        應(yīng)急語言漢英雙語語料庫的創(chuàng)建服務(wù)于國家和地方應(yīng)急外語翻譯需求。首先,語料庫具有較強(qiáng)的數(shù)據(jù)處理優(yōu)勢,可以為翻譯服務(wù)工作提供源語素材[11],為應(yīng)急公告發(fā)布和宣傳翻譯提供平臺支持。通過術(shù)語和表達(dá)的搜索,可以大大地提升應(yīng)急翻譯文案的處理效率,并且確保了應(yīng)急語言翻譯的準(zhǔn)確性,另外助力了應(yīng)急事件的多場景應(yīng)用。其次,應(yīng)急語言翻譯語料庫為機(jī)器翻譯提供了專業(yè)的語料素材,可以提高應(yīng)急類文本的機(jī)器翻譯質(zhì)量。

        應(yīng)急語言漢英雙語語料庫的創(chuàng)建服務(wù)于應(yīng)急外語人才培養(yǎng)需求。以應(yīng)急雙語語料庫為素材,基于語料庫語言學(xué)和語料庫翻譯學(xué),基于數(shù)據(jù)分析提取有高針對性的緊急詞匯和高頻詞匯,科學(xué)編寫應(yīng)急外語人才訓(xùn)練素材和教材,提高人才培養(yǎng)效度。提高高校外語專業(yè)學(xué)生的應(yīng)急英語語言技能,將視角從培養(yǎng)學(xué)生語言技能過渡到應(yīng)用技能,對非外語工作人員展開必要的應(yīng)急外語教育或提供應(yīng)急外語手冊以備所需,為國家培養(yǎng)和儲備應(yīng)急外語服務(wù)人才[12]。

        應(yīng)急語言漢英雙語語料庫的構(gòu)建既滿足了當(dāng)下疫情背景下對應(yīng)急語言服務(wù)的迫切需求,又填補(bǔ)了國內(nèi)應(yīng)急漢英雙語語料庫缺失的空白,為科學(xué)研究、學(xué)科建設(shè)和人才培養(yǎng)都提供了有價值的實(shí)踐平臺。

        六、結(jié)語

        構(gòu)建疫情背景下的應(yīng)急語言漢英雙語語料庫是應(yīng)急外語服務(wù)多語種語料庫的重要組成部分,也助力推進(jìn)了國家語言應(yīng)急體制的建設(shè)。通過應(yīng)急語言漢英雙語語料庫的研發(fā)和創(chuàng)建,可以為基于語料庫的翻譯研究及語言對比提供語料基礎(chǔ),具有很強(qiáng)的理論意義,同時還可以在術(shù)語提取、機(jī)器翻譯和翻譯教學(xué)等方面實(shí)現(xiàn)其應(yīng)用價值,還能助力突發(fā)事件應(yīng)急管理,充分實(shí)現(xiàn)語言的服務(wù)功能,為提升全球公共應(yīng)急管理能力提供強(qiáng)有力的支撐。

        當(dāng)然,構(gòu)建應(yīng)急外語服務(wù)雙語語料庫所面臨的巨大困難和挑戰(zhàn)也是不容忽視的,例如“平臺支持”“技術(shù)保障”“語料處理”“信息更新”等,這也預(yù)示著一個豐富的語料庫的建設(shè)不是一蹴而就的,而是需要持久性和不斷地與時俱進(jìn)。應(yīng)急外語服務(wù)平行語料庫的建設(shè)應(yīng)該立足當(dāng)下、聚焦需求,國內(nèi)外互助,只有這樣才能更好地面對時代發(fā)展提出的迫切要求,面對現(xiàn)實(shí)需要發(fā)出的時代召喚。

        猜你喜歡
        詞匯語言學(xué)生
        本刊可直接用縮寫的常用詞匯
        一些常用詞匯可直接用縮寫
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        本刊可直接用縮寫的常用詞匯
        趕不走的學(xué)生
        讓語言描寫搖曳多姿
        學(xué)生寫話
        累積動態(tài)分析下的同聲傳譯語言壓縮
        學(xué)生寫的話
        我有我語言
        女人下边被添全过视频| 国产午夜无码精品免费看动漫| 中文字幕乱码亚洲无线| 日本女优激情四射中文字幕 | 亚洲老妇色熟女老太| 91啦视频在线观看| 日韩精品极品免费在线视频| 婷婷亚洲岛国热超碰中文字幕| 免费中文熟妇在线影片| 亚洲毛片αv无线播放一区| 中文字幕人妻一区色偷久久| 亚洲一区二区三区地址| 国产乱了真实在线观看| 人妻丰满av∨中文久久不卡| 日本一极品久久99精品| 国产一区二区三区在线观看第八页| 久久精品无码一区二区三区免费| 91精品手机国产在线能| 午夜精品一区二区三区av免费| 草逼短视频免费看m3u8| 国产成人aaaaa级毛片| 亚洲精品乱码久久久久久麻豆不卡| 手机免费在线观看日韩av| 高清午夜福利电影在线| 精品久久久久久中文字幕| 无码中文字幕av免费放| 国产亚洲av综合人人澡精品| 国模吧无码一区二区三区| 在线看片无码永久免费aⅴ | 午夜蜜桃视频在线观看| 老色鬼在线精品视频| 日日摸夜夜添狠狠添欧美| 区一区一日本高清视频在线观看 | 又爽又猛又大又湿的视频| 综合图区亚洲另类偷窥| 久久精品女同亚洲女同 | 99精品免费视频| 国产91久久精品成人看网站| 一本色道久久综合狠狠躁篇 | av免费在线国语对白| 丰满少妇高潮惨叫久久久一|