亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        全球化背景下地方外宣翻譯的平行語料庫構(gòu)建研究

        2024-01-19 09:01:38張傳鈺?劉玉澄
        校園英語·月末 2023年7期
        關(guān)鍵詞:外宣翻譯

        張傳鈺?劉玉澄

        摘 要:本文以江蘇省連云港市為例,研究平行語料庫的構(gòu)建過程,主要包括資料收集和整理、語料清洗和對齊、建立平行語料庫以及語料庫的維護(hù)和更新。在資料收集和整理階段,需要確定語料庫的主題和目標(biāo)語言,并收集和整理相關(guān)的文本數(shù)據(jù)。在語料清洗和對齊階段,需要進(jìn)行數(shù)據(jù)清洗、預(yù)處理和對齊操作,以確保語料庫的質(zhì)量和可用性。在建立平行語料庫階段,需要使用自動(dòng)或人工方法進(jìn)行文本對齊,并對對齊結(jié)果進(jìn)行校驗(yàn)和評估。在維護(hù)和更新階段,需要定期更新和維護(hù)語料庫,并對新增文本進(jìn)行對齊和校驗(yàn)。本文還探討了平行語料庫在機(jī)器翻譯和自然語言處理中的應(yīng)用和作用,認(rèn)為平行語料庫可以提高機(jī)器翻譯和自然語言處理的精度和效率,促進(jìn)跨語言和跨文化交流和合作。本文研究對于平行語料庫的建設(shè)和利用具有一定的理論和實(shí)踐意義。

        關(guān)鍵詞:平行語料庫;外宣翻譯;語料庫構(gòu)建;語料處理

        作者簡介:張傳鈺(1990.08-),男,江蘇連云港人,南京醫(yī)科大學(xué)康達(dá)學(xué)院,講師,研究生,研究方向:翻譯,翻譯學(xué),教學(xué)法;劉玉澄(2002.01-),女,山東煙臺(tái)人,南京醫(yī)科大學(xué)康達(dá)學(xué)院英語專業(yè)本科在讀,研究方向:翻譯;翻譯技術(shù)。

        地方外宣翻譯平行語料庫是促進(jìn)城市對外交流、文化交流和經(jīng)濟(jì)發(fā)展的重要工具。近年來,隨著中國綜合國力的進(jìn)一步增強(qiáng)和“一帶一路”倡議的實(shí)施,外宣翻譯發(fā)生了新的變化, 呈現(xiàn)出新的特點(diǎn)。以連云港為例,連云港外宣翻譯平行語料庫可以為城市的發(fā)展提供重要的支持,包括推廣和宣傳城市資源、促進(jìn)文化交流、跨語言交流和推動(dòng)經(jīng)濟(jì)發(fā)展等。

        首先,外宣翻譯平行語料庫可以為連云港的對外交流提供重要支持。連云港是一個(gè)重要的沿海城市,擁有豐富的經(jīng)濟(jì)、文化和旅游資源。通過建立外宣翻譯平行語料庫,可以將這些資源向國內(nèi)外更好地推廣和宣傳。通過語料庫中的雙語數(shù)據(jù),可以更方便地進(jìn)行翻譯和傳播,從而擴(kuò)大連云港的知名度和影響力,吸引更多的投資和人才進(jìn)入連云港。

        其次,外宣翻譯平行語料庫還可以促進(jìn)文化交流和跨語言交流。業(yè)界認(rèn)為,對于外宣翻譯質(zhì)量問題的討論不應(yīng)僅停留于對拼寫、語法等“低級錯(cuò)誤”糾錯(cuò)層面,而要從更為寬廣的層面探索優(yōu)化外宣翻譯的途徑增強(qiáng)外宣效果。語言是文化交流的重要媒介,通過翻譯平行語料庫,可以更方便地將連云港的文化資源進(jìn)行傳播,吸引更多的外國友人了解和體驗(yàn)連云港文化。同時(shí),通過與外國文化進(jìn)行交流,可以促進(jìn)連云港的文化創(chuàng)新和發(fā)展,打造更具特色的城市文化。

        最后,外宣翻譯平行語料庫還可以為連云港的經(jīng)濟(jì)發(fā)展提供支持。在全球化的背景下,跨國經(jīng)濟(jì)交流和合作越來越頻繁,而語言交流是其中不可或缺的環(huán)節(jié)。通過建立外宣翻譯平行語料庫,可以更方便地進(jìn)行商務(wù)翻譯和跨語言交流,促進(jìn)連云港與外國企業(yè)的合作和交流,推動(dòng)連云港的經(jīng)濟(jì)發(fā)展。

        一、平行語料庫構(gòu)建——資料收集和整理

        語料庫, 從字面上看, 就是語言的倉庫, 專業(yè)的定義是“為語言研究和應(yīng)用而收集的, 在計(jì)算機(jī)中存儲(chǔ)的語言材料, 由自然出現(xiàn)的書面語或口語樣本匯集而成, 用來代表特定的語言或語言變體?!钡胤酵庑g平行語料庫是指由地方政府或機(jī)構(gòu)發(fā)布的外宣資料,通過翻譯變成了其他語言版本,這些語料可以用于機(jī)器翻譯等領(lǐng)域的研究。構(gòu)建這樣的平行語料庫需要以下幾個(gè)步驟:

        第一步是收集和整理資料。需要找到地方政府或機(jī)構(gòu)發(fā)布的宣傳資料,如新聞稿、政策文件、宣傳視頻等。然后將這些資料翻譯成需要的語言,例如英語、法語等。最好能夠保持翻譯的一致性和準(zhǔn)確性,可以請專業(yè)人士或?qū)I(yè)翻譯人員進(jìn)行翻譯。

        地方外宣翻譯平行語料庫的資料收集和整理是構(gòu)建平行語料庫的第一步。這一步驟的關(guān)鍵是找到適合的宣傳資料和合適的翻譯人員。

        首先,需要確定需要收集的宣傳資料類型。一般來說,地方政府或機(jī)構(gòu)發(fā)布的宣傳資料包括新聞稿、政策文件、宣傳視頻等。為了收集到全面、準(zhǔn)確的資料,可以定期瀏覽地方政府或機(jī)構(gòu)的官方網(wǎng)站,關(guān)注官方媒體發(fā)布的宣傳信息,或者通過社交媒體等渠道獲取信息。以下列舉了連云港市的部分官方外宣渠道及對外交流交往資源:

        連云港港口:連云港港口是中國東海岸最重要的港口之一,是中國“21世紀(jì)海上絲綢之路”的重要樞紐港口,擁有良好的航運(yùn)網(wǎng)絡(luò)和港口設(shè)施,是中國對外貿(mào)易的重要通道之一。

        連云港市人民政府外事與僑務(wù)辦公室:該辦公室是連云港市政府機(jī)構(gòu),負(fù)責(zé)處理涉外事務(wù)和僑務(wù)工作,為外籍人士和華僑提供服務(wù)和支持。

        連云港市文化廣電旅游局:連云港市文化廣電旅游局是連云港市政府機(jī)構(gòu),負(fù)責(zé)推廣連云港的旅游資源和文化,吸引國內(nèi)外游客前來旅游觀光,為城市的對外交流交往提供渠道和平臺(tái)。

        其次,需要確定翻譯人員的選擇標(biāo)準(zhǔn)。翻譯人員需要具備一定的語言能力和專業(yè)背景,能夠準(zhǔn)確理解原文并將其翻譯成目標(biāo)語言。為了保證翻譯質(zhì)量,最好選擇有翻譯經(jīng)驗(yàn)、能夠熟練使用翻譯工具和技術(shù)的專業(yè)翻譯人員進(jìn)行翻譯。

        在資料收集和整理的過程中,還需要注意以下幾點(diǎn):

        保持原文的一致性和準(zhǔn)確性。對于原文中的錯(cuò)別字、語法錯(cuò)誤、不準(zhǔn)確的用詞等進(jìn)行修改和補(bǔ)充,確保原文質(zhì)量。

        翻譯人員需要準(zhǔn)確理解原文的意思,并根據(jù)目標(biāo)語言的語言特點(diǎn)和習(xí)慣進(jìn)行翻譯。同時(shí),還需要注意翻譯的一致性和準(zhǔn)確性,避免出現(xiàn)歧義和錯(cuò)誤。

        對于部分專業(yè)性很強(qiáng)的宣傳資料,可以邀請相關(guān)領(lǐng)域的專業(yè)人士或者翻譯公司進(jìn)行翻譯,以確保翻譯的準(zhǔn)確性和專業(yè)性。

        資料收集和整理是構(gòu)建地方外宣翻譯平行語料庫的關(guān)鍵步驟。需要通過科學(xué)、規(guī)范的方式來收集和整理宣傳資料,并選擇合適的翻譯人員進(jìn)行翻譯,以保證平行語料庫的質(zhì)量和可用性。

        二、平行語料庫構(gòu)建——語料清洗和對齊

        第二步是清洗和對齊語料。對于翻譯資料中的重復(fù)部分、錯(cuò)誤信息、無關(guān)內(nèi)容等進(jìn)行清理,保證語料的質(zhì)量和準(zhǔn)確性。然后需要對原文和翻譯文本進(jìn)行對齊,即將原文和翻譯文本一一對應(yīng),這一步可以借助一些工具來輔助完成。

        地方外宣翻譯平行語料庫的語料清洗和對齊是構(gòu)建平行語料庫的重要步驟。語料清洗是指在語料庫中剔除掉無效的數(shù)據(jù),而語料對齊則是將源語言和目標(biāo)語言的句子進(jìn)行一一對應(yīng)。

        語料清洗的過程中,需要注意以下幾點(diǎn):

        剔除無效數(shù)據(jù)。例如,一些翻譯錯(cuò)誤、缺失信息、格式不規(guī)范的數(shù)據(jù)可以進(jìn)行剔除。

        統(tǒng)一格式。將語料庫中的數(shù)據(jù)的格式統(tǒng)一化,方便后續(xù)的處理和使用。

        進(jìn)行去重。由于宣傳資料的發(fā)布可能會(huì)重復(fù),導(dǎo)致語料庫中存在相同的數(shù)據(jù),因此需要進(jìn)行去重處理。

        在進(jìn)行語料對齊的過程中,需要注意以下幾點(diǎn):

        1.對齊的精度。需要確保對齊的精度盡可能高,避免出現(xiàn)誤差。語料對齊是指將兩個(gè)或多個(gè)文本之間的相應(yīng)部分進(jìn)行匹配和對齊。它是許多自然語言處理任務(wù)的基礎(chǔ),例如機(jī)器翻譯、文本對齊和文本比較。提高語料對齊的精度可以提高這些任務(wù)的完成質(zhì)量和效率。下面是幾個(gè)提高語料對齊精度的方法:①使用更好的算法。語料對齊可以使用不同的算法,例如基于字符串匹配的算法、基于短語匹配的算法和基于神經(jīng)網(wǎng)絡(luò)的算法。不同算法的優(yōu)缺點(diǎn)不同,選擇適合數(shù)據(jù)的算法可以提高語料對齊的精度。②清洗數(shù)據(jù)。清洗數(shù)據(jù)可以去除文本中的噪聲和錯(cuò)誤,例如拼寫錯(cuò)誤和語法錯(cuò)誤。這可以使文本更加規(guī)范,從而提高語料對齊的精度。③使用更多的訓(xùn)練數(shù)據(jù)。語料對齊的精度通常隨著訓(xùn)練數(shù)據(jù)的增加而提高。使用更多的訓(xùn)練數(shù)據(jù)可以提高模型的泛化能力,從而提高語料對齊的精度。④使用詞級別的對齊。在語料對齊時(shí),可以使用詞級別的對齊來更準(zhǔn)確地匹配文本。詞級別的對齊可以考慮到單詞的含義和上下文,從而提高語料對齊的精度。⑤人工校對。在對齊的過程中,可以進(jìn)行人工校對以糾正錯(cuò)誤。人工校對可以提高對齊的準(zhǔn)確性,但需要耗費(fèi)大量的時(shí)間和人力資源。

        2.處理語言差異。由于中英文語言存在差異,例如語序、句式等方面,可能會(huì)導(dǎo)致翻譯不準(zhǔn)確或不完整,需要進(jìn)行適當(dāng)?shù)奶幚?。在處理跨語言語料庫時(shí),語言差異是一個(gè)常見的問題。為了正確地處理跨語言數(shù)據(jù),需要考慮以下幾個(gè)方面:①語言學(xué)差異。不同的語言在語法結(jié)構(gòu)、詞匯、語義和文化背景等方面可能存在差異。了解和理解這些差異是處理跨語言數(shù)據(jù)的重要前提。②翻譯。對于跨語言數(shù)據(jù),可能需要進(jìn)行翻譯。這可以通過機(jī)器翻譯模型或人工翻譯來完成。但是需要注意的是,翻譯可能會(huì)引起誤譯,尤其是在涉及多義詞、語言的隱含含義、文化背景等方面的時(shí)候。③對齊。語言差異可能導(dǎo)致跨語言數(shù)據(jù)中的文本不對齊。對齊是指將兩個(gè)或多個(gè)文本之間的相應(yīng)部分進(jìn)行匹配。它是許多自然語言處理任務(wù)的基礎(chǔ)。對齊可以通過使用基于字符串匹配、基于短語匹配或基于神經(jīng)網(wǎng)絡(luò)的算法來完成。④數(shù)據(jù)清理。在處理跨語言數(shù)據(jù)時(shí),需要清理數(shù)據(jù)以去除不必要的信息和錯(cuò)誤。這可以通過自動(dòng)或手動(dòng)方法來完成。⑤語言模型的訓(xùn)練。處理跨語言數(shù)據(jù)的語言模型需要進(jìn)行跨語言訓(xùn)練。這可以通過使用跨語言的預(yù)訓(xùn)練模型或從頭開始訓(xùn)練一個(gè)跨語言模型來完成。

        3.使用專業(yè)工具。可以使用專業(yè)的語料對齊工具,例如Trados、MemoQ等,來提高對齊的精度和效率。

        三、平行語料庫構(gòu)建——建立平行語料庫

        第三步是建立平行語料庫。將清洗和對齊的語料按照一定的格式和標(biāo)準(zhǔn)組織起來,建立平行語料庫。語料庫應(yīng)該包括原文、翻譯文本和元數(shù)據(jù)等信息,如文本來源、發(fā)布時(shí)間、翻譯人員等。平行語料庫的格式和標(biāo)準(zhǔn)需要根據(jù)具體的應(yīng)用場景進(jìn)行調(diào)整。

        地方外宣翻譯平行語料庫的格式和標(biāo)準(zhǔn)是平行語料庫的重要組成部分,它們決定了平行語料庫的結(jié)構(gòu)和使用方式。下面,筆者將從以下幾個(gè)方面進(jìn)行闡述。

        格式:地方外宣翻譯平行語料庫可以采用多種格式,例如TMX、XLIFF、PO等格式。其中,TMX是一種行業(yè)標(biāo)準(zhǔn)的平行語料庫格式,支持多種語言和工具之間的互操作性,因此較為常用。而XLIFF和PO等格式則適用于特定的翻譯軟件和場景。

        標(biāo)準(zhǔn):為了確保平行語料庫的質(zhì)量和可用性,需要遵循一定的標(biāo)準(zhǔn)。例如,對于平行語料庫的命名和存儲(chǔ)路徑應(yīng)該進(jìn)行規(guī)范,以便于管理和維護(hù)。同時(shí),平行語料庫中的元數(shù)據(jù)、句子對齊等信息也需要進(jìn)行規(guī)范化處理,以便于后續(xù)的信息處理和利用。

        元數(shù)據(jù):平行語料庫中的元數(shù)據(jù)包括源語言、目標(biāo)語言、創(chuàng)建時(shí)間、更新時(shí)間、創(chuàng)建者、描述信息等,可以通過這些元數(shù)據(jù)對平行語料庫進(jìn)行檢索、分類和管理。

        句子對齊:平行語料庫的句子對齊是平行語料庫的核心內(nèi)容之一。需要進(jìn)行精確的句子對齊,以確保源語言和目標(biāo)語言的句子一一對應(yīng),沒有遺漏或重復(fù)。

        地方外宣翻譯平行語料庫的格式和標(biāo)準(zhǔn)對于平行語料庫的構(gòu)建、管理和使用都具有重要的作用,需要根據(jù)實(shí)際需求和情況進(jìn)行選擇和制定,以保證平行語料庫的質(zhì)量和可用性。

        四、平行語料庫構(gòu)建——維護(hù)和更新

        最后一步是語料庫的維護(hù)和更新。平行語料庫需要進(jìn)行定期的維護(hù)和更新,包括對新發(fā)布的宣傳資料進(jìn)行翻譯和對齊,對已有語料進(jìn)行清理和更新等,以保證語料庫的構(gòu)建質(zhì)量和可用性。

        地方外宣翻譯平行語料庫的維護(hù)和更新是確保平行語料庫長期可用和保持高質(zhì)量的重要步驟。以下將從幾個(gè)方面進(jìn)行闡述。

        監(jiān)測和修復(fù)錯(cuò)誤:在平行語料庫的使用過程中,可能會(huì)出現(xiàn)一些錯(cuò)誤,例如句子對齊錯(cuò)誤、譯文錯(cuò)誤等。因此,需要對平行語料庫進(jìn)行監(jiān)測和修復(fù),以保證平行語料庫的準(zhǔn)確性和可用性。

        添加新的數(shù)據(jù):隨著時(shí)間的推移,地方外宣翻譯平行語料庫需要不斷地更新和添加新的數(shù)據(jù),以滿足新的翻譯需求和語言變化。因此,需要建立定期添加新數(shù)據(jù)的機(jī)制,以確保平行語料庫的時(shí)效性和覆蓋范圍。

        統(tǒng)計(jì)和分析:平行語料庫的統(tǒng)計(jì)和分析可以幫助用戶了解平行語料庫的內(nèi)容和特點(diǎn),以便于更好地利用平行語料庫進(jìn)行翻譯和研究。因此,需要對平行語料庫進(jìn)行統(tǒng)計(jì)和分析,并提供相應(yīng)的工具和接口,以便于用戶進(jìn)行數(shù)據(jù)挖掘和分析。

        標(biāo)準(zhǔn)和規(guī)范的更新:隨著翻譯和語言技術(shù)的不斷發(fā)展,平行語料庫的標(biāo)準(zhǔn)和規(guī)范也需要不斷更新和完善。因此,需要建立標(biāo)準(zhǔn)和規(guī)范的更新機(jī)制,以確保平行語料庫的格式和標(biāo)準(zhǔn)與最新的技術(shù)和需求保持一致。

        雖然地方外宣翻譯平行語料庫的構(gòu)建包含多個(gè)步驟,需要耗費(fèi)大量的時(shí)間和精力。但是,建立這樣的平行語料庫可以為機(jī)器翻譯等領(lǐng)域的研究提供有價(jià)值的資源。

        參考文獻(xiàn):

        [1]黃友義.中國站到了國際舞臺(tái)中央,我們?nèi)绾畏g[J].中國翻譯,2015(5):5-7.

        [2]胡興文,張健.外宣翻譯的名與實(shí):張健教授訪談錄[J].中國外語,2013(3):100-104.

        [3]王杭.茶文化外宣翻譯中的語料庫技術(shù)應(yīng)用[J].福建茶葉,2018(2):449.

        基金項(xiàng)目:本文系2022年度 “江蘇省社科應(yīng)用研究精品工程”外語類課題立項(xiàng)項(xiàng)目:《“一帶一路”背景下的地方外宣翻譯的平行語料庫構(gòu)建研究——以連云港為例》(立項(xiàng)號:22SWC-33)、2022年度 “江蘇省社科應(yīng)用研究精品工程”外語類課題立項(xiàng)項(xiàng)目(立項(xiàng)號:22SWC-33)、2022年度江蘇省社科應(yīng)用研究課題成果。

        猜你喜歡
        外宣翻譯
        生態(tài)翻譯視閾下非物質(zhì)文化遺產(chǎn)外宣翻譯
        國際傳播視閾下的外宣翻譯特點(diǎn)探析
        淺析高校簡介英譯中“認(rèn)同”的建構(gòu)
        江西省高校門戶網(wǎng)站外宣翻譯現(xiàn)狀研究
        英語實(shí)用翻譯研究
        考試周刊(2016年52期)2016-07-09 23:17:02
        順應(yīng)論視閾下的中國政府網(wǎng)外宣翻譯研究
        外宣翻譯中中國特色詞匯的翻譯
        跨文化意識(shí)下河北省非物質(zhì)文化遺產(chǎn)外宣翻譯的研究
        考試周刊(2016年25期)2016-05-26 19:15:00
        漢英外宣翻譯中的本土化順應(yīng)策略
        考試周刊(2016年6期)2016-03-11 08:23:58
        外宣翻譯“三貼近原則”指導(dǎo)下的河南省旅游翻譯研究
        色婷婷在线一区二区三区| 精品人妻伦九区久久aaa片69| 朝鲜女子内射杂交bbw| 国产精品无码久久久一区蜜臀 | 日韩好片一区二区在线看| 无码一区二区三区不卡AV| 久久精品国产视频在热| 国产自拍视频免费在线观看| 人人妻人人澡人人爽人人精品浪潮 | 亚洲一区二区三区偷拍自拍| 国产91精品一区二区麻豆亚洲| 亚洲av日韩av激情亚洲| 亚洲另类欧美综合久久图片区| 国产成人无码区免费网站| 久九九久视频精品网站| 人妻少妇中文字幕久久hd高清| 国产精品一区二区三区专区| 手机在线播放成人av| 偷拍夫妻视频一区二区| 亚洲字幕av一区二区三区四区| 久久乐国产精品亚洲综合| 99re国产电影精品| 精品久久精品久久精品| 精品国产一区二区三区三| 欧洲vat一区二区三区| 国产亚洲日韩一区二区三区| 国产偷闻隔壁人妻内裤av| 久久99国产综合精品女同| 国产精品无码素人福利不卡| 国产成人午夜精华液| 久久精品中文字幕久久| 国产精品自拍网站在线| 亚洲成av人片在线观看| 色一情一区二区三区四区| 久久久精品国产亚洲AV蜜| 中文字幕久久熟女人妻av免费| 国产高清在线一区二区不卡| 亚洲a∨无码一区二区三区| 蜜臀av一区二区| 99久久无色码中文字幕鲁信| 人妻少妇精品视频专区二区三区|