亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)建設(shè)初探

        2020-09-14 09:54:48袁博馮倩馬晶郭龐娜郭夢(mèng)遙
        讀與寫·教師版 2020年7期
        關(guān)鍵詞:醫(yī)學(xué)英語(yǔ)傳染病

        袁博 馮倩 馬晶 郭龐娜 郭夢(mèng)遙

        摘要:在全球傳染病呈上升趨勢(shì)的背景下,國(guó)際間傳染病領(lǐng)域的合作與研究顯得尤為重要。但有關(guān)傳染病學(xué)的語(yǔ)料庫(kù)的建設(shè)及研究在我國(guó)才剛剛起步。因此,本研究旨在豐富傳染病學(xué)雙語(yǔ)語(yǔ)料庫(kù)存在的空白,同時(shí)該庫(kù)也對(duì)“語(yǔ)言+醫(yī)學(xué)”的教學(xué)方向起到了輔助作用。本文主要通過傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)建庫(kù)基礎(chǔ)與研究背景、建庫(kù)過程、建庫(kù)意義及應(yīng)用、結(jié)語(yǔ)四方面來(lái)展開討論。

        關(guān)鍵詞:平行語(yǔ)料庫(kù)建設(shè);傳染病;醫(yī)學(xué)英語(yǔ)

        分類號(hào):G623.31

        1.建庫(kù)基礎(chǔ)與研究背景

        近年來(lái),全球傳染病呈上升趨勢(shì)。2020年初,我國(guó)迎來(lái)了一項(xiàng)巨大的傳染病挑戰(zhàn),2019-nCov病毒導(dǎo)致的新型冠狀病毒肺炎在武漢迅速爆發(fā)并蔓延至全國(guó)乃至其他國(guó)家。此外,近些年爆發(fā)的由SARS、MERS和埃博拉病毒引起的傳染病也極大的危害了人們的健康。因此,國(guó)際間的傳染病防控與研究就顯得尤為重要。傳染病學(xué)平行語(yǔ)料庫(kù)在醫(yī)學(xué)相關(guān)領(lǐng)域的科學(xué)研究及教學(xué)中可以起到重要作用。

        通過語(yǔ)料庫(kù)進(jìn)行語(yǔ)言研究的方式得到了國(guó)際社會(huì)的廣泛認(rèn)可。語(yǔ)料庫(kù)已逐漸運(yùn)用于學(xué)科教學(xué)及語(yǔ)言教學(xué)等多個(gè)領(lǐng)域。語(yǔ)料庫(kù)主要指經(jīng)科學(xué)取樣和加工的大規(guī)模電子文本庫(kù),借助語(yǔ)料分析工具,研究者能夠開展相關(guān)的語(yǔ)言理論及語(yǔ)言應(yīng)用研究。同時(shí),語(yǔ)料庫(kù)的類型也多種多樣,根據(jù)不同的研究目的, 語(yǔ)料庫(kù)可以劃分為通用語(yǔ)料庫(kù)和專用語(yǔ)料庫(kù)。通用語(yǔ)料庫(kù)主要針對(duì)一般性語(yǔ)料庫(kù)研究,例如:人民日?qǐng)?bào)分詞語(yǔ)料庫(kù)(NEPD)、英國(guó)國(guó)家語(yǔ)料庫(kù)(BNC)等;而專用語(yǔ)料庫(kù)則是針對(duì)某一特定專業(yè)領(lǐng)域的語(yǔ)言的研究,例如:中國(guó)傳媒大學(xué)的媒體語(yǔ)言語(yǔ)料庫(kù)(MLC)和本研究涉及的傳染病學(xué)語(yǔ)料庫(kù)等。按照語(yǔ)料的語(yǔ)種,語(yǔ)料庫(kù)也可以分成單語(yǔ)語(yǔ)料庫(kù)、雙語(yǔ)語(yǔ)料庫(kù)和多語(yǔ)語(yǔ)料庫(kù)。按照語(yǔ)料的組織形式,雙語(yǔ)語(yǔ)料庫(kù)可分為平行語(yǔ)料庫(kù)和可比語(yǔ)料庫(kù),前者是指原文文本及其平行對(duì)應(yīng)的譯語(yǔ)文本構(gòu)成的雙語(yǔ)語(yǔ)料庫(kù),相互間存在“翻譯關(guān)系”;后者收集的文本是由不同語(yǔ)言的文本或同一種語(yǔ)言不同變體的文本所構(gòu)成的兩個(gè)或兩個(gè)以上的語(yǔ)料庫(kù)。針對(duì)同一主題,如學(xué)習(xí)者產(chǎn)出的語(yǔ)言與本族語(yǔ)者產(chǎn)生的語(yǔ)言,但相互之間不存在直接的“翻譯關(guān)系”。其中雙語(yǔ)平行語(yǔ)料庫(kù)是探索同一內(nèi)容如何用兩種語(yǔ)言表達(dá)的語(yǔ)料庫(kù),它是一種能將源語(yǔ)言文本和其譯語(yǔ)文本進(jìn)行全文檢索并對(duì)照顯示的語(yǔ)料庫(kù),可用于譯文比較、翻譯教學(xué)等多個(gè)領(lǐng)域。

        本研究基于國(guó)內(nèi)外權(quán)威醫(yī)學(xué)網(wǎng)站和圖書資源, 經(jīng)過整合編輯處理,旨在建立一個(gè)適應(yīng)傳染病學(xué)研究和醫(yī)學(xué)英語(yǔ)及翻譯教學(xué)需求的傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)。

        2.傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)的建設(shè)意義

        2.1語(yǔ)料庫(kù)與翻譯研究

        語(yǔ)料庫(kù)在翻譯領(lǐng)域的應(yīng)用程度不言而喻,傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)的建成會(huì)方便譯員進(jìn)行傳染病學(xué)對(duì)語(yǔ)言會(huì)議的譯前準(zhǔn)備工作,同時(shí)也會(huì)對(duì)有關(guān)醫(yī)學(xué)文獻(xiàn)和新聞的筆譯工作者提供相當(dāng)程度的便利。此外,在翻譯研究領(lǐng)域,本庫(kù)也能夠滿足譯員“語(yǔ)言+專業(yè)背景”的現(xiàn)實(shí)需求,準(zhǔn)譯員對(duì)專業(yè)雙語(yǔ)語(yǔ)料庫(kù)的大量輸入, 其專業(yè)語(yǔ)言的轉(zhuǎn)換意識(shí)也會(huì)得到質(zhì)的飛躍,成為具有扎實(shí)專業(yè)背景的翻譯技術(shù)人才,以適應(yīng)未來(lái)的專業(yè)翻譯環(huán)境。

        2.2語(yǔ)料庫(kù)與教學(xué)

        在北華大學(xué),醫(yī)學(xué)英語(yǔ)的教學(xué)及MBBS培訓(xùn)得到了醫(yī)學(xué)院老師們的重視。傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)為原始的課堂提供了新的教學(xué)方向?;谡鎸?shí)應(yīng)用場(chǎng)景而產(chǎn)生的語(yǔ)料庫(kù),為醫(yī)學(xué)英語(yǔ)教學(xué)提供了切實(shí)可行的語(yǔ)言事實(shí)。并在一定程度上能夠?qū)魅静W(xué)教材的編寫起到輔助作用。

        近年來(lái)ESP(專門用途英語(yǔ))課程改革正在一步一步地推進(jìn)中,教師可通過本庫(kù)創(chuàng)新傳染病學(xué)科英語(yǔ)的詞匯課和寫作課教學(xué)模式,以詞為“點(diǎn)”進(jìn)行檢索,展開語(yǔ)“面”,根據(jù)詞頻使用和搭配頻率,拓展相關(guān)詞匯和表達(dá),也能作為診斷式語(yǔ)言教學(xué)提供系統(tǒng)而準(zhǔn)確的依據(jù),為專用英語(yǔ)教學(xué)課堂提供新的路徑。ESP課程教學(xué)借助語(yǔ)料庫(kù)的功能,通過工具的索引、詞表和搭配查詢?nèi)蠡竟δ埽詳?shù)據(jù)支撐的形式提供給學(xué)生具有代表性、針對(duì)性的教學(xué)素材。

        3.語(yǔ)料庫(kù)的建設(shè)過程

        傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)的建設(shè)總原則是建立一個(gè)能夠比較全面反映傳染病學(xué)英漢雙語(yǔ)語(yǔ)言事實(shí)的語(yǔ)料庫(kù)。因此,本語(yǔ)料庫(kù)建庫(kù)過程分為以下三個(gè)步驟:選擇語(yǔ)料、采集加工語(yǔ)料、語(yǔ)料勘誤及檢索語(yǔ)料、最后將加工好的語(yǔ)料導(dǎo)入以形成語(yǔ)料庫(kù)。

        3.1選擇語(yǔ)料

        在建設(shè)的前期要充分考慮語(yǔ)料庫(kù)的抽樣原則,即什么樣的語(yǔ)料方為有效語(yǔ)料。此外還要考慮到如何保證樣本分布均衡,要兼顧文體特點(diǎn)、時(shí)間跨度、語(yǔ)料屬性是否全面等問題, 從而使該語(yǔ)料庫(kù)盡可能具有代表性和可用性。[2] 語(yǔ)料也要有合理的數(shù)量比例, 要如實(shí)反映近年來(lái)傳染病領(lǐng)域英語(yǔ)的橫向和縱向發(fā)展趨勢(shì)。[3]所以,選擇語(yǔ)料是決定一個(gè)語(yǔ)料庫(kù)是否有意義,建成后能否達(dá)到預(yù)期應(yīng)用方向的根本步驟。

        因此,語(yǔ)料的選擇范圍被鎖定在包括國(guó)內(nèi)外醫(yī)學(xué)科技類網(wǎng)站、WHO官網(wǎng)、國(guó)外傳染病學(xué)期刊(如:《柳葉刀》(LANCET)、《傳染病》(Infectious Diseases)等)、國(guó)內(nèi)外傳染病學(xué)專業(yè)書目(如:《醫(yī)院感染學(xué)》、《傳染病百科全書》(Encyclopedia of Infectious Diseases)、《傳染病學(xué)原理與實(shí)踐》(Principles and Practice of Infectious Diseases)等)以及高校醫(yī)學(xué)專業(yè)部分教材在內(nèi)的專業(yè)資料。本研究選取的語(yǔ)料來(lái)源均為醫(yī)學(xué)學(xué)科的重要文獻(xiàn)和資料,語(yǔ)料來(lái)源經(jīng)過學(xué)界專家編輯校正,可確保準(zhǔn)確無(wú)誤、專業(yè)性強(qiáng)。

        3.2采集加工語(yǔ)料

        (1)語(yǔ)料的采集與降噪

        在采集語(yǔ)料的過程中會(huì)遇到一些難以提取處理的語(yǔ)料來(lái)源,對(duì)于不同的語(yǔ)料來(lái)源,本研究也采用了不同的提取方式。

        對(duì)于來(lái)源為紙質(zhì)材料的語(yǔ)料(下稱紙質(zhì)語(yǔ)料),先掃描所有紙質(zhì)材料為PDF格式,然后將其轉(zhuǎn)化為可編輯的TXT文檔。對(duì)于紙質(zhì)語(yǔ)料,文檔的可編輯轉(zhuǎn)化只能通過OCR進(jìn)行識(shí)別,但此方法適用于文本較少,頁(yè)面較小的語(yǔ)料來(lái)源,因?yàn)镺CR識(shí)別需要依賴于手機(jī)或電腦等電子設(shè)備,受屏幕大小的限制,導(dǎo)致OCR的識(shí)別區(qū)域有限、識(shí)別的清晰度閾值較大。除上述限制,紙質(zhì)語(yǔ)料還存在一個(gè)弊端,就是要保證掃描清晰度可使識(shí)別工具閱讀,得到足夠清晰的PDF是后續(xù)步驟開展的關(guān)鍵。

        相較于紙質(zhì)語(yǔ)料,來(lái)自于PDF格式或Word文檔的語(yǔ)料可以直接采用文檔轉(zhuǎn)換進(jìn)行采集,一種是通過文檔轉(zhuǎn)換器轉(zhuǎn)化,然后經(jīng)過人工降噪,即對(duì)轉(zhuǎn)化后的Word文本進(jìn)行再加工,刪除其中存在的背景、圖表、空行和附錄等對(duì)語(yǔ)料庫(kù)意義不大的內(nèi)容,使文本內(nèi)容更加規(guī)范,格式保持一致。此方式比紙質(zhì)語(yǔ)料采集容易很多,也會(huì)大大提高語(yǔ)料的采集效率,但也偶然存在亂碼和信息缺失等情況。

        因此,本研究采用了上述兩種方式結(jié)合的方法進(jìn)行語(yǔ)料采集,保證了兩者的互補(bǔ)性,也使得語(yǔ)料來(lái)源具有豐富性,更加符合建庫(kù)原則。

        (2)語(yǔ)料的對(duì)齊與賦碼

        在語(yǔ)料的加工處理過程中,對(duì)齊與賦碼是決定語(yǔ)料在具體應(yīng)用中能否呈現(xiàn)語(yǔ)言事實(shí)的關(guān)鍵。對(duì)齊后的語(yǔ)料擁有更強(qiáng)的直觀性,在實(shí)際應(yīng)用中會(huì)達(dá)到事半功倍的效果。

        筆者項(xiàng)目組先后試用Trados,ABBYYAligner和雪人CAT進(jìn)行雙語(yǔ)對(duì)齊處理,但效果均不盡人意。經(jīng)過多方比較,最終采取“Transmate+Xbench”模式,雖然處理方法較為繁瑣,但處理質(zhì)量高、效果好。

        首先,將采集到的“生語(yǔ)料”導(dǎo)入Transmate進(jìn)行自動(dòng)對(duì)齊。但計(jì)算機(jī)的自動(dòng)識(shí)別會(huì)存在無(wú)法避免的錯(cuò)誤及亂碼情況,這時(shí)就需要將自動(dòng)識(shí)別出現(xiàn)的竄行以及語(yǔ)義緊密段的錯(cuò)誤合并和分離等情況進(jìn)行人工干預(yù),經(jīng)過手動(dòng)處理的語(yǔ)料得到了進(jìn)一步的美化,符合了對(duì)齊的標(biāo)準(zhǔn)。再將全部處理好的語(yǔ)料導(dǎo)出為tmx格式,然后用Xbench將tmx格式的語(yǔ)料轉(zhuǎn)碼為txt格式,然后按語(yǔ)料的分類建立文件夾分別保存。

        對(duì)齊之后就要對(duì)語(yǔ)料賦碼,賦碼后的語(yǔ)料擁有了更多的語(yǔ)言信息,更廣的應(yīng)用范圍和更高的使用價(jià)值。賦碼語(yǔ)料庫(kù)主要有三種賦碼形式:詞性碼、語(yǔ)法碼和句法碼。本研究主要賦予詞性碼,并采用學(xué)屆上接受度較高,實(shí)際應(yīng)用效果好的Treetagger軟件進(jìn)行賦碼。賦碼后的語(yǔ)料由“生語(yǔ)料”變成了“熟語(yǔ)料”(也稱賦碼語(yǔ)料),熟語(yǔ)料可以通過Keywords Plus等軟件進(jìn)行語(yǔ)料分析等方向。

        3.3語(yǔ)料刪重及語(yǔ)料檢索

        借助Ultraedit和Editplus文本處理器對(duì)文本進(jìn)行整理,利用正則表達(dá)刪去重復(fù)語(yǔ)料,再進(jìn)行人工復(fù)核,做好重復(fù)語(yǔ)料的清理工作。至此,得到的熟語(yǔ)料就可以用于檢索,進(jìn)行實(shí)際應(yīng)用。

        本研究通過對(duì)比試用BFSU_Paraconc、CUC_Paraconc和SADU_ParaConc三款平行語(yǔ)料庫(kù)檢索軟件,發(fā)現(xiàn)本庫(kù)更加適合后兩者進(jìn)行檢索,其優(yōu)點(diǎn)如下:支持單文檔雙語(yǔ)語(yǔ)料檢索可自動(dòng)識(shí)別雙語(yǔ)保存在單文件中的對(duì)齊形式,支持多種編碼的純文本語(yǔ)料檢索。經(jīng)過試用,本語(yǔ)料庫(kù)可以通過檢索,快速分析單詞使用場(chǎng)景,例如在遇到“epidemic”這個(gè)詞的時(shí)候,通過查詢,可得到圖1,2所示結(jié)果,因篇幅所限,僅列舉部分作為舉例。

        4.結(jié)語(yǔ)

        在人們開始發(fā)現(xiàn)語(yǔ)料庫(kù)對(duì)語(yǔ)言研究的重要性后,語(yǔ)料庫(kù)研究在中國(guó)已經(jīng)有了很大的進(jìn)步。與此同時(shí),也難免存在一些問題,比如:語(yǔ)料庫(kù)的重復(fù)性問題、語(yǔ)料庫(kù)共享化問題等依然亟待解決、針對(duì)個(gè)別領(lǐng)域(如醫(yī)學(xué)),國(guó)內(nèi)的語(yǔ)料庫(kù)資源還比較貧乏,在細(xì)化的傳染病領(lǐng)域更是少之又少。因此,如何讓將傳染病學(xué)與語(yǔ)料庫(kù)技術(shù)結(jié)合是本研究重點(diǎn)解決的任務(wù),也希望本語(yǔ)料庫(kù)的建成能夠滿足翻譯研究和醫(yī)學(xué)英語(yǔ)教學(xué)需要,真正發(fā)揮現(xiàn)實(shí)作用。

        參考文獻(xiàn)

        [1] Hardie Andrew Lars Borin (ed). 2002. Parallel corpora, parallel worlds. Selected papers from a symposium on parallel and comparable corpora at Uppsala University, Sweden, 22–23 April, 1999. Languages in Contrast. International Journal for Contrastive Linguistics,2005,5(2)

        [2] 王連柱.醫(yī)學(xué)英語(yǔ)語(yǔ)料庫(kù)的建庫(kù)原則探析[J].新鄉(xiāng)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2009,23(04):131-132.

        [3] 章國(guó)英.專門用途醫(yī)學(xué)英語(yǔ)語(yǔ)料庫(kù)構(gòu)建的意義及實(shí)踐[J].中國(guó)醫(yī)學(xué)教育技術(shù),2014,28(02):146-149.

        [4] 施稱,章國(guó)英.醫(yī)學(xué)英語(yǔ)語(yǔ)料庫(kù)在ESP課程改革中的應(yīng)用[J].西北醫(yī)學(xué)教育,2015,23(01):129-132.

        該文為2019年北華大學(xué)外國(guó)語(yǔ)學(xué)院國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目 【醫(yī)學(xué)傳染病學(xué)英漢雙語(yǔ)平行語(yǔ)料庫(kù)建設(shè)】(項(xiàng)目號(hào):201910201024)的階段性研究成果。

        猜你喜歡
        醫(yī)學(xué)英語(yǔ)傳染病
        《傳染病信息》簡(jiǎn)介
        傳染病信息(2022年3期)2022-07-15 08:25:08
        傳染病的預(yù)防
        肝博士(2022年3期)2022-06-30 02:48:50
        3種傳染病出沒 春天要格外提防
        呼吸道傳染病為何冬春多發(fā)
        職業(yè)性傳染病的預(yù)防
        醫(yī)學(xué)英語(yǔ)教學(xué)平臺(tái)的設(shè)計(jì)理念及RSS技術(shù)的應(yīng)用
        圖式理論在醫(yī)學(xué)英語(yǔ)閱讀中的作用
        高職院校醫(yī)學(xué)英語(yǔ)教學(xué)現(xiàn)狀調(diào)查及對(duì)策分析
        亞太教育(2016年34期)2016-12-26 18:45:46
        過渡試點(diǎn)課醫(yī)學(xué)英語(yǔ)詞匯記憶調(diào)查
        亞太教育(2016年31期)2016-12-12 21:46:20
        在醫(yī)學(xué)類高職高專公共英語(yǔ)教學(xué)中融入醫(yī)學(xué)英語(yǔ)的有效途徑初探
        日韩精品人妻系列中文字幕| 四虎影视久久久免费| 99在线无码精品秘 人口| 国产在线观看女主播户外| 大地资源网在线观看免费官网 | 亚洲欧美日韩国产综合一区二区| 天堂最新在线官网av| 少妇被粗大猛进进出出| 男女啪啪在线视频网站| 奶头又大又白喷奶水av| 无码人妻少妇色欲av一区二区| 亚洲国产精品国自产电影| 久久久久AV成人无码网站| 网站在线观看视频一区二区| 亚洲欧美国产精品久久| 亚洲午夜精品久久久久久人妖| 亚洲欧洲精品成人久久曰影片| 亚洲天堂av免费在线| 国产一区二区黄色网页| 夜夜揉揉日日人人青青| 熟妇人妻AV中文字幕老熟妇 | 久久亚洲一级av一片| 日韩有码中文字幕在线视频| 国产精品亚洲av三区亚洲| 又大又紧又粉嫩18p少妇| 久久永久免费视频| 无码国产一区二区色欲| 久久精品中文字幕有码| 亚洲av美国av产亚洲av图片| 久久精品片| 天堂a版一区二区av| 麻豆人妻性色av专区0000| 国产男女免费完整视频| 久久久久无码国产精品不卡| 禁止免费无码网站| 麻豆成人久久精品一区| 亚洲成a人片在线观看无码3d| 国产精品va在线播放我和闺蜜| 亚洲VA欧美VA国产VA综合| 一区二区亚洲精品国产精| 美女不带套日出白浆免费视频 |