亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        臨床醫(yī)療英語應(yīng)用文語料庫建設(shè)與實(shí)施

        2018-01-21 09:25:26張文奕盧喆宋雪姣
        中國校外教育(下旬) 2018年12期
        關(guān)鍵詞:應(yīng)用文語料語料庫

        張文奕 盧喆 宋雪姣

        【摘要】臨床醫(yī)療英語屬于科技英語的一個(gè)分支。對(duì)醫(yī)學(xué)生而言,學(xué)習(xí)和掌握臨床醫(yī)療英語應(yīng)用文語言特點(diǎn)與寫作技巧尤其重要。在我國將語料庫技術(shù)與專門用途英語相結(jié)合的研究正方興未艾。在簡(jiǎn)述二者結(jié)合的必要性和重要性的基礎(chǔ)上,探討臨床醫(yī)療英語應(yīng)用文語料庫的創(chuàng)建原則、建庫步驟與建設(shè)方法。

        【關(guān)鍵詞】臨床醫(yī)療英語 應(yīng)用文語料庫 建設(shè)方法作為一種科技文體,臨床醫(yī)療英語具有嚴(yán)謹(jǐn)規(guī)范、邏輯嚴(yán)密、客觀簡(jiǎn)明的語言特色,其遣詞造句、語法結(jié)構(gòu)具有獨(dú)特的詞匯體系和句法特征。隨著全球化的進(jìn)程,醫(yī)學(xué)生必需具有國際化的學(xué)術(shù)視野,經(jīng)常了解國內(nèi)外領(lǐng)域的最新動(dòng)態(tài),不動(dòng)查閱醫(yī)學(xué)文獻(xiàn)。在本科階段,對(duì)醫(yī)學(xué)生而言,學(xué)習(xí)和掌握臨床醫(yī)療英語應(yīng)用文語言特點(diǎn)與寫作技巧尤其重要。因此,建設(shè)臨床醫(yī)療英語應(yīng)用文語料庫,開展基于醫(yī)療英語的醫(yī)療行業(yè)英語語言的研究更具有緊迫性。語料庫不同于電子文檔或數(shù)據(jù)庫,語料庫的建設(shè)有特定的研究目的和具體用途,臨床醫(yī)療英語應(yīng)用文語料庫主要用于研究臨床醫(yī)療英語詞匯,分析臨床醫(yī)療英語應(yīng)用文語言特點(diǎn),完善和開發(fā)相關(guān)教材等。

        一、臨床醫(yī)療英語應(yīng)用文語料庫創(chuàng)建原則

        臨床醫(yī)療英語應(yīng)用文語料庫的總體建庫原則是建立一個(gè)能全面反映臨床醫(yī)療英語語言事實(shí)的語料庫。該語料庫的建設(shè)應(yīng)遵循隨機(jī)抽樣法、內(nèi)容真實(shí)性、語料代表性、庫容適度性等原則。

        1.隨機(jī)抽樣

        語料庫是在隨機(jī)采樣的基礎(chǔ)上收集的有代表性的真實(shí)語言材料的集合,是語言運(yùn)用的樣本。因此,臨床醫(yī)療英語應(yīng)用文語料庫在語料抽樣范圍和主題覆蓋方面都力求取得平衡,在收集語料時(shí)按比例分層抽樣,需要考慮到每一主題類型的抽樣比例,在分布上應(yīng)盡可能均勻。主題涵蓋禮儀文書、求職文書、醫(yī)務(wù)文件、公務(wù)文書和科研文書五個(gè)方面。

        2.真實(shí)性

        真實(shí)性是建設(shè)語料庫的基本前提,無此前提,語料庫就不能反映真實(shí)的語言面貌,基于語料庫的研究及得出的結(jié)論也必然是毫無意義的。具體而言,一要收集實(shí)際使用中的文本,而不能是研究者杜撰的;二要收集符合條件的文本,不符合的一律剔除。為了確保語料的真實(shí)性,應(yīng)以復(fù)印、掃描或拍照等方式收集最原始的語料,從源頭上保證語料的真實(shí)性。

        3.代表性

        語料庫的代表性,即研究中所使用的語料是否能夠代表我們需要研究的語言。它對(duì)建成語料庫應(yīng)用語言研究結(jié)果的可信度至關(guān)重要,這是建設(shè)臨床醫(yī)療英語應(yīng)用文語料庫的首要原則,是區(qū)分語料庫與語料檔案庫的重要標(biāo)準(zhǔn)。一個(gè)語料庫是否有代表性首先要看語料庫所代表的總體??傮w而言,臨床醫(yī)療英語應(yīng)用文語料庫代表的往往是理論上有限而實(shí)際上無限的總體?,F(xiàn)實(shí)中建庫者不可能將所有的臨床醫(yī)療英語應(yīng)用文語料全部收集起來。為了提高語料的代表性,必須借助統(tǒng)計(jì)學(xué)抽樣方法,確保建立的語料庫中的語料樣本能最大限度地反映總體的特征。

        4.庫容適度性

        語料庫規(guī)模并不是越大越好。總體而言,10萬詞次的語料庫可以滿足音韻學(xué)研究,形態(tài)學(xué)研究的語料庫需要達(dá)到50萬詞次,而句法學(xué)研究則需要50萬到100萬詞次的語料庫。我校建設(shè)的臨床醫(yī)療英語應(yīng)用文語料庫初步庫容為50萬詞,各主題均占20%,約10萬字。該語料庫具有開放性、動(dòng)態(tài)性和擴(kuò)容性的特點(diǎn),爭(zhēng)取在語料庫初步建成3年之后進(jìn)一步擴(kuò)展到100萬詞。

        二、臨床醫(yī)療英語應(yīng)用文語料庫建庫步驟

        臨床醫(yī)療英語應(yīng)用文語料庫的建庫步驟主要涉及語料的來源、采集、整理、標(biāo)注、統(tǒng)計(jì)等內(nèi)容。具體說來臨床醫(yī)療應(yīng)用文語料庫的建設(shè)要經(jīng)歷下列18道工序:語料庫設(shè)計(jì)、確定語料收集范圍、先導(dǎo)語料采集取樣論證、編制語料收集要求和工作流程、培訓(xùn)語料采集人員、語料正式采集、回收語料并分類保存、紙質(zhì)語料文本轉(zhuǎn)為txt文本、校對(duì)、語料清潔整理、抽檢語料樣本、對(duì)所有文本進(jìn)行文件頭部元信息標(biāo)注、校對(duì)、分詞、語料標(biāo)注和詞性賦碼、校對(duì)、復(fù)查抽檢、對(duì)語料進(jìn)行統(tǒng)計(jì)分析等。

        三、建設(shè)方法

        1.建立語料庫

        建立語料庫涉及到文本的掃描、錄入和反復(fù)校對(duì)。每個(gè)取樣存為一個(gè)單獨(dú)文件,文件名以學(xué)科領(lǐng)域等因素命名。完成文本的數(shù)字化后進(jìn)行文本整理,它是語料庫建庫的關(guān)鍵環(huán)節(jié),涉及文本的備份、文本的清潔整理、語料元信息的標(biāo)注等環(huán)節(jié)。整理后的文本要進(jìn)行文本加工,文本加工涉及分詞、詞性標(biāo)注及其他語言信息標(biāo)注等環(huán)節(jié)。在臨床醫(yī)療英語應(yīng)用文語料庫中,標(biāo)注主要包括頭部元信息標(biāo)注和詞性標(biāo)注。元信息主要包括:文本說明信息(序號(hào)、文本分類等)、文獻(xiàn)信息(作者、時(shí)間、標(biāo)題等)、文本結(jié)構(gòu)信息(章節(jié)、段落等)等。元信息標(biāo)注是后期語料庫檢索、查詢、分析、構(gòu)建子語料庫的重要依據(jù)和條件。臨床醫(yī)療英語應(yīng)用文語料庫的最終標(biāo)注格式是XML。即可擴(kuò)展標(biāo)記語言。它具有跨平臺(tái)的優(yōu)勢(shì),一般用于數(shù)據(jù)存儲(chǔ)。

        2.實(shí)現(xiàn)檢索軟件的自動(dòng)抽取

        為了能夠抽取研究者感興趣的語言單位,需要運(yùn)用自動(dòng)檢索工具,這些工具為可單獨(dú)運(yùn)行的檢索軟件。單語純文本語料庫支持WordSmith、AntConc、Editplus等檢索工具對(duì)文本各種信息和語言特色的檢索分析。

        四、可能遇到的問題和解決辦法

        臨床醫(yī)療英語應(yīng)用文語料庫的建設(shè)重點(diǎn)是語料庫的代表性,即語料能否代表所要研究的語言。語料庫的代表性主要涉及語料庫的設(shè)計(jì)容量、語料來源以及取樣的平衡。解決辦法是在具體語料采集環(huán)節(jié)之前要進(jìn)行取樣論證,根據(jù)設(shè)計(jì)容量和語料來源、獲得途徑、著作權(quán)法等相關(guān)法律法規(guī)明確取樣準(zhǔn)則和標(biāo)準(zhǔn)。然后根據(jù)取樣準(zhǔn)則進(jìn)行隨機(jī)簡(jiǎn)單抽樣、先導(dǎo)分析并進(jìn)而制定臨床醫(yī)療英語應(yīng)用文語料庫的工作計(jì)劃和工作流程。建設(shè)難點(diǎn)是語料庫的標(biāo)注。即把表示各種語言特征的附碼添加到相應(yīng)的語言成分上,以便于計(jì)算機(jī)對(duì)特定語料進(jìn)行識(shí)別和提取。標(biāo)注工作的加工深度直接影響整個(gè)語料庫的質(zhì)量和應(yīng)用價(jià)值。解決辦法為實(shí)施標(biāo)注工作前確定標(biāo)注環(huán)境、工具、標(biāo)注內(nèi)容和規(guī)則、制定標(biāo)注標(biāo)記集等,確保語料標(biāo)注的一致性和準(zhǔn)確性。限于篇幅,筆者將另文贅述。

        臨床醫(yī)療英語應(yīng)用文語料庫的建設(shè)和相關(guān)研究,一方面,可提升語料庫研究在國內(nèi)專業(yè)領(lǐng)域理論研究基礎(chǔ)。另一方面,可以通過在臨床醫(yī)學(xué)領(lǐng)域的應(yīng)用,有利于解決該領(lǐng)域國內(nèi)外科研技術(shù)交流中的語言障礙,提升本領(lǐng)域的學(xué)術(shù)交流合作。此外,也可促進(jìn)臨床醫(yī)學(xué)在詞典編纂、術(shù)語研究、語篇分析、文本資料分析、教材編寫和語言教學(xué)等方面發(fā)展,此領(lǐng)域的研究工作具有重要的理論和現(xiàn)實(shí)意義。

        參考文獻(xiàn):

        [1]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.

        [2]Kennedy.G.An Introduction to Corpus Linguistics[M].London:Addison Wesley Longman Limited,1998.187.

        [3]梁茂成.語料庫英語教程[M].北京:外語教學(xué)與研究出版社,2010.37.

        [4]何安平.語料庫輔助英語教學(xué)入門(修訂版)[M].北京:外語教學(xué)與研究出版社,2017.204.

        課題項(xiàng)目:臨床醫(yī)療應(yīng)用文語料庫建設(shè)和研究;項(xiàng)目類別:2016年中青年項(xiàng)目;項(xiàng)目編號(hào):ZQN2016-10。

        猜你喜歡
        應(yīng)用文語料語料庫
        應(yīng)用文寫作:語言簡(jiǎn)練、得體、有效
        《語料庫翻譯文體學(xué)》評(píng)介
        高職應(yīng)用文寫作教學(xué)改革與創(chuàng)新
        活力(2019年21期)2019-04-01 12:18:24
        把課文的優(yōu)美表達(dá)存進(jìn)語料庫
        基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
        高職應(yīng)用文教學(xué)方法初探
        新課程研究(2016年3期)2016-12-01 05:54:16
        關(guān)于高職《應(yīng)用文寫作》教學(xué)改革的思考
        華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
        基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
        語言與翻譯(2015年4期)2015-07-18 11:07:45
        《苗防備覽》中的湘西語料
        寂寞少妇做spa按摩无码| 98色婷婷在线| 国色天香社区视频在线| 亚洲中文字幕一区精品自拍| 18禁无遮拦无码国产在线播放 | 久久精品成人一区二区三区蜜臀| 亚洲天堂中文| 国产欧美曰韩一区二区三区| 日本人妻少妇精品视频专区| 亚洲国产成人精品一区刚刚 | 亚洲一区二区三区四区地址| 成人丝袜激情一区二区| 国产福利一区二区三区在线观看 | 人妖熟女少妇人妖少妇| 国产精品视频一区二区久久| 亚洲av熟女中文字幕| 亚洲精品宾馆在线精品酒店| 国产精品a免费一区久久电影| 日韩高清在线观看永久| 乱中年女人伦av三区 | 色小姐在线视频中文字幕| 成人久久黑人中出内射青草| 日本真人边吃奶边做爽动态图 | 国产成人vr精品a视频| 提供最新的在線欧美综合一区| 99re国产电影精品| 久久少妇呻吟视频久久久| 五月婷婷开心六月激情| 国产乱人伦av在线麻豆a| 无码成人aaaaa毛片| 亚洲色图视频在线观看网站| 国产特黄1区2区3区4区| 免费一区二区三区女优视频| 中文无码精品a∨在线观看不卡 | 天天中文字幕av天天爽| 91久久国产精品综合| 精品高清免费国产在线| 无码熟妇人妻av影音先锋| 国产成年女人特黄特色毛片免| 国产成人啪精品| 亚洲国产一区久久yourpan|