亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        網(wǎng)絡(luò)動(dòng)態(tài)語料庫的論述與應(yīng)用

        2015-04-29 00:00:00李言實(shí)武曉杰張慧
        新課程學(xué)習(xí)·下 2015年1期

        摘 要:以動(dòng)態(tài)語料庫理論為基礎(chǔ),探討作為第三代語料庫的網(wǎng)絡(luò)動(dòng)態(tài)語料庫的研究和此語料庫未來的基本發(fā)展方向。語料庫以其科學(xué)有效的方式為語言學(xué)習(xí)提供了很好的平臺。就網(wǎng)絡(luò)動(dòng)態(tài)語料庫建立的可行性和實(shí)用性進(jìn)行探討,希望能夠?qū)φZ言學(xué)語料庫的人才培養(yǎng)有一定的啟發(fā)。

        關(guān)鍵詞:語言理論;二語習(xí)得;網(wǎng)絡(luò)資源

        一、語料庫研究綜述

        隨著現(xiàn)代網(wǎng)絡(luò)技術(shù)的積極推廣和廣泛應(yīng)用,外語教學(xué)與研究也發(fā)生了翻天覆地的改變?,F(xiàn)代語言學(xué)研究最前沿的方法就是基于語料庫的建立,可以在網(wǎng)絡(luò)環(huán)境下創(chuàng)造一個(gè)更為全面而科學(xué)的二語習(xí)得環(huán)境??梢岳孟冗M(jìn)的網(wǎng)絡(luò)技術(shù),為語言研究者構(gòu)建真實(shí)而全面的語言學(xué)習(xí)和研究的素材。眾所周知,動(dòng)態(tài)語料庫是一個(gè)機(jī)器可讀的文本數(shù)據(jù)庫,包括在不同上下文的自然話語。也就是說,語料庫語言學(xué)是對語言所表達(dá)的樣本的“真實(shí)世界”的文本研究。最初的語料庫基本由語言研究者手工完成,語料庫現(xiàn)在基本上發(fā)展到了一個(gè)自動(dòng)化的過程。語料庫語言學(xué)的研究者認(rèn)為真實(shí)的可靠的語言分析最好采用的是在現(xiàn)場采集的樣本,因?yàn)樵谧匀徽鎸?shí)的語言環(huán)境中,有著最少的實(shí)驗(yàn)因素的干擾。語料庫發(fā)展大致經(jīng)歷了三個(gè)階段:20世紀(jì)60年代興起的小型語料庫,80年代的大型語料庫,從20世紀(jì)90年代開始出現(xiàn)的動(dòng)態(tài)語料庫。動(dòng)態(tài)語料庫的特點(diǎn)是對早期語料庫實(shí)行的內(nèi)容更新,建立開放式、滾動(dòng)式、動(dòng)態(tài)的歷時(shí)性語料庫。

        現(xiàn)代語料庫語言學(xué)的一個(gè)里程碑是Henry Kucera和 W. Nelson Francis在1967年基于布朗語料庫的分析得出的“當(dāng)今美國英語的計(jì)算分析”。該研究是兩位研究者對從多種來源獲得美國英語精心的分析工作,共約一萬字。他們的工作融合了語言學(xué)、語言教學(xué)、心理學(xué)、統(tǒng)計(jì)學(xué)、社會學(xué)的元素,分析計(jì)算了多樣而豐富的文本。另一個(gè)現(xiàn)代語料庫語言研究重要的出版物是Randolph Quirk的 “英語用法的說明”,其中他對英語用法進(jìn)行了詳盡調(diào)查,并作出了系統(tǒng)的分析。

        另外,自布朗語料庫誕生以來,許多類似的結(jié)構(gòu)語料庫也出現(xiàn)了, 比如20世紀(jì)60年代研究英式英語的LOB語料庫,以印度英語為語料分析的Kolhapur語料庫,以新西蘭英語為研究對象的Wellington語料庫,還有Australian Corpus of English(澳大利亞英語)以及Frown Corpus(20世紀(jì)90年代初美國英語)甚至FLOB語料庫(20世紀(jì)90年代英式英語)。當(dāng)然還有另外一些語料庫代表了不同的語言、品種和方式,包括英語國際語料庫和英國國家語料庫,是各種口頭和書面文本約有一億字的語料收集。第一臺由電腦轉(zhuǎn)錄口語的語料庫是Montreal French Project,建于1971年,這一語料庫含一百萬字。

        近年來大量的語言學(xué)學(xué)習(xí)一直致力于調(diào)查研究如何利用計(jì)算機(jī)促進(jìn)語言學(xué)習(xí)。COCA語料庫研究選用的是美國當(dāng)代英語語料庫,這是由楊伯翰大學(xué)Mark Davies教授開發(fā)的。COCA具有其他語料庫望塵莫及的突出優(yōu)勢。首先作為語料庫資源,COCA語料庫是一種動(dòng)態(tài)的語料庫資源,它沒有最后固定的版本,也就是說語料庫資源處于不斷的更新與補(bǔ)充中。該語料庫是美國最新當(dāng)代英語語料庫。另外,該語料庫檢索界面同時(shí)提供英國國家語料(BNC)、時(shí)代周刊(TIME)、美國歷史語料庫(COHA)、美國當(dāng)代英語語料庫(COCA)四個(gè)語料庫的檢索選擇。語言學(xué)習(xí)者可以根據(jù)研究需求選擇合適的語料庫,或者通過比較檢索結(jié)果,必要時(shí)可借助通配符擴(kuò)大搜索結(jié)果,保證檢索的有效性和科學(xué)性。

        在20世紀(jì)六七十年代就建立起的布朗語料庫(Brown University Standard Corpus of Present-Day American English Corpus)和 LOB 數(shù)據(jù)庫(Lancaster-Oslo-Bergen Corpus),分別匯集了一百萬詞次的美國英語和英國英語。接著在20世紀(jì)80年代年代建成了LLC語料庫(London-Lund Corpus of Spoken English),這一語料庫則是第一部匯集了五十萬詞次的英語口語語料庫。50萬詞次的廣州石油大學(xué)石油英語語料庫和一百萬詞次的上海交通大學(xué)科技英語語料庫是20世紀(jì)八九十年代在國內(nèi)首批建成的語料庫。1999年,由廣東外語外貿(mào)大學(xué)桂詩春教授和上海交通大學(xué)楊惠中教授負(fù)責(zé)主持、國內(nèi)十幾個(gè)院校合作完成的容詞量為一百萬詞的中國學(xué)習(xí)者英語語料庫,他們廣泛搜集了專業(yè)英語、大學(xué)英語以及中學(xué)英語學(xué)習(xí)者的各種書面語資料,匯編成語料庫。語料庫的建立為各種語言學(xué)研究和語言學(xué)工程提供了很大的便捷,尤其是在辭典編撰、基本詞匯表繪制、機(jī)器翻譯和自然語言處理以及人工智能等方面有著重要的作用。

        二、動(dòng)態(tài)語料庫的作用

        動(dòng)態(tài)語料庫的構(gòu)建與英語教學(xué)語料庫研究就是要通過對英語語篇的統(tǒng)計(jì)分析對語言進(jìn)行客觀地描述。Gavioli曾指出語言研究者利用語料庫進(jìn)行學(xué)習(xí)和研究,他們的自主學(xué)習(xí)能力增強(qiáng)。學(xué)會觀察語言現(xiàn)象,總結(jié)語言規(guī)律,這不僅遵循語言學(xué)習(xí)理論,并且還能提升他們的語法意識,從而促進(jìn)二語習(xí)得過程。另外Izaskun曾指出憑借詞頻比較手段,搜索到與原文本最接近的文章,進(jìn)行對比并建立語料庫,可拓展高水平語言學(xué)習(xí)者的閱讀和詞匯習(xí)得途徑。研究表明,語料庫教學(xué)可以對聽說讀寫各個(gè)方面進(jìn)行輔助教學(xué),尤其是在同義詞辨析方面,語料庫表現(xiàn)出了其不俗的學(xué)習(xí)輔助功能。語料庫研究方法可以有效地分析對比同義詞因部分義素重疊而產(chǎn)生的理解和運(yùn)用的疑惑,這種方法可以說是對傳統(tǒng)的基于直覺判斷的同義詞辨析方法的一種很好的補(bǔ)充。李娜、陳德生、徐啟龍和王家義曾指出傳統(tǒng)意義上的語義學(xué)和語體學(xué)視角下的同義詞辨析大都采用直覺判斷,主要依靠對詞匯定義的描述,而在語料庫語言學(xué)研究角度下,定性和定量相結(jié)合的方法可以解釋類聯(lián)接、搭配關(guān)系和語義韻等方面的語言特征,從而實(shí)現(xiàn)對語言中同義詞的科學(xué)辨析。根據(jù)現(xiàn)在的研究現(xiàn)狀來觀察,將語料庫應(yīng)用于語言教學(xué)的研究正在蓬勃發(fā)展,國內(nèi)相關(guān)研究不算很豐富,大都只局限于同義詞辨析,幾乎很少涉及語言中的短語和句法層面。

        語料庫的研究和應(yīng)用可以上溯到19世紀(jì)末,然而對龐大的語料資源進(jìn)行計(jì)算機(jī)化的處理,也就是利用電腦和因特網(wǎng)進(jìn)行注釋、加工、解碼以及檢索、取樣到最后統(tǒng)計(jì)分析等研究工作則是近三十年來的事。計(jì)算機(jī)的使用為語料庫在人文科學(xué)的應(yīng)用上開辟了新的道路,使語篇分析和語體研究更為科學(xué)準(zhǔn)確而可靠。針對語料庫在歷時(shí)和共時(shí)兩個(gè)角度上的使用所表現(xiàn)出來的規(guī)律性或傾向性,很多學(xué)者從詞匯和句法的層面、篇章結(jié)構(gòu)以及篇章類型對研究出發(fā)點(diǎn)進(jìn)行了深入的探討。目前國內(nèi)對利用動(dòng)態(tài)語料庫的手段輔助語言教學(xué)的研究尚不成熟和多見。最早是何安平在國內(nèi)語言學(xué)界引入語料庫的概念,他從宏觀上探討了語料庫在外語教育中的應(yīng)用理論與實(shí)踐。另外,楊節(jié)之結(jié)合外語課堂實(shí)踐,討論了網(wǎng)絡(luò)語料庫對實(shí)際問題解決的促進(jìn)作用等。

        三、動(dòng)態(tài)語料庫的建立

        為了進(jìn)行基于語料庫的語言學(xué)習(xí),就必須獲得語料庫和字詞檢索程序。語料庫一般包括一個(gè)數(shù)據(jù)庫的自然文本,從寫作或錄制語音轉(zhuǎn)錄編制的。

        基于動(dòng)態(tài)語料庫的互動(dòng)式的設(shè)計(jì)與構(gòu)建的可行性,對國內(nèi)語言教學(xué)研究而言,語料庫的研究和開發(fā)十分有益于深化外語教學(xué)研究。此外,隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的高速發(fā)展,基于網(wǎng)絡(luò)的動(dòng)態(tài)語料庫使用日益廣泛,利用網(wǎng)絡(luò)資源中的語料庫資源進(jìn)行對外漢語教學(xué)和研究的輔助已成為可能,同時(shí)也是一種必要。

        動(dòng)態(tài)語料庫的建立必須利用網(wǎng)絡(luò)這一動(dòng)態(tài)的資源。當(dāng)今網(wǎng)絡(luò)時(shí)代,各大報(bào)紙和雜志在因特網(wǎng)上也發(fā)布其電子文本,用戶可以點(diǎn)擊相應(yīng)的網(wǎng)址進(jìn)入網(wǎng)站進(jìn)行檢索。許多網(wǎng)站都設(shè)有兩條檢索路徑,一個(gè)鏈接外部互聯(lián)網(wǎng),一個(gè)鏈接報(bào)刊的內(nèi)部資料庫。“本網(wǎng)檢索”將會鏈接到本網(wǎng)報(bào)紙或雜志庫,在自己的資源系統(tǒng)中檢索。第二條路徑是“互聯(lián)網(wǎng)檢索”,用戶可在此鏈接到互聯(lián)網(wǎng),這是利用搜索引擎在互聯(lián)網(wǎng)中進(jìn)行檢索。我們可以選擇“本網(wǎng)檢索”,進(jìn)入報(bào)紙庫內(nèi)部檢索語料。在報(bào)紙或雜志網(wǎng)絡(luò)系統(tǒng)中進(jìn)行檢索,這本身就將報(bào)紙或雜志資源變成了語言研究者的語料庫。在這種資源庫中搜索,優(yōu)點(diǎn)是出處具體、語言文字相對規(guī)范。每一個(gè)搜索的結(jié)果都有對應(yīng)的報(bào)紙來源,也就是我們在獲取語句的同時(shí)能得到關(guān)于語句的其他信息,包括時(shí)間和報(bào)紙的名稱,這對于語料庫的建立是至關(guān)重要的。

        利用搜索引擎也可以建立語料庫,例如Google和Baidu。利用這種方式進(jìn)行搜索,優(yōu)點(diǎn)是方便快捷、信息量大。二者強(qiáng)大的搜索功能得到了廣大用戶的認(rèn)可,一般情況下輸入詞條即可得到諸多相關(guān)信息,利用它們搜索語料資源,比如流行語,不能不說是一種便捷的手段。但是這么做,缺點(diǎn)也是非常突出的。最突出的問題就是信息源重復(fù)和引用的不規(guī)范。搜索出來的結(jié)果往往是網(wǎng)站上的文字不少新聞相互轉(zhuǎn)貼,信息重復(fù)自然不可避免。

        利用網(wǎng)絡(luò)動(dòng)態(tài)語料庫實(shí)現(xiàn)對語言教學(xué)研究的輔助,利用語料庫科學(xué)、量化的特點(diǎn)對語料進(jìn)行解析、重組、保存、分析等自動(dòng)操作即可構(gòu)建動(dòng)態(tài)的實(shí)時(shí)語言學(xué)習(xí)語料庫。本文主要探討了語料庫的發(fā)展、文獻(xiàn)綜述和動(dòng)態(tài)語料庫建立的可能性和可行性。為網(wǎng)絡(luò)動(dòng)態(tài)語料庫的開發(fā)與自動(dòng)構(gòu)建提供了一些思路。利用網(wǎng)絡(luò)構(gòu)建開放的、動(dòng)態(tài)的、連續(xù)的新型動(dòng)態(tài)語料庫是語料庫語言學(xué)發(fā)展的一個(gè)趨勢。面對浩瀚的網(wǎng)絡(luò)語料,如何實(shí)時(shí)利用,辨析網(wǎng)絡(luò)語料是語料庫構(gòu)建首要面對和解決的問題,希望本文能對網(wǎng)絡(luò)動(dòng)態(tài)語料庫的發(fā)展和探索起到一定的作用,并且對網(wǎng)絡(luò)語料庫英語高層次創(chuàng)新型人才培養(yǎng)起到指導(dǎo)性的作用。

        參考文獻(xiàn):

        [1]韓朝陽.網(wǎng)絡(luò)數(shù)據(jù)挖掘在平行語料庫中的應(yīng)用研究[D].河南師范大學(xué),2012.

        [2]黃志輝.中國英語新聞網(wǎng)站研究[D].南昌大學(xué),2006.

        [3]梁茂成,李文忠,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2004-08.

        [4]羅永勝.基于詞典和自建小型語料庫的WITH使用對比分析[J].廣東醫(yī)學(xué)院學(xué)報(bào),2011,29(3):336-338.

        [5]王曉東,王靖.基于Ontology 的Web 語料的挖掘[J].河南師范大學(xué)學(xué)報(bào): 自然科學(xué)版,2006(4):43-45.

        [6]楊惠中,衛(wèi)乃興.中國英語學(xué)習(xí)者英語口語語料庫建設(shè)與研究[M].上海外語教育出版社,2004:1-4.

        注:本文為2014年山西省軟科學(xué)課題《基于動(dòng)態(tài)語料庫的英語高層次創(chuàng)新型人才培養(yǎng)策略研究》,2014年山西省科技廳軟科學(xué)課題《山西省對外宣傳中文化負(fù)載語匯的翻譯研究》階段性研究成果。

        作者簡介:李言實(shí)(1972—),女,山西臨汾人,太原理工大學(xué)外國語學(xué)院講師,主要從事翻譯學(xué)研究。武曉杰(1976—),男,山西介休人,太原理工大學(xué)外國語學(xué)院講師,主要從事翻譯學(xué)研究。張慧(1978—),女,山西太原人,太原理工大學(xué)外國語學(xué)院講師,主要從事翻譯學(xué)研究。

        ?誗編輯 趙飛飛

        中国丰满人妻videoshd| 久久久久亚洲AV成人网毛片| 久久久调教亚洲| 国产精品自拍盗摄自拍| 97在线视频人妻无码| 久久无码人妻精品一区二区三区| 亚洲精品黄网在线观看| 小草手机视频在线观看| 亚洲人成综合第一网站| 人人爽人人澡人人人妻| 香蕉视频一级| 一区二区三区四区在线观看视频| 国产精品女同二区五区九区| 美女脱了内裤露出奶头的视频| 无人视频在线观看免费播放影院| 老司机在线精品视频网站| 久久成人永久免费播放| 91久久福利国产成人精品| 国产少妇露脸精品自拍网站| 狠狠爱婷婷网五月天久久| 精品国产性色无码av网站| 国产亚洲精品aaaa片app| 国产在线观看精品一区二区三区| 在线播放偷拍一区二区| 久久中文字幕暴力一区| 真人做人试看60分钟免费视频| 富婆如狼似虎找黑人老外| 精品亚洲人伦一区二区三区| 中文字幕精品久久一区二区三区 | 免费看草逼操爽视频网站| 亚洲色精品三区二区一区 | 国产亚洲av手机在线观看| 校花高潮一区日韩| 日韩性感av一区二区三区| 精品无码av无码专区| 久久只精品99品免费久23| 亚洲国产精品一区二区第四页 | 视频一区二区三区中文字幕狠狠| 人妻少妇满足中文字幕| 西西午夜无码大胆啪啪国模| 粗了大了 整进去好爽视频|