亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語料庫語言研究對(duì)語言教學(xué)的啟示

        2012-12-31 00:00:00張敏,王禮華,張志義
        吉林農(nóng)業(yè)·C版 2012年10期

        摘要:文章通過對(duì)語料庫的演變與發(fā)展,語料庫的研究與機(jī)器翻譯,語料庫研究的科學(xué)性和前瞻性,及語料庫對(duì)語言教學(xué)的啟示,闡述了語料庫的應(yīng)用改變了傳統(tǒng)的語言研究模式,使得語言研究在具有科學(xué)性依據(jù)的同時(shí)更好地服務(wù)于語言的交際功能和目的。

        關(guān)鍵詞:計(jì)算機(jī)化;語料庫;科學(xué)性;前瞻性;語言教學(xué)

        中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1674-0432(2012)-10-0271-2

        基金項(xiàng)目:該論文為教育部2011年度“春輝計(jì)劃”立項(xiàng)資助合作科研項(xiàng)目,項(xiàng)目編號(hào):Z2011129。

        1 語料庫的演變與發(fā)展

        隨著計(jì)算機(jī)科學(xué)的發(fā)展,語料庫的研制也進(jìn)入到了新的階段。第一代語料庫通常是指20世紀(jì)60年代至80年代建成的電子語料庫。在這其中,由布朗大學(xué)于1963-1964年建成的布朗語料庫可以稱作最為典型的代表。該語料庫的全稱為“布朗大學(xué)當(dāng)代美語標(biāo)準(zhǔn)預(yù)料庫”是當(dāng)今最早的機(jī)讀語料庫。第一代語料庫通常將所收集的語料轉(zhuǎn)化為電子符號(hào)儲(chǔ)存在計(jì)算機(jī)內(nèi)。多種信息需要在計(jì)算機(jī)上進(jìn)行標(biāo)注。標(biāo)注指的是借助于計(jì)算機(jī)軟件對(duì)預(yù)料進(jìn)行加工,把各種語言特征的附碼標(biāo)注在相應(yīng)的語言成分上,這樣計(jì)算機(jī)才能夠進(jìn)行識(shí)讀。自20世紀(jì)下半葉英美開發(fā)出第一代語料庫以來,世界上許多國家和地區(qū)也陸續(xù)建立起各種單語語料庫,其中包括書面語和口語,共時(shí)語料和歷時(shí)語料。限于當(dāng)時(shí)的計(jì)算機(jī)技術(shù)和應(yīng)用水平,第一代語料庫的規(guī)模一般不超過100萬詞次。

        隨著計(jì)算機(jī)信息技術(shù)的發(fā)展出現(xiàn)了第二代語料庫。這些語料庫的規(guī)模通常在千萬詞甚至是上億詞次以上,數(shù)量之巨遠(yuǎn)遠(yuǎn)超過了第一代語料庫。此外,第二代計(jì)算機(jī)語料庫大都采用了教新的KDEM (Kurzwei Data Entry Machine) 光電符號(hào)識(shí)別技術(shù),大大加快了語料庫的標(biāo)注處理,能夠使語料庫的編碼和編輯從繁重的人工輸入中解脫出來。第二代語料庫的鮮明特點(diǎn)是語料庫建庫的周期短,對(duì)語料加工的自動(dòng)化程度高,結(jié)構(gòu)安排更為合理。這些特點(diǎn)在很大程度上都?xì)w功于計(jì)算機(jī)信息技術(shù)的不斷更新和迅猛發(fā)展。

        2 語料庫語言研究的科學(xué)性

        語料庫研究是一種科學(xué)的語言研究方法。語料庫的建立可以使語言研究者較為快速地從大批量文本中準(zhǔn)確地提取多種數(shù)據(jù)。運(yùn)用語料庫進(jìn)行分析,我們能夠十分有效地將語料庫中的大量數(shù)據(jù)呈現(xiàn)在我們面前,使得隱藏于大量文本中的語言信息得以浮現(xiàn)出來。只要研究者細(xì)心觀察,便可以從大量的數(shù)據(jù)中發(fā)現(xiàn)規(guī)律。這非常有利于研究者把定量研究和定性研究科學(xué)地結(jié)合起來,同時(shí)也為語言學(xué)習(xí)積累了豐富的科學(xué)知識(shí)。

        語料庫的應(yīng)用也充分體現(xiàn)出了科學(xué)性。語料庫的應(yīng)用大致可以分為建庫、數(shù)據(jù)提取、統(tǒng)計(jì)和數(shù)據(jù)分析這三個(gè)主要階段。在建庫之前,需要進(jìn)行取樣方面的論證,此時(shí)建庫者需要考慮到取樣的平衡,語料庫的設(shè)計(jì)容量,語料來源等。語料庫中的語料都是具有代表性的資料,具有很強(qiáng)的科學(xué)性。同時(shí),所得到的文本還需進(jìn)行細(xì)致的整理和清潔,并按照需要進(jìn)行必要的標(biāo)注。標(biāo)注主要分為元信息標(biāo)注,語音標(biāo)注,詞性賦碼,語義標(biāo)注,句法標(biāo)注等。無論是人工標(biāo)注還是自動(dòng)標(biāo)注,都要在核對(duì)其準(zhǔn)確性之后才能入庫。語言研究者可以利用各種語料庫分析工具從語料庫中提取所需信息。數(shù)據(jù)的提取可涉及到語音數(shù)據(jù)的提取,索引的生成,詞表的生成,主題詞表的生成和搭配和類連接的提取等。

        3 語料庫語言研究的前瞻性

        人類的各項(xiàng)交流均無法脫離語言這一工具。隨著科技的日新月異,語言的研究和學(xué)習(xí)也需要科學(xué)性的研究方法。計(jì)算機(jī)語料庫語言研究代表著語言研究發(fā)展的科學(xué)化趨勢,具有前瞻性。從第一個(gè)語料庫—布朗語料庫在美國誕生以來,語料庫的容量越來越大,計(jì)算機(jī)語料庫的設(shè)計(jì)越來越科學(xué)。隨著時(shí)代的進(jìn)步和科技的發(fā)展,語料庫的容量將近一步擴(kuò)大。同時(shí),在這些大型的語料庫中,語言研究者和使用者不僅能夠得到樣本文本,而且可以根據(jù)需要提取已對(duì)樣本進(jìn)行預(yù)處理的標(biāo)注文本、其他用戶的使用及評(píng)價(jià)信息等,以供研究是參考。隨著語言研究的國際化,不同語種的語言研究越來越依賴于可機(jī)讀的電子語料庫這一工具。人們已經(jīng)意識(shí)到傳統(tǒng)的語言學(xué)家、計(jì)算機(jī)語言學(xué)家和計(jì)算機(jī)科學(xué)家已經(jīng)聯(lián)手開始合作研究,使得語料庫語言學(xué)的研究成為一個(gè)跨學(xué)科的語言學(xué)分支。語料庫分析軟件及應(yīng)用軟件開發(fā)和推廣具有廣闊的前景?!白鳛橐环N獨(dú)特而強(qiáng)大的技術(shù)工具,計(jì)算機(jī)使得這種新的語言學(xué)(語料庫語言學(xué))成為可能?!? (Leech,1992)。在今后,隨著計(jì)算機(jī)的發(fā)展,語料庫語言學(xué)研究參與人員的不斷增加,語料庫分析和應(yīng)用軟件的開發(fā)和推廣既有重大意義,又有廣闊的前景。為了滿足不同語料庫使用者的需要,語料庫的編制者在研制綜合性的超大型的語料庫的同時(shí),正在努力建立更多的專業(yè)性較強(qiáng)的專門用途的語料庫。無論是大量的在線語料庫還是各種電子媒介發(fā)行的電子文本語料庫,以及各種類型的語料庫,其建設(shè),發(fā)展和應(yīng)用都離不開計(jì)算機(jī)和網(wǎng)絡(luò)平臺(tái)。語料庫的研究使語言研究和學(xué)習(xí)者不再拘泥于傳統(tǒng)的教學(xué)和學(xué)習(xí)方法,具有了與實(shí)際相結(jié)合的更加科學(xué)化的研究和學(xué)習(xí)方式。可以預(yù)見,語料庫的應(yīng)用將從傳統(tǒng)領(lǐng)域擴(kuò)展到更多的新興領(lǐng)域和學(xué)科,而且隨著以語料庫為基礎(chǔ)的研究方法日益受到重視并得到廣泛應(yīng)用,相應(yīng)研究成果的價(jià)值也會(huì)更加突出。

        4 語料庫語言研究對(duì)于語言學(xué)習(xí)的啟示

        語料庫研究將在語言教學(xué)和研究方面發(fā)揮更大的作用。語料庫語言研究使語言研究的層次更加清晰,更加立體化。語料庫的研究產(chǎn)生了基于詞語的語境共現(xiàn)技術(shù),詞表統(tǒng)計(jì)、搭配研究。同時(shí),分析形態(tài)的基本依據(jù)是詞語,主要概念為詞素、形態(tài)音位。分析詞語的基本依據(jù)是語境詞,主要概念為詞頻、形符、類符、類/形比、搭配詞、搭配力、語法模式、意義單位等。分析短語的基本依據(jù)是臨近的短語和句子,主要概念為詞簇、短語、表達(dá)和命題。分析篇章的基本依據(jù)是篇章的句子和同類文本,主要概念為銜接、文類、話語分析。由此可見,與傳統(tǒng)的語言研究方式相比,語料庫的研究使得語言研究更加細(xì)致,更加具體。在傳統(tǒng)的語言教學(xué)中,教學(xué)者通常只要求學(xué)習(xí)者掌握詞語的意思(教師大多是使用同義詞進(jìn)行釋義),也就是說,教師往往認(rèn)為只要求學(xué)生領(lǐng)會(huì)某詞在不同句子中表達(dá)什么意思就夠了。在語法講解時(shí),通常忽略了實(shí)際使用時(shí)的各種語境因素,過分強(qiáng)調(diào)所謂的系統(tǒng)性和正確性,使知識(shí)的學(xué)習(xí)過于僵化,學(xué)生往往在實(shí)際運(yùn)用中缺少靈活性。在課文的講解中,也沒有考慮到詞匯及句型的使用頻率,學(xué)生只是被動(dòng)地接受知識(shí),而在現(xiàn)實(shí)生活中往往不知如何表達(dá),形成了輸入與輸出極度不平衡的現(xiàn)象。

        語料庫的語言研究將引起外語教學(xué)思想觀念的轉(zhuǎn)變,改變傳統(tǒng)外語教學(xué)中輸入與輸出不平衡的現(xiàn)象。因?yàn)檎Z料庫的語言研究是有區(qū)分性地對(duì)待典型的語言現(xiàn)象。通過檢索手段進(jìn)行頻率統(tǒng)計(jì),語料庫語言學(xué)將語言的不對(duì)稱分布特征清楚地呈現(xiàn)在人們面前:大部分書面文章的95%的內(nèi)容由4000~5000個(gè)高頻詞構(gòu)成,而它們中的前1000個(gè)高頻詞又占據(jù)了文章的85%;在口語語料庫中,50個(gè)高頻功能詞就占據(jù)了60% (Nation,1990)。這樣,在語言教學(xué)過程中就能將高頻詞,高頻語法結(jié)構(gòu)和高頻詞匯搭配等。同時(shí),語料庫語言研究為分析目的語和母語之間的差異性提供了技術(shù)上的可能和科學(xué)可靠的依據(jù),它所揭示的目的語的典型語言特征是教學(xué)的重點(diǎn)并得到學(xué)生和教師的共同重視。語料庫的語言研究改變了傳統(tǒng)的對(duì)語言規(guī)則進(jìn)行大量的定義和解釋的僵化學(xué)習(xí)現(xiàn)象,通過對(duì)語料庫中大量實(shí)例的研究和分析可以得出語言的實(shí)際運(yùn)用規(guī)則。此外還能將以教師為中心的填鴨式教學(xué)變?yōu)橐詫W(xué)生為中心的探索型教學(xué),鼓勵(lì)學(xué)生充分利用語料庫資源,能夠極大地發(fā)揮他們?cè)趯W(xué)習(xí)中的積極性和主動(dòng)性。

        語料庫的語言研究可以打破傳統(tǒng)教學(xué)大綱的局限性,能夠?yàn)檎Z言教學(xué)提高豐富的詞匯、短語、句子、篇章及其他類型的資料。這些資料不僅在語法上正確,而且是在上下文里得體的語言結(jié)構(gòu)。語料庫的應(yīng)用還可以幫助語言教學(xué)者實(shí)現(xiàn)著名語言理論家克拉申可理解性輸入假設(shè)理論中的i+1原則,i代表的是學(xué)生現(xiàn)有的語言水平,1指的是提供給學(xué)生的輸入材料的難度要稍微提高一點(diǎn)(即略高于他們現(xiàn)有的水平)。在傳統(tǒng)教學(xué)中,教師很難把握這一差距,而語料庫的應(yīng)用可以使教師較為容易的把握這一差距。因?yàn)檎Z料庫可為語言教學(xué)者充分描述學(xué)生在某一階段的知識(shí)狀況,依據(jù)這一表述,大綱設(shè)計(jì)者便能制定出超出學(xué)生目前外語水平而難度在合理范圍之內(nèi)的學(xué)習(xí)內(nèi)容。以語料庫為基礎(chǔ)的語言教學(xué)能夠更好地實(shí)現(xiàn)語言的交際功能。由此可見,語料庫的語言研究為語言教學(xué)及語言應(yīng)用帶來了豐富的啟示,符合語言教學(xué)及語言應(yīng)用的發(fā)展趨勢。

        參考文獻(xiàn)

        [1] 張政.計(jì)算機(jī)翻譯研究[M].北京:清華大學(xué)出版社,2006.

        [2] 馮志偉.機(jī)器翻譯研究[M].北京:中國對(duì)外翻譯出版公司,

        2004.

        [3] 梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2010.

        作者簡介:張敏(1978-),女,吉林省吉林市人,北華大學(xué)外語學(xué)院講師,研究方向:語言學(xué);王禮華(1961-),女,福建泉州人,大阪電氣通訊大學(xué)綜合信息學(xué)部副教授,研究方向:數(shù)字游戲;張志義(1964-),男,吉林省吉林市人,北華大學(xué)工程訓(xùn)練中心博士,教授,研究方向:機(jī)械自動(dòng)化。

        国产女同舌吻1区2区| 人妻少妇进入猛烈时中文字幕| 亚洲激情综合中文字幕| 亚洲av永久无码精品古装片| 欧美日韩国产成人高清视频| 欧美成人a在线网站| AV成人午夜无码一区二区| 青青自拍视频成人免费观看| 国产麻豆久久av入口| 亚洲人成网站色www| 亚洲AV无码一区二区三区日日强| 538在线视频| 国产成人久久精品二区三区| 在线精品国产亚洲av蜜桃| 国产精品第一国产精品| 亚洲一区综合精品狠狠爱| 狼人av在线免费观看| 国产av剧情一区二区三区| 女邻居的大乳中文字幕| 亚洲mv国产精品mv日本mv| 中文字幕丰满人妻被公强| 曰韩内射六十七十老熟女影视 | 黑色丝袜秘书夹住巨龙摩擦| 国产在线无码制服丝袜无码| 久久精品成人91一区二区| 中文字幕乱码人妻在线| 国产98色在线 | 国产| 精品欧美乱码久久久久久1区2区| 国产精品久久无码免费看 | 国产西西裸体一级黄色大片| 91精品久久久中文字幕| 一本一本久久aa综合精品 | 成人区人妻精品一熟女| 久热爱精品视频在线观看久爱| 人妻少妇偷人精品一区二区三区| 国产av一区二区精品凹凸| 91精品福利观看| 日韩精品高清不卡一区二区三区| 日韩人妻不卡一区二区三区| 亚洲依依成人亚洲社区| jiZZ国产在线女人水多|