亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        免費綠色軟件AntConc在外語教學(xué)和研究中的應(yīng)用

        2009-04-03 06:44:00王春艷
        外語電化教學(xué) 2009年1期

        王春艷

        摘 要: 語料庫免費綠色工具軟件AntConc,由日本學(xué)者Laurence Anthony開發(fā),具有詞語檢索、生成詞表和主題詞三大功能。本文介紹了AntConc3.2.1的三項主要功能;以語料庫語言學(xué)界的權(quán)威軟件Wordsmith4.0為參照軟件,以SPSS11.5為統(tǒng)計工具,驗證了其主要功能的可信度;并概要舉例說明了和三大功能相關(guān)的基于語料庫和語料庫驅(qū)動的外語教學(xué)與研究。

        關(guān)鍵詞: AntConc;語料庫;綠色軟件

        中圖分類號:H319.3文獻(xiàn)標(biāo)識碼:A文章編號:1001-5795(2009)01-0045-0004

        語料庫語言學(xué)從60、70年代發(fā)展至今,逐步成為一門成熟的學(xué)科。該學(xué)科的迅速發(fā)展從很大程度上歸功于計算機技術(shù)的進(jìn)步和支持。許多工具軟件,如Claws,Pos-tagger,WordSmith,Mconcord等的開發(fā)對語料庫語言學(xué)的發(fā)展起著至關(guān)重要的作用。WordSmith是語料庫語言學(xué)的一個主要有力工具,在當(dāng)今的語料庫語言學(xué)領(lǐng)域是公認(rèn)的權(quán)威軟件,它由英國利物浦大學(xué)開發(fā),牛津大學(xué)出版社出版。WordSmith功能強大,但它是商業(yè)軟件。本文推薦使用的AntConc是由日本學(xué)者Laurence Anthony開發(fā)的綠色免費軟件,其版本在不斷更新。只要登錄到http://www.antlab.sci.waseda.ac.jp下載后即可直接使用。AntConc具有界面簡潔和操作方便的優(yōu)點,并基本實現(xiàn)了WordSmith的所有功能。該軟件的使用有助于語料庫語言學(xué)研究隊伍的壯大。本文通過重點介紹AntConc3.2.1的三大功能,即詞語檢索、生成詞表和主題詞功能,和WordSmith的基本功能進(jìn)行對比,用統(tǒng)計軟件SPSS11.5統(tǒng)計分析,驗證了AntConc的可信度,并概要說明了圍繞其三項主要功能而開展的基于語料庫和語料庫驅(qū)動的外語教學(xué)研究,由此說明了計算機輔助研究方法在外語研究和教學(xué)中的重要性。

        1 AntConc3.2.1軟件的主要功能

        1.1 詞語檢索功能

        從龐大的語料中檢索提取某個詞語或短語的所有詞條,是AntConc的基本功能。AntConc的檢索分為基本檢索和高級檢索?;緳z索功能可以實現(xiàn)對固定詞和詞組的檢索。檢索結(jié)果可以根據(jù)sort功能排序,并可以保存為text文件。

        AntConc的高級檢索功能可以對搜索條件進(jìn)行設(shè)定(context),例如,查找take和look的搭配,可以設(shè)定搜索詞為take,搭配詞(context word)為look,跨距(span)可以設(shè)定從右一(R1)到右五(R5),就能檢索到take a look, take on a peaceful look, take on a new look等搭配。

        高級檢索還可以實現(xiàn)基于文件的檢索。要實現(xiàn)基于文件的檢索,研究者要先行編寫一個text文件,把要檢索的內(nèi)容寫入文件。這樣可以一次性地對一組詞實現(xiàn)批量檢索。

        為了驗證AntConc檢索結(jié)果的可信度,筆者使用AntConc對一組介詞(38個)在語料庫Brown中進(jìn)行了檢索,其結(jié)果和語料庫語言學(xué)界公認(rèn)的權(quán)威軟件Wordsmith4.0的檢索結(jié)果進(jìn)行對比,統(tǒng)計計算得到二者相關(guān)值為1.00,這表明兩個軟件的檢索結(jié)果在0.01的水平上達(dá)到了顯著相關(guān)。進(jìn)而可以論斷AntConc的檢索結(jié)果可以信賴。兩個軟件在Brown語料庫中檢索到38個介詞的頻次對比(采用log對數(shù)值),如圖1┧示。

        AntConc的檢索功能可以實現(xiàn)對母語文本和學(xué)習(xí)者文本中有關(guān)語言現(xiàn)象的頻率統(tǒng)計。揭示母語語言現(xiàn)象及語言的發(fā)展規(guī)律;對照母語文本和學(xué)習(xí)者文本,發(fā)現(xiàn)其異同,了解外語學(xué)習(xí)者中間語的發(fā)展特點及發(fā)展規(guī)律。例如:英語中有很多近義詞,要研究比較其用法的區(qū)別,可以基于母語語料庫,對它們進(jìn)行檢索、詞頻統(tǒng)計、人工分析后得出結(jié)論。以true 和real一組近義詞為例,用AntConc檢索Brown語料庫,分別得到含有real的索引行256條,含有true的索引行231條。從它們在句中充當(dāng)?shù)恼Z法成分、語意韻、非詞語化使用狀況三方面進(jìn)行分析。表1~3顯示了real和true在語料庫Brown中的語法成分、語義韻和非詞語化的使用狀況。研究結(jié)果表明real 和true在句中充當(dāng)?shù)恼Z法成分存在著差別:Real在句中更多時候做定語,true在句中更多時候做表語。兩者搭配詞的語義韻也存在顯著差異:real既可以和褒義、中性詞語搭配使用,也可以和貶義詞語搭配使用,其語義韻表現(xiàn)為中性;true語義韻也表現(xiàn)為中性,但是它一般和褒義、中性意義的詞語搭配使用,很少與貶義詞語搭配使用。在非詞語化使用的程度上,形容詞real和true 之間也存在顯著差異: real 的非詞語化現(xiàn)象明顯,true的非詞語化現(xiàn)象不明顯(注:此研究數(shù)據(jù)為筆者2007年的相關(guān)研究的數(shù)據(jù)。)。

        1.2 生成詞表功能(Wordlist)

        根據(jù)某個語料庫,統(tǒng)計生成詞匯的詞頻表是AntConc又一大主要功能。生成詞表功能對教學(xué)大綱的制定、課本內(nèi)容的編排起著舉足輕重的作用。它還為對比不同語料庫,不同文本即不同的語言群體的詞匯使用狀況提供可靠的語料依據(jù)。AntConc生成詞表的功能不但可以生成單獨的詞匯列表(wordlist),還可以生成詞塊(cluster)列表。AntConc的詞塊生成功能在cluster功能卡下操作。值得注意的是,由于計算機只是機械地切分統(tǒng)計詞塊的頻率,所以對于計算機生成的詞塊表,一定要進(jìn)行后期的意義分析,把生成詞塊表中沒有意義的詞塊去除。

        為了驗證AntConc詞表生成功能的可靠性,把AntConc基于語料庫Brown生成的詞表和WordSmith的詞表進(jìn)行了對比,兩個詞表前1000個中有959個重疊詞(注:此研究數(shù)據(jù)使用武漢大學(xué)沈陽老師提供的軟件ROST計算得出,特此感謝。)。把959個重疊詞在Brown中出現(xiàn)的頻次進(jìn)行統(tǒng)計計算,兩者相關(guān)值為0.977,結(jié)果表明兩者在0.01的水平上呈現(xiàn)顯著相關(guān)。因此可以得到結(jié)論:AntConc生成的詞表可以信賴?;贐rown生成的兩個詞表的重疊詞的頻次對比(采用log對數(shù)值)如圖2所示。

        生成詞表用于大綱設(shè)計、課本編排的研究有很多:Ljung(1991)對比了瑞典EFL高級中學(xué)課本內(nèi)容和Cobuild語料庫的檢索結(jié)果,發(fā)現(xiàn)在課本中出現(xiàn)頻率最高的前1000個詞中有20%未出現(xiàn)在Cobuild語料庫頻率最高的前1000個詞中。 Kennedy(1998)也觀察到了課本和語料庫的內(nèi)容不一致現(xiàn)象。他發(fā)現(xiàn)表示量詞時,很多課本多用“all”和“every”,而書面語語料庫和口語語料庫都表明更地道的表達(dá)方法是用詞匯形式來達(dá)到量化的目的,如:使用entirely,completely,whole,throughout等副詞(摘自Sincliair,2004:41)。此類研究的基礎(chǔ)是基于語料庫所生成的詞表。

        詞塊的研究也受到越來越多的語言學(xué)家的關(guān)注(Sinclair,1991;Lewis,1993,1997,2000;Nation,2001;Willis,1990;Nattinger,1992;Cook,1997等)(見楊,2005)。詞塊的研究表明母語講話者的語言中存在大量大于單個詞的詞塊,學(xué)習(xí)者的中間語也同樣存在著大量詞塊。語料庫驅(qū)動的詞塊研究范式由Sinclair(1991)首創(chuàng),Altenberg(1998)基于母語口語語料庫LLC(London Lund Corpus)對母語口語詞塊的特點研究被視為該范式下詞塊學(xué)研究的里程碑(衛(wèi)乃興,2007)。衛(wèi)乃興(2007)基于COLSEC描述了中國學(xué)習(xí)者英語口語的詞塊特征并發(fā)現(xiàn),學(xué)習(xí)者用于表達(dá)命題內(nèi)容的復(fù)現(xiàn)詞塊多于本族語者, 而用于實施語用功能的復(fù)現(xiàn)詞塊則嚴(yán)重少于本族語者甚至完全缺失, 由此影響到學(xué)習(xí)者話語的交互性、合作性、禮貌性與適切性等語用品質(zhì)。濮建忠(2003)基于CLEC對中國英語學(xué)習(xí)者的書面語的詞塊特點有詳細(xì)的研究和分析,研究結(jié)果表明母語者前20個最常用的三詞詞塊無一出現(xiàn)在學(xué)習(xí)者最常用的20個三詞詞塊中;母語者的詞塊絕大多數(shù)似與語篇的內(nèi)容無多大關(guān)系,而學(xué)習(xí)者的詞塊絕大多數(shù)與語篇內(nèi)容直接相關(guān)。詞塊研究中對詞塊的檢索、統(tǒng)計功能,AntConc都能夠?qū)崿F(xiàn),這為詞塊研究提供了可靠的技術(shù)支持。

        為了驗證AntConc生成詞塊功能的可信度,筆者對濮建忠(2005)的詞塊研究結(jié)果用AntConc進(jìn)行重新統(tǒng)計,結(jié)果非常一致:基于母語語料庫Brown,AntConc生成的三詞詞塊和濮建忠(2005)使用Wordsmith生成的三詞詞塊的前20個最常用詞塊保持完全一致?;谥袊⒄Z學(xué)習(xí)者語料庫CLEC(非英語專業(yè)學(xué)生作文部分),AntConc生成的三詞詞塊列表最常用的前20個詞塊中含有濮建忠(2005)使用Wordsmith生成的三詞詞塊列表前20中的16個,未包括的四個詞塊也相繼出現(xiàn)在詞塊列表的第22、23、24和35位(如表4所示)。用AntConc生成的詞塊列表和濮建忠(2005)的研究結(jié)果一致:母語者前20個最常用的三詞詞塊無一出現(xiàn)在學(xué)習(xí)者最常用的20個三詞詞塊中。由此可以認(rèn)為AntConc具有可靠的詞塊生成功能。

        1.3 主題詞功能(keyword list)

        通過比較兩個不同大小的語料庫,可以得到主題詞,也就是所研究的語料庫中頻率超常的詞語。計算主題詞需要兩個語料庫。一是觀察語料庫(observed corpus);一是參照語料庫(reference corpus)。一般來說,參照語料庫要比觀察語料庫大?;驹~表統(tǒng)計能夠提供一個語料庫文本的詞語頻率和分布信息,卻難以說明詞語在語境中的用法和詞語之間的關(guān)系;主題詞統(tǒng)計能提供語篇層面詞語的分布與文本主題的關(guān)系以及詞語之間的關(guān)系(李文中,2005)。

        根據(jù)主題詞網(wǎng)絡(luò)分析,能夠發(fā)現(xiàn)主題詞觸發(fā)學(xué)生有關(guān)現(xiàn)實世界的認(rèn)知結(jié)構(gòu),學(xué)生通過選擇詞語實現(xiàn)語義表達(dá)。學(xué)生的心理詞匯圍繞某個主題概念形成獨特的語義場,在語義場中,詞語與詞語之間具有復(fù)雜的語義關(guān)系和聯(lián)想關(guān)系,這些相互關(guān)聯(lián)的詞語在運用中通過在句子層面的詞語搭配和類聯(lián)結(jié)以及在語篇層面的詞語聯(lián)系體現(xiàn)出來。學(xué)生的作文成功與否,取決于他們能否構(gòu)建圍繞主題、聯(lián)想以及詞語搭配關(guān)系的詞語網(wǎng)絡(luò)(李文中,2005)。

        AntConc的主題詞功能可以在keyword list功能卡下操作。AntConc的主題詞功能既可以生成正主題詞(positive keywords)列表,也可以生成負(fù)主題詞(negative keywords)列表。

        如圖3所示,以母語語料庫Brown為參照語料庫,觀察60位同學(xué)以Education為題的同題作文(注:60篇作文為2007年外研社暑期語料庫和語言研究培訓(xùn)班提供數(shù)據(jù),感謝李文中、梁茂成、許家金等老師的幫助和支持。)主題詞狀況。在AntConc的主題詞功能下,計算出60篇作文的主題詞。如表3所示:結(jié)果顯示的第一行是根據(jù)主題詞的主題性log likelihood值由高到低的排序。第二行是60篇作文中關(guān)鍵詞出現(xiàn)的絕對頻率。第三行是主題性log likelihood值。第四行是主題詞列表。

        根據(jù)得到的主題詞表,可以畫出主題詞網(wǎng)絡(luò)圖,并進(jìn)行主題詞分析(李文中,2005)。從education為題的60篇作文的主題詞表,可以看出該主題的行為者為I,we, you,us等表明學(xué)生認(rèn)為教育是關(guān)系你我大家的問題。表達(dá)行為的詞有g(shù)et,keep,receive,master等表達(dá)學(xué)生渴望通過教育得到知識、掌握知識的愿望。表示具體動作的動詞有study,learn,read,catch,等,說明學(xué)生認(rèn)為要通過教育,通過學(xué)習(xí)、閱讀的方式,獲得知識。方位詞有school,university,society等,學(xué)生把教育和學(xué)校、大學(xué)聯(lián)系在一起,他們認(rèn)為受教育的程度和在社會的發(fā)展以及畢業(yè)后步入社會的生存狀況息息相關(guān)。主題詞的聯(lián)想詞有l(wèi)ifelong,important,secure,future,useful,knowledge等,所有這些都能折射出學(xué)生對教育的積極肯定態(tài)度。

        為了驗證AntConc的生成主題詞表功能的可信度,同樣對AntConc的主題詞生成功能和WordSmith4.0的主題詞功能進(jìn)行了對比。以母語語料庫Brown為參照語料庫,分析60位同學(xué)以education為題的同題作文的主題詞狀況。對于AntConc和WordSmith4.0各自生成的正主題詞詞表的前170個詞進(jìn)行了對比,其重疊詞有154個。154個重疊詞的頻次在0.01水平上的相關(guān)值為0.999;154個重疊詞的主題性值(log likelihood值)在0.01水平上的相關(guān)值為0.998。這表明AntConc的主題詞生成功能可以信賴。

        2 AntConc3.2.1軟件的其他功能

        AntConc除了具有上述三大主要功能以外,還可以提供檢索詞的上下文背景,檢索詞在文本中出現(xiàn)的位置圖,計算搭配詞的搭配力等功能。對于語法標(biāo)注過的文本,AntConc還可以通過正則表達(dá)式實現(xiàn)對一定語法單位的檢索,這對詞法、句法的研究是非常有力、可靠的支持。

        3 小結(jié)

        本文舉例概述了AntConc的主要功能及相關(guān)研究,通過對比AntConc和WordSmith的詞語檢索、生成詞表和主題詞三大基本功能,我們可以得到如下結(jié)論:免費綠色軟件AntConc3.2.1功能齊全,值得信賴。它為基于語料庫和語料庫驅(qū)動的外語教學(xué)與研究有著巨大的支持,對日益廣大的外語研究者提供了免費的幫助,這里還要非常感謝日本學(xué)者Laurence Anthony的開拓和奉獻(xiàn)精神。2007年外研社組織的語料庫和語言研究暑期研討班也重點介紹了AntConc的操作用法。希望AntConc的功能越來越完善,更多的學(xué)者能夠掌握這個有用的工具,開展自己的外語教學(xué)和研究,為我們的外語研究和教學(xué)發(fā)展做貢獻(xiàn)?!?/p>

        參考文獻(xiàn)

        [1] Anthony, L. AntConc: Design and Development of a Freeware Corpus Analysis Toolkit for the Technical Writing Classroom[C]. 2005 IEEE International Professional Communication Conference Proceedings,2005.

        [2] Biber, D., Conrad, S. and Reppen, R. Corpus Linguistics[M]. Foreign Language Teaching and Research Press, Cambridge University Press,2000.

        [3] Lyons J. Language and Linguistics[M]. Cambridge University Press, Cambridge. M,1981.

        [4] Kennedy, G. An Introduction to Corpus Linguistics[M]. Foreign Language Teaching and Research Press,2000.

        [5] Sinclair, J. How to use corpora in Language Teaching[M]. John Benjamins Publishing Company,2004.

        [6] Sinclair, J. Trust the text[M]. Routledge London,2004.

        [7] Thomas, J. Using Corpora for Language Research[M]. Foreign Language Teaching and Research Press,2001.

        [8] 王立非,梁茂成.Wordsmith方法在外語教學(xué)中的應(yīng)用[J].外語電化教學(xué),2007.6.

        [9] 衛(wèi)乃興.詞語搭配的界定與研究體系[M].上海:上海交通大學(xué)出版社,2002.

        [10] 衛(wèi)乃興,李文中,濮建忠.語料庫應(yīng)用研究[C].上海:上海外語教育出版社,2005.

        [11] 楊惠中,桂詩春,楊達(dá)復(fù).基于CLEC語料庫的中國學(xué)習(xí)者英語分析[C].上海:上海外語教育出版社,2005.

        [12] 楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2004.

        Applications of AntConc in Foreign Language Teaching and Research

        WANG Chun-yan

        (Foreign Language Institute, Shanghai Jiaotong University, Shanghai 200240, China)

        Abstract: AntConc is a free and green tool developed by the Japanese scholar Laurence Anthony. AntConc featured by three main functions of concordance, wordlist and keywords now is extensively applied in the field of corpus linguistics. This paper introduces the three main functions of AntConc 3.2.1 and confirms its reliability in reference to the authority software Wordsmith 4.0. during which the statistics software SPSS 11.5 is employed. Some corpus-based and corpus-driven studies related to its three main functions in foreign language teaching and researching are also exemplified in this paper.

        Key words: AntConc; Corpus; Green Software

        日本人妻av在线观看| 老熟妻内射精品一区| 免费一区二区三区在线视频| 一区二区三区国产精品| 国模91九色精品二三四| 精品久久久久久无码人妻蜜桃| 亚洲国产av无码精品| 熟女人妻在线视频| 亚洲av无码专区亚洲av桃 | 黑人免费一区二区三区| 国产伦理一区二区久久精品| 精品+无码+在线观看| 性动态图av无码专区| 窄裙美女教师在线观看视频| 国家一级内射高清视频| а√天堂8资源中文在线| 国产剧情av麻豆香蕉精品| 亚洲最新版无码AV| 最新国内视频免费自拍一区| 国产av无码专区亚洲av麻豆| 无码aⅴ免费中文字幕久久| 亚洲精品久久国产高清情趣图文 | 日本道免费一区日韩精品| 免费在线观看av不卡网站| 亚洲一区二区三区中文字幂| 亚洲视频高清| 一本色道88久久加勒比精品| 久久久久成人精品无码中文字幕 | 久久国产免费观看精品3| 亚洲91av| 国产精品农村妇女一区二区三区| 亚洲国产精品18久久久久久| 国产精品毛片无码| 国产成人AV乱码免费观看| 日韩精品在线一二三四区| 极品新婚夜少妇真紧| 免费精品美女久久久久久久久久| 男女深夜视频网站入口| 欧美激情视频一区二区三区免费 | 四虎精品成人免费观看| 国产91成人自拍视频|