亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語料庫驅(qū)動(dòng)下的詞語搭配研究

        2016-07-06 19:11:08岳士君
        藝術(shù)科技 2016年3期
        關(guān)鍵詞:語料庫

        岳士君

        摘 要:文章通過語料庫驅(qū)動(dòng)的方法,研究“保持”和“維持”與前后搭配詞的關(guān)系,使用相關(guān)對(duì)“保持”和“維持”的詞語搭配作了定量與定性分析。得出結(jié)論:“保持”前只能加“還、仍然、一直”等副詞,而“維持”還可以加“只、才、只能”等副詞;“保持”后還常常跟與人心理有關(guān)的形容詞搭配,且常常是積極的,維持后接的名詞常常是個(gè)人的最低需求,如生活、生計(jì)、生命,維持后最常接名詞“秩序”。

        關(guān)鍵詞:語料庫;詞語搭配;保持;維持

        0 引言

        自20世紀(jì)60年代人類歷史上第一個(gè)計(jì)算機(jī)語料庫——Brown語料庫問世以來,語言學(xué)界越來越認(rèn)識(shí)到用計(jì)算機(jī)采集的大規(guī)模語料庫對(duì)于語言學(xué)實(shí)證研究的重要作用。運(yùn)用語料庫,我們可以進(jìn)行詞語、句子甚至是語篇的研究。而詞語搭配是當(dāng)今語料庫語言學(xué)最為活躍的領(lǐng)域。在我國,特別是2000年以來,它越來越受到人們的重視。相關(guān)的研究包括詞語搭配的概念界定如林杏光(1994)、[1]衛(wèi)乃興(2002))、[2]詞語搭配研究的理論框架(李文中(2004)、[3]繆海燕、孫藍(lán)(2005)[4])、基于語料庫和語料庫驅(qū)動(dòng)的研究方法(如衛(wèi)乃興(2002a)[5])等,其研究成果主要運(yùn)用于外語教學(xué)、詞典編纂等領(lǐng)域。

        1 研究緣由及方法

        1.1 研究緣由

        查北語HSK動(dòng)態(tài)作文語料庫,維持用錯(cuò)共9例,應(yīng)該為保持的有3例,占33.33%,比如我希望爸爸在光州經(jīng)常你一個(gè)人生活{CJZR},還是能保持{CC維持}健康,過得開心。

        保持用錯(cuò)共36例,應(yīng)該為維持的有8例,占22.22%。比如:人類為了維持{CC保持}自己的生活才種糧食{CC食[C]物}。

        《現(xiàn)代漢語詞典》(第6版)對(duì)保持的解釋為:動(dòng):維持(原狀),使不消失或不減弱。對(duì)維持的解釋:動(dòng)①使繼續(xù)存在下去;保持②保護(hù);維護(hù)支持。我們可以看到,詞典釋詞始終不能避免循環(huán)釋義的弊端。

        本文將采用語料庫的數(shù)據(jù)對(duì)保持和維持的前后搭配詞作定量分析,分析它們的共性和差異,并通過個(gè)例研究對(duì)語料庫語言學(xué)的詞語搭配研究起到一定的啟示作用。

        1.2 研究方法

        衛(wèi)乃興(2002a)指出,詞語搭配研究有兩種基本方法:基于數(shù)據(jù)(data-based approach)的方法和數(shù)據(jù)驅(qū)動(dòng)(data-driven approach)的方法。本文即采用第二種方法:數(shù)據(jù)驅(qū)動(dòng)的方法,最大限度地減少人為因素的干擾。

        本文使用Laurence Anthony編寫的軟件AntConc3.4.3w(Windows)2014對(duì)語料進(jìn)行處理。首先,將語料文本和AntConc都設(shè)置成相應(yīng)的UTF-8編碼格;其次,使用中科院的ICTCLAS軟件對(duì)語料進(jìn)行分詞處理;最后,將分詞語料導(dǎo)入AntConc軟件,進(jìn)行檢索分析。

        2 “保持”和“維持”的搭配研究

        2.1 語料整理與分析

        2.1.1 語料整理

        本文選用中國傳媒大學(xué)媒體語言語料庫,在語料庫中輸入“保持”一詞28155條索引,使用Excel的Index函數(shù)嵌套row函數(shù)每隔14行提取一條索引,共取2000條。在語料庫中輸入“維持”一詞,獲得8526條索引,每隔4行提取一條索引,共取2000條。

        2.1.2 語料分析

        跨距的選擇:孫宏林(1998)[6]在大規(guī)模漢語語料中統(tǒng)計(jì)了名詞、動(dòng)詞、形容詞的搭配詞的分布情況,得出動(dòng)詞的最佳觀察窗口是(-3,4),本文即采取孫的結(jié)論,把跨距界定在(-3,4)之間。

        T值和MI值:在“Tool preference”下選擇“Collocates preference”,然后在“show statistics measure”中選擇MI值或T值。根據(jù)汪臘萍(2006)[7]的研究成果,如果某詞項(xiàng)的MI值和T值都比較大(MI3且T2.33),則該詞項(xiàng)組合可被認(rèn)為是典型且常用的詞項(xiàng)搭配。本文將沿用已有研究成果,即結(jié)合MI值和T值進(jìn)行測(cè)量。

        其他:“concordance”選項(xiàng)卡中將“Search Window Size”設(shè)置為25,以便于顯示節(jié)點(diǎn)詞兩側(cè)(-4,4)距離的語境。Collocates選項(xiàng)卡中的最小頻數(shù)設(shè)為3。結(jié)果以T值或MI值排序,故需要選擇“Sort by stat”。

        所有參數(shù)設(shè)置完成,在搜索框中輸入索引詞,點(diǎn)擊“Start”。

        2.2 “保持”和“維持”的右側(cè)搭配詞研究

        2.2.1 “保持”右側(cè)搭配詞考察

        AntConc3.4.3w(Windows)2014對(duì)“保持”搭配詞進(jìn)行檢索,按照T值和MI值分別進(jìn)行排序,再按照MI3且T2.33取值(使用excel的if函數(shù)嵌套countif函數(shù)、vlookup函數(shù)求得交集,再用if函數(shù)區(qū)分左側(cè)搭配詞和右側(cè)搭配詞)最后得出134條高頻右側(cè)搭配詞,總計(jì)頻數(shù)3340次?,F(xiàn)按搭配詞的共現(xiàn)頻率排列如下(限于篇幅,取前20個(gè),括號(hào)內(nèi)為搭配詞頻數(shù),下同):

        穩(wěn)定(196)、溝通(60)、克制(36)、左右(25)、經(jīng)濟(jì)(194)、一個(gè)(57)、以上(35)、一定(25)、平穩(wěn)(187)、勢(shì)頭(57)、狀態(tài)(34)、冷靜(25)、較(165)、交往(56)、政策(34)、領(lǐng)先(24)、快(139)、黨(49)、協(xié)調(diào)(34)、持續(xù)(24)。

        這些詞可以歸納為名詞、動(dòng)詞、形容詞、助詞、數(shù)詞、代詞、連詞等,我們?nèi)サ魯?shù)詞、代詞、連詞等非搭配關(guān)系詞,得到“保持”右搭配詞詞性歸類:

        名詞:左右、經(jīng)濟(jì)、以上、勢(shì)頭、狀態(tài)、政策、態(tài)勢(shì)、高層、社會(huì)、水平、高度、一致、距離。

        動(dòng)詞:溝通、克制、交往、領(lǐng)先、持續(xù)、增長、聯(lián)系。

        形容詞:穩(wěn)定、一定、平穩(wěn)、協(xié)調(diào)、良好、密切、基本、健康、清醒、安全、冷靜、長期。

        2.2.2 “維持”右側(cè)搭配詞考察

        AntConc3.4.3w(Windows)2014對(duì)“保持”搭配詞進(jìn)行檢索,按照T值和MI值分別進(jìn)行排序,再按照MI3且T2.33取值,最后得出118條高頻右側(cè)搭配詞,總計(jì)頻數(shù)2684次?,F(xiàn)按搭配詞的共現(xiàn)頻率排列如下:

        在(331)、低(46)、時(shí)間(29)、這種(23)、秩序(198)、生活(45)、生計(jì)(28)、運(yùn)轉(zhuǎn)(23)、不(156)、左右(40)、較(28)、天(23)、一個(gè)(81)、下去(36)、治安(27)、零(23)、原判(57)、正常(35)、以上(26)、高位(23)。

        這些詞可以歸納為名詞、動(dòng)詞、形容詞、助詞、數(shù)詞、代詞、連詞等,我們?nèi)サ魯?shù)詞、代詞、連詞等非搭配關(guān)系詞,得到“維持”右搭配詞詞性歸類:

        名詞:秩序、原判、水平、生活、左右、現(xiàn)狀、生命、時(shí)間、生計(jì)、治安、以上、天氣、目前、政策、高位。

        動(dòng)詞:變、下去、至、運(yùn)轉(zhuǎn)、比較、運(yùn)營、運(yùn)行。

        形容詞:穩(wěn)定、高、低、正常、安全、長。

        代詞:一個(gè)、這個(gè)、這種、自己。

        2.2.3 “保持”和“維持”右側(cè)搭配詞的對(duì)比考察

        名詞:維持后接的名詞常常是個(gè)人的最低需求,如生活、生計(jì)、生命,維持后最常接名詞“秩序”,而在其他場(chǎng)合,維持和保持可以互換,如左右、政策、水平等。

        動(dòng)詞:保持常常后接的表現(xiàn)人與人之間關(guān)系的動(dòng)詞,如溝通、克制、交往、領(lǐng)先,而維持常跟著表示事物運(yùn)動(dòng)的動(dòng)詞,如變化、下去、至、運(yùn)轉(zhuǎn)、比較、運(yùn)營、運(yùn)行。

        形容詞:兩者都可以表示事物處于“穩(wěn)定”狀態(tài),但是保持還常常與人心理有關(guān)的形容詞搭配,且常常是積極的,如清醒、冷靜。

        代詞:保持跟不定代詞“一個(gè)”搭配較多,而維持還可以跟有定代詞“這個(gè)、這種”搭配。

        2.3 “保持”和“維持”的左側(cè)搭配詞研究

        2.3.1 “保持”左側(cè)搭配詞考察

        AntConc3.4.3w(Windows)2014對(duì)“保持”搭配詞進(jìn)行檢索,按照T值和MI值分別進(jìn)行排序,再按照MI3且T2.33取值,最后得出85條高頻右側(cè)搭配詞,總計(jì)頻數(shù)1868次?,F(xiàn)按搭配詞的共現(xiàn)頻率排列如下:

        繼續(xù)(157)、會(huì)(41)、仍然(27)、總體(20)、要(155)、能(40)、水土(26)、事務(wù)(19)、始終(79)、能夠(37)、連續(xù)(25)、為了(19)、將(74)、雙方(33)、愿(25)、各方(17)、一直(59)、希望(33)、價(jià)格(23)、內(nèi)(16)。

        這些詞可以歸納為名詞、動(dòng)詞、形容詞、副詞、連詞、介詞等,“維持”右搭配詞詞性歸類:

        名詞:關(guān)系、雙方、希望、金融、水土、價(jià)格、紀(jì)錄、中方、總體、事物、各方、危機(jī)。

        動(dòng)詞:繼續(xù)、要、會(huì)、能、能夠、連續(xù)、愿、處理、沖擊、呼吁、擴(kuò)大。

        形容詞:好、努力。

        副詞:始終、將、一直、還、仍、仍然、依然、必須。

        2.3.2 “維持”左側(cè)搭配詞考察

        AntConc3.4.3w (Windows)2014對(duì)“保持”搭配詞進(jìn)行檢索,按照T值和MI值分別進(jìn)行排序,再按照MI3且T2.33取值,最后得出105條高頻右側(cè)搭配詞,總計(jì)頻數(shù)1958次?,F(xiàn)按搭配詞的共現(xiàn)頻率排列如下(限于篇幅,取前20個(gè)):

        將(140)、一直(46)、如果(23)、聯(lián)邦(17)、來(101)、上訴(38)、現(xiàn)場(chǎng)(23)、難以(17)、還(86)、靠(37)、只(23)、判決(17)、繼續(xù)(76)、為了(37)、但(21)、氣溫(17)、能(76)、可以(30)、并(20)、想(17)。

        這些詞可以歸納為名詞、動(dòng)詞、形容詞、副詞、連詞、介詞等,“維持”右搭配詞詞性歸類:

        名詞:利率、價(jià)格、現(xiàn)場(chǎng)、地區(qū)、基金、警察、聯(lián)邦、判決、氣溫、二審、美聯(lián)儲(chǔ)、央行。

        動(dòng)詞:來、繼續(xù)、能、要、能夠、上訴、靠、可以、難以、宣布、決定、駁回、想、主導(dǎo)。

        副詞:還、仍、仍然、一直、依然、只、才、只能。

        2.3.3 “保持”和“維持”左側(cè)搭配詞的對(duì)比考察

        就名詞和動(dòng)詞來講,保持和維持沒有顯著差異,但是兩者前面的副詞存在差異,保持前只能加“還、仍然、一直”等副詞,而維持還可以加“只、才、只能”等副詞。

        3 結(jié)論

        以下是HSK語料中,維持誤用為保持的案例:

        用機(jī)器把營[C]養(yǎng)送給{CC到}病人,維持{CC保持}病人的生命。

        這三個(gè)和尚的故事告訴我們{CJX}在生活上很重要的事,[BC。]就是應(yīng)該互相幫助,要不然難以維持{C保持}社會(huì)秩序。

        但是經(jīng)濟(jì)方面,對(duì)越南來講,比較[F較]困難一點(diǎn),因?yàn)榧依镏挥幸粋€(gè)人工作,是很難維持{CC保持}生計(jì)[F計(jì)]的。

        最重要的是我們以后怎樣維持{CC保持}我們的生命?

        為了維持{CC保持}生命,吃的食品[BD,]后來變成威脅人類生命的存在。

        人類為了維持{CC保持}自己的生活才種糧食{CC食[C]物}。

        因此保持[C]夫妻的好關(guān)系才會(huì)維持{CC保持}溫暖[C]的家庭[C]。

        以下是HSK語料中,維持誤用為保持的案例:

        可是汽車的喇叭聲應(yīng)該保持{CC維持}現(xiàn)在的聲音,否則一定會(huì){CJ-zy會(huì)}發(fā)生嚴(yán)重的交通事故,總之我覺得這個(gè)作法要看情況。

        我希望爸爸在光州經(jīng)常你一個(gè)人生活{CJZR},還是能保持{CC維持}健康,過得開心。

        我們還是在有聲音的狀況下才能活,[BC、]才能保持{CC維持}冷靜{CQ的}自己。

        用本文研究方法考察出的“維持”與“保持”的區(qū)別可以很好地幫助留學(xué)生采取正確的表達(dá)。同時(shí),通過個(gè)例研究可以推廣到其他近義詞的比較,這對(duì)于近義詞詞典的編纂起到了很好的補(bǔ)充作用。

        4 不足與展望

        第一,語料庫來源單一。本文只選用了中國傳媒大學(xué)的語料庫,如果同時(shí)從國家語委以及北京大學(xué)的現(xiàn)代漢語語料庫中抽取相同比例的語料,會(huì)使語料更具平衡性。

        第二,參考類連接。本文只使用了語料庫驅(qū)動(dòng)的方式進(jìn)行研究,如果參考建立類連接,將會(huì)更好地從句法層面凸顯“維持”和“保持”區(qū)別。

        參考文獻(xiàn):

        [1] 林杏光.論詞語搭配及其研究[J].語言教學(xué)與研究,1994(4):19-25.

        [2] 衛(wèi)乃興.詞語搭配的界定與研究體系[M].上海:上海交通大學(xué)出版社,2002.

        [3] 李文中.基于COLEC的中介語搭配及學(xué)習(xí)者策略分析[J].河南師范大學(xué)學(xué)報(bào),2004(31):5.

        [4] 繆海燕,孫藍(lán).非詞匯入高頻動(dòng)詞搭配的組塊效應(yīng)——一項(xiàng)基于語料庫的研究[J].解放軍外國語學(xué)院學(xué)報(bào),2005,28(3):40-43.

        [5] 衛(wèi)乃興.基于語料庫和語料庫驅(qū)動(dòng)的詞語搭配研究[J].當(dāng)代語言學(xué),2002,4(2):101-104.

        [6] 孫宏林.詞語搭配在文本中的分布特征[A].黃昌寧.1998中文信息處理國際會(huì)議論文集[C].北京:清華大學(xué)出版社,1998:230-236.

        [7] 汪臘萍.詞項(xiàng)搭配的定量分析方法[J].上海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2006(6):117-122.

        猜你喜歡
        語料庫
        《語料庫翻譯文體學(xué)》評(píng)介
        基于語料庫的“はずだ”語義用法分析
        基于語料庫“隱秘”的詞類標(biāo)注初步探究
        把課文的優(yōu)美表達(dá)存進(jìn)語料庫
        基于COCA語料庫的近義詞辨析 ——以choose和select為例
        口譯不宜“任性”:基于語料庫的外事翻譯等效探索
        語言與翻譯(2015年3期)2015-07-18 11:11:04
        基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
        語言與翻譯(2015年4期)2015-07-18 11:07:45
        基于英漢雙語平行語料庫的無根回譯研究
        基于語料庫的近義詞辨析研究——以suspect和doubt為例
        低碳經(jīng)濟(jì)英語語料庫建設(shè)與應(yīng)用
        久久精品中文字幕久久| 亚洲av成人精品日韩在线播放| 亚洲av无码av男人的天堂| 夜夜综合网| 亚洲国产精品夜男人天堂| 麻豆国产精品一区二区三区| 无码人妻丰满熟妇啪啪网站| 在线观看国产精品日韩av| 亚洲AV秘 无码一区二区三| 中文字幕日韩精品人妻久久久| 国产午夜av秒播在线观看| 秋霞午夜无码鲁丝片午夜精品| 999久久66久6只有精品| 日本一区二区三区激视频| 国产色视频一区二区三区qq号| 国产又黄又大又粗的视频| 成年女人在线观看毛片| 中文字幕日本在线乱码| 亚洲熟女综合色一区二区三区 | 精品人妻少妇嫩草av无码专区| 又爽又黄无遮挡高潮视频网站| 日本视频精品一区二区| 精品一区二区三区婷婷| 久久久久成人片免费观看蜜芽| 中日韩欧美在线观看| 亚洲综合av一区在线| 久久成人成狠狠爱综合网| 国产精品美女久久久久久久久| 蜜芽尤物原创AV在线播放| 久久伊人亚洲精品视频| 极品少妇一区二区三区四区| 国产99久久无码精品| 精品国产精品久久一区免费| 亚洲欧美v国产一区二区| 久久精品人妻一区二区三区| 国产精品久久一区性色a| 人妻少妇满足中文字幕| 欧美大肥婆大肥bbbbb| 不卡无毒免费毛片视频观看| 亚州中文热码在线视频| 欧美乱妇高清无乱码在线观看|