亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語料庫在中國的研究發(fā)展與趨勢

        2017-05-31 09:12:32劉皓
        現(xiàn)代交際 2017年8期
        關(guān)鍵詞:文獻計量學(xué)語料庫

        劉皓

        摘要:中國語料庫的研究歷經(jīng)了30多年的發(fā)展,已經(jīng)取得了長足的進步,并呈現(xiàn)出了一定的發(fā)展趨勢。本文通過文獻計量法分析語料庫在中國的研究發(fā)展趨勢:整理了中國知網(wǎng)(CNKI)1982年至2016年與語料庫研究有關(guān)的文獻11056篇;對文獻年度數(shù)量、文獻來源、研究層次、研究學(xué)科、發(fā)表機構(gòu)、論文作者、科技成果、經(jīng)費支持、人才培養(yǎng)等進行了詳細(xì)分析。將語料庫研究在中國的發(fā)展劃分為3個階段:1982年至1999年的萌芽階段,2000年至2010年的快速增長階段,2011年至2016年的高速成長階段??偨Y(jié)和探索了語料庫在中國的研究變化趨勢,指出目前語料庫研究存在的不足。旨在進一步服務(wù)和推動中國語料庫研究的持續(xù)健康發(fā)展。

        關(guān)鍵詞:文獻計量學(xué) CNKI 語料庫

        中圖分類號:H0 文獻標(biāo)識碼:A 文章編號:1009-5349(2017)08-0170-04

        語料庫語言學(xué)是在文本語料的基礎(chǔ)上進行語言研究的一門學(xué)科(楊惠中,2002),被稱為結(jié)構(gòu)主義語言學(xué)派與功能主義語言學(xué)派,“兩陣對壘天平上的一個舉足輕重的砝碼”(劉楊,2009),亦是語言學(xué)科中飆升最快的學(xué)科之一?,F(xiàn)代大型電子語料庫及相關(guān)研究,始于20世紀(jì)60年代大西洋兩岸。今年是世界上第一個機讀英語語料庫(布朗語料庫,Brown Corpus)建立50周年的時候。50年來,西方學(xué)者在語料庫研究成果應(yīng)用方面已積累了大量的經(jīng)驗,以語料庫為基礎(chǔ)的語言學(xué)研究在語言學(xué)和計算機科學(xué)研究中都取得了豐碩的成果,語料庫的建設(shè)得到了世界各國的廣泛重視。世界上的主要語言都建立了許多不同規(guī)模、不同類型的語料庫,語料庫的加工程度越來越深,語料庫的應(yīng)用范圍也越來越廣,語料庫在語言學(xué)研究和自然語言處理中發(fā)揮了越來越重要的作用。語料庫已經(jīng)成為現(xiàn)代語言學(xué)研究的重要基礎(chǔ),在語法書編寫、詞典編纂、教育教學(xué)上都有諸多經(jīng)典案例。

        20世紀(jì)80年代以來,隨著計算機應(yīng)用技術(shù)的不斷發(fā)展,在中國,語料庫語言學(xué)從萌芽到蓬勃發(fā)展。30多年來,中國的語料庫語言學(xué)者篳路藍縷,從草創(chuàng)到開拓,從試驗到創(chuàng)新,功不可沒。他們創(chuàng)建語料庫,培育團隊,立足本土開展語料庫應(yīng)用,引介與創(chuàng)新并重,如今已成果繽紛,蔚然可觀。(《語料庫語言學(xué)》發(fā)刊詞,2014)

        文獻計量分析對把握特定領(lǐng)域的研究進展和研究熱點有很好的效果,與傳統(tǒng)經(jīng)驗判斷的方法相比能夠得出更為客觀可信的結(jié)論。(翁勝斌,2013)中國知網(wǎng)(CNKI)是目前國內(nèi)最具權(quán)威的數(shù)字圖書館之一,中國知網(wǎng)(CNKI)幾乎囊括了所有國內(nèi)發(fā)行的相關(guān)文獻資料。因此,本文將以知網(wǎng)(CNKI)作為研究數(shù)據(jù)庫,將語料庫作為關(guān)鍵詞進行全范圍搜索,通過搜索結(jié)果進行分類及人工檢驗,采用文獻計量法,從載文分析、研究層次、研究學(xué)科以及文獻來源等方面,對30年來我國語料庫語言學(xué)研究成果進行了系統(tǒng)的分析總結(jié),探索語料庫在我國的研究變化趨勢,以期進一步服務(wù)和推動我國語料庫研究的持續(xù)健康發(fā)展。

        一、數(shù)據(jù)來源及研究方法

        數(shù)據(jù)來源:中國知網(wǎng)(CNKI),文獻總數(shù):11056篇;檢索條件:發(fā)表時間在1980年1月1日,到2016年12月31日并且(關(guān)鍵詞=語料庫不包含關(guān)鍵詞=語料)或者[題名=中英文擴展(語料庫)并且題名=中英文擴展(語料)精確匹配],專輯導(dǎo)航:哲學(xué)與人文科學(xué),社會科學(xué)Ⅰ輯,社會科學(xué)Ⅱ輯,信息科技,經(jīng)濟與管理科學(xué)。數(shù)據(jù)庫種類:期刊、特色期刊、國際會議、國內(nèi)會議、博士論文及碩士論文等。

        本文主要采用文獻計量法,從以下9個方面進行全面分析。

        二、語料庫文獻計量分析

        (一)載文分析

        在中國對語料庫的研究是從20世紀(jì)80年代初興起的。檢索結(jié)果顯示,1982年由楊惠中和黃人杰聯(lián)合撰寫發(fā)表在《外語教學(xué)與研究》的“JDEST科技英語計算機語料庫”是國內(nèi)最早研究語料庫的公開文獻。

        總體來看,1982年以來,中國語料庫研究相關(guān)文獻數(shù)量呈現(xiàn)不斷上升趨勢(圖1),據(jù)此可將中國語料庫研究劃分為三個階段:

        第一階段(1982—1999年):萌芽階段。我國語料庫研究發(fā)展特征為文獻數(shù)量少(文獻148篇,占比13%),這期間,研究機構(gòu)理工院校居多,清華大學(xué)、哈爾濱工業(yè)大學(xué)、國防科學(xué)技術(shù)大學(xué)、華中理工大學(xué)等都在其列。文獻前三者依次為清華大學(xué)、北京郵電大學(xué)和南京大學(xué);涉及的學(xué)科有12個,位居前三位的是計算機軟件及計算機應(yīng)用(328%)、中國語言文學(xué)(322%)和外國語言文學(xué)(198%)。

        第二階段(2000—2010年):我國語料庫研究快速增長(文獻3718篇,占比337%)。文獻總數(shù)較第一階段增長了25倍,特別是碩博論文由2篇增加到900篇;涉及的學(xué)科有40余個,位居前三的為外國語言文學(xué)(573%)、中國語言文學(xué)(250%)和計算機軟件及計算機應(yīng)用(133%);研究機構(gòu)中外國語大學(xué)和師范院校有了顯著的增加,文獻前三者依次為大連海事大學(xué)、上海交通大學(xué)和北京語言大學(xué)。

        第三階段(2011—2016年)為高速發(fā)展階段(文獻7190篇,占比650%),文獻數(shù)量呈指數(shù)型增長態(tài)勢;外國語言文學(xué)(658%)、中國語言文學(xué)(267%)和計算機軟件及計算機應(yīng)用(51%)仍位居前三,但涉及的學(xué)科更多。比如:貿(mào)易經(jīng)濟、汽車工業(yè)、體育及宗教等;研究機構(gòu)的絕大多數(shù)是外語和師范院校,大連海事大學(xué)、上海交通大學(xué)仍占據(jù)文獻前三者。這期間隨著科學(xué)研究者的增加、各領(lǐng)域多元化的發(fā)展趨勢以及充分的技術(shù)支持,從2011年起,每年的文獻增加量趨于高速穩(wěn)定狀態(tài),2014年達到了峰值(1326篇)。由此可知,國內(nèi)關(guān)于語料庫的研究隨著時間流逝而愈加成熟,這是學(xué)術(shù)類科學(xué)研究最健康的體現(xiàn)趨勢。

        (二)研究層次

        在中國有關(guān)語料庫的研究主要集中在哲學(xué)與人文科學(xué)(845%)、信息技術(shù)(103%)、社會科學(xué)(38%)等三大領(lǐng)域;基礎(chǔ)科學(xué)(自然)、工程技術(shù)、農(nóng)業(yè)技術(shù)、醫(yī)療衛(wèi)生科技僅占比10%;經(jīng)濟與管理科學(xué)占比04%。研究層次有基礎(chǔ)研究(社科)、高等教育、基礎(chǔ)教育、工程技術(shù)(自科)、行業(yè)指導(dǎo)(社科)、基礎(chǔ)與應(yīng)用基礎(chǔ)研究等19個類別。基礎(chǔ)研究(社科)、高等教育、基礎(chǔ)教育和工程技術(shù)(自科)等4類文獻就占總文獻的827%,其中涉及基礎(chǔ)研究(社科)的文獻數(shù)量最多,共6528篇,占總數(shù)的590%。(圖2)

        (三)涉及學(xué)科

        語料庫研究的文獻涉及的學(xué)科多達四十余個,除語言、文學(xué)、教育及計算機應(yīng)用等外,還涉及圖書情報、貿(mào)易經(jīng)濟、旅游、管理學(xué)、考古、宗教、體育、音樂等。這說明語料庫技術(shù)在語料庫語言學(xué)方面運用得日益成熟之外,也萌芽了其他方向的學(xué)科,嘗試把語料庫這項技術(shù)融入本學(xué)科,表現(xiàn)出這項技術(shù)多元化的潛力。

        文獻數(shù)量排名前10的學(xué)科有外國語言文字、中國語言文字、計算機軟件及計算應(yīng)用、文藝?yán)碚摗⒅械冉逃?。(圖3)英語在外國語言文字文獻類中占比954%,英語教育、翻譯及寫作是語料庫研究的主體。中國語言文字研究文獻依次為漢語(523%)、語言學(xué)(443%)和中國少數(shù)民族語言(34%),漢語教育,語義、詞匯、詞義和語法是中國語言文字研究的重點。

        (四)發(fā)表機構(gòu)

        參與語料庫研究的機構(gòu)多達上百個,前10個機構(gòu)總文獻數(shù)量占所有文獻數(shù)量的159%(圖4),表明國內(nèi)語料庫研究機構(gòu)之多,各機構(gòu)文獻所占比例相對平均,發(fā)展均衡。大學(xué)為研究語料庫最主要的機構(gòu),發(fā)文數(shù)量最多的前40個研究機構(gòu)均為大學(xué)。大連海事大學(xué)發(fā)表碩士論文最多(225篇);發(fā)表博士論文最多的是山東大學(xué)(29篇)和上海外國語大學(xué)(29篇);發(fā)布期刊論文最多的是上海交通大學(xué)(157篇),在特色期刊發(fā)布論文最多的是和河南師范大學(xué)(21篇);國內(nèi)外會議交流文章最多的是北京語言大學(xué),分別為27和25篇。

        (五)論文作者

        發(fā)表文章前5名的作者為何安平(華南師范大學(xué))、陳建生(天津科技大學(xué))、王克非(北京外國語大學(xué))、胡開寶(上海交通大學(xué))和毛文偉(上海外國語大學(xué))。(圖5)

        文章被引次數(shù)前5名的作者為解放軍外國語學(xué)院濮建忠(1061次)、上海交通大學(xué)衛(wèi)乃興(972次)、南京大學(xué)的文秋芳等(580次)、廣東外語外貿(mào)大學(xué)杜金榜(428次)和華南師范大學(xué)何安平(280次)。

        文章下載次數(shù)前5名的作者為解放軍外國語學(xué)院濮建忠(8389次)、廣東外語外貿(mào)大學(xué)桂詩春(7650次)、山東大學(xué)尹海良(6737)、華中師范大學(xué)何婷婷(6159)和華南師范大學(xué)(5883)。

        維吾爾語語料庫研究發(fā)表文章最多的是新疆大學(xué)吐爾根;蒙古語語料庫研究發(fā)表文章最多的是內(nèi)蒙古大學(xué)華沙寶;藏語語料庫研究發(fā)表文章最多的是青海師范大學(xué)才加讓。

        (六)文獻來源與數(shù)據(jù)庫

        本文文獻檢索使用了6個數(shù)據(jù)庫,它們分別是:中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫,中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫,特色期刊,中國重要會議論文全文數(shù)據(jù)庫,國際會議論文全文數(shù)據(jù)庫和中國博士學(xué)位論文全文數(shù)據(jù)庫。(圖6)中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫和中國優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫中的文獻數(shù)量最多,二者文獻占文獻總數(shù)的847%。從分析可以看出,語料庫語言學(xué)這一新型技術(shù)在進行語料庫應(yīng)用研究的同時,也是研究生完成碩士學(xué)位論文的主要研究項目。

        刊登語料庫研究文章最多的期刊是海外英語、外語電化教學(xué)、解放軍外國語學(xué)院學(xué)報、現(xiàn)代語文(語言研究版)、中文信息學(xué)報等。(圖7)發(fā)表碩士研究生學(xué)位論文最多的機構(gòu)是大連海事大學(xué),發(fā)布博士研究生學(xué)位論文最多的機構(gòu)是山東大學(xué)。

        (七)科技成果、專利與標(biāo)準(zhǔn)

        1.科技成果

        語料庫研究的科技成果僅有23項:計算機軟件及計算機應(yīng)用11項,外國語言文字5項,中國語言文字2項,圖書情報與數(shù)字圖書館、初等教育與文化經(jīng)濟各1項。獲得科技成果最多的是青海師范大學(xué)(3項)。

        2.專利

        語料庫研究共獲得專利49項:計算機軟件及計算機應(yīng)用38項,電信技術(shù)7項,計算機硬件技術(shù)4項。申請專利的國家有中國、美國和日本。申請專利較多的機構(gòu)依次為美國微軟公司(4項)、日本東芝株式會社(2項)、哈爾濱工業(yè)大學(xué)(2項)、北京語言大學(xué)(2項)及摩托羅拉(中國)電子有限公司(2項)。

        3.標(biāo)準(zhǔn)

        由中國標(biāo)準(zhǔn)研究中心編制的國家標(biāo)準(zhǔn)《建立術(shù)語語料庫的一般原則和方法》(標(biāo)準(zhǔn)號:GB/T 13725-2001)于2001年11月發(fā)布,2002年6月1日起正式實施。該標(biāo)準(zhǔn)規(guī)定了建立術(shù)語語料庫(簡稱“術(shù)語庫”)的一般原則與方法。適用于術(shù)語庫的研究、開發(fā)、維護及有關(guān)管理工作。

        語料庫研究的科技成果、專利和標(biāo)準(zhǔn)如此之少,超出了想象,也反映了中國在這方面的研究水平和國外比有很大差距,需要引起足夠的重視。

        (八)資金來源

        長期且穩(wěn)定的資金來源對從事科學(xué)研究來說是必不可少的。因此,我們需要對資金來源機構(gòu)進行定量分析。從檢索的數(shù)據(jù)來看,共有1479篇文章受到國家社會科學(xué)基金的資助,資助率為134%。共49項各類基金參與資助,其中國家社會科學(xué)基金、國家自然科學(xué)基金、國家高技術(shù)研究發(fā)展計劃、國家重點基礎(chǔ)研究發(fā)展計劃資助最多。(圖7)

        從事語料庫研究的學(xué)者大部分沒能獲得國家層面的經(jīng)費資助,這從一個側(cè)面反映了社會科學(xué)研究的現(xiàn)狀,應(yīng)該引起管理部門的重視。

        (九)人才培養(yǎng)

        30多年來,培養(yǎng)與語料庫研究有關(guān)的博士研究生141名、碩士研究生2433名。第一個語料庫碩士研究生(汪冰,1997)和第一個語料庫博士研究生(王斌,1999)均誕生在中國科學(xué)院計算機研究所。培養(yǎng)20名以上研究生的機構(gòu)有41所。(圖9)大連海事大學(xué)培養(yǎng)的碩士研究生最多(225名)。山東大學(xué)培養(yǎng)的博士研究生最多(29名)。

        三、結(jié)語

        中國語料庫的研究歷經(jīng)35年的發(fā)展,已經(jīng)取得了長足的進步,并呈現(xiàn)出了一定的發(fā)展趨勢。首先,語料庫研究領(lǐng)域不斷擴展,從語言學(xué)、文字學(xué)、語法學(xué)發(fā)展到寫作學(xué)、詞典學(xué)、方言學(xué)、修辭學(xué)等學(xué)科;從英語語料庫發(fā)展到俄語、日語、法語、德語及西班牙語語料庫;從漢語語料庫發(fā)展到蒙古語、藏語、維吾爾語語料庫;從哲學(xué)與人文科學(xué)、社會科學(xué)發(fā)展到經(jīng)濟與管理科學(xué)。其次,語料庫研究的隊伍不斷壯大,年輕一代的高學(xué)歷復(fù)合型人才正成為語料庫研究的生力軍。此外,由最初的純理論推介研究逐漸轉(zhuǎn)向?qū)嵶C研究,基于數(shù)據(jù)、數(shù)據(jù)驅(qū)動綜合的幾種研究方法得到充分應(yīng)用,語料庫應(yīng)用研究延伸到工程科技、農(nóng)業(yè)科技及醫(yī)藥衛(wèi)生科技等自然科學(xué)領(lǐng)域。

        雖然國內(nèi)相關(guān)研究成果頗豐,但仍存在一些研究不足,可作為未來深入探索的研究方向。首先,當(dāng)下研究多局限于英語和漢語,法語、俄語、

        西班牙語等語言的語料庫研究較少,阿拉伯語語料庫的文獻更是空白。法語、俄語、

        西班牙語等語言的雙語語料庫研究還有很大發(fā)展空間。其次,我國的語料庫研究基本上都在國內(nèi)的中文期刊上發(fā)表,而很少有論文發(fā)表在高層次的國際期刊上,缺少與國際學(xué)術(shù)界的互動與交流,以至于國際學(xué)術(shù)界對中國的語料庫研究知之甚少。最后,語料庫應(yīng)用工具軟件的開發(fā)能促進語料庫研究,是語料庫研究的一個重要內(nèi)容,但國內(nèi)在這方面的研究相對薄弱,應(yīng)該引起重視。

        參考文獻:

        [1]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.

        [2]劉楊.語料庫與機器翻譯[J].大眾文藝:學(xué)術(shù)版,2009(12).

        [3]譚鍵.語料庫及語料庫語言學(xué)的發(fā)展與應(yīng)用[J].西北工業(yè)大學(xué)學(xué)報社會科學(xué)版,2005(1).

        [4]翁勝斌. CNKI數(shù)據(jù)源的關(guān)鍵詞共現(xiàn)分析與多維尺度分析的現(xiàn)實方法[J].現(xiàn)代情報,2013,33(4).

        責(zé)任編輯:楊國棟

        猜你喜歡
        文獻計量學(xué)語料庫
        《語料庫翻譯文體學(xué)》評介
        基于語料庫“隱秘”的詞類標(biāo)注初步探究
        把課文的優(yōu)美表達存進語料庫
        《現(xiàn)代泌尿外科雜志》2011~2013年文獻計量學(xué)指標(biāo)分析
        《廣西民族研究》創(chuàng)辦30年來刊發(fā)文章的回顧與展望
        中文圖書評價體系研究
        PubMed收錄葡萄胎相關(guān)文獻的計量學(xué)分析
        PubMed收錄護患關(guān)系相關(guān)文獻的計量學(xué)分析
        基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
        語言與翻譯(2015年4期)2015-07-18 11:07:45
        PubMed收錄胃切除術(shù)相關(guān)文獻的計量學(xué)分析
        国产自产在线视频一区| 日韩激情无码免费毛片| 欧美人与动牲交a欧美精品| 日韩欧美在线播放视频| 亚洲一区二区三在线播放| 乳乱中文字幕熟女熟妇| 午夜天堂av天堂久久久| 国产精品一区二区久久乐下载 | 色伊人国产高清在线| 蜜桃视频中文字幕一区二区三区| 91久久香蕉国产熟女线看| 中文无码人妻有码人妻中文字幕| 尤物网址在线观看| 国产精品九九九久久九九| 少妇特殊按摩高潮不断| 不卡视频在线观看网站| 国产成人综合日韩精品无码| 亚洲aⅴ天堂av天堂无码麻豆| 二区久久国产乱子伦免费精品| 亚洲男女视频一区二区| 国产一区亚洲二区三区极品 | 国产成人精品亚洲午夜| av中文字幕在线资源网| 麻豆国产精品一区二区三区| 国产无套粉嫩白浆在线| 吃奶摸下的激烈视频| 成人免费无码视频在线网站| 精品一区二区三区国产av| 久久精品国产99久久久| 国产在线精品成人一区二区三区 | 欧美大成色www永久网站婷| 无码熟妇人妻AV影音先锋| 日本熟女人妻一区二区三区| 中文字幕免费人成在线网站 | 色一情一乱一伦一区二区三区日本| 永久免费看免费无码视频| 一区二区国产视频在线| 成人影片麻豆国产影片免费观看 | 日韩精品中文字幕免费人妻 | 优优人体大尺大尺无毒不卡| 99香蕉国产精品偷在线观看|