亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于CiteSpace的國內(nèi)外語料庫研究對比考察

        2020-06-28 01:21:34華正雷

        華正雷

        (湖南大學(xué) 中國語言文學(xué)學(xué)院,湖南 長沙 410082)

        一、引言

        依托計算機(jī)的存儲與處理技術(shù),語料庫使數(shù)據(jù)的大批量高效分析成為可能,這讓語料庫成為熱門研究的同時,也令計量研究方法興盛起來。隨著研究的推進(jìn),李菲[1]、賈雯[2]、張麗平、顧飛榮[3]、甄鳳超[4]、張新杰[5]等國內(nèi)學(xué)者對語料庫發(fā)展現(xiàn)狀進(jìn)行了總結(jié),但這些都是基于傳統(tǒng)的文獻(xiàn)分析,對國際研究也關(guān)注甚少(1)當(dāng)前國內(nèi)直接回顧國際語料庫研究的文章較為少見,其大都散見于介紹語料庫語言學(xué)產(chǎn)生、發(fā)展、現(xiàn)狀、意義等的文獻(xiàn)中。。文本挖掘及可視化軟件的出現(xiàn),為文獻(xiàn)計量分析與知識圖譜(Knowledge Graph)研究提供了技術(shù)支持,劉霞等[6]、王露[7]、王偉[8]以及張繼東、陳文[9]、楊柳[10]等基于CiteSpace軟件(2)楊柳在文中還使用了信息可視化軟件BICOMB與Ucinet。,對國內(nèi)外語料庫研究進(jìn)行了信息可視化分析,但這些考察把國內(nèi)與國際獨(dú)立開來分別加以評述,沒有進(jìn)行對比性分析。同國際相比,國內(nèi)語料庫研究起步相對較晚(3)布朗語料庫(Brown Corpus)(1964)是世界上首個電子語料庫,國內(nèi)最早的電子語料庫是上海交通大學(xué)科技英語語料庫(Jiao Tong University Corpus for English in Science and Technology,簡稱JDEST)(1986)。,成果也要少一些,須在與國際研究的對比中發(fā)現(xiàn)不足,以改進(jìn)自身的發(fā)展。

        基于上述研究狀況,文章嘗試著運(yùn)用CiteSpace對國內(nèi)外語料庫研究進(jìn)行對比考察。

        二、文獻(xiàn)來源與軟件說明

        文章進(jìn)行信息可視化分析的文獻(xiàn)來源于CSSCI與SSCI數(shù)據(jù)庫(4)CSSCI是Chinese Social Sciences Citation Index的縮寫,是南京大學(xué)中國社會科學(xué)研究評價中心開發(fā)研制的、用于中文社會科學(xué)領(lǐng)域論文收錄與文獻(xiàn)被引情況檢索的數(shù)據(jù)庫;SSCI是Social Sciences Citation Index的縮寫,是專門針對人文社會科學(xué)領(lǐng)域的科技文獻(xiàn)引文數(shù)據(jù)庫。兩者分別收錄在數(shù)據(jù)庫CNKI(China National Knowledge Infrastructure,簡稱CNKI)與WoS(Web of Science,簡稱WoS)中。,得到與主題相關(guān)的中文文獻(xiàn)共計1052篇,外文文獻(xiàn)5335篇,檢索日期為2019年6月8日。具體步驟是:在CSSCI中以篇名(詞)、關(guān)鍵詞為“語料庫”兩個條件檢索文獻(xiàn)(5)篇名(詞)與關(guān)鍵詞的關(guān)系為“或”。,發(fā)文年代設(shè)置為2000至2018,文獻(xiàn)類型、學(xué)科類別分別為論文、語言學(xué);在SSCI中以主題為corpus、corpora、文獻(xiàn)類型為Article、語種為English四個條件進(jìn)行檢索(6)主題、文獻(xiàn)類型與語種之間的關(guān)系為and,主題corpus與corpora的關(guān)系為or。,時間跨度自定義為2000至2018,類別選擇Linguistics。

        CiteSpace是一款集引文分析(Citation Analysis)與信息可視化分析(Information Visualization Analysis)為一體的引文網(wǎng)絡(luò)分析軟件,是美國德雷塞爾大學(xué)(Drexel University)陳超美于2004年開發(fā)研制。CiteSpace通過運(yùn)用數(shù)學(xué)、計算機(jī)等方法與手段,分析施引文獻(xiàn)(Citing Article)與被引文獻(xiàn)(Cited Article)之間的知識聯(lián)系與知識網(wǎng)絡(luò),并將其以科學(xué)知識圖譜的形式呈現(xiàn)出來[11]。

        三、施引文獻(xiàn)的分析

        (一)施引文獻(xiàn)的數(shù)量分析

        根據(jù)發(fā)文數(shù)量可以判定某一領(lǐng)域的被關(guān)注程度,圖1、圖2是CSSCI與SSCI中檢索到文獻(xiàn)數(shù)量的相關(guān)折線圖。

        圖1 國內(nèi)外施引文獻(xiàn)年度分布折線圖

        圖2 國內(nèi)外施引文獻(xiàn)年度差額分布折線圖

        總的來看,國際施引文獻(xiàn)數(shù)量每年都要多于國內(nèi),這在圖2中有更加直觀地反映;從圖2可以看出,2007年以后,國內(nèi)外施引文獻(xiàn)數(shù)量差額迅速擴(kuò)大,除了2016年,差額每年都在增加。具體來說,國內(nèi)起初三年每年的施引文獻(xiàn)數(shù)量都還較少;2002年至2010年間,除2008年數(shù)量下降以外,9年來數(shù)量逐年增多,其中2010年達(dá)到了最多的103篇(7)2010年的施引文獻(xiàn)數(shù)量在2000年至2018年間也是最多的。;從2010年至2016年,除了2015年數(shù)量出現(xiàn)上升,7年間數(shù)量逐年減少,2016年最少,只有67篇;2016年至2018年間,數(shù)量每年都略有增加。在國外,除了2002年、2011年與2016年,19年間數(shù)量逐年增長,其中前7年增長速度較慢,后12年增長速度加快。

        (二)施引文獻(xiàn)的信息可視化分析

        1.合作信息可視化分析(1)國家(或地區(qū))合作信息可視化分析(8)CiteSpace中,節(jié)點類型(Node Types)中的國家(Country)理解為國家(或地區(qū))更為精確。

        將外文文獻(xiàn)導(dǎo)入CiteSpace,選擇節(jié)點類型中的國家(或地區(qū))進(jìn)行國際語料庫研究中的國家(或地區(qū))合作信息可視化分析(9)具體參數(shù)設(shè)置是:在時間分區(qū)(Time Slice)中把時間設(shè)置為2000年至2018年,并以一年為時限進(jìn)行一次時區(qū)分割,將選擇標(biāo)準(zhǔn)(Selection Criteria)設(shè)定為Top 100%(Select top 100% of most cited or occurred items from each slice),并對合并后的圖譜進(jìn)行裁剪(Pruning the Merged Network)。下文進(jìn)行信息可視化分析時,僅對相異參數(shù)的設(shè)置進(jìn)行說明。。

        圖3 國家(或地區(qū))合作信息可視化圖譜

        從圖3節(jié)點對應(yīng)的信息統(tǒng)計表中可以得到,SSCI中收錄通訊地址為中國大陸地區(qū)的施引文獻(xiàn)共計353篇,次于美國(1040篇)、英格蘭(648篇)、西班牙(632篇)和德國(451篇)(10)圖3中節(jié)點代表施引文獻(xiàn)通訊地址署名的國家(或地區(qū)),節(jié)點的大小表示施引文獻(xiàn)數(shù)量的多少;節(jié)點由顏色各異的年輪組成,年輪從里至外表示時間由遠(yuǎn)到近,而年輪的厚度則代表對應(yīng)時間施引文獻(xiàn)的數(shù)量;節(jié)點間連線表示國家(或地區(qū))間的合作,連線的顏色對應(yīng)首次合作出現(xiàn)的時間,連線的粗細(xì)代表合作的強(qiáng)度;節(jié)點中年輪以及節(jié)點間連線顏色的對應(yīng)時間可以參照圖譜上方時區(qū)中的顏色。下文進(jìn)行信息可視化分析時,節(jié)點以及節(jié)點間連線的信息解讀與此類似。,位居世界第5,表明大陸地區(qū)語料庫研究在國際上具備一定影響力。根據(jù)圖譜中節(jié)點以及節(jié)點間連線的位置分布可以判定,美國、德國與英格蘭在國際語料庫研究中地位突出,且關(guān)聯(lián)緊密(11)圖譜中代表美國、德國、英格蘭的節(jié)點面積較大,節(jié)點德國、英格蘭都是圍繞美國分布并與其相交,表明三者關(guān)系密切;另外,三節(jié)點中介中心性(Betweenness Centrality)(節(jié)點中介中心性是指節(jié)點在圖譜中占據(jù)的位置,高中介中心性的節(jié)點在連接其他節(jié)點時作用重大;中介中心性大于等于0.1的節(jié)點,其外層會顯示為紫色)都大于0.1。,而中國大陸地區(qū)距美、德、英節(jié)點所在區(qū)域還有一定距離,再根據(jù)其節(jié)點間連線數(shù)量以及中介中心性的數(shù)值可以斷定,中國大陸地區(qū)與國際間的聯(lián)系尚還較為欠缺(12)中國大陸地區(qū)僅與愛爾蘭、澳大利亞、奧地利、比利時、丹麥、德國、加拿大、美國、南非、中國臺灣地區(qū)、威爾士、西班牙、新西蘭、新加坡以及英格蘭等15個國家地區(qū)存在合作,其在圖譜中的中介中心性為0.01。。

        表1 國家(或地區(qū))施引文獻(xiàn)數(shù)量統(tǒng)計表(前10位)(附帶中介中心性)

        (2)機(jī)構(gòu)(Institution)、作者(Author)合作信息可視化分析

        將國內(nèi)外施引文獻(xiàn)導(dǎo)入CiteSpace,選擇節(jié)點類型中的機(jī)構(gòu)、作者進(jìn)行國內(nèi)外語料庫研究中的機(jī)構(gòu)、作者合作信息可視化分析。

        圖4 機(jī)構(gòu)、作者合作信息可視化圖譜(國內(nèi))(T≥6(13)T是Threshold的簡寫,在進(jìn)行可視化分析時,T的含義各異,這里是指施引文獻(xiàn)數(shù)量不小于6篇的機(jī)構(gòu)、作者。另外,文章對圖譜中署名相同的機(jī)構(gòu)、作者進(jìn)行了合并。)

        圖5 機(jī)構(gòu)、作者合作信息可視化圖譜(國際)(T≥30(14)文中進(jìn)行信息可視化分析的中文文獻(xiàn)大致是外文的1/5,為合理對比考察國內(nèi)外語料庫研究,文章將國外文獻(xiàn)信息可視化分析中的T值統(tǒng)一設(shè)置為國內(nèi)的5倍。)

        根據(jù)圖4、圖5中節(jié)點、節(jié)點間連線數(shù)量以及分布狀況大致可以判定,參與國際語料庫研究的機(jī)構(gòu)、作者要更多,聯(lián)系也較為緊密(15)因T值設(shè)置較大,圖3中的作者姓名暫未能顯示出來。,而國內(nèi)的研究與合作主要是在少數(shù)機(jī)構(gòu)、作者中進(jìn)行。

        表3 機(jī)構(gòu)、作者施引文獻(xiàn)統(tǒng)計表(國際)(前10位)

        2.關(guān)鍵詞(Key Word)共現(xiàn)信息可視化分析

        關(guān)鍵詞是文章觀點、內(nèi)容的高度概括,通過關(guān)鍵詞分析可以對所研究領(lǐng)域的內(nèi)容、方向以及熱點(Research Hotspot)進(jìn)行把握[12]。將國內(nèi)外施引文獻(xiàn)導(dǎo)入CiteSpace,選擇節(jié)點類型中的關(guān)鍵詞進(jìn)行國內(nèi)外語料庫研究中的關(guān)鍵詞共現(xiàn)信息可視化分析。

        圖6 關(guān)鍵詞共現(xiàn)信息可視化圖譜(國內(nèi))(T≥2)

        圖7 關(guān)鍵詞共現(xiàn)信息可視化圖譜(國際)(T≥10(16)圖7合并了含義相同的關(guān)鍵詞Corpus與Corpora,去除了與研究主題無關(guān)的關(guān)鍵詞Corpus Callosum。)

        圖6顯示,關(guān)鍵詞語料庫(489次)在圖譜中居于絕對核心地位;從圖7可以看出,英語(597次)、語料庫(544次)、語言(473次)、話語(349)、語料庫語言學(xué)(296次)等都是出現(xiàn)次數(shù)較多的關(guān)鍵詞,這表明國內(nèi)語料庫研究熱點相對單一,而國外則要更加多樣(17)關(guān)鍵詞共現(xiàn)信息可視化圖譜中的節(jié)點越大,其所代表的關(guān)鍵詞成為研究熱點的可能性就越大。。

        表4 國內(nèi)外施引文獻(xiàn)中的關(guān)鍵詞統(tǒng)計表(前10位)(附帶中介中心性)

        作為國內(nèi)外都在關(guān)注的研究熱點,關(guān)鍵詞語料庫關(guān)涉范圍廣泛,指向并不明確,文章將依據(jù)圖譜中與其共現(xiàn)的關(guān)鍵詞分布情況對這一熱點進(jìn)行細(xì)化考察。

        表5 國內(nèi)外施引文獻(xiàn)中與語料庫共現(xiàn)的關(guān)鍵詞分布統(tǒng)計表(T(國內(nèi))≥5;T(國外)≥20(18)與語料庫共現(xiàn)的關(guān)鍵詞國內(nèi)共計90個,國際共計34個。)

        通過歸納整合表5中的關(guān)鍵詞發(fā)現(xiàn)(19)整合歸納時,對于關(guān)涉范圍廣泛、指向不明確的關(guān)鍵詞不做考慮。,對于語料庫這一研究熱點,國內(nèi)研究多與教學(xué)、翻譯、搭配等方面相關(guān),而國際則與語法、話語、計量分析等領(lǐng)域關(guān)系密切。

        表6 國內(nèi)外施引文獻(xiàn)中與語料庫共現(xiàn)的關(guān)鍵詞歸納整合表

        突變術(shù)語(Burst Term)是指使用次數(shù)明顯增多,或在較短時間內(nèi)突然出現(xiàn)的術(shù)語,其可以較為準(zhǔn)確地反映出研究領(lǐng)域的前沿動態(tài)[13]。從關(guān)鍵詞共現(xiàn)信息可視化圖譜中可以獲悉以下關(guān)鍵詞發(fā)生了突變,具體見表7。

        表7 國內(nèi)外施引文獻(xiàn)中的突變關(guān)鍵詞統(tǒng)計表

        表7顯示,與國際相比,國內(nèi)發(fā)生突變的關(guān)鍵詞要少很多,這表明在2000年至2018年間,國際語料庫研究中出現(xiàn)的前沿動態(tài)要更多。國內(nèi)研究最近出現(xiàn)的前沿是詞塊、標(biāo)注與語料庫方法,而國際研究前沿主要是在學(xué)習(xí)領(lǐng)域。

        四、被引文獻(xiàn)的信息可視化分析

        (一)文獻(xiàn)共被引(Document Cocited Analysis)信息可視化分析

        將國內(nèi)外施引文獻(xiàn)導(dǎo)入CiteSpace,選擇節(jié)點類型中的文獻(xiàn)被引(Cited Reference)進(jìn)行國內(nèi)外語料庫研究中的文獻(xiàn)共被引信息可視化分析(20)文獻(xiàn)共被引是指兩篇文獻(xiàn)被同一文獻(xiàn)引用,共被引文獻(xiàn)在研究主題上會有一定的相似性,下文作者共被引(Author Cocited Analysis)中的情況與此類似。。文獻(xiàn)的被引次數(shù)在一定程度上可以反映其影響度[6,14],而文獻(xiàn)共被引圖譜中關(guān)鍵節(jié)點的分析可以揭示出研究領(lǐng)域的知識結(jié)構(gòu)[11](21)知識結(jié)構(gòu)可以理解為所研究領(lǐng)域的知識基礎(chǔ)(Intellectual Base)、轉(zhuǎn)折性文獻(xiàn)等。。

        圖8 文獻(xiàn)共被引信息可視化圖譜(國內(nèi))(T≥4)

        圖9 文獻(xiàn)共被引信息可視化圖譜(國際)(T≥20)

        表8 國內(nèi)被引文獻(xiàn)信息統(tǒng)計表[15~30](T≥8)

        表9 國際被引文獻(xiàn)信息統(tǒng)計表[31~44](T≥40)

        表8、表9是圖8、圖9中高被引文獻(xiàn)的信息統(tǒng)計表,通過整理歸納兩表中的文獻(xiàn)可以發(fā)現(xiàn),國內(nèi)語料庫研究的知識基礎(chǔ)(22)一個領(lǐng)域的知識基礎(chǔ)是由該領(lǐng)域的前期文獻(xiàn)組合而成。主要是在翻譯、學(xué)習(xí)以及語料庫建設(shè)、研究方面,國際則是集中于語言理論(23)語言理論包括程式語、詞匯理論與語法理論。與語料分析領(lǐng)域;在內(nèi)容的實踐與理論傾向性上,兩者差異顯著。

        表10 國內(nèi)外被引文獻(xiàn)中的轉(zhuǎn)折性文獻(xiàn)信息統(tǒng)計表[15,17,20,40,45~48](24)在CiteSpace信息可視化圖譜中,中介中心性大于等于0.1的被引文獻(xiàn)被視作是轉(zhuǎn)折性文獻(xiàn)。

        根據(jù)表10羅列的被引文獻(xiàn)可以發(fā)現(xiàn),國內(nèi)語料庫研究先后出現(xiàn)了翻譯教學(xué)、外語(詞匯)教學(xué)以及漢譯詞匯特征考察等重要轉(zhuǎn)折點,國際則出現(xiàn)了語言習(xí)得、認(rèn)知語法與程式語言;就轉(zhuǎn)折性文獻(xiàn)數(shù)量以及中介中心性的數(shù)值來看,國內(nèi)語料庫研究出現(xiàn)的轉(zhuǎn)折點要更多,且更加突出。

        (二)作者共被引信息可視化分析

        將國內(nèi)外施引文獻(xiàn)導(dǎo)入CiteSpace,選擇節(jié)點類型中的作者被引(Cited Author)進(jìn)行國內(nèi)外語料庫研究中的作者共被引信息可視化分析(25)CiteSpace計算作者共被引時只考慮第一作者,同一作者在一篇文獻(xiàn)中被引多次也按一次計算[11]。。

        圖10 作者共被引信息可視化圖譜(國內(nèi))(T≥10)

        圖11 作者共被引信息可視化圖譜(國際)(T≥50)

        根據(jù)圖10、圖11中節(jié)點、節(jié)點間連線的數(shù)量及其分布狀況可以看出,同國際語料庫研究一樣,國內(nèi)也形成了相關(guān)的學(xué)術(shù)共同體(Academic Community)(26)作者共被引是指兩位作者同被一篇文獻(xiàn)引用,兩位作者所研究的內(nèi)容會有一定的相似性。根據(jù)圖譜的整體色調(diào)可以判定,國內(nèi)形成學(xué)術(shù)共同體的時間要晚于國際。。與國際學(xué)術(shù)共同體不同的是,國內(nèi)學(xué)術(shù)共同體有更多國際學(xué)者參與其中(27)因T值設(shè)置較大,圖11中國內(nèi)學(xué)者的名字暫未顯示出來。,這表明國內(nèi)語料庫中的一些研究是在吸收借鑒國際研究成果的基礎(chǔ)上進(jìn)行的。

        表11 國內(nèi)語料庫研究被引作者統(tǒng)計表(前15位)

        五、總結(jié)與展望

        通過使用CiteSpace,文章從施引文獻(xiàn)與被引文獻(xiàn)兩個方面對國內(nèi)外語料庫研究進(jìn)行了信息可視化對比考察,發(fā)現(xiàn)從2000年至2018年間,國內(nèi)語料庫研究的知識基礎(chǔ)主要是在語料庫的實用方面,這大致奠定了國內(nèi)研究熱點、研究前沿的發(fā)展基調(diào),也是與國際語料庫研究的重要差異所在。

        在過往19年間,國內(nèi)語料庫研究成果卓著,但也存有一些不足之處:與國際語料庫最近十多年的強(qiáng)勁發(fā)展勢頭相比,國內(nèi)語料庫的受關(guān)注程度出現(xiàn)了下滑,而國內(nèi)的研究與合作主要是集中于少數(shù)機(jī)構(gòu)、作者之間,這些給國內(nèi)語料庫發(fā)展帶來了不少阻礙;另外,加強(qiáng)國內(nèi)語料庫發(fā)展理論建設(shè)也要提上議程。這些對改變國內(nèi)過多依賴國際研究成果以及長期將語料庫視為一種研究方法、工具的現(xiàn)狀意義重大。

        精品人妻码一区二区三区红楼视频| 亚洲夜夜骑| 国产丝袜精品丝袜一区二区| 麻豆精品国产免费av影片| 99久久无码一区人妻| 黑人巨茎大战欧美白妇| 亚洲国产精品嫩草影院久久| 日韩精品一区二区三区四区视频| 国产一区二区三区av免费| 久久精品国产亚洲av无码娇色| 久久精品国产一区二区电影| 成人自拍视频国产一区| 亚洲成人精品久久久国产精品| 国产午夜毛片v一区二区三区| 两个黑人大战嫩白金发美女| 人妻av一区二区三区高| 五月婷婷六月丁香久久综合| 亚洲av综合永久无码精品天堂| 国产视频毛片| 色婷婷亚洲一区二区在线| 色视频网站一区二区三区| 亚洲熟女乱色综合亚洲图片| 国内成人精品亚洲日本语音| 亚洲中文乱码在线视频| 亚州国产av一区二区三区伊在| 日本一区午夜艳熟免费 | 极品av麻豆国产在线观看| 在线人妻无码一区二区| 青青草视频在线观看视频免费| 日本午夜理伦三级好看| 国产av一级黄一区二区三区| 亚洲色爱免费观看视频| 国产精品无码无片在线观看3D| 偷拍熟女露出喷水在线91| 色哟哟最新在线观看入口| 国产一区二区三区av在线无码观看| 亚洲专区在线观看第三页| 91在线视频在线视频| 日出水了特别黄的视频| 亚洲av午夜成人片精品| 亚洲一区二区三区偷拍厕所|