王 偉
(天津體育學院,天津)
科學知識圖譜是在信息技術(shù)的推動下,發(fā)展起來的一個新的研究領(lǐng)域??茖W知識圖譜的概念源于2003年美國國家科學院組織的研討會,它能以圖像形式表示在一定空間形式、一定時間范圍中展現(xiàn)與變化的系統(tǒng)概念,能揭示知識之間的聯(lián)系及知識的發(fā)展規(guī)律(劉則淵,2008:4)。在常用的科學知識圖譜繪制軟件中,由美國Drexel大學陳超美博士開發(fā)的CiteSpace是目前最為流行的工具之一。根據(jù)陳悅等(2014)等對應用CiteSpace開展計量研究的555篇文獻的解讀,CiteSpace已經(jīng)廣泛地應用于圖書情報領(lǐng)域、管理領(lǐng)域、教育學、公共管理、社會學、體育學、基礎(chǔ)醫(yī)學等領(lǐng)域。可見,CiteSpace已是信息計量學中應用最廣泛的可視化工具之一。
在語言研究領(lǐng)域,語料的收集、整理和分析歷來受到人們的重視。自第一代電子語料庫布郎(BROWN)于上世紀60年代初建立以后,語料庫及其相關(guān)學科在最近的二三十年中得到了快速的發(fā)展。在我國,語料庫的研究已有30多年的歷史了,中國期刊全文數(shù)據(jù)庫中關(guān)于語料庫的第一篇文章為“JDEST科技英語計算機語料庫”(楊惠中黃人杰,1982)。根據(jù)筆者前期在中國期刊全文數(shù)據(jù)庫上的統(tǒng)計,在1982年至2000年間,我國語料庫的研究逐漸起步,外語類核心期刊每年的發(fā)文量一直徘徊在10篇左右。然而,自本世紀以后,語料庫研究的文獻數(shù)量迅速增加,這為開展語料庫研究的知識圖譜可視化分析提供了數(shù)據(jù)基礎(chǔ)。
因此,本研究嘗試利用CiteSpace軟件,并結(jié)合傳統(tǒng)的定量研究和定性分析,對2001—2016年國內(nèi)外語類15種核心期刊中語料庫研究的文獻分布、作者/機構(gòu)合作情況和研究熱點等進行追蹤,借助可視化的手段對我國外語界語料庫的研究進展進行系統(tǒng)梳理,為該領(lǐng)域的研究者提供一定參考。
本研究選取的數(shù)據(jù)來自中國期刊全文數(shù)據(jù)庫(CNKI)收錄的外語類核心期刊,并加入影響因子較高的兩個語言文字類期刊《中國翻譯》、《上海翻譯》,共15種期刊(總表見表1)。這些期刊長期關(guān)注著我國外語事業(yè)的發(fā)展,每年發(fā)文數(shù)量穩(wěn)定,代表著國內(nèi)外語類研究的最高水平。
表1 本研究的數(shù)據(jù)來源(按照字母順序排序)
在知識圖譜中,CiteSpace提供了五類共11種功能選擇,前兩類是針對施引文獻的合作圖譜(包括作者、研究單位、國別)和共現(xiàn)圖譜(特征詞、關(guān)鍵詞、學科類別);第三類是針對被引文獻的共引圖譜,第四類是耦合圖譜,第五類是共同資助圖譜。考慮到CNKI數(shù)據(jù)的特點,本研究將重點研究前兩類中的可視化圖譜分析。
圖1 15種期刊中語料庫的年發(fā)文量分布圖
從圖1中可以看出,在2001年至2016年間,外語界15種核心期刊中語料庫研究的發(fā)文數(shù)量經(jīng)歷了兩個階段。其中,2001年至2009年間為語料庫文獻的快速增長期,文獻數(shù)量從每年20篇左右開始逐年快速增長;2010年至2016年間為穩(wěn)定發(fā)展期,這期間每年發(fā)表的語料庫文獻數(shù)量保持在100篇以上。
根據(jù)系統(tǒng)設(shè)置要求,選取termsource中的title,abstract,author keywords和keywords plus項,選定node types為author和institution,其他參數(shù)為系統(tǒng)設(shè)置,采用最小生成樹算法,生成研究者和研究單位的可視化圖譜,調(diào)節(jié)閾值(Threshold)為7,字體大小(font size)為12,得到圖2。同時,統(tǒng)計數(shù)據(jù)后得到表2和表3。(注:本研究只計算第一作者及其研究機構(gòu)的貢獻,以機構(gòu)主名稱為計算標準,如上海外國語大學的各院系統(tǒng)一合并為上海外國語大學)
圖2 研究者及機構(gòu)的可視化圖譜
表2 國內(nèi)語料庫研究的高產(chǎn)機構(gòu)(前十位)
表3 國內(nèi)語料庫研究的高產(chǎn)作者(前十位)
根據(jù)表2的統(tǒng)計,我們發(fā)現(xiàn),在外語類核心期刊發(fā)表語料庫研究的院校中,排名第一的是上海交通大學,發(fā)文量接近100篇(99篇),之后是四所重點外國語大學(北京外國語大學,解放軍外國語學院,廣東外語外貿(mào)大學和上海外國語大學),發(fā)文量均在40篇以上。表2中所列的10所院校共發(fā)文450篇,占2001年至2016年間全部文獻的三分之一多(36.5%)。我國開設(shè)外語專業(yè)的高校有近1000所,從事語料庫相關(guān)研究的外語教師并不在少數(shù),但是從圖2研究者及機構(gòu)的圖譜來看,結(jié)合表2的統(tǒng)計,從事語料庫研究的整體力量比依然不平衡,高質(zhì)量的研究成果集中在一些綜合性大學和重點外語院校的研究者和教師。
表3為語料庫研究領(lǐng)域的高產(chǎn)作者,以這些研究者為中心,產(chǎn)生了我國外語類語料庫研究的一些重要團隊,如北京外國語大學的王立非教授團隊、王克非教授團隊、北京航空航天大學的衛(wèi)乃興教授團隊、上海交通大學的胡開寶教授團隊、華南師范大學的何安平教授團隊、燕山大學的劉澤權(quán)教授團隊等。語料庫研究不同于語言研究的其他分支及流派,它通常包括語料庫的建設(shè)、方法論的探索、具體應用性研究的開展,還包括語料庫分析技術(shù)和工具的開發(fā)及實現(xiàn)(陳功梁茂成,2010:79)。因此,團隊的建設(shè)和團隊的交流與合作是保證語料庫研究有序進行、不斷創(chuàng)新的關(guān)鍵。上述的這些團隊構(gòu)成了我國外語界語料庫研究的中堅力量,在推動語料庫的研究和發(fā)展方面起到了重要的作用,為我國培養(yǎng)出了一批杰出的青年語料庫學者和人才。
圖3 高頻關(guān)鍵詞的可視化分析
根據(jù)系統(tǒng)設(shè)置要求,本研究以1年為一個時間分區(qū),將2001—2016年分成16個分區(qū),選取每個時間分區(qū)內(nèi)50個引用率最多或者出現(xiàn)次數(shù)最多的關(guān)鍵詞,采用尋徑算法,得到圖3和表4。
當前,低溫等離子技術(shù)在塑料改性中的應用較為廣泛,主要涉及的高分子材料包括聚乙烯、聚四氟乙烯、聚丙烯等。塑料制品的化學性質(zhì)穩(wěn)定,耐酸堿,耐低溫,被廣泛應用于制作家庭用品當中。但是其易燃燒、親水性差的特點,也限制了其使用范圍。
在CiteSpace科學知識圖譜中,研究關(guān)鍵詞的高頻出現(xiàn)率,反映了該關(guān)鍵詞具有較高的關(guān)注度,是人們的研究熱點。中介中心度是反映關(guān)鍵詞重要度的另一個指標,表明了一個關(guān)鍵詞在整個網(wǎng)絡(luò)中作為“媒介”的能力,即占據(jù)其他兩個節(jié)點之間最短路徑的能力。一個關(guān)鍵詞的中介中心度越高,意味著它控制的關(guān)鍵詞之間的信息流越多(Small,1986:97)。
從表4中可以看出,關(guān)鍵詞“語料庫”、“語料庫語言學”、“語義韻”在科學知識圖譜中共現(xiàn)的頻率排名前三位,三者的中介中心度均超過了0.1。這說明這三類研究不僅是人們的研究熱點,而且其研究內(nèi)容與其他研究的關(guān)聯(lián)度較高。其中,共現(xiàn)頻率和中介性最高的關(guān)鍵詞“語料庫”,反映了語料庫在整個網(wǎng)絡(luò)中起著戰(zhàn)略性的中介作用。由于語料庫具有很多傳統(tǒng)方法不具備的優(yōu)勢,如語料規(guī)模大,計算快速準確,結(jié)合定量的分析和定性的解釋,能夠?qū)φZ言做出更全面準確的調(diào)查(Biber,2000),語料庫的研究方法已經(jīng)廣泛地應用于外語研究中的各個方面。
一方面,語料庫語言學、語料庫翻譯學、語料庫文體學等學科,隨著語料庫的興起而發(fā)展壯大,盡管人們在學科屬性上尚存在爭議,但這些因語料庫而產(chǎn)生的學科無論是作為一門獨立學科,抑或是一個分支學科,抑或是一門交叉學科,都已然成為語言研究中不可或缺的一個部分,可以說,語料庫的研究帶動了語言研究諸多學科的發(fā)展。另一方面,語料庫還為語言研究提供了方法上的創(chuàng)新。語料庫的研究方法,按照對語料依賴程度的不同,可以分為“基于語料庫”的研究方法和“語料庫驅(qū)動”的研究方法。盡管這兩種研究方法在目的和操作過程上存在差異,但不可否認的是,語料庫研究方法的優(yōu)勢是顯而易見的,從近16年來語料庫研究文獻的數(shù)量增長來看,外語研究者們已經(jīng)普遍接受語料庫的研究方法為一種重要的研究范式。綜上所述,越來越多的研究者意識到語料庫的價值,不僅在語料庫相關(guān)學科上進行研究與思考,也在各自領(lǐng)域中利用語料庫方法進行“三角驗證”,豐富了語料庫研究的同時,拓展了語料庫研究的深度和廣度。
表4 高頻關(guān)鍵詞和中介中心度(前十個)
根據(jù)系統(tǒng)設(shè)置要求,在CiteSpace中啟用聚類分析功能,從施引文獻的“索引詞條”中提取聚類標簽詞進行自動聚類。本次聚類的modularity Q值為0.6307,平均Silhouette值為0.413。一般認為,若modularity Q值和Silhouette值大于0.4,可認為聚類效果比較理想。圖4為系統(tǒng)自動生成的聚類圖譜,根據(jù)系統(tǒng)自動聚類排名前5位的結(jié)果,統(tǒng)計后得到表5。
圖4 2001—2016年國內(nèi)語料庫研究的聚類分析圖譜
表5 系統(tǒng)自動的聚類結(jié)果(前五個)
表5中聚類容量代表該聚類中的關(guān)鍵詞數(shù)量,Silhouette值代表一個聚類中關(guān)鍵詞之間的同質(zhì)性,log-likelihood是提取聚類標識詞的一種算法。中介中心度高的文獻,往往在網(wǎng)絡(luò)中處于節(jié)點群之間的連通位置,因此,圖譜中的節(jié)點群代表了語料庫研究中的核心方向。由于聚類標識詞是CiteSpace自動生成的,且信息量有限,筆者將結(jié)合包含相應關(guān)鍵詞的典型文獻和前人的研究進行定性分析。由于前文已經(jīng)論述了聚類序號0(語料庫)在外語研究中的價值,限于篇幅,下文將著重介紹聚類序號1—4的分析結(jié)果。
3.4.1 翻譯教學
聚類序號1的標識詞是“翻譯教學”。隨著語料庫的發(fā)展,基于語料庫的翻譯教學研究逐漸受到研究人員和教師的關(guān)注。語料庫,作為翻譯教學的資源和手段,被普遍認為對翻譯教學有積極的促進作用,特別是雙語平行語料庫,通過大規(guī)模平行文本的呈現(xiàn),可以為翻譯教學提供豐富的教學樣例作為參考或進行比較,能夠有效促進學生發(fā)現(xiàn)式的學習。
平行語料庫應用于譯員培訓/翻譯教學最早可追溯到1997年。在此之后,國內(nèi)陸續(xù)有一些學者開始研究語料庫在翻譯教學實踐中的應用(王克非,2004b;于連江,2004;秦洪武王克非,2007),并且,平行語料庫在翻譯教學方面的研究不斷深入,如:余軍和王朝暉(2010)將語料庫的構(gòu)建與比較翻譯教學模式和步驟相結(jié)合,深化了語料庫在翻譯教學程序上的研究;熊兵(2015)則在綜合前人研究的基礎(chǔ)上,分析了翻譯教學語料庫的構(gòu)建,論述了基于平行語料庫的翻譯教學模式的構(gòu)建及其操作步驟。此外,研究者還可以發(fā)揮想象,充分利用其它類型語料庫的特點,將大型通用單語參考語料庫、小型專用可比語料庫或?qū)iT用途語料庫等與翻譯教學相結(jié)合,拓寬翻譯教學的視野(李德超王克非,2011;朱曉敏,2011;朱一凡等,2016)。語料庫已成為當今翻譯教學研究的一股重要力量,隨著人們對翻譯教學的持續(xù)關(guān)注,對各種語料庫的綜合運用必將給翻譯教學中的“教”與“學”帶來持續(xù)而深遠的影響。
3.4.2 中國學習者
聚類序號2的標識詞是“中國學習者”。在外語教學與研究中使用語料庫所關(guān)注的一個重要對象就是中國外語學習者。以英語習得為例,蔡金亭(2008)曾在其專著中系統(tǒng)介紹了中國學習者的中介語(interlanguage),指出中介語的三個特征為可變性、滲透性、石化性。以往對于中介語的研究,理論語言學的兩大陣營——普遍語法和功能語法,都有各自的觀點和解釋。比較而言,功能語法由于采用經(jīng)驗主義的路線,倡導“向語言學習語言”,更加關(guān)注語言的實際使用。因此,沿著功能主義的路線,建立在學習者大量語料基礎(chǔ)上的語料庫,可以使研究者通過大量的真實數(shù)據(jù)進行定性分析,得出更有說服力的結(jié)論和解釋。
基于語料庫的方法,外語研究者分析了中國學生在外語使用中的一些問題和規(guī)律。在書面語方面,研究者不僅考察了以詞項為基礎(chǔ)的局部語言單位,如楊貝(2003)比較了中國英語學習者與本族語學生寫作中HAVE的用法,楊瀅瀅(2015)對中美大學生同一主題作文詞匯和詞塊的特征進行了對比研究。一些學者還綜合考察了詞匯語法的共現(xiàn)、語義韻和語義傾向等,如衛(wèi)乃興(2006)基于語料庫對學生英語中的語義韻進行了對比研究,孫海燕(2004)探討了學生英語形容詞的搭配語義特征,陸軍(2010)分析了學習者英語近義詞的搭配行為與語義韻,方秀才(2015)以BE和HAVE為例,研究了中國EFL學習者動詞的語義虛化用法。另有學者關(guān)注了學習者中介語在句法和篇章層面的特點,如基于語料庫的關(guān)系從句研究(李金滿,2008)、被動語態(tài)研究(陳萬霞,2002)、疑問句研究(王立非張巖,2006)、感嘆句研究(劉科成彭爽,2012)、銜接機制研究(陳鵬濮建忠,2011)等。與此同時,隨著語料庫技術(shù)的不斷發(fā)展,針對學習者口語方面的研究也不斷涌現(xiàn),這些研究成果加深了人們對我國學習者中介語的理解和認識,為中國外語教學與研究提供了許多有益的啟示。
3.4.3 語料庫語言學
聚類序號3的標識詞是“語料庫語言學”?,F(xiàn)代語料庫語言學是20世紀中后期興起的一門語言研究科學。關(guān)于語料庫語言學的特點,Halliday曾指出:“語料庫語言學將數(shù)據(jù)收集與理論論述有機地結(jié)合在一起,使我們對語言的理解發(fā)生了質(zhì)的變化”(轉(zhuǎn)引自王克非,2004a:4)。作為一門年輕的學科,語料庫語言學的內(nèi)部尚存在著一些爭議。潘永樑(2001)、桂詩春(2004)、衛(wèi)乃興(2009)、梁茂成(2010,2012)等學者曾發(fā)文,在語料庫語言學的學科基礎(chǔ)、目的論、方法論等重要理論問題上進行過系統(tǒng)的梳理和研究,有助于人們理解概念上的差異,加深人們對語料庫語言學的認識。在應用方面,基于語料庫的研究方法幾乎可以應用于語言學研究的所有領(lǐng)域。Hunston指出:“可以毫不夸張地說,在過去幾十年里,語料庫以及語料庫的研究對語言研究以及語言應用研究進行了一場革新”(轉(zhuǎn)引自王克非,2004a:4)。宋紅波和王雪利(2013)曾對2001—2010年間發(fā)表在國內(nèi)核心期刊的語料庫語言學的研究情況進行過綜述,他們通過詳細的分析,認為語料庫被廣泛應用于外語教學、翻譯研究和語言研究等領(lǐng)域。根據(jù)何中清和彭宣維(2011)的研究,未來語料庫容量將會更大,類型更加多樣化,語料庫語言學的跨學科性越來越突出,將會與其它語言理論實現(xiàn)進一步融合。這種融合反過來又將擴大語料庫研究的應用范圍,促進語言研究各領(lǐng)域的發(fā)展。
3.4.4 學習者語料庫
聚類序號4的標識詞是“學習者語料庫”。語料庫的建設(shè)是應用語料庫進行語言研究的基礎(chǔ),在語料庫的建設(shè)方面,“針對外語學習者而建立的學習者語料庫(learner corpora)可謂異軍突起,成為當今語料庫建設(shè)中一股新的力量”(李文中,1999:52)。我國第一部學習者語料庫是由廣東外語外貿(mào)大學和上海交通大學于2002年共同建立的中國學習者英語語料庫(CLEC),此后,學習者語料庫發(fā)展非常迅速,國內(nèi)比較有代表性的大型學習者語料庫有:中國英語學生口筆語語料庫(SWECCL)、中國學習者英語口語語料庫(COLSEC)、中國大學生英漢漢英口筆譯語料庫(PACCEL)、中國英語專業(yè)語料庫(CEMC)等,研究者可以利用這些大型學習者語料庫,輕松獲得中國學習者語言特征的第一手資料,對學習者的語言特征進行全面和深入的分析。除此之外,外語教師還可以根據(jù)研究問題,自行設(shè)計和建立小型學習者語料庫,豐富語言側(cè)面的相關(guān)研究。總而言之,各種學習者語料庫的建立為我國語言學研究和語言教學的發(fā)展提供了強大的數(shù)據(jù)支持和寶貴的經(jīng)驗參考。
在CiteSpace軟件中,選擇突現(xiàn)性(Burstness)功能,顯示2001年至2016年間語料庫研究領(lǐng)域中的突變詞,如下圖5。
圖5 突變詞(burst term)統(tǒng)計
圖5 為CiteSpace所捕捉的突變詞,突變詞代表了語料庫研究領(lǐng)域的前沿熱點。其中,begin為起始時間,end為截止時間,strength代表了突變強度,CiteSpace探測到的突變詞共有8個,分別為外語教學、語料庫、語料庫語言學、英語寫作、學習者語料庫、詞語搭配、中國英語學習者、平行語料庫,突變詞的捕捉結(jié)果與聚類分析的結(jié)果基本相吻合。一直以來,語料庫在外語教學中得到了廣泛的應用,尤其值得關(guān)注的是外語教學中的寫作教學、詞匯教學和翻譯教學。
綜合以上分析,筆者對語料庫在外語教學與研究中的應用提出幾點思考和建議。
首先,繼續(xù)深化和拓寬語料庫在外語教學中的應用。如前所述,語料庫已廣泛應用于詞匯教學、寫作教學、翻譯教學等方面,取得了豐碩的研究成果,在這些研究的基礎(chǔ)上,隨著語料庫技術(shù)的發(fā)展,一方面,應進一步探索語料庫的“深度加工”,設(shè)計出以文本解釋能力為導向的標注體系,幫助教師更好地進行教學設(shè)計,輔助課程教學。另一方面,還應加強語料庫在口語教學、專門用途英語教學等方面的應用,拓寬研究領(lǐng)域,形成新的研究熱點,推動外語教學和研究的整體發(fā)展。
其次,利用語料庫加深對語言本質(zhì)的認識和對語言使用的研究。語料庫為開展各種語言研究提供真實、可靠且豐富的數(shù)據(jù)資源,通過對各種語言現(xiàn)象進行的定量研究和概率研究,可以極大地豐富已有的研究方法。因此,充分運用理論語言學方面的最新成果,結(jié)合語料庫的實證方法,可以幫助人們回答通過傳統(tǒng)途徑難以回答的問題,接近語言的本質(zhì)特征。而且,通過對語言使用真實狀態(tài)的描寫,還可以更好地了解學習者的語言應用和使用失誤等特征,進行針對性的教學改革,在提高學習者語言應用能力上發(fā)揮積極的指導作用。
最后,利用語料庫創(chuàng)新語言的測試與評估。完整的教學離不開測試與評估這一重要的環(huán)節(jié),目前,語料庫在語言教學中的研究主要集中在教學方法上,對語言測試的研究相對不多,今后,可以加強語料庫技術(shù)在語言測試與評估中的應用和研究,減少試題編寫和設(shè)計的主觀性和隨意性,提高測試的內(nèi)容效度,為試題設(shè)計過程提供更加科學的依據(jù)。利用語料庫技術(shù)建設(shè)語言測試的信度和統(tǒng)一標準,在語言教學中更好地發(fā)揮反撥作用。