劉 輝
(黑龍江大學俄羅斯語言文學與文化研究中心,哈爾濱 150080)
提 要:本文選取Coh-Metrix 3.0系統(tǒng)中指稱性銜接Z值1個指標,從自建學術期刊方法部分語料庫隨機抽取600個語料樣本進行分析。研究結果顯示不同學科群與學科對銜接手段的使用具有明顯的傾向性。其中,人文科學中較多采用指稱性銜接,生命科學與應用科學各學科中指稱性銜運用較少,純科學與社會科學中指稱性銜接運用較為均衡,沒有明顯的傾向性。這些發(fā)現(xiàn)表明不同學科期刊論文方法部分的銜接特征存在顯著差異,而造成上述差異的主要原因在于學科性和學科間性的相互作用。
韓禮德曾經(jīng)指出,“重要的是動態(tài)地看待語篇,將其視為意義生成的過程,并將語篇銜接視為這個過程的一個方面,通過這一過程意義流(the flow of meaning)被導向可追溯的話語流(a trackable current),而不是任其隨意的流淌”(Halliday 2010:311)。銜接是文本建構的一種重要手段,是由句子向語篇過渡的重要環(huán)節(jié),是語篇研究過程中不可缺少的環(huán)節(jié)(謝群 2017:28)。傳統(tǒng)的銜接研究大多通過人工方式分析不同體裁銜接手段的分布特征。受到準確性與效率的制約,這些研究的樣本較小,其結果的代表性不高。隨著文本自動化分析技術的發(fā)展,計算機輔助的語篇分析逐漸成為學界研究的主流。
孟菲斯大學開發(fā)的Coh-Metrix軟件以系統(tǒng)功能語言學的理論框架為基礎,融合計算語言學、心理語言學、認知語言學和語料庫語言學等相關學科的最新研究成果。該軟件能夠有效檢測文本的詞匯、句法和語篇特征,被廣泛用于語篇分析的各個領域。2012年9月該軟件推出3.0版本,可從11個維度分析語篇,總計觀察變量106個。筆者選取文本易讀性主成分指數(shù)(text easability principal component scores)中的指稱性銜接Z值(text easability PC referential cohesion, Z score)1個變量進行統(tǒng)計與分析,旨在了解從句子到語篇的文本建構規(guī)律,從而進一步明確各學科群與學科之間的相互聯(lián)系與區(qū)別。須要指出,Z值是在平均值被設定為0的情況下,用來表明被觀察變量或數(shù)據(jù)距離平均值上下的標準偏差(McNamara et al. 2014:84)。
本文語料來自筆者自建的學術期刊方法部分語料庫。該語料庫選取2008-2014年間被SCI,SSCI和A&HCI學術文獻檢索系統(tǒng)收錄的200種期刊發(fā)表的論文,樣本總量為3,000個,總計2,728,583詞次(token)。這些樣本來自20個學科,涵蓋純科學、應用科學、生命科學、社會科學和人文科學5個學科群。
本研究中,筆者首先用隨機化的方法取得30個隨機序數(shù),隨后根據(jù)這些序數(shù)提取每個學科對應的語料樣本,20個學科共收集樣本600個。最后利用Coh-Metrix 3.0在線分析工具分析所有樣本并回收分析結果。
根據(jù)本文的研究問題,筆者利用SPSS 22.0首先對變量進行描述性統(tǒng)計,并采用三線表呈現(xiàn)結果,隨后檢驗各變量間的差異顯著性。對于符合參數(shù)檢驗條件的變量將匯報正態(tài)性及方差齊性檢驗結果,不符合條件的變量將直接采用非參數(shù)檢驗。本研究中分組的最小樣本為30,因此在參數(shù)檢驗時僅匯報Shapiro-Wilk檢驗結果。
文本中具有較多的指稱性銜接成分時,表明句際之間或整個文本內(nèi)部存在更多的詞匯或語義重疊。這些指稱性成分是讀者理解語篇的顯性線索。當文本中的指稱性成分較少時,語義連接的線索也相應地減少,讀者理解語篇的難度則會相應地增加(同上:85)。實際上,Coh-Metrix統(tǒng)計的指稱性銜接變量包括名詞重疊、論元重疊、詞干重疊和實詞重疊等多種類型。而指稱性銜接Z值和百分比是在整體上對這些銜接手段的衡量,是區(qū)分文本難度及語篇建構方式的重要變量。因此,本文分別比較學科群和學科之間的指稱性銜接變量旨在揭示其中的聯(lián)系與區(qū)別。
描述結果顯示,人文科學的指稱性銜接Z值最高,為0.20,生命科學的指稱性銜接Z值最低,為-0.65,具體結果見表1。
表1 學科群指稱性銜接統(tǒng)計與檢驗
顯示漸進顯著性。 顯著性水平為.05。
檢驗結果顯示,指稱性銜接Z值在各學科群中分布的P值為0.000,小于0.05(卡方值為60.729),表明它們在各個學科群中的分布具有顯著差異。組間成對比較結果顯示,在這個變量上,生命科學與純科學、生命科學與社會科學、生命科學與人文科學、人文科學與應用科學以及人文科學與純科學之間均存在顯著差異,其它學科群相互之間則沒有明顯區(qū)別。統(tǒng)計結果表明,人文科學使用指稱性銜接手段的頻率最高,文本難度最低;社會科學、純科學與應用科學的使用頻率較低,文本難度居中;生命科學的使用頻率最低,文本難度最高。筆者對學科群詞匯密度的分析顯示,生命科學的詞匯密度最高,人文科學的詞匯密度最低。而指稱性銜接中的名詞重疊和論元重疊等均同實詞有關。因此,詞匯密度同指稱性銜接之間存在關聯(lián),詞匯密度的檢驗結果在一定程度上驗證此處的檢驗結果。
SPSS分析結果顯示,指稱性銜接Z值正態(tài)分布,Shapiro-Wilk檢驗的P值分別為0.958、0.218、0.667和0.454,均大于0.05,方差齊性檢驗P值為0.404,大于0.05,符合參數(shù)檢驗的要求,見表2。
表2 純科學指稱性銜接Z值單因素方差分析
方差同質(zhì)性檢驗
ANOVA
表2顯示,數(shù)學指稱性銜接Z值最高,為0.31,化學最低,為-1.03;檢驗結果顯示,該變量分布的P值為0.000,小于0.05(F值為28.929),表明該變量在4個學科間的分布具有統(tǒng)計學意義上的顯著差異。組間多重比較結果顯示,除統(tǒng)計學與數(shù)學外,其它學科相互之間均存在統(tǒng)計學意義的顯著差異。
組間成對比較結果顯示,除物理學與統(tǒng)計學、數(shù)學與統(tǒng)計學外,該變量在其它學科之間的分布均具有顯著差異。本文的統(tǒng)計結果與筆者針對本學科群詞匯密度的統(tǒng)計結果相一致,同學科群可讀性分析的結果也基本一致。而針對純科學句法相似度的分析表明,除主要動詞前詞匯數(shù)量外,4個學科在名詞短語修飾語數(shù)量、相鄰句句法相似度和全部句子句法相似度3個維度上均存在顯著區(qū)別。綜合這些檢驗結果,4個學科在建構文本的過程中絕大多數(shù)變量的分布均呈現(xiàn)較為穩(wěn)定的變化,從而保證學科之間的相互聯(lián)系與區(qū)別。
SPSS分析結果顯示,指稱性銜接Z值正態(tài)分布,Shapiro-Wilk檢驗的P值分別為0.376、0.065、0.848和0.610,均大于0.05,方差齊性檢驗的P值為0.204,大于0.05,符合進行參數(shù)檢驗的條件,詳情見表3。
表3的統(tǒng)計結果顯示,計算機指稱性銜接Z值最高,為0.82,材料學最低,為0.50;分析結果顯示,指稱性銜接Z值分布的P值為0.000,小于0.05(F值為15.414),表明該變量在4個學科間的分布具有統(tǒng)計學意義上的顯著差異。組間多重比較結果顯示,除工程學與應用機械外,其它學科相互之間均存在統(tǒng)計學意義上的顯著差異。
表3 應用科學指稱性銜接Z值單因素方差分析
方差同質(zhì)性檢驗
ANOVA
組間成對比較結果顯示,材料學與工程學、材料學與計算機、應用機械與計算機之間存在顯著差異,其它學科相互之間無明顯差別。前文詞匯密度與句法復雜度的分析表明,計算機科學的詞匯密度最高,材料學的詞匯難度最低,計算機科學的句法復雜度高于材料學??勺x性與指稱性銜接的分析結果顯示,計算機科學的文本難度又低于材料學。由此可見,在詞匯、句子和語篇3個層面上,兩個學科的文本難度始終處于一種此消彼長的狀態(tài)。
SPSS分析結果顯示,指稱性銜接Z值正態(tài)分布,Shapiro-Wilk檢驗P值分別為0.104、0.864、0.065和0.201,均大于0.05,方差齊性檢驗P值為0.253,大于0.05,符合參數(shù)檢驗的條件,見表4。
表4顯示,農(nóng)學指稱性銜接Z值最高,為-0.40,醫(yī)學最低,為-0.92;檢驗結果顯示,該變量分布的P值為0.015,小于0.05(F值為3.613),表明該變量在各學科間的分布差異具有統(tǒng)計學意義的顯著性;組間多重比較結果顯示,除醫(yī)學與農(nóng)學外,其它學科相互之間均不存在顯著差異。組間成對比較結果顯示,除農(nóng)學和醫(yī)學外,其它學科相互之間不存在明顯區(qū)別。作為接近學科連續(xù)統(tǒng)中央的成員,醫(yī)學、公共健康、生物學和農(nóng)學在已經(jīng)分析過的變量中均表現(xiàn)出較高的一致性。該學科群的詞匯密度最高,句子數(shù)量和段落最多,句法復雜度高于學科群平均水平,可讀性低于學科群平均水平,指稱性銜接指數(shù)最低,表明生命科學方法部分的文本難度在詞匯、句子和語篇層面始終維持在較高難度。雖然學科群內(nèi)部各成員之間在一些變量的分析中表現(xiàn)出明顯差異,但是它們作為接近學科原型的成員,均表現(xiàn)出明顯的集中傾向。
表4 生命科學指稱性銜接Z值單因素方差分析
方差同質(zhì)性檢驗
ANOVA
統(tǒng)計結果顯示,商務與經(jīng)濟學的指稱性銜接Z值最高,為0.23,法學最低,為-0.17,詳情如表5所示。
表5 社會科學指稱性銜接特征描述
顯示漸進顯著性。 顯著性水平為.05。
檢驗結果顯示,上述指稱性銜接Z值分布的P值為0.018,小于0.05(卡方值分別為10.042),表明它在各個學科中的分布具有顯著差異。組間成對比較結果顯示,兩個變量僅在心理學同商務與經(jīng)濟學之間存在顯著差別,其它學科相互之間不存在明顯區(qū)別。針對社會科學各個變量的分析結果顯示,社會科學的詞匯密度最高,各個學科之間的詞匯密度十分接近,表明該學科群在詞匯層面上的難度最高,而在句子和語篇層面該學科的文本難度卻呈現(xiàn)明顯的下降趨勢。這種整體的變化規(guī)律表明,社會科學方法部分文本建構時,更傾向于在詞匯層面上體現(xiàn)其學科復雜性,而在句際之間及語篇銜接上則傾向使用較為簡單的建構策略。(嚴明 2017:77) 就學科群內(nèi)部的成員而言,心理學始終在不同程度上保持著自身的邊緣性學科的特征,在很多變量中均呈現(xiàn)出與其它學科之間的顯著區(qū)別。而不同變量在社會學、商務與經(jīng)濟學和法學中的分布卻始終保持著較高的一致性,說明它們的學科特征和語篇建構策略比較相似。
統(tǒng)計結果顯示,文學指稱性銜接Z值最高,為0.64,語言學最低,為-0.45,具體見表6。
表6 人文科學指稱性銜接特征統(tǒng)計與檢驗
顯示漸進顯著性。 顯著性水平為.05。
檢驗結果顯示,指稱性銜接Z值分布的P值為0.000,小于0.05(卡方值分別為19.417),表明它在各學科中的分布具有顯著差異。組間成對比較結果顯示,此變量在語言學同其它3個學科之間的分布均存在顯著差異,而其它3個學科相互之間則沒有明顯差別。這一檢驗結果再次說明,語言學作為人文學科的非典型成員同哲學、歷史和文學3個學科之間在語篇特征上存在明顯不同。須要指出,本節(jié)的檢驗結果表明歷史與哲學兩個學科的文本難度存在一定的變化。筆者已經(jīng)分析過的相關變量中,歷史在詞匯密度、句子數(shù)量、平均句長和平均段長等變量的統(tǒng)計結果均高于哲學,說明它在詞匯和句子層面的文本難度高于哲學。但是,歷史的指稱性銜接Z值卻低于哲學,表明在語篇層面上二者的文本難度發(fā)生轉(zhuǎn)變,歷史的文本難度低于哲學,體現(xiàn)出與此前不同的難度變化趨勢。這種變化趨勢表明,不同學科會根據(jù)交際目的的不同調(diào)整文本建構的策略運用及重心。綜合本學科群的統(tǒng)計與分析結果,人文學科在建構方法部分的文本時傾向于使用更多的指稱性銜接手段,從而提高文本的可讀性,降低文本的整體難度。
銜接手段是文本建構的重要方式,靈活組合有效運用不同的銜接手段是建構方法部分的核心策略之一。本文研究表明,不同學科群與學科對銜接手段的使用具有明顯的傾向性。這些傾向性既是學科特征的體現(xiàn),也是銜接手段運用的基本規(guī)律。其中,人文科學較多采用指稱性銜接,生命科學與應用科學各學科中指稱性銜運用較少,純科學與社會科學中指稱性銜接運用較為均衡,沒有明顯的傾向性。因此,合理運用銜接手段既要符合學科群或?qū)W科的基本特點,又要體現(xiàn)主體對文本建構的有效掌控。畢竟期刊論文的規(guī)范性與規(guī)約性對研究者均具有較強的約束力,銜接手段的組合與運用也須要適當考慮這些因素。