謝 冰 胡永近
(1.宿州學院外國語學院,安徽 宿州234000)(2.宿州學院外國語學院,安徽 宿州234000)
在認知語言學中,構式可以是任何語法信息(包括句法、語義、語用等)的習慣搭配[1]。Goldberg曾指出,語域(register)等也是語義的重要信息之一[2]。本科畢業(yè)論文以寫作的形式集中體現(xiàn)了學習者對所學專業(yè)的認識和見解。不同于口語交流,畢業(yè)論文中含有大量的書面語和學術語言,因此往往需要更高的語域設定。作為議論文的一種具體形式,畢業(yè)論文寫作需要對科學研究不同階段中的現(xiàn)象和原因進行評論和說明,而作為對整個句子進行說明和解釋的語法手段,評注性狀語表明說話人對話語的看法或態(tài)度[3][4]。作為典型的評注性狀語,“-ly副詞+speaking” 構式在對句子進行評述時,也行使了語言的元語言功能[5]。Lakoff[6]認為包含 “-ly副詞+speaking” 構式的句子是帶有對該句部分或整體評論的句子,這種結構被Lakoff定義為模糊限制句(hedged sentence)。楊才英和魯熙瑩[7]基于不同語料庫從系統(tǒng)功能語法的角度分析了“副詞+speaking”結構,研究發(fā)現(xiàn)英漢兩門語言在“副詞+speaking”結構中存在句法以及詞類搭配的不同。胡夢瑩[8]基于AntConc中的相關功能和卡方檢驗對本族語語料庫和二語語料庫中立場副詞的搭配進行研究,該研究重點考察了中國高中學生對該搭配類型的頻率以及詞匯語法特征。研究發(fā)現(xiàn),相較于本族語者,中國高中學生對于立場副詞的用法呈現(xiàn)出過度或過少使用的情況。此外,當前對于副詞的研究多聚焦于副詞的搭配類型研究或基于某一理論的定性研究,且對詞匯的語域信息沒有給予足夠的重視。在理想的英語教學(ELT)環(huán)境中,教師的教學活動應為基于使用的(usage-based)教學材料,而實際情況有可能是無論是教師的表述還是教材的內(nèi)容都有可能不是慣用的表達方式[9]10,因此學生的語言習得也完全有可能只是基于直覺(intuition)的表達方式。本文對比研究“-ly副詞+speaking”構式在母語和本族語語料庫的異同,探究其原因,并提出對中國英語學習者的啟示和建議。
Jones和Waller認為說話者通過使用某一構式可以折射出其對某一事件的態(tài)度[9]72。多數(shù)語料庫在線網(wǎng)站及語料分析軟件均以頻率作為最基本的檢索方式。Widdowson曾指出,在語言研究中,頻率有時并不能完全反映以及結構的典型性和相對認知凸顯[10]。本研究基于此進行了進一步思考,并嘗試在詞匯搭配頻率與語義之間尋求一種更為科學的量化方法?;バ畔⒅?mutual information,縮寫為MI值)也是語料庫語言學中一種較為常見的計算詞匯搭配強度的方法。一般來說,MI 值越大,說明搭配強度越大。在實際操作中以 MI 值 3 為臨界值,MI 值大于 3 的搭配詞可視作顯著搭配詞[11][12]。一些在線語料庫及語料分析軟件均提供此方法。而互信息值最大的不足就是對臨界特征的概率比較敏感,且它沒有考慮特征在文本中發(fā)生的頻度,因而此方法經(jīng)常傾向于選擇稀有特征[13]。通過采用簡單的互信息值計算,工作語料庫中的一些低頻數(shù)據(jù)確實獲得了更多的關注,而這并不是實驗設計的初衷。結合本試驗工作語料庫的數(shù)據(jù)特點,為了更為科學地論證和探索“-ly副詞+speaking”構式的語義特征以及其在二語學習者中的運用,本研究選用對數(shù)似然比(Log Likelihood Ratio)的計算方法對語料數(shù)據(jù)進行重新評估。首先,與互信息算法相比,該方法在處理低頻單詞時,其對分類的貢獻沒有過分放大且低頻單詞對分類的貢獻計算更為準確。其次,該算法在考慮低頻單詞對分類結果產(chǎn)生正面影響的同時,能較好地控制其對分類產(chǎn)生的負面影響[14]。本研究中的對數(shù)似然比計算由Gries(2014)[15]的搭配構式分析(collostructional analyses)實現(xiàn)。該分析方法基于R語言(3.4.1版本),具有三個子程序,分別為共現(xiàn)詞素分析(collexeme analysis)、區(qū)別共現(xiàn)詞素分析(distinctive collexeme analysis)以及共變共現(xiàn)詞素分析(co-varying collexeme analysis)。本研究所采用的是共現(xiàn)詞素分析。該子程序需要研究者提供(a)工作語料庫的總?cè)萘俊?b)工作構式在該語料庫中的總頻率、(c)語料庫中檢索到的“-ly副詞+speaking”構式類別以及(d)在“-ly副詞+speaking”構式中出現(xiàn)的每一個副詞在語料庫中的使用頻率。該程序通過對數(shù)似然比計算出工作構式的搭配強度并將計算結果按照搭配構式強度(collostruction strength)的大小進行排序,該數(shù)值越大,則表明對應的單詞與“-ly副詞+speaking”構式的語義關聯(lián)越密切。以表1為例,若詞X在構式Y中出現(xiàn)的頻率為A, 而其在語料庫中其他地方出現(xiàn)的頻率為B,那么則有:
表1 搭配構式分析中詞X和構式Y共現(xiàn)頻率示意圖
表1中的不同頻率將和假設詞X和構式Y間不存在關系時的期待頻率進行比較,兩種頻率間的差異將被量化[16],其量化結果即為詞X和構式Y的搭配強度值。
本研究基于本族語和二語語料庫對中國英語專業(yè)學生學術語言中“-ly副詞+speaking”構式的搭配及特點予以對比分析,并對其現(xiàn)象和特征予以解釋,這也是自建語料庫的意義之一[9]9。其中本族語語料庫選取了美國當代英語語料庫(COCA (corpus of contemporary American English))和英國學術寫作語料庫(BAWE (British academic written English)),二語語料庫為作者自建的英語專業(yè)畢業(yè)論文語料庫。通過對“-ly副詞+speaking”構式進行跨庫檢索并對比頻率以及對其搭配強度(collostructional strength)的研究,對最終數(shù)據(jù)予以分析說明。在本研究的三個工作語料庫中,COCA語料庫包含了五種不同的組成來源(口語、雜志、小說、報紙和學術),因為該語料庫的五個組成部分具有等量關系,為了確保研究工具的針對性和研究對象在量化上的均衡,因此本研究只選取該語料庫中的學術語料部分,其容量約為1.1億詞。BAWE語料庫容量約為6百萬詞, 包含了2700余篇英語為母語且對其熟練掌握的本科學生的寫作,單篇字數(shù)從500-5000不等,內(nèi)容選自社會科學、自然科學、生命科學和藝術等共計35個學科領域。自建語料庫選自宿州學院外國語學院2015-2018年間四屆本科共計647名畢業(yè)生的畢業(yè)論文定稿,共計約3百萬詞,該語料庫為同質(zhì)的(mono-modal),所有論文的工作語言均為英語,論文的研究方向主要包含英語語言學、英美文學、翻譯、跨文化交際及商務英語五個方向。為了配合本研究的需要,這些論文文本只保留正文部分(所有論文均刪除了封面、致謝、摘要、目錄、參考文獻及附錄等非正文部分),編輯之后的單篇平均長度為4800詞。
本文選用了語料分析軟件AntConc 3.5.7[17]對BAWE和自建語料庫中的語料進行初步檢索。COCA的語料檢索部分由該語料庫網(wǎng)站的在線分析功能完成。然后本研究將對三個語料庫中“-ly副詞+speaking”構式進行搭配強度分析,此部分研究選用了Gries[15]的基于R(3.4.1版本)的搭配構式分析(collostructional analyses)。
表2呈現(xiàn)的是基于該算法三個語料庫中搭配構式語義強度排在前九位的搭配詞匯。Gries[15]認為搭配構式強度大于1.20103時具有統(tǒng)計學意義(p<.05),而上表中的所有搭配詞匯均符合此標準,即其與“-ly副詞+speaking”構式的搭配均呈顯著水平。從表2可以看出,雖然三個語料庫的容量不同,基于搭配構式強度的排序依然可以反映出“-ly副詞+speaking”構式在各自語料庫中使用者的使用習慣和語義特征。
表2 “-ly副詞+speaking”搭配構式強度排序
具體來說,strictly、generally、broadly同時出現(xiàn)在三個語料庫搭配強度排序的前四位,表明本族語者和二語習得者對此類搭配選擇具有一致性。其中,COCA語料庫中排序前兩位的為strictly和generally,兩者之間的搭配構式強度差異并不大(strictly:1857.93,generally:1716.61),遠遠大于排名第三的broadly(760.1535)及其后的搭配構式強度。而搭配強度排在BAWE語料庫前兩位的分別為generally和broadly,其二者的搭配強度(分別為240.3499和132.7883)則顯著大于其后詞匯的搭配強度。在自建語料庫中,搭配構式強度最大的是generally和strictly,搭配強度分別為2603.074和138.4117,雖然二者均極具統(tǒng)計學上的顯著性,不過二者間的搭配強度相差較大,甚至搭配強度排名二至九位的八個詞匯的搭配強度之和亦未達到generally單個詞匯搭配構式強度值的半數(shù),因此可以推論:中國英語學生本科畢業(yè)論文中generally占據(jù)了“-ly副詞+speaking”構式的主導意義。
其次,僅同時出現(xiàn)在兩個英語為母語的語料庫中的高強度搭配詞匯有practically、simply、roughly、metaphorically。此點研究發(fā)現(xiàn)的意義在于:若某詞在兩個不同國家的本族語語料庫中均以較高的搭配構式強度出現(xiàn),則可以說明在英式英語和美式英語中,這些詞匯均與工作構式間語義關系密切。以metaphorically為例,它是唯一一個在兩個本族語語料庫中搭配強度位列前十卻在自建語料庫中無此用法的單詞。
例1 … the image works because he is, metaphorically speaking, a slave of love. (BAWE語料庫)
例2 Metaphorically speaking, conventions in dramatic performance are like a generator of meanings. (BAWE語料庫)
例3 She concludes: “Metaphorically?speaking, woman was the original mask”.(COCA語料庫)
例1-3中均含有metaphorically speaking,Lakoff[18]認為隱喻是人類普遍的認知方式。而在人際交流包括論文的闡釋中,隱喻的手段也在一定程度上可以將一些相對復雜的信息簡單化、具體化,從而提高信息傳遞的有效性。
第三,在兩個本族語語料庫中,一些表示學科視角的詞匯與“-ly副詞+speaking”呈現(xiàn)出了較強的語義關聯(lián)。例如anthropologically、evolutionarily、mathematically、historiographically、etymologically、epistemologically、anatomically、ontologically等,相比之下,此類用法在自建語料庫中出現(xiàn)的頻率為0,所以其搭配強度也為0。
最后,在排名前九的搭配構式中,frankly、comparatively和relatively僅出現(xiàn)在了自建的二語語料庫中。
首先,“generally speaking”成為所有語料庫中的最強搭配構式之一的主要原因是:由于學術研究通過論證從而實現(xiàn)開拓和創(chuàng)新[19],這要求學術研究須具備一定的普遍性,因此,無論在佐證、分析和結論部分,對研究進行概括性的描述是必不可少的,而“generally speaking”表述意為“一般來說”“普遍來說”,其與speaking的搭配構式語義具有普遍意義,這些構式語義均可對論文的某一方面或者整體進行評述,用途較為普遍,這也是評價性副詞的主要功能之一。例4-6分別列舉了三個語料庫中“generally speaking”的用法,例4中對語法知識的描述、例5對工業(yè)發(fā)展規(guī)律的闡釋以及例6中對美國人文地理的敘述在一定程度上都具有普遍性,這也體現(xiàn)了學術研究對規(guī)律探索的本質(zhì)特征。
例4 Generally speaking, a word for English attributive mostly located before the center word. (自建語料庫)
例5 Generally speaking, an industry adjusts its level of barriers with time.(BAWE)
例6 Generally?speaking, residents in Mississippi were poor.(COCA)
其次,自建語料庫中未見metaphorically與工作構式的搭配則可能是由于二語學習者的隱喻產(chǎn)出能力一般低于本族語者[20],因此對于中國的英語學習者來說,使用英語文化中的隱喻語言表述并不常見。
第三,學科視角類詞匯與speaking組成的評論性副詞短語可以體現(xiàn)出研究較強的專業(yè)性,同時也可以在寫作中起到點名信息身份和來源的作用。雖然自建語料庫中的語料來源均為英語專業(yè)本科畢業(yè)論文,但是作為一種學術研究的書面形式,英語學科的專業(yè)性和相應的學科劃分理應出現(xiàn)在寫作中。自建語料庫的這一特征一定程度上反映了中國英語專業(yè)學生在進行畢業(yè)論文寫作或在進行相對應的科學研究時,缺乏更為專業(yè)或精確的表述。
最后,在自建語料庫中,frankly與工作構式間搭配的顯著強度源于學生對單詞語域的不恰當理解而產(chǎn)生的誤用,相同的搭配在另外兩個本族語語料庫中的搭配則屈指可數(shù)。究其原因,筆者以COCA語料庫為例進行了相關檢索。結果詳見表3和表4。
表3 frankly speaking在COCA語料庫中的頻率檢索情況
表4 frankly在COCA語料庫中的頻率檢索情況
例7 I mean,frankly speaking, there are people who would love to be back in New Orleans who are not. (COCA(選自其口語語言部分))
例8 Frankly speaking, if you're looking for good nutrition in a hot dog, you’re barking up the wrong tree. (COCA(選自其口語語言部分)
例9 Frankly speaking, the language transfer in English teaching is not only unavoidable but also beneficial. (自建語料庫)
通過對COCA語料庫的數(shù)據(jù)檢索發(fā)現(xiàn),frankly speaking在該語料庫中共出現(xiàn)41次,其在該語料庫中五個組成部分(口語、雜志、小說、報紙和學術)的分布具有顯著的傾斜性,分別為口語19次、小說6次、雜志3次、報紙11次,而在學術語言中僅出現(xiàn)2次。本研究通過對單詞frankly在該語料庫中的出現(xiàn)頻率進行檢索發(fā)現(xiàn)了更為顯著的分布特征:該詞在COCA語料庫的總頻率為12666次,其中有8275次出現(xiàn)在了口語的部分,占總頻率的65%,而該詞在小說、雜志以及報紙中的使用頻率分別為1297、1176和1474。在學術領域中該詞的頻率僅為444次,該詞在學術語體中的使用頻率僅占該語料庫中出現(xiàn)總頻率的3%,結合上述數(shù)據(jù),該詞具有顯著的口語化特征。例7和例8均選自COCA語料庫中frankly占比最高的口語用法,而例9則選自自建語料庫中中國學生的學術寫作。通過對比可發(fā)現(xiàn)前兩例的句中含有話語標記語 I mean、第一和第二人稱的使用,以及單詞的縮寫形式等典型的口語特征。而考慮到此二例語料選自母語為英語的本族語者,且該用法在語料庫中所選自的口語組成部分具有統(tǒng)計學上的顯著性,例9中中國學生的用法雖無語法規(guī)則層面的錯誤,但其搭配對比本族語者的搭配在語域?qū)用婢哂酗@著差異,因此可以得出結論:frankly speaking 在學術領域中的使用并不符合該表達的語義和語用特征。類似的語用失誤還出現(xiàn)在自建語料庫中briefly speaking等搭配的使用中,該表達在語料總量最小的自建語料庫中反而使用頻率最高,而由表5可見,BAWE語料庫中對briefly speaking的檢索結果甚至為零。
表5 briefly speaking在COCA語料庫中的頻率檢索情況
例10 Briefly speaking it is a domestic issue. (COCA)
例11 Briefly speaking, free translation pays less attention to the alternations of the original pattern and the sentence structure. (自建語料庫)
通過上文中對frankly等詞實際用法的例證發(fā)現(xiàn),同一單詞在本族語和二語語料庫中的語用差異可能是非常顯著的。究其原因,主要是二語習得者在語言使用過程中只遵循了語法或者句法規(guī)則,而忽略了其語用特征。
comparatively和relatively二詞雖然也在COCA和BAWE語料庫中與speaking搭配出現(xiàn),但其搭配強度遠低于其在自建語料庫中的排名。這二詞在語義上相近,均含有“相對”和“比較”之意,如例12和例13所示,在例12中甚至同時出現(xiàn)了relatively和comparatively。二者同時出現(xiàn)在搭配構式強度的前六位,一定程度上可以反映出中國英語習得者在進行學術寫作時具有將比較行為以語言的形式予以顯化。
例12 From the interview we discovered, comparatively speaking, extrinsic motivation has greater impact. (自建語料庫)
例13 Relatively speaking, the kinship terms of husband and wife department is comparatively simple. (自建語料庫)
上述分析說明詞匯的搭配語法知識包含了除去語法結構之外的語用及語域等知識,中國二語習得者在“-ly副詞+speaking”構式的搭配使用中有時忽略了其除去語法結構之外的信息從而造成了誤用或使用不足。因此,二語習得者一定程度上可以通過在二語語料庫和本族語語料庫的對比學習中獲得新的語域知識,提高語言表達的精確度和專業(yè)度,進而提升自身的專業(yè)能力。
本研究所使用的搭配構式分析的意義還體現(xiàn)在:一些在語料庫中出現(xiàn)頻率較高的搭配詞匯例如typically、precisely、increasingly、clearly等在搭配構式強度分析的結果卻顯示其與“-ly副詞+speaking”構式間在語義上互相排斥(repulsion),這是由于該類詞匯雖然在“-ly副詞+speaking”構式中出現(xiàn)的絕對頻率較高,但其在語料庫中整體的頻率遠高于其在“-ly副詞+speaking”構式中出現(xiàn)的頻率。基于搭配構式強度對于數(shù)量關系的考量更為全面的特點,上述幾詞與“-ly副詞+speaking”構式的語義關系極其微弱。這在一定程度上解釋了頻率和意義之間并非總是對等的。
本研究通過跨庫檢索,對“-ly副詞+speaking”構式的搭配進行了量化研究。在基于對數(shù)似然比的搭配構式分析中發(fā)現(xiàn):1,在所有工作語料庫中, generally、strictly和broadly與工作構式間具有較高的搭配強度,說明了此三詞構成了該構式的核心語義來源,一定程度上也說明了中國學生對此的成功習得。2,相較于兩個本族語語料庫,中國英語專業(yè)學生畢業(yè)論文中缺乏“學科”類詞匯以及metaphorically等具有典型文化特征的詞匯所構成的“-ly副詞+speaking”構式,而此用法在兩個本族語語料庫中較強的搭配體現(xiàn)出其在學術寫作中的語義地位和必要性。3,相較于兩個本族語語料庫,有些搭配(frankly等)僅出現(xiàn)在中國英語專業(yè)學生畢業(yè)論文中。出現(xiàn)這些現(xiàn)象和語言用法的原因可能是語言習得者對于單詞的語域及語用知識并不了解。相反,有些搭配則為本族語語料庫所獨有,這一定程度上體現(xiàn)了母語知識對語言搭配的積極影響,并對二語習得者起到了積極的啟示和示范作用。4,搭配構式分析作為一種基于對數(shù)似然比算法的量化統(tǒng)計方法,相較于傳統(tǒng)的詞頻統(tǒng)計更為科學,可以挖掘出詞頻背后的深層關系,在規(guī)模性統(tǒng)計分析中更有優(yōu)勢。在研究方法上,除去搭配構式分析,后續(xù)的研究可以從數(shù)據(jù)的離散程度(dispersion)等方面進一步考察構式語義的典型性等信息。本研究自建語料庫部分僅涵蓋了一所高校的英語專業(yè)畢業(yè)論文,未來的研究可以建設更具規(guī)模的二語語料庫。