秦琴 丁研
(北京交通大學(xué) 語言與傳播學(xué)院, 北京 100044)
飽和度的概念源自轉(zhuǎn)換-生成語法,表示所生成語言意義和形式的完整性,包括意義飽和度與句法飽和度(Heim & Kratzer,2000:3)。作為當(dāng)代認(rèn)知主義理論的基礎(chǔ),生成語法的語義理論認(rèn)為,語言中具有指謂功能的詞所代表的是集合概念,本身不飽和,需要有其他成分提供限制域和轄域使其飽和(Chung & Ladusaw,2004:8);意義飽和的基礎(chǔ)是謂詞+論元飽和,完整的概念與意義的形成是飽和的謂詞結(jié)構(gòu)不斷進(jìn)行組合擴(kuò)張的過程(Kearns,2011)。對意義飽和度的討論多見于跨語種的語言現(xiàn)象分析和特定語言現(xiàn)象飽和度構(gòu)建與表達(dá)效果的研究,如Primus(2011)對不同語種被動結(jié)構(gòu)主語論元飽和度的探討,以詞匯為核心的意義飽和度構(gòu)建對表達(dá)效果的影響分析(Depraetere & Salkie,2017),以及動詞意義網(wǎng)絡(luò)構(gòu)建與意義飽和度生成的研究等(Zafari & Hourali,2019)。
生成語法認(rèn)為,在不考慮語用因素的條件下,句法飽和與意義飽和是并行的,具有同質(zhì)性,謂詞+論元飽和結(jié)構(gòu)是意義、句法的接口(Chung & Ladusaw,2004)。謂詞作為句子成分使用時,自身會帶有價位(valence),決定論元的個數(shù)和位置,價位的填充是句法飽和度的形成過程(Plank & Lahiri,2015)。近年來針對句法飽和度的研究從之前的謂詞論元層面逐漸轉(zhuǎn)移到句子整體層面,如Wetta(2015)對句法片段飽和的研究,Scontras(2014)句內(nèi)連接標(biāo)記飽和的提出,Walker(2017)對關(guān)系從句飽和原則的分析等。在Ackerman & Webelhuth (2019)最近的研究中,提出了謂詞論元飽和、所屬標(biāo)記飽和與修飾語飽和等相關(guān)參數(shù)和投射組合原則。
上述研究從跨語種和語用實(shí)踐等視角,對意義和句法飽和度的構(gòu)建途徑和形態(tài)以及表達(dá)效果進(jìn)行了分析,為轉(zhuǎn)換-生成語法的研究開辟了更為廣闊的視角,擴(kuò)展了這一理論的研究深度和范圍,但也存在一些不足。上述研究對象或?yàn)槟骋灰饬x功能和句法范疇的跨語言對比分析,或是針對本族語語料庫進(jìn)行的意義、句法飽和度研究,對基于本族語者和二語學(xué)習(xí)者語料庫的對比研究幾乎沒有,而作為一個語言生成概念,針對本族語者和二語學(xué)習(xí)者意義、句法飽和度構(gòu)建的對比應(yīng)當(dāng)是二語習(xí)得研究不可缺少的環(huán)節(jié)。
當(dāng)代二語習(xí)得的認(rèn)知理論肯定了生成語法的組合觀,在擴(kuò)展后者語言官能理論的同時,提出語言輸出過程包括概念化、意義組合和句法生成三個核心階段(Skehan,2014),并認(rèn)為與本族語者意義、句法體系相互促進(jìn)的線性發(fā)展模式不同,二語學(xué)習(xí)者意義、句法體系的發(fā)展是相互制約、螺旋式上升的雙相模式。針對上述觀點(diǎn),代表性的研究層出不窮,如二語學(xué)習(xí)者概念、意義與句法發(fā)展之間的代償現(xiàn)象(Robinson,2005;Skehan,2014),概念信息復(fù)雜度與句法構(gòu)建折損(Bunger et al.,2013)等。盡管上述學(xué)者針對意義和句法體系發(fā)展的研究或多或少都借鑒了生成語法和組合理論的相關(guān)原則與方法(如二語學(xué)習(xí)者意義成熟度和句法成熟度的比較),但直接針對本族語者和二語學(xué)習(xí)者意義、句法飽和度構(gòu)建的對比研究幾乎沒有。李芝與戴曼純(2009)的研究指出,在轉(zhuǎn)換-生成語法視角下,二語習(xí)得與一語習(xí)得的狀態(tài)、習(xí)得過程也必然大不相同。在這樣的背景下,從意義、句法飽和度入手對本族語者和二語學(xué)習(xí)者的目的語生成規(guī)律進(jìn)行挖掘和分析,是對生成語法和二語習(xí)得理論的有益探索。
綜上所述,本研究以轉(zhuǎn)換-生成語法和二語習(xí)得的認(rèn)知理論為基礎(chǔ),從多源語料庫提取there be句型為研究對象,通過標(biāo)注、統(tǒng)計(jì)和自然語言處理模型,對英語本族語者和中國二語學(xué)習(xí)者輸出文本中意義、句法的飽和度進(jìn)行對比分析,并對其背后的深層作用機(jī)制進(jìn)行探討,具體回答以下問題:
(1)二語學(xué)習(xí)者輸出文本中there be句型的句法飽和度與本族語者有無差異?
(2)二語學(xué)習(xí)者輸出文本中there be句型的意義飽和度與本族語者有無差異?
(3)影響本族語者和二語學(xué)習(xí)者意義、句法飽和度構(gòu)建的深層認(rèn)知原因是什么?如何產(chǎn)生影響?
出于數(shù)據(jù)統(tǒng)計(jì)經(jīng)濟(jì)性的考慮,本研究先行處理句法飽和度。在存在句研究領(lǐng)域,較多學(xué)者認(rèn)同的是there be句型的基本結(jié)構(gòu)包括空主語there,表存在的系動詞be和由NP構(gòu)成的支柱詞結(jié)構(gòu),具備上述三者的存在句稱為獨(dú)立存在句(bare existentials),支柱詞之后還有根據(jù)需要而存在的結(jié)構(gòu),統(tǒng)稱為尾部結(jié)構(gòu)(coda),而對there be句型謂詞結(jié)構(gòu)的確認(rèn)是長期爭論的問題。本研究采用最新相關(guān)理論,認(rèn)為支柱詞位置的非限定性廣義量詞結(jié)構(gòu)是謂語,系動詞和支柱詞之間的是修飾成分,尾部結(jié)構(gòu)是謂詞的隱性論元(Francez,2010;Mcnally,2016)。根據(jù)Ackerman &Webelhuth(2019)的研究,常用的句法飽和度參數(shù)包括謂詞論元飽和、所屬標(biāo)記飽和與修飾語飽和三種。結(jié)合上述學(xué)者的研究與存在句本身的非限定特征,本文舍棄所屬標(biāo)記飽和,設(shè)定謂詞論元飽和與修飾語飽和兩個主體參數(shù)來表征there be句型的句法飽和。謂詞論元飽和包括基礎(chǔ)結(jié)構(gòu)飽和與深層結(jié)構(gòu)飽和兩個參數(shù),其中基礎(chǔ)結(jié)構(gòu)飽和包含四個因子:空主語、系動詞、支柱詞與可選尾部結(jié)構(gòu)。每個因子均包括0與1兩個值,任一句子若包含上述某一因子,該因子值即為1,否則為0。深層論元結(jié)構(gòu)飽和因子為尾部結(jié)構(gòu)長度,修飾語飽和參數(shù)統(tǒng)計(jì)因子為支柱詞前修飾語長度。參照Charlene(2017)的研究,本文采用there be句型的T單位長度做為基礎(chǔ)比較變量,并對二語學(xué)習(xí)者的句法正確率進(jìn)行隨機(jī)抽樣檢測,考查其there be 句型輸出的句法相對飽和度。
在Heim & Kratzer(2000)和Kearns(2011)等人的研究中,意義是由性質(zhì)(property)和關(guān)系(relation)構(gòu)成的。表示性質(zhì)的詞即廣義上的謂詞,代表具備某種性質(zhì)的個體集合,如普通名詞、動詞、形容詞和副詞等。關(guān)系的來源有兩個,即詞匯與句法結(jié)構(gòu)。本研究討論的是單一的there be句型,因此舍棄句法關(guān)系,采用表示關(guān)系和性質(zhì)的詞匯做為意義飽和度統(tǒng)計(jì)因子。本文對意義飽和度的分析包括兩部分,通過謂詞+論元結(jié)構(gòu)中性質(zhì)與關(guān)系詞匯的統(tǒng)計(jì)分布和深層意義模型的析取,來表征句子內(nèi)部詞語意義之間的分配關(guān)系和意義組合擴(kuò)張的過程。
依據(jù)體量對等的原則,本研究在對多個語料庫的容量進(jìn)行對比考查后,選擇BROWN、FLOB、FROWN、LOB、LOCNESS做為本族語料來源,選擇WECCL和CLEC做為二語學(xué)習(xí)者語料來源,并使用蘭卡斯特大學(xué)開發(fā)的標(biāo)注軟件claws7對所選語料庫進(jìn)行整體標(biāo)注,在此基礎(chǔ)上用課題組自行開發(fā)的軟件Hooks對所有標(biāo)注為EX0的句子進(jìn)行提取,并將提取結(jié)果導(dǎo)入Eviews 數(shù)據(jù)庫。本族語語料庫提取there be句型共計(jì)7863個,二語學(xué)習(xí)者語料庫提取there be句型共計(jì)9642個。課題組對所提取的句子進(jìn)行了初步的篩選,剔除嚴(yán)重錯誤影響解讀的句子,最終得到本族語者there be 句型7456個,二語學(xué)習(xí)者there be句型7559個,生成兩個子庫。選擇這七個語料庫為數(shù)據(jù)基礎(chǔ)的原因是上述語料庫均為封閉語料庫,有一定的穩(wěn)定性。為了保證研究的科學(xué)性,本研究選用COCA語料庫2012-2017子庫做為對比語料庫,隨機(jī)提取there be句型8000個,用于統(tǒng)計(jì)數(shù)據(jù)的對比。
在Eviews環(huán)境下,本研究將兩個子庫置入根據(jù)成分功能設(shè)定空位的數(shù)據(jù)庫,在支柱詞前后賦空位值,然后以句子為單位將所有單詞按結(jié)構(gòu)順序入位,并進(jìn)行特征統(tǒng)計(jì),得出描述性結(jié)果如下:在本族語子庫中,9.6%的句子為獨(dú)立存在句,即空主語、系動詞和支柱詞位為非空,尾部結(jié)構(gòu)為空。這一類型在二語學(xué)習(xí)者子庫中占比為11.3%,經(jīng)Z檢驗(yàn)確認(rèn),二者沒有顯著差異。本族語there be句型的90.4%和二語學(xué)習(xí)者的88.7%尾部結(jié)構(gòu)均為非空位,沒有顯著差異。由此可見,本族語者和二語學(xué)習(xí)者在基本結(jié)構(gòu)的使用頻率上沒有顯著差異,均表現(xiàn)為下述句法結(jié)構(gòu)的飽和態(tài)。
[空主語] [系動詞][支柱詞](尾部結(jié)構(gòu))
對句子結(jié)構(gòu)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)顯示,本族語子庫there be句型的T單位平均值為15.96,支柱詞前修飾語非空位的平均值為4.93,尾部結(jié)構(gòu)非空位的平均值為10.68;而二語學(xué)習(xí)者子庫的上述值分別為10.76、3.76和6.31,COCA語料庫隨機(jī)提取there be句型的上述值分別為14.93、4.78和9.85。經(jīng)Z檢驗(yàn),本族語者和二語學(xué)習(xí)者T單位長度差異性顯著,前置修飾語差異性不顯著,尾部結(jié)構(gòu)長度差異性顯著。圖1是尾部結(jié)構(gòu)長度序列和出現(xiàn)頻率的柱形圖。圖中顯示,本族語者和二語學(xué)習(xí)者尾部結(jié)構(gòu)非空位序列的交叉點(diǎn)出現(xiàn)在8的位置,即尾部結(jié)構(gòu)長度是8個詞位以下的there be句子數(shù)量,二語學(xué)習(xí)者使用頻率高于本族語者,峰值出現(xiàn)在3和4附近;尾部結(jié)構(gòu)長度是8個詞位及以上的,本族語者使用頻率高于二語學(xué)習(xí)者,峰值出現(xiàn)在10和11附近。
經(jīng)統(tǒng)計(jì),本族語子庫中尾部結(jié)構(gòu)長度是8個詞位及以上的句子數(shù)量占比為59.8%,8個詞位以下的句子數(shù)量為30.6%;而在二語學(xué)習(xí)者子庫中,尾部結(jié)構(gòu)長度是8個詞位以下的句子數(shù)量為62.5%,8個詞位及以上的句子數(shù)量為26.2%。可以看出,本族語者和二語學(xué)習(xí)者there be句型的主體句式在尾部結(jié)構(gòu)非空位的長度序列上,幾乎呈現(xiàn)倒置的比例,二語學(xué)習(xí)者尾部結(jié)構(gòu)的句法飽和度顯著低于本族語者。
圖1 CODA長度序列和出現(xiàn)頻率
上述分析顯示,本族語者和二語學(xué)習(xí)者在基本句法層面飽和度沒有顯著差異,在深層結(jié)構(gòu)層面,二語學(xué)習(xí)者尾部結(jié)構(gòu)的句法飽和度顯著低于本族語者。
本文將Claws標(biāo)注后的句子置入Eviews表格,每詞一格,并對所有表示性質(zhì)和關(guān)系的詞匯進(jìn)行分類提取,非空位的詞匯共提取出133個細(xì)分類。參照Kearns(2011)的研究,本文根據(jù)詞性與功能將所有細(xì)分歸結(jié)為19個大類,其中表示性質(zhì)的八類,表示關(guān)系的十類,其他詞匯一類。表示性質(zhì)的包括形容詞、數(shù)詞、名詞、人稱代詞、表性質(zhì)的副詞、實(shí)義動詞謂語、實(shí)義動詞的現(xiàn)在分詞和過去分詞形式;表示關(guān)系的包括定冠詞、不定冠詞、不定代詞、并列連詞、從屬連詞、疑問代詞、介詞、表關(guān)系的副詞、不定式標(biāo)志和助動詞;其他類包括存在句標(biāo)志EX0和無分類標(biāo)志詞匯等等。
通過Eviews對所有分類統(tǒng)計(jì)顯示:在基本結(jié)構(gòu)層面,空主語、系動詞、支柱詞和前置修飾語位置上詞匯的性質(zhì)和功能分布差異不顯著,而支柱詞后尾部結(jié)構(gòu)中表性質(zhì)與關(guān)系的詞匯分布差異顯著。本文分三步對尾部結(jié)構(gòu)即深層論元意義飽和度進(jìn)行對比。
圖2 表關(guān)系的詞匯頻率平均值
圖3 表性質(zhì)的詞匯頻率平均值
第一步,對本族語者和二語學(xué)習(xí)者there be句型尾部結(jié)構(gòu)表關(guān)系和性質(zhì)的詞匯數(shù)量進(jìn)行比較,得出圖2表關(guān)系的詞匯頻率平均值和圖3表性質(zhì)的詞匯頻率平均值。圖2、圖3顯示,本族語者單位句子表關(guān)系和表性質(zhì)的詞匯使用頻率平均值均高于二語學(xué)習(xí)者,其中前者定冠詞、不定冠詞和從屬連詞接近后者的5倍,介詞和助動詞接近后者的3倍;本族語者名詞、數(shù)詞、形容詞、謂語動詞的平均值是二語學(xué)習(xí)者的4到10倍。
第二步,對本族語者和二語學(xué)習(xí)者there be句型尾部結(jié)構(gòu)意義分配的規(guī)律進(jìn)行比較,得出關(guān)系類詞匯分布和性質(zhì)類詞匯分布。為了節(jié)省篇幅,本文只列出支柱詞后八位表關(guān)系類詞匯分布。表1顯示,在支柱詞后的八個非空位中,本族語者表關(guān)系的十類詞匯的出現(xiàn)頻率半數(shù)以上高于二語學(xué)習(xí)者,隨著非空位的向后延續(xù),本族語者呈現(xiàn)相對穩(wěn)定的波浪形增減或穩(wěn)步減少的態(tài)勢,而二語學(xué)習(xí)者除不定式之外,全部快速降低,二者差距迅速拉開。表現(xiàn)特殊的有:介詞,疑問代詞、助動詞前一到三位二語學(xué)習(xí)者頻率出現(xiàn)高于本族語者的情況,之后本族語者使用頻率穩(wěn)步增多;不定式,第一位至第五位二語學(xué)習(xí)者使用頻率高于本族語者,從第六位開始,二者均緩慢下降。
表1 關(guān)系類詞匯分布
表性質(zhì)類詞匯分布顯示,在支柱詞后的八個非空位中,本族語名詞、數(shù)詞、表性質(zhì)的副詞和過去分詞的出現(xiàn)頻率始終高于二語學(xué)習(xí)者。隨著非空位的向后延續(xù),本族語上述詞匯的使用頻率表現(xiàn)出波浪型穩(wěn)步下降或穩(wěn)步上升的趨勢,二語則表現(xiàn)為下降趨勢。表現(xiàn)特殊的有:二語形容詞、現(xiàn)在分詞、謂語動詞和人稱代詞第一位至第四位使用頻率高于本族語者,之后本族語上述詞匯使用頻率穩(wěn)步增加或保持不變,二語則快速下降。
總量求和顯示,在第一和第二非空位,二語表關(guān)系和表性質(zhì)的詞匯總頻率均高于本族語者,從第三位開始,本族語關(guān)系和性質(zhì)詞匯的使用頻率高于二語且保持穩(wěn)定,后者使用頻率則急速下降。在后續(xù)表格中,本族語上述詞匯分類表現(xiàn)出穩(wěn)定的延續(xù)性,明顯的下降趨勢出現(xiàn)在19到21位之后。這表明本族語者傾向于將尾部論元的擴(kuò)張鋪陳于后續(xù)的非空位中,二語學(xué)習(xí)者則將意義集中于貼近支柱詞的非空位。
第三步,本研究對二語學(xué)習(xí)者子庫中there be句型的正確率進(jìn)行了補(bǔ)充驗(yàn)證:以8個詞位為界,隨機(jī)抽取尾部結(jié)構(gòu)8個詞位以下的句子200個,連續(xù)抽取5次;再抽取尾部結(jié)構(gòu)8個詞位以上的句子200個,連續(xù)抽取5次。此項(xiàng)驗(yàn)證的目的是,考查在意義飽和度與本族語者接近的情況下,二語學(xué)習(xí)者能否進(jìn)行正確的句法編碼。結(jié)果顯示:尾部結(jié)構(gòu)8個詞位以下的句子5次抽取的正確率分別為87.0%、65.0%、81.5%、93.5%和76.0%;尾部結(jié)構(gòu)8個詞位以上的句子5次抽取的正確率分別為23.5%、14.5%、28.0%、26.0%和18.5%。這一結(jié)果表明,部分二語學(xué)習(xí)者表現(xiàn)出了增加意義飽和度的趨勢,進(jìn)而寫出了較長的句子,但是句法飽和度的增加是相對的,即填充了更多的位置,但同時導(dǎo)致了錯誤率的升高。
本研究選擇Francez(2010)和McNally(2016)的理論來構(gòu)建存在句的原子概念,即支柱詞本身是謂語,指謂廣義量詞結(jié)構(gòu),尾部結(jié)構(gòu)是謂語支柱詞的隱性論元,為廣義量詞提供轄域。近年的認(rèn)知語言學(xué)和計(jì)算語言學(xué)研究均發(fā)現(xiàn),認(rèn)知模型和自然語言處理模型之間有著很強(qiáng)的聯(lián)系,通過對自然語言成分進(jìn)行模型算法構(gòu)建,可以使句子和篇章的深層意義和概念得到清晰的表達(dá),揭示傳統(tǒng)研究方法無法發(fā)現(xiàn)的深層規(guī)律,如Kurdi(2017)和Fauconnier(2018)對DRS模型和謂詞函數(shù)升級算法的運(yùn)用。這些模型方法與轉(zhuǎn)換-生成語法的邏輯函數(shù)有著天然的聯(lián)系。本文沿用上述學(xué)者的模型架構(gòu)理念,對二語學(xué)習(xí)者和本族語者的高頻句式進(jìn)行深層意義的提取。在前文描述性分析的基礎(chǔ)上,本文分別從二語學(xué)習(xí)者和本族語者子庫中尾部結(jié)構(gòu)長度的最高頻率聚集區(qū)間隨機(jī)抽取句子進(jìn)行比較分析。
結(jié)合上文,本族語者和二語學(xué)習(xí)者there be句型呈現(xiàn)如下三種型態(tài)。
第一種,獨(dú)立存在句。本族語者和二語學(xué)習(xí)者這一類型的使用頻率沒有顯著區(qū)別,代表句子如There is a shop。該句的概念模型可以用下式表示:
[[There is a shop]]=λP(e,t)[a(λx)[shop(χ)],P)](D)
該模型式構(gòu)建了如下意義結(jié)構(gòu):表達(dá)量詞a所轄下普通名詞集合shop與語境場P的交集,D是所有組成語境域的集合。廣義量詞表達(dá)的是集合的集合,語義類型為
式一:
λP(e,t)[Q(λx)[N(χ)],P)](D)
第二種,尾部結(jié)構(gòu)簡單的存在句,二語學(xué)習(xí)者的主體句式,尾部結(jié)構(gòu)長度頻率峰值出現(xiàn)在3到4,代表句型There are two volunteers in the hospital。該句概念模型如下:
[[hospital ]]@([[there are two volunteers]])=
the(λm[hospital(m)],λy[two(λn[volunteers(n)],λm[in(m,y)])])
該模型式表示量詞two所轄下普通名詞集合volunteer與語境場P的交集,P為與話語參照體hospital存在in關(guān)系的所有物體集合,在模型式中進(jìn)行了λ還原運(yùn)算,因?yàn)槲膊拷Y(jié)構(gòu)中包含的定冠詞the本身需要轄域,而在該句中the的轄域是開放的,依托的是更大的語境。這一類別所表達(dá)的意義可以用如下模型式概括:
式二:
(λm[N1(m)],λy[Q(λn[Np(n)],λm[R(m,y)])]
第三種,本族語者主體句式,尾部結(jié)構(gòu)長度頻率峰值出現(xiàn)在10到11,支柱詞后為多個參照體—關(guān)系詞構(gòu)建的集合矩陣,代表句型There were no tracks in the snow that had drifted across the long doorstep。為了閱讀方便,本文將模型式分層表達(dá):
[[across the long doorstep]] @([[ that had drifted]] @([[ in the snow]] @([[there were no tracks]])))= ……
the[λv[doorstep(v)&long(v)],λu[across(u,w)])
λT((e,t)t)[a(λi[i?J],λj[(λq[drift(q),(j)])])]
λj((e,t))[the(λm[snow(m)]λq[that(q,j)])
該模型刻畫了一個內(nèi)部存在多個層次的意義結(jié)構(gòu):普通名詞集合track與語境場P的交集構(gòu)建no的轄域,P表述為與話語參照體snow存在in關(guān)系的所有物體集合,在模型式中進(jìn)行了λ還原運(yùn)算;第二級尾部結(jié)構(gòu)為定冠詞the和否定詞no提供了轄域,表示第一級尾部結(jié)構(gòu)所提供集合在某一時間段內(nèi)所具有的性質(zhì)(drifted),j為該性質(zhì)存在的時間,J為該句子生成時的大時間域,第三級尾部結(jié)構(gòu)引入新的參照體doorstep,通過across構(gòu)建更大的集合s,進(jìn)行λ還原運(yùn)算λu[across(u,w)],限制第二級尾部結(jié)構(gòu)并為之前的冠詞和否定詞提供轄域。集合s應(yīng)當(dāng)有一個更大的語境,此處在還原運(yùn)算中省略。這種意義結(jié)構(gòu)類型符合Francez(2010)所提出的累積效應(yīng)(stacking effect),即多重尾部結(jié)構(gòu)中,后續(xù)的尾部結(jié)構(gòu)限制前一級尾部結(jié)構(gòu)的語境場,同時為支柱詞中的量詞提供構(gòu)成轄域集的條件。這一類型的模型可以概括為:
式三:λCn+1[Qn(λv[N(v)],……λy[Q0(λz[Np(z)],λu[R(u,y))])……
上述分析表明,本族語者和二語學(xué)習(xí)者there be句型的意義構(gòu)建有著很大的差異:本族語者傾向于使用多個性質(zhì)—關(guān)系詞結(jié)構(gòu)形成嵌套矩陣鏈,盡可能包含大的信息量,為謂語提供隱性論元,這一結(jié)論符合Francez(2010)提出的本族語者閉合語境場使用傾向;而在二語學(xué)習(xí)者的主體句式中,尾部結(jié)構(gòu)論元與謂詞是開放的線性關(guān)系,很少形成嵌套矩陣鏈,對廣義量詞轄域的限制信息較少,意義表達(dá)對更大語境的依賴度較高。也就是說,本族語者there be 句型深層意義的飽和度要高于二語學(xué)習(xí)者。
綜上所述,在基本結(jié)構(gòu)層面,本族語者和二語學(xué)習(xí)者there be 句型的意義、句法飽和度構(gòu)建沒有顯著差異;在深層結(jié)構(gòu)層面,本族語者there be句型尾部論元意義、句法飽和度要高于二語學(xué)習(xí)者,前者尾部論元傾向于使用信息量較高的集合矩陣鏈,為支柱詞位置的廣義量詞提供邊界清晰的轄域,對大語境的依賴性較低,二語學(xué)習(xí)者傾向于使用開放的線性尾部論元,轄域邊界模糊,對大語境的依賴度較高。隨著意義飽和度的增長,二語學(xué)習(xí)者的句法飽和度會相對增加,但句法錯誤率也會升高。
上述結(jié)果可以通過認(rèn)知關(guān)系的深層構(gòu)建和前語言輸出階段的內(nèi)化過程兩個方面來分析。
首先,認(rèn)知關(guān)系的深層構(gòu)建是意義飽和度構(gòu)建的基礎(chǔ)。Culicover & Jackendoff(2012)的研究指出,相同表層語言現(xiàn)象的內(nèi)核是同一種認(rèn)知關(guān)系(cognitive relation),對同一認(rèn)知關(guān)系的內(nèi)部處理過程會產(chǎn)生類似的、程式化的語法輸出結(jié)構(gòu)。在對本族語者和二語學(xué)習(xí)者there be句型深層意義的模型構(gòu)建中可以發(fā)現(xiàn),二者對這一句式的內(nèi)部關(guān)系認(rèn)知存在差異:二語學(xué)習(xí)者傾向于表達(dá)的是世界集或者某一時間或空間集與支柱詞參照體集合的關(guān)系,世界、時間與空間本身的其他特征在這一關(guān)系之外,屬于更大的語境;而本族語者傾向于表達(dá)的是支柱詞話語參照體與多個特征集合的關(guān)系,世界、時間與空間本身的關(guān)聯(lián)特征是內(nèi)部關(guān)系的組成部分。簡而言之,二語學(xué)習(xí)者表達(dá)的是話語參照體的存在和存在性,而本族語者表達(dá)的是話語參照體以什么樣的方式、在什么樣的地方存在和與周邊參照體的關(guān)聯(lián)性。
本研究認(rèn)為,這一差異源自本族語者和二語學(xué)習(xí)者母語和文化背景的不同。英語there be句型的概念核心是支柱詞參照物與語境集合的關(guān)系,以及集合與更廣域集合矩陣的關(guān)系,是其存在方式、性質(zhì)或事件性和評論性趨向等與其他參照物的上述特征共同構(gòu)成的概念網(wǎng)絡(luò)(McNally,2016)。漢語存在句核心概念表達(dá)的是某地存在、發(fā)生或消失某物或某事,是由存在動詞、參與者和地點(diǎn)構(gòu)成的小句概念體系(何偉、王敏晨,2018),與語境相關(guān)的其他參照物信息多數(shù)處于存在句之外,與英語廣義量詞所引入的核心參照物及其限制域和轄域所構(gòu)建的嵌套語境有著本質(zhì)上的區(qū)別。
深層認(rèn)識關(guān)系的不同使本族語者和二語學(xué)習(xí)者自然生成了差異化的語法結(jié)構(gòu),即二語學(xué)習(xí)者簡化的尾部結(jié)構(gòu)論元和本族語者嵌套的復(fù)雜尾部結(jié)構(gòu)論元,進(jìn)而使二語學(xué)習(xí)者there be 句型謂詞論元的意義飽和度遠(yuǎn)低于本族語者。
第二,前語言輸出階段的內(nèi)化過程決定了句法飽和度。Skehan(2014)的研究指出,二語輸出要經(jīng)過概念化、公式化、詞元提取、再公式化和句法編碼的過程。概念化即深層意義的構(gòu)建,包括所表達(dá)時間和空間的構(gòu)建、核心意象與參照體的數(shù)量選擇、組織關(guān)系、運(yùn)動與過程等(Fauconnier,2018)。做為語言化(verbalization)的前期階段,深層意義構(gòu)建會啟動使用者的記憶存儲,激活大腦中相關(guān)參照體、時間、空間和性質(zhì)等意義節(jié)點(diǎn)(nodes)及其與詞匯和表層句法工具的聯(lián)系,推動句法編碼的實(shí)現(xiàn)。
本研究認(rèn)為,本族語者的隱性習(xí)得背景使其對事物的概念和規(guī)律具有強(qiáng)大的長期記憶存儲,在輸出階段的內(nèi)化過程中,能夠激活大量的關(guān)聯(lián)信息,并且迅速檢索詞匯存儲,尋找與意義匹配的公式化句法編碼工具,最終推動句法的飽和。二語學(xué)習(xí)者在輸出過程中首先受到母語存在概念的影響,其意義構(gòu)建時對信息的挖掘和關(guān)聯(lián)模式具有局限性;同時,二語學(xué)習(xí)者目的語記憶存儲有限,詞匯的檢索與公式化句法編碼工具的匹配相對受限,只能生成較為簡單的表層結(jié)構(gòu),句法飽和度較低。
最后,二語學(xué)習(xí)者尾部結(jié)構(gòu)8個詞位以上的句子正確率較低,表明當(dāng)部分二語學(xué)習(xí)者所輸出的there be句型在意義、句法飽和度上表現(xiàn)出與本族語者接近的趨勢時,其句法的錯誤率就會上升,引發(fā)相對的句法不飽和,制約意義的表達(dá)。這一結(jié)論表明意義飽和度的構(gòu)建一方面是句法飽和度的推動力,能夠促進(jìn)句子內(nèi)部結(jié)構(gòu)的擴(kuò)張,但是會以降低相對飽和度為代價,增加句法的錯誤率。而對于本族語者,概念化、公式化、詞匯提取等是線性生成的過程,意義的飽和度會直接驅(qū)動句法飽和度的發(fā)展。
本研究以轉(zhuǎn)換-生成語法和二語習(xí)得的認(rèn)知理論為基礎(chǔ),從多源語料庫提取there be句型為研究對象,通過標(biāo)注、統(tǒng)計(jì)和自然語言處理模型,對英語本族語者和中國二語學(xué)習(xí)者輸出文本的意義、句法飽和度進(jìn)行對比,并對其背后的深層作用機(jī)制進(jìn)行探討,得出結(jié)論如下。
在基本結(jié)構(gòu)層面,本族語者和二語學(xué)習(xí)者there be句型的意義、句法飽和度構(gòu)建無顯著差異。在深層結(jié)構(gòu)層面,本族語者there be句型尾部論元意義、句法飽和度要高于二語學(xué)習(xí)者,前者尾部論元傾向于使用信息量較高的集合矩陣鏈,為廣義量詞及支柱詞結(jié)構(gòu)提供邊界清晰的轄域,對大語境的依賴性較低;二語學(xué)習(xí)者傾向于使用開放的線性尾部論元,轄域邊界模糊,對大語境的依賴度較高。本族語者和二語學(xué)習(xí)者意義、句法飽和度的差異性源自二者深層認(rèn)知關(guān)系和內(nèi)化過程的不同;關(guān)聯(lián)性認(rèn)知構(gòu)建和廣域的概念化推動意義和句法的飽和,是二者發(fā)展的源動力。Orta?tepe(2013)認(rèn)為,深層概念構(gòu)建的相似性是二語學(xué)習(xí)者實(shí)現(xiàn)熟練目的語輸出的必然途徑,本研究結(jié)論與其相似。但是在這一過程中,二語學(xué)習(xí)者意義、句法飽和度的增加會以句法錯誤率的上升為代價。
本研究的意義在于將轉(zhuǎn)換-生成語法和二語習(xí)得的認(rèn)知理論相結(jié)合,通過對英語本族語者和二語學(xué)習(xí)者輸出文本中意義、句法的飽和度構(gòu)建和深層認(rèn)知關(guān)系的作用機(jī)制進(jìn)行分析,從新的視角對二語學(xué)習(xí)者表層句法輸出的提高途徑進(jìn)行探索。當(dāng)然,本研究也存在一些局限性,there be句型只是二語學(xué)習(xí)中眾多值得關(guān)注的語言現(xiàn)象之一,還有其他內(nèi)外因素會影響意義、句法體系的發(fā)展。隨著相關(guān)理論和方法的不斷更新,有關(guān)生成語法和二語習(xí)得的認(rèn)知研究在微觀和宏觀層面都有著更加廣闊和深入的探索空間。