譚 浩
(湘潭大學碧泉書院哲學與歷史文化學院,湖南 湘潭 411105)
語言學研究的一個目標就是尋找普遍語法。語法grammar 的詞源追溯到希臘語中grammatika,由gramma即“字母”和tika組成,意思是“字母的藝術”。語言學中語法的意思就是語言的技藝,語法學將這種技藝從語言中抽象出來,代表了主體的語言能力,包含了語言的聲音、意義、形式、詞匯這四個部分,分別構成了語音、語義、語形和詞典。由于存在不同的語言,語言學家對它們的抽象就意味著有不同的語法。然而杜馬塞(Du Marsais)在1750年提出:“在語法中,有一些部分屬于所有語言;這些部分來自所謂的一般語法(general grammar)。除了這些一般部分之外,還有那些只屬于一種特定語言的部分,它們構成了每種語言的特定語法?!盵1]約1630年,阿爾斯泰德(Johann Heinrich Alsted)就指出一般語法是任何特定語法的模式規(guī)范。這種一般語法是所有語言所遵循的定律(law),即表示所有語言的共性——普遍語法(universal grammar)。根據(jù)喬姆斯基的觀點,普遍語法是人類天生語言能力的一部分,刻畫了可能的特定語法類。語言學家尋找普遍語法正如科學家尋找普遍科學定律,是一個無限接近真理的過程。語言學家對語言習得也感興趣。兒童顯然是出色的語言學習者,他們被置身于語言環(huán)境中,無需語言指導便可學習到語言的用法而與人交流,甚至在長大以后,他們可以使用高級的語法。喬姆斯基認為,正是天生根植于人類大腦中的普遍語法能力,使得人類是杰出的學習者,他們根據(jù)現(xiàn)實世界的語言,以及普遍語法所產(chǎn)生的特定語法類,歸納學習獲得實際語言能力。
語法就是描述語言能力的一個真模型,就語形中的句法理論來說,句法范疇思想已經(jīng)滲透到語言學研究的各個方面。句法理論研究句子的形成規(guī)則,范疇則是從各種真實語句中總結抽象出來規(guī)則所運用的組成部分。句法抽象的是語義之外的僅表示語句的共有結構,而范疇就是結構的端點。下面就以基本范疇語法(Basic Categorial Grammar,簡稱BCG)舉例介紹。[2]BCG的范疇集由基本范疇集和其上的連接詞“/”和“”構成的復合范疇組成。
定義1(范疇)
B為基本范疇集,CAT(B)為范疇集,是滿足下列條件的最小集:1.B為CAT(B)的子集;2.如果A,B為CAT(B)的元素,則(A/B)為CAT(B)的元素,(AB)為CAT(B)的元素(一般約定最外層括號是省略的)。
在語言學中,基本范疇集一般可能由不同的元素組成,比如B={s,n,vp,v}或者B={s,np}。其中,就和語言的詞性對應來說,s代表句子,n代表名詞,np代表名詞短語,v代表動詞,vp代表動詞短語。其中比較特殊的是范疇s,因為范疇之間的結構形成句子,那么就意味著范疇的形成要體現(xiàn)詞匯(詞匯類,范疇)與句子之間的關系,所以s一般而言是不可或缺的。既然范疇對應詞性,歸根結底它表示的是實際語言的具體詞匯類。BCG通過詞典來規(guī)定詞匯與范疇之間的關系。
定義2(詞典)
已知非空字符串集∑+和基本范疇集B。BCG詞典LEX為∑+和CAT(B)的有窮關系。
具體來看,詞典就是將每個詞匯指派一個范疇,然而某些詞匯可能有不同的詞性,所以可能會指派給不同的范疇。給定了詞典和范疇,接下來要確定范疇如何組成句子,即需要一個形成句子的規(guī)則。BCG的規(guī)則所使用的是矢列演繹系統(tǒng)。一個矢列公式就是如A1,...,An?B的形式,其中A1,...,An稱之為前件,?稱之為演繹,B稱之為后件。該演繹系統(tǒng)由以下公理模式和Cut規(guī)則組成:
其中橫線之下的矢列稱之為從公理id、A>、A<與Cut規(guī)則有限多次運用由橫線其上的矢列可導出,顯然橫線之上沒有矢列則意味著無條件可導出。將此矢列演繹系統(tǒng)運用于范疇之上可得:
定義3(可導性)
已知B為基本范疇集,┝B稱之為由B(確定的范疇集)可導關系,X?A由B可導即X?A屬于┝B寫作┝X?A。該可導關系集是滿足下面條件的最小集合:對于任意的A,B,C屬于CAT(B)以及X,Y,Z屬于CAT(B)構成的有窮序列,有1.┝A?A;2.┝A/B,B?A;3.┝B,BA?A;4.如果┝X?A而且┝Y,A,Z?B,那么┝Y,X,Z?B。
就BCG而言,既然它要確定生成一個句子,那么可以指定一個集合S為最終要得到范疇集,一般可取S={s},其中s就是指表示為句子的范疇。這樣,BCG句法由如下定義:
定義4(BCG句法)
已知非空字符串集∑+。BCG句法G為三元組,其中B為有窮集(基本范疇集),LEX為∑+×CAT(B)上的有窮子關系,S為CAT(B)的子集。令L(G)表示該句法生成的句子(語言)集合,則α ∈L(G)當且僅當a1,...,an∈Σ+,A1,...,An∈CAT(B),S′∈S滿足1.α=a1...an;2.對于所有的1≤i≤n,
下面通過一個例子[3]310來說明BCG的句法生成。
令B={s,np};
LEX={
S={s};
有了如上確定的G,可以生成L(G)={catseatfish,fisheatcats},可以看到G生成的語句是沒有空格字符的,但是并不影響理解。其中catseatfish的生成可由下面矢列形式分析樹表示:
圖1 catseatfish的BCG矢列分析樹
將矢列形式的前件寫在橫線之上,演繹符號寫為橫線,后件寫在橫線之下,適當?shù)貙⑾嗤暮蠹c前件進行合并,該矢列形式分析樹可寫為更易看出生成結構的如下分析樹:
圖2 catseatfish的BCG結構分析樹
可見該句結構如下圖:
圖3 catseatfish的二叉結構
顯然,該語法下也可以生成同樣結構的fisheatcats。保持詞典不變,通過更改BCG所運用的演繹規(guī)則,可以生成同樣結構的catsfisheat,這種SOV(主語-賓語-謂語)形式的句子一般出現(xiàn)在日語之中,不同于之前的SVO形式。特殊的情況下,如果句子的結構圖如下:
圖4 catseatfish的三叉結構
則會稱該句子的生成沒有遵循一致的語法,或者至少沒有遵循與BCG一致的語法。前面的幾種情況與BCG一致,因為它們生成的結構相同,雖然可能屬于不同的語法。這樣就可以區(qū)分四類情況,一是BCG確定的一致結構的SVO形式,二是BCG確定的一致結構的SVO形式另一個具體實例,三是與BCG一致結構的SOV形式,四是與BCG不一致結構的形式??梢钥吹?,語法分析具有三個層次,一是語法層次,二是分析樹(結構),三是具體形式。前面一二情況具有同樣的語法,結構,但是具體形式不同;三具有不同的語法,但結構一致,具體形式不同;情況四則結構不一致。這四種情況的最大公約數(shù)就是結構一致性問題,為了體現(xiàn)語法對結構的指導,與BCG一致結構的語法就成為了目前第一層次的存在。根據(jù)普遍語法思想,它生成所有具體語法,就意味著成為最高層次的存在。
表1 語法分析的四種層次
語言習得是歸納推理的過程,可以根據(jù)這種層級來規(guī)定。從原則上講,任何一種真實語言的語法可以推出數(shù)量與復雜度上無限的結構集,并且推出無限具體實例。因此每個更高抽象層次都會生成下級情形,從而限制了更低層次的可能假設空間。因此語言的學習就變成了,結合該層次生成的較低級別的觀察數(shù)據(jù)與該層次的較高級別生成的可能假設空間,推斷在中間的抽象級別的層次內容。比如運用已知的語法推斷具體語句的結構。然而,普遍語法的表示形式尚無共識,但是層次2的理論規(guī)定了一組抽象類別(范疇)和規(guī)則(演繹),這種構成也許是普遍語法可以借鑒的形式。這種形式可以只從下層實例歸納獲得,比如通過具體語句總結結構;也允許在同一層次內部的推理,比如在語句缺詞的情況下根據(jù)規(guī)則進行補完。因此,在每個層次都存在三種類型的學習與推理,一是同層次推斷補完,二是從下層實例歸納學習獲得該層知識,三是在上層知識約束的假設空間內,通過下層實例歸納學習獲得該層知識。
因果圖模型(網(wǎng)絡)在一定程度上對應于具體語句的分析結構。進一步的類比可以得到最低級別的事件層次,即因果圖中變量取特定值的實例。上一層級的因果理論層級,正如特定語言中的結構解析樹是由更抽象的知識級別(一致語法)生成的,可以生成特定因果網(wǎng)絡的假設空間。這種高一級別的因果理論可以稱之為因果語法。與普遍語法類似,因果語法可能取決于一個真正的(和天生的)基礎,即通用理論。因此,從高到低這四個層級分別是,通用理論,因果語法,因果圖,事件。正如語言語法理論通常根據(jù)抽象句法范疇和語句構成規(guī)則來構建理論一樣,我們也可以根據(jù)抽象因果范疇和范疇間的因果規(guī)則(也可稱之為因果律)對因果語法進行形式化。由于因果圖模型已經(jīng)存在因果貝葉斯網(wǎng)絡的表示形式,所以因果語法、通用理論也可以考慮通過貝葉斯網(wǎng)絡進行形式化。
同樣,在因果學習和推理上也存在三類問題。一是同層次的原因推斷和預測結果。這是一個因果網(wǎng)絡的補全過程,通過因果貝葉斯網(wǎng)絡在因果圖層次是可以做到的。它推斷相關事件中隱藏的原因,或預測其未觀察到的結果,將系統(tǒng)中因果聯(lián)系起來形成完整網(wǎng)絡結構。二是學習因果關系網(wǎng)絡。在因果語法知識提供的約束候選因果結構中,根據(jù)下一層級的事件實例,在中間層次推論因果關系網(wǎng)絡。三是學習因果語法。在未知通用理論的情況下,通過下層知識歸納學習上層知識。顯然,如果只是從數(shù)據(jù)中學習因果網(wǎng)絡結構的統(tǒng)計方法,在機器學習還是心理學等方面,作為擬合或構建因果模型的最基本的自下而上過程,都需要大量的訓練實例。正如杰出的語言學習者兒童一樣,因果網(wǎng)絡的學習者通常也只是觀察到稀疏的事件數(shù)據(jù)。例如,舒爾茨(Thomas Shultz)區(qū)分了因果關系的統(tǒng)計觀點和因果機制觀點,統(tǒng)計觀點由因果之間因果共變特征確定,因果機制主要被定義為“力和能量的生成傳遞”。他的實驗表明,學齡前兒童優(yōu)先考慮能量傳遞的空間因果過程的證據(jù)(或線索),而非共變證據(jù)。對于共變證據(jù),成年人更善于使用,但是也在直覺上更喜歡生成傳遞證據(jù)。[4]因果語法方法下,因果學習將自上而下和自下而上的約束整合在一起,以在與學習者理解相一致的候選中尋找最佳因果模型。這種觀點似乎解釋了人們如何從如此少的數(shù)據(jù)成功推斷因果結構。實際上,除了高一層級的知識可約束因果模型的空間,其他的同層級先驗知識也有可能。最終學習到的知識都要根據(jù)對所觀察到的原始數(shù)據(jù)的解釋程度來間接評估。下面通過簡單的說明來舉例因果語法的知識。[3]305
圖5 癥狀和危險行為的因果知識網(wǎng)
該圖代表的是幾種疾病,其結果(癥狀)和原因(危險行為)的知識網(wǎng),箭頭代表可能的因果關系。給定一個患病個體的一個或多個觀察到的癥狀,該網(wǎng)絡給出了一組因果解釋。網(wǎng)絡還為假設分配相對概率。如果也觀察到患者的某些行為,那么隱藏疾病變量的那些概率將發(fā)生變化,以反映從觀察到的行為到癥狀的最可能途徑。[3]304這種網(wǎng)絡當然需要一種因果語法知識來進行構建,以表征該圖與下面三個圖之間的共同特性。
圖6 具有共同因果語法特征的因果知識網(wǎng)(a)
圖7 具有共同因果語法特征的因果知識網(wǎng)(b)
圖8 具有共同因果語法特征的因果知識網(wǎng)(c)
該共同特性,又即因果語法可以用兩個原則來簡單說明:一是存在三類變量,癥狀,疾病和行為。這些范疇是開放的,并且大小不確定,因此可能會引入新變量。二是變量之間的因果關系因這些范疇而受到限制,可能的直接原因僅出現(xiàn)在從行為到疾病,從疾病到癥狀之間。顯然前者規(guī)定了因果語法的范疇,后者規(guī)定了規(guī)則。下面兩個圖則提供了與該語法不一致的實例。
圖9 不一致因果語法特征的因果知識網(wǎng)(a)
圖10 不一致因果語法特征的因果知識網(wǎng)(b)
但上述語法表示是非形式化的,為了形式化表示就需要形式化語言。在貝葉斯方法的基礎上,除了基于概率圖模型的表示,還有基于多體謂詞邏輯的表示方法。這兩種方法存在表達能力和可學習性方面的權衡(trade-off),顯然邏輯方法由于直接涉及到因果節(jié)點的語義層面,表達能力更強,但是復雜性更高。而且在邏輯上并沒有一個統(tǒng)一的學習框架,因此對它的論述借助于小規(guī)模實例是有益的。
為了定義統(tǒng)一的邏輯術語,我們便有如下規(guī)定。常量用小寫字母或單詞(或加下標)表示,變量用大寫字母(或加下標)表示,謂詞用首字母大寫單詞(組)(或加下標)表示,全稱量詞用?表示。需要注意的是,如果論域中有三個實體p1、p2和p3,則式?P ChestPain(P)表示三個實體都具有胸痛屬性,它所涉及的是命題的真相,亦即該式被寫出就當且僅當該式的真值為真(真是冗余的陳述)。多體邏輯將實體劃分為各種類型,并對謂詞可以應用的實體類型加以約束。我們使用與謂詞相同的表示法來引用類型,因為類型自然會轉換為謂詞。[5]334比如對于疾病,我們可能要區(qū)分兩種類型的實體——People 和Object,并斷言ChestPain是僅可應用于People類型的實體的謂詞。由于類型的引入,這種多體謂詞邏輯更加提供了比圖語言更豐富本體的表示方法。下面就以blicket檢測器的案例用它進行形式化。
blicket是一種特殊的立方塊(block),存在許多方塊,其中一些是blicket,它們與其他方塊幾乎無區(qū)別,而且blicket 只能通過blicket 檢測器檢測出來。受試者被告知通過將一個或多個方塊放在檢測器上,通過一些列試驗,被要求說出哪些方塊具有使檢測器激活的能力(表示檢測到了blicket)。戈普尼克(Gopnik)和索貝爾(Sobel)在其實驗中,孩子們在一系列試驗中看到一起放置在探測器上的兩個塊a和b,或者分別放置在探測器上。在每次試驗中,blicket檢測器被激活或者沒有動靜。這樣的實驗結果肯定和每次試驗的順序有關。用變量A和B對塊與檢測器之間的接觸進行編碼,用變量E對檢測器的響應進行編碼。接下來,對該實驗所涉及因果語法進行形式化如下。
該理論包括本體,因果結構的表示。作為因果網(wǎng)絡的生成語法,該理論分別生成網(wǎng)絡的節(jié)點,節(jié)點之間的因果關系。本體規(guī)定了論域中實體的類型并在這些類型上定義謂詞。這些類型是按層次結構組織的,首先分為Object,Power 和Trial。Object 類型進一步分為Block 和Machine。謂詞分為結構謂詞和因果謂詞。因果謂詞指定的變量在因果網(wǎng)絡中顯示為節(jié)點。結構謂詞指定論域中實體的基本屬性,并約束了基于因果謂詞所定義的候選因果網(wǎng)絡。這樣,有兩種類型的因果謂詞:如果在試驗T上對象O和O'接觸,則有Contact(O,O',T);如果機器M在試驗T上處于激活狀態(tài),則有Active(M,T)。這些謂詞均適用于特定的Trial,代表實驗的離散時間間隔。有兩個結構謂詞:如果對象O 擁有力P(比如是blicket),則有Has(P,O);如果力P 激活機器M,則Activates(P,M)(如該機器是blicket 檢測器)。需要注意的是,這里假定只有一個力概念,即bilcket,是一種理論實體或屬性。理論的因果律指定變量之間必須或可能存在的因果關系。該理論的結構性規(guī)定決定了特定因果關系存在的可能性。每個規(guī)則都包含一組根據(jù)結構謂詞陳述的條件。該因果語法可由下表示。
表2 blicket檢測器的多體邏輯因果語法
該因果語法可以生成因果網(wǎng)絡的假設空間。假設我們有兩個塊a和b,一個檢測器d,一個力blicket,并且知道d由該力激活,則謂詞集如下:Contact(a,d,T),Contact(b,d,T)和Active(d,T)。因為因果關系在所有試驗T中都是恒定的,所以我們可以用四個圖結構來表示這些可能因果網(wǎng)絡。其中,我們使用變量A和B分別表示Contact(a,d,T)和Contact(b,d,T),而E表示Active(d,T)。
圖11 blicket檢測器的因果網(wǎng)絡假設空間
在blicket實驗中,通常要求學習者判斷一個塊(例如a)是否是一個blicket。此問題詢問Has(blicket,a)是否為真。因為Has(blicket,a)在邏輯上條件于Contact(a,d,T)和Active(d,T)之間存在因果關系,所以可以將這個問題簡化為關于因果網(wǎng)絡結構的貝葉斯推斷。blicket實驗的因果學習過程由許多科學家進行了分門別類的研究。比如,特南鮑姆(Tenenbaum)等研究了反向阻塞(backward blocking)條件的實驗。[5]339-341卡明(Kamin)將“阻塞”一詞以說明在多因實驗中,其中一個因與結果配對,它能獲得正的關聯(lián)強度,同時在加入另一個時,就并不能獲得與結果的關聯(lián),因為它被已學習到的因果關聯(lián)所阻塞。[6]反向阻塞則,受試者首先暴露于復合刺激下,然后才暴露于單獨刺激,會產(chǎn)生對其中之一的關聯(lián)強度的下降。該實驗在成年人身上進行。受試者者被隨機分為兩組,不同的是他們如何引入先驗概念。最初為兩組受試者展示12個方塊,一次放置在檢測器上。在罕見(rare)情況下,這些方塊中只有2個導致探測器啟動。在常見(common)情況下,檢測器會激活12個中的10個。這樣可以假設學習者的先驗概率為,在罕見條件下為1/6,在常見條件下為5/6。實驗的判斷階段分為三次試驗,在第1階段中,僅向受試者展示了2個新方塊,a和b;在階段2中,受試者看到a和b一起放在檢測器上,并激活了檢測器;在階段3中,僅將a放置在檢測器上,并激活了檢測器。在每個階段之后,要求受試者對a和b是blicket的概率進行評分。通過對實驗結果的權變(contingency)計算和利用貝葉斯模型計算結果的比較,得到該模型確實具有符合實驗的學習性。在罕見情況下,在階段2后,a和b成為blicket的概率增加;然后,階段3試驗提供了明確的證據(jù),即a是blicket,而b是blicket的概率返回到階段1時先驗概率的情況。而在常見情況下,在階段2后,a和b成為blicket 的概率沒有明顯變化,階段3使a是blicket 的概率為1,而b是blicket的概率稍微下降。這些結果如下圖引自注釋1,其中橫坐標從左到右表示三個階段。至于高層次知識的學習問題可參見該注釋的論文。
圖12 blicket檢測器的反向阻塞實驗結果
需要注意的是,以上只是因果語法可能是什么樣的建議,而不是充分的說明。這僅是一些理論的可能模型,這些模型可以解釋人們因果推理能力的特定方面,并非一般的普遍的形式化模型。人們對因果語法的確切描述可能難以捉摸,就像對自然語言語法一樣。從人們對語言的陳述或因果關系的判斷的觀察數(shù)據(jù),到人們在做出這些判斷時所承擔的不可觀察的抽象知識的形式描述,這種向后歸納工作并不容易。[5]343但這種因果語法的思想,為定位自然語言中因果語義的研究提供了工具。
首先需要說明的是,之前因果語法的術語所表示的是因果理論范疇,而這里因果語義的術語所表示的是語言學中的,語言所揭示出的是因果關系的語義關系。其基本思想是,因果分析是語言分析的基礎,語言分析影響因果分析。[7]倫納德·泰爾米(Leonard Talmy)關注于語言中的表示因果關系的語義分析。其中因果致使關系是基礎的概念,致使是語言中的范疇,是人們對現(xiàn)實世界因果關系的認知結果。[9]泰米爾區(qū)分了多種復雜程度各異的因果致使(causative)情境,并將它們解析為基本的語義元素以及它們的組合。[8]其中,最為基本的語義情境稱之為自主事件(autonomous events),最基本的致使情境稱之為基本致使情境或基本因果(basic causation)。復雜因果是由自主事件,其他類型事件,基本因果,復雜因果組合而成。
語義分析中的致使術語表示的也是事件間的因果關系,這與因果理論是一致的。不同點便在于自主事件可以被認為是事件的潛在自我致使。比如“Water poured from the tank.”這個句子的事件被表述之后若要尋找其原因,也必須要付諸外部事件對其的致使,但是在語義分析中,該句的致使性并不能逃出該句本身,因此稱之為自主事件。自主事件可以作為一個完成致使情境、因果情境、基本因果的組成元素?;局率骨榫吵俗鳛榻M成部分,也是所有復雜致使情境的共有結構。它由兩個簡單事件與它們之間的因果致使關系組成,由句法表示如下。②
圖13 基本因果致使結構的認知語義分析樹
這個結構中的something 從某種意義上來說應指事件。比如“The window's breaking resulted from a ball.”若要表達致使義,其句式應該補全為“The window's breaking resulted from a ball's sailing into it.”。如若不清楚補全內容,可以用力這樣的抽象實體以表明,如“The window's breaking resulted from a ball's power.”在這個句子中,球具有使窗戶破損的力,并且施展了出來,成為一個事件。因此,上面a.和b.的語言形式可以視為a.S(event)CAUSE S(event)和b.S(event)RESULT FROM S(event)。這樣,一個事件(cause左邊的S事件)被稱為致使事件,另一事件(在cause右邊的S事件稱為被致使事件或結果事件),對b的情況相反。
泰爾米還分析了復雜致使情境,這些情境包括:
A ball's rolling into it broke the vase.(致使事件的致使情境)
A ball broke the vase in(by)rolling into it.(工具致使情境)
I broke the vase in(with my/by)rolling a ball into it.(作者致使情境——有非預期結果)
The branch's falling down on it toppled the aerial.(2事件致使情境)
I slid the plate across the table by pushing on it with a stick.(連續(xù)致使情境)
具體可參見注釋2。那么因果語法如何回到因果語義?這是一個開放的問題。首先,各表示致使關系語句的具體形式處在最低層級,它表示了一類(復雜)致使關系。然后,致使關系結構當屬上一層次,但不同的復雜致使關系所表達的是簡單事件的復合,該種復合關系如果是因果關系,那么就可以通過因果理論來表示成為因果網(wǎng)絡,如果不僅是因果關系,則需要結合其他理論共同表示。最后,具體致使網(wǎng)絡的高一級別理論產(chǎn)生了該層網(wǎng)絡的候選假設,即意味著基本致使關系模式S(event)CAUSE S(event)處在該層級。這樣,從現(xiàn)實中的不同因果關系,都可以產(chǎn)生無數(shù)的致使語句,而對致使語句的語義分析,最終可以通過建立高層級的現(xiàn)實因果理論來獲得。而致使語句的因果結構,也不僅可以從具體語句中歸納獲得,也可以從高低兩個層級知識歸納獲得。這便是從因果語法獲得的對因果語義分析的啟示。
注釋:
①該節(jié)例子引自Joshua B.Tenenbaum,Thomas L.Griffiths.Two Proposals for Causal Grammars[A]//A.Gopnik,L.Schulz.Causal Learning:Psychology,Philosophy,and Computation[M].Oxford,UK:Oxford University Press,2007:333-342。
②圖引自Talmy L.Toward a Cognitive Semantics,Vol.1:Concept Structuring Systems.Language,Speech,and Communication[M].A Bradford Book:The MIT press,2000:481。