胡玉秀
【摘要】雖然語法檢錯(cuò)研究和應(yīng)用已經(jīng)取得了一定的成果,但是目前的檢錯(cuò)系統(tǒng)缺乏通用性,查錯(cuò)能力也并不理想。文章通過語言學(xué)理論優(yōu)選論詞匯功能語法(OT-LFG)對(duì)中國(guó)英語學(xué)習(xí)者的英語冠詞習(xí)得過程進(jìn)行分析解釋,利用OT-LFG理論框架中的評(píng)估器過濾機(jī)制為語法檢錯(cuò)和修改提供理論支持及實(shí)踐基礎(chǔ)。
【關(guān)鍵詞】?jī)?yōu)選論;詞匯功能語法;語法檢錯(cuò)
一、引言
優(yōu)選論最初誕生于音系學(xué)領(lǐng)域,由音系學(xué)家A.Prince和認(rèn)知科學(xué)家P.Smolensky于20世紀(jì)90年代初提出,并通過在應(yīng)用中發(fā)現(xiàn)問題和解決問題不斷發(fā)展和完善,已經(jīng)拓展到幾乎所有的語言學(xué)領(lǐng)域,但優(yōu)選論在計(jì)算機(jī)句法學(xué)方面的介紹和研究成果還很少。因此,利用優(yōu)選論詞匯功能語法理論來研究其在英語語法錯(cuò)誤檢測(cè)及修改上的應(yīng)用不僅可以推動(dòng)和拓展優(yōu)選論的發(fā)展及應(yīng)用,幫助我們更深入地了解人類語言機(jī)制(language faculty,即人類是如何獲得語言知識(shí)系統(tǒng)的),而且將成為自然語言處理研究的理論支持和實(shí)踐基礎(chǔ),為自然語言處理研究和發(fā)展做出貢獻(xiàn)。
二、語法檢錯(cuò)及優(yōu)選論的理論可行性
(一)語法檢錯(cuò)
目前語法檢測(cè)已成為普通大眾應(yīng)用最為普遍的自然語言處理技術(shù)之一,然而相關(guān)的研究卻相對(duì)貧乏。國(guó)內(nèi)相關(guān)的研究也不多見。Clement, Gerdes & Marlet(2011)分析這其中主要有兩個(gè)原因: 實(shí)際應(yīng)用和語言學(xué)研究主導(dǎo)方向。首先,語法檢錯(cuò)系統(tǒng)通常局限于某種語言,因此應(yīng)用的通用性非常差;其次,一個(gè)更加深層次的原因是語言學(xué)作為一門語言科學(xué),主要致力于自身學(xué)科的發(fā)展,少數(shù)的跨學(xué)科語言學(xué)如社會(huì)語言學(xué)、心理語言學(xué)以及外語教學(xué)也只是間接地對(duì)語法錯(cuò)誤檢測(cè)有些研究。
另外,目前的自動(dòng)檢測(cè)系統(tǒng)如微軟公司的Word系統(tǒng)只能進(jìn)行單詞的拼寫檢查,以及相鄰單詞之間簡(jiǎn)單關(guān)系的分析和檢查,而對(duì)于那些需要深入分析才能識(shí)別的錯(cuò)誤無能為力。即使是目前開發(fā)的專門用于輔助寫作的系統(tǒng)如Whitesmoke, Grammarly, Ginger,也只能進(jìn)行主要語法錯(cuò)誤的簡(jiǎn)單查錯(cuò)和修改,對(duì)于那些需要考慮語義上下文關(guān)系的語法錯(cuò)誤則不能全部識(shí)別。
(二)優(yōu)選論
優(yōu)選論的根本思想是,各語言間的不同根本原因是普遍性制約條件不同等級(jí)排列的結(jié)果。這些制約條件普遍存在于所有語言中,并且是可違反的(Kuhn, 2003: ix)。圖1清楚地展示了優(yōu)選論下語言的共性(Language Universality)和類型變化的特性(Language Variability)(Lam, 2004)。
在圖1中,制約條件A,B,C,D,E普遍存在于所有語言中,而這五個(gè)制約條件的不同排列產(chǎn)生了X語言和Y語言。因此,學(xué)習(xí)一種語言實(shí)際上是學(xué)習(xí)制約條件在目標(biāo)語言中的排列。
(三)優(yōu)選論句語法
優(yōu)選論句法學(xué),即優(yōu)選論詞匯功能語法(OT-LFG),是優(yōu)選論(OT)和詞匯功能語法(LFG)的結(jié)合體。LFG強(qiáng)調(diào)語法功能比如主語、謂語、賓語等和詞匯在語法中的核心地位,并且提出語言當(dāng)中各個(gè)結(jié)構(gòu)如句法、語意、功能是平行存在并且相互對(duì)應(yīng)的。這種對(duì)應(yīng)關(guān)系通過成分結(jié)構(gòu)(constituent structure,簡(jiǎn)稱c-structure)和功能結(jié)構(gòu)(functional structure,簡(jiǎn)稱f-structure)之間的映射(mapping)來實(shí)現(xiàn)。LFG主要由詞庫、句法和語義解釋三部分組成。表示語義的謂詞論元結(jié)構(gòu)首先在詞庫里通過詞匯編碼而分配到一個(gè)語法功能。這種語義與語法功能之間的聯(lián)系在詞庫里是可以通過詞匯規(guī)則進(jìn)行轉(zhuǎn)換的。當(dāng)一個(gè)詞條最后取得正確的語法功能編碼以后,它就可以和其他表示語法意義的詞條一起構(gòu)成詞匯進(jìn)入到句法部分。在OT-LFG中,LFG發(fā)揮著生成器的作用,也就是所有輸出項(xiàng)都是以LFG的成分結(jié)構(gòu)和功能結(jié)構(gòu)配對(duì)的形式出現(xiàn)的(見圖2)。
在OT-LFG中,輸入項(xiàng)為由功能結(jié)構(gòu)解析的所要表達(dá)的意思(a meaning parsed in f-structure),輸出項(xiàng)為成分結(jié)構(gòu)和功能結(jié)構(gòu)的成對(duì)出現(xiàn)。FDR與*FunctN為兩個(gè)制約條件。研究證明(Kaplan & Bresnan, 1995),在LFG中由成分結(jié)構(gòu)到功能結(jié)構(gòu)的運(yùn)算在數(shù)學(xué)上是有定解的(decidable),而且所有的運(yùn)算都只需要“合一”(unification)這種簡(jiǎn)單的預(yù)算方式。合一運(yùn)算是數(shù)理邏輯中“并”運(yùn)算的一種適于自然語言處理的特殊形式。由于采用合一運(yùn)算作為基本的運(yùn)算方式,詞匯功能語法就可以十分方便地應(yīng)用到自然語言處理中去。
優(yōu)選論在計(jì)算音系學(xué)上的研究不但證實(shí)了優(yōu)選論的基本假定和方法是可以形式化并應(yīng)用到計(jì)算機(jī)語言學(xué)應(yīng)用中的,而且證實(shí)了優(yōu)選論是計(jì)算上易于操作的(computationally tractable)(Eisner, 1997; Karttunen, 1998; Heiberg, 1999)。因此,需要有針對(duì)性研究,使其可以在計(jì)算句法學(xué)上得到應(yīng)用??梢姡瑑?yōu)選論詞匯功能語法是一個(gè)既具有理論價(jià)值又有實(shí)際價(jià)值的研究方向。相信通過深入細(xì)致的研究工作,可以使其應(yīng)用到語法錯(cuò)誤檢測(cè)上,為實(shí)現(xiàn)準(zhǔn)確地自動(dòng)英語語法檢測(cè)與修改系統(tǒng)做出積極貢獻(xiàn)。
三、可行性路線探討
陳述了目前語法錯(cuò)誤檢測(cè)的問題以及應(yīng)用優(yōu)選論的理論可行性,這部分將以英語冠詞錯(cuò)誤為例探討優(yōu)選論在語法檢錯(cuò)中的應(yīng)用路線。之所以選擇英語冠詞為例,不僅因?yàn)樗腻e(cuò)誤率高,而且因?yàn)樗亩鄬哟畏治鲂枨笞鳛樽匀徽Z言檢錯(cuò)對(duì)象最有代表性,也因?yàn)檠芯孔C明優(yōu)選論對(duì)于語言中涉及多個(gè)界面的問題(interface problems)具有最有效的解釋力。
鑒于優(yōu)選論句法學(xué)的理論特點(diǎn),本文建議采用優(yōu)選論詞匯功能語法的理論框架對(duì)英語名詞短語中冠詞的使用進(jìn)行優(yōu)選論解釋和概括,在此基礎(chǔ)上分析中國(guó)英語學(xué)習(xí)者的英語冠詞使用錯(cuò)誤,并通過優(yōu)選論的評(píng)估器過濾功能檢驗(yàn)其在自然語言處理語法檢錯(cuò)中的應(yīng)用性。首先,通過自由寫作、中譯英練習(xí)以及英語冠詞使用填空題收集數(shù)據(jù),并對(duì)數(shù)據(jù)整理描述分析。具體可行性路線如下。
(一)應(yīng)用優(yōu)選論詞匯功能語法對(duì)英語名詞短語中冠詞的使用進(jìn)行優(yōu)選論描述性概括
在優(yōu)選論分析中,問題的描述性概括非常重要,它是承接數(shù)據(jù)與分析的必要中間步驟??梢栽诿~短語語義環(huán)境(Noun phrase semantic context)的幫助下進(jìn)行優(yōu)選論描述性概括。
(二)基于名詞短語所指(noun phrase reference)語意分析設(shè)計(jì)中譯英練習(xí)
Huebner(1983)提出了名詞短語所指語義環(huán)境,在英語冠詞研究中廣為應(yīng)用。他將名詞短語所指的語義通過兩個(gè)二元的特征分為四類(見圖3),一個(gè)特征是專一所指(±Specific Referent(±SR)),另一個(gè)特征是假定聽者知道所指(±Assumed Known to the Hearer(±HK)).
(三)將Master(1994)設(shè)計(jì)的冠詞診斷測(cè)試(Article diagnostic test)按名詞短語所指語義環(huán)境分類
此冠詞診斷測(cè)試是專門針對(duì)母語為非英語的學(xué)習(xí)者使用英語冠詞的情況研究而設(shè)計(jì)的,它包括所有的英語冠詞使用,分為兩部分:第一部分是由獨(dú)立的語義不相關(guān)句子構(gòu)成的;第二部分是一段敘述短文。測(cè)試中共有58個(gè)填空。結(jié)合Huebner(1983)的語義環(huán)境分類可將這58個(gè)語義分類,并用來收集英語冠詞使用數(shù)據(jù)。
(四)應(yīng)用優(yōu)選論制約條件以及OT-LFG評(píng)估器對(duì)冠詞使用錯(cuò)誤進(jìn)行分析解釋
如上所述,優(yōu)選論的根本思想是語言間的不同是由于制約條件在不同語言中的排列不同所造成的,因而學(xué)習(xí)一門語言就是學(xué)習(xí)制約條件不同排列的過程。在這個(gè)過程中,存在于學(xué)習(xí)者語法體系中的制約條件的“錯(cuò)誤”排列導(dǎo)致應(yīng)用錯(cuò)誤,在接觸顯性語言形式后學(xué)習(xí)者發(fā)現(xiàn)錯(cuò)誤并激發(fā)制約條件的重新排列直至達(dá)到目標(biāo)語言中的排列順序。接下來需具體研究是怎樣的排列順序?qū)е铝斯谠~使用的錯(cuò)誤,進(jìn)而達(dá)到錯(cuò)誤過濾的目的。
(五)運(yùn)用錯(cuò)誤驅(qū)動(dòng)下的制約條件降級(jí)演算模擬習(xí)得過程,以建立英語冠詞習(xí)得顯性語言形式小型數(shù)據(jù)庫
優(yōu)選論認(rèn)為外語的習(xí)得過程即制約條件的降級(jí)過程。Tesar & Smolensky(1998)提出通過制約條件的降級(jí)演算系統(tǒng)學(xué)習(xí)者可以建立起來所學(xué)語言的制約條件等級(jí)體系。那么通過錯(cuò)誤驅(qū)動(dòng)下的制約條件降級(jí)演算模擬英語冠詞習(xí)得過程即可獲得包含英語冠詞使用錯(cuò)誤的例子。糾正所得錯(cuò)誤并與原有錯(cuò)誤并列,從而建立小型的數(shù)據(jù)庫以促進(jìn)英語冠詞習(xí)得過程。
四、結(jié)語
優(yōu)選論是自然語言處理研究中較新的語言學(xué)理論框架,基于普遍語法,可學(xué)性理論按照語言習(xí)得規(guī)律、過程提出的規(guī)則,其強(qiáng)大的通用性、解釋力將在句法研究中得到進(jìn)一步檢驗(yàn)和應(yīng)用。在國(guó)內(nèi)同類研究中此理論框架在自然語言處理研究中甚少見到,因此此類研究對(duì)于自然語言處理研究領(lǐng)域和計(jì)算語言學(xué)領(lǐng)域?qū)⒕哂兄匾膯l(fā)作用,也將對(duì)句法理論語言學(xué)的發(fā)展做出重大的貢獻(xiàn),具有較高的實(shí)際意義和學(xué)術(shù)價(jià)值。當(dāng)然,本文僅對(duì)一類語法現(xiàn)象進(jìn)行了可行性探討,對(duì)于哪些制約條件及什么樣的制約條件排列可以通過評(píng)估器解釋英語冠詞使用錯(cuò)誤,學(xué)習(xí)者是怎樣通過制約條件的重新排列習(xí)得英語冠詞的,優(yōu)選論詞匯功能語法在語法檢錯(cuò)上的應(yīng)用是否可行等問題還有待各領(lǐng)域?qū)<覍W(xué)者的進(jìn)一步考察。
【參考文獻(xiàn)】
[1]Clement, L., Gerdes, K.& Marlet, R.2011.A Grammar Correction Algorithm: Deep Parsing and Minimal Corrections for a Grammar Checker.LNAI 5591, pp.47-63.Springer–Verlag Berlin Heidelberg.
[2]Eisner, Jason.1997.Efficient Generation in Primitive Optimality Theory.In Proceedings of the ACL, Madrid, Spain.
[3]Heiberg, Andrea Janine.1999.Features in Optimality Theory.PhD Thesis, Universityof Arizona.
[4]Huebner, T.1983.A Longitudinal Analysis of the Acquisition of English.Ann Arbor, MI: Karoma.
[5]Kaplan, Ronald.& Bresnan, Joan.1995.Lexical Functional Grammar: A Formal System for Grammatical Representation.In Dalrymple, M., Kaplan, R.M., Maxwell, [18] J., & Zaenen, A.(Eds.) 1995.Formal Issues in Lexical-Functional Grammar.Palo Alto: CSLI, Stanford University.
[6]Karttunen, Lauri.1998.The Proper Treatment of Optimality in Computational Phonology.Rutgers Optimality Archive, ROA-258.
[7]Kuhn, Jonas.2003.Optimality-Theoretic Syntax: A Declarative Approach.Stanford: CSLI Publications, Centre for the Study of Language and Information.
[8]Lam, Olivia.2004.Aspects of the Cantonese Verb Phrase: Order and Rank.Unpublished MPhil Dissertation.The University of Hong Kong.
[9]Master, P. 1994. The effect of systematic instruction on learning the English article system.In T.Odlin (Ed.), Perspectives on Pedagogical Grammar,pp.229-252.New York: Cambridge University Press.