□馮志偉
紀念我的恩師沃古瓦教授
□馮志偉
1985年9月30日,我突然接到法國格勒諾布爾大學同事的電報(當時電子郵件還不普及,也沒有微信),我的導師沃古瓦(Bernard Vauquois)教授不幸患白血病去世,時年56歲。這個晴天霹靂把我轟得大腦都麻木了。
沃古瓦身體健康,我在法國學習時曾和他一起去滑雪,他的滑雪技術(shù)極為高超,滑起來像燕子一樣地在白雪皚皚的高山上飛,他還這么年輕,怎么就去世了呢?我簡直不敢相信這個噩耗。
后來我才知道,沃古瓦在1985年初到馬來西亞檳榔大學研制機器翻譯系統(tǒng),他親臨第一線參與編程,日夜工作,積勞成疾,1985年8月只好回法國休息,但幾天后就與世長辭。
今天是沃古瓦教授去世31年的日子,我特地寫下這篇文章,以此作為對我的恩師的追念。
沃古瓦(1929-1985)
沃古瓦是法國數(shù)學家、物理學家、天文學家、計算機科學家和計算語言學家,于1929年6月14日生于法國[1]。
沃古瓦天資聰穎,早年學習數(shù)學、物理學和天文學,于1952年至1958年在法國國家科研中心(CNRS)所屬的默東(Meudon)天文臺天體物理學研究所工作。
從1957年開始,他的研究興趣逐漸轉(zhuǎn)向了物理學的應(yīng)用方面,開始關(guān)注當時剛剛興起的電子計算機的新技術(shù),從電子計算機的角度來研究物理學問題,并在天體物理學研究所給物理學家們講授電子計算機程序設(shè)計課程。沃古瓦對于天體物理學和電子計算機的雙重愛好反映在他當時發(fā)表的物理學論文中。此后,他的研究興趣逐漸地從天體物理學轉(zhuǎn)向了計算機科學。
1960年,沃古瓦剛滿31歲就成為了法國格勒諾布爾理科醫(yī)科大學計算機科學系教授,他與該大學的昆茨滿(Jean Kuntzmann,法國)教授和伽斯提訥(No?l Gastinel,法國)教授一起開創(chuàng)了該大學的計算機科學研究。在這個時期,他同時還參與了國際上對于算法語言ALGOL60的研制工作,于1963年與巴庫斯(John W.Backus,美國)和瑙爾(Peter Naur,美國)等學者合作發(fā)表了《關(guān)于算法語言ALGOL60的報告》(1960)和《關(guān)于算法語言ALGOL60的修訂報告》(1963),這兩個報告是關(guān)于計算機程序語言研究的奠基性文獻[2]。沃古瓦是計算機高級程序設(shè)計語言的開創(chuàng)者之一。不久,他的興趣就從程序設(shè)計語言轉(zhuǎn)到了更加復雜的自然語言方面,他立志要用計算機來處理人類的自然語言,造福人類。
為了研究自然語言的計算機處理,沃古瓦于1960年在格勒諾布爾大學建立了自動翻譯研究中心(法文:Centre d'étude pour la Traduction Automatique,簡稱CETA),這個中心后來改名為自動翻譯研究組(法文:Groupe d'étude pour la Traduction Automatique,簡稱GETA),現(xiàn)名叫作自動翻譯與語言語音自動處理研究組(法文:Groupe d'étude pour la Traduction Automatique et le Traitment Automatique de Langue et Parole,簡稱GETALP)。這個研究組屬于格勒諾布爾信息實驗室(法文:Laboratoire d’informatique de Grenoble),其目的在于使用計算機技術(shù)來克服人類的語言障礙,突破人類的語言藩籬。從此,沃古瓦便全身心地投入了自然語言計算機處理的研究。
在此期間,沃古瓦非常關(guān)注國際上自動翻譯的研究,在訪問了美國等國家的一些自動翻譯研究中心之后,他認為這些自動翻譯系統(tǒng)的設(shè)計思想比較落后,理論基礎(chǔ)比較單薄,他把這些系統(tǒng)稱為第一代自動翻譯(first generation of automatic translation)系統(tǒng),而他則要研制第二代自動翻譯(second generation of automatic translation)系統(tǒng)。他明確指出,第二代自動翻譯系統(tǒng)的研制應(yīng)當另辟蹊徑,應(yīng)當建立在形式語言和形式語法理論的基礎(chǔ)之上,于是他提出了“樞軸語言”(pivot language)的理論,主張在自動翻譯中按照“分析-轉(zhuǎn)換-生成”的步驟分層次地進行源語言的分析、源語言-目標語言的轉(zhuǎn)換、目標語言的生成,他還提出了自動翻譯三角形來描述自動翻譯的全過程,這種機器翻譯三角形后來叫作“沃古瓦三角形”(Vauquois triangle)。沃古瓦三角形又叫作機器翻譯金字塔(pyramid of machine translation)。如下圖所示:
沃古瓦三角形
在“沃古瓦三角形”中,機器翻譯從源語言開始,首先進行源語言形態(tài)分析,接著進行源語言句法分析,然后進行源語言語義分析,分析完成后就進行目標語生成,首先進行目標語語義生成,接著進行目標語句法生成,然后進行目標語形態(tài)生成,產(chǎn)生出目標語言?!拔止磐呷切巍钡捻敹耸侵虚g語言(interlingua),這是獨立于源語言和目標語言規(guī)范的語義表達形式。
在“沃古瓦三角形”中,如果從源語言出發(fā),經(jīng)過形態(tài)分析就直接進行目標語的形態(tài)生成,產(chǎn)生出目標語言,這樣的方法叫作直接翻譯方法(direct approach);如果從源語言出發(fā),經(jīng)過源語言形態(tài)分析和源語言句法分析,然后在句法層面進行源語言和目標語的句法轉(zhuǎn)換,再進行目標語的句法生成和形態(tài)生成,最后產(chǎn)生出目標語言,這樣的方法叫作句法轉(zhuǎn)換翻譯方法(syntactic transfer approach);如果從源語言出發(fā),經(jīng)過源語言形態(tài)分析和源語言句法分析,再進行源語言語義分析,然后在語義層面進行源語言和目標語的語義轉(zhuǎn)換,再進行目標語的語義生成、句法生成和形態(tài)生成,最后產(chǎn)生出目標語言,這樣的方法叫作語義轉(zhuǎn)換翻譯方法(semantic transfer approach);如果從源語言出發(fā),經(jīng)過源語言的形態(tài)分析、句法分析和語義分析,一直分析到“沃古瓦三角形”的頂端,得到源語言的中間語言表示,然后從中間語言表示出發(fā),經(jīng)過語義生成、句法生成和形態(tài)生成,最后產(chǎn)生出目標語言,這樣的方法叫作中間語言翻譯方法(interlingua approach)。
在直接翻譯方法中,源語言文本中的詞是一個接一個地進行處理的,這種方法要使用一部較大的雙語詞典,詞典中的每一個條目相當于翻譯每一個詞的小程序。在轉(zhuǎn)換翻譯方法中,首先對輸入文本進行解析,然后利用規(guī)則將源語言的解析結(jié)果轉(zhuǎn)換到目標語言的解析結(jié)果,再利用這個解析結(jié)果得到目標語言句子。在中間語言翻譯方法中,首先對源語言文本進行分析,得到抽象的意義表示,這種表示形式稱為中間語言(interlingua),目標語言句子要根據(jù)這種中間表示來生成。
從“沃古瓦三角形”中可以看出,從直接翻譯方法到轉(zhuǎn)換翻譯方法到中間語言翻譯方法,對語言的分析程度不斷加深,在目標語言的另一端,對應(yīng)的層次是對語言的生成程度不斷提高。此外,“沃古瓦三角形”還表明了不同方法對轉(zhuǎn)換知識的依賴程度。在直接翻譯方法中,需要大量的轉(zhuǎn)換知識(對每個詞來說,幾乎所有的翻譯知識都是轉(zhuǎn)換知識)。在轉(zhuǎn)換翻譯方法中,轉(zhuǎn)換規(guī)則僅用于句法分析樹或者是語義角色(thematic role)。在中間語言翻譯方法中,不需要特定的轉(zhuǎn)換知識。隨著三角形的斜邊的上升,所需要的轉(zhuǎn)換知識程度遞減,到了三角形頂端,就不需要進行轉(zhuǎn)換了。
1962年到1971年期間,沃古瓦領(lǐng)導自動翻譯研究中心,開發(fā)了俄-法自動翻譯系統(tǒng),達到了實用化的水平,國際領(lǐng)先。
經(jīng)過多年的自動翻譯實踐,沃古瓦清楚地認識到自動翻譯研究中的陳述式方法和中間語言方法的缺陷,因而他采用啟發(fā)式程序設(shè)計技術(shù),開發(fā)了語言處理程序設(shè)計專用語言(法文:Langages Spécialisés pour la Programmation Linguistique,簡稱LSPL),并用這種專用語言建立了自動翻譯軟件系統(tǒng)ARIANE-78。
這個軟件系統(tǒng)分為ATEF,ROBRA,TRANSF和SYGMOR四個部分。語言工作者可以利用這個軟件來描述自然語言的各種規(guī)則。其中,ATEF是一個非確定性的有限狀態(tài)轉(zhuǎn)換器,用于原語形態(tài)分析,它的程序接收原語文本作為輸入,并提供出該文本中每個詞的形態(tài)解釋作為輸出;ROBRA是一個樹形圖轉(zhuǎn)換器,它的程序接收源語言形態(tài)分析的結(jié)果作為輸入,借助語法規(guī)則對此進行運算,輸出能表示句子結(jié)構(gòu)的樹形圖;ROBRA還可以按同樣的方式實現(xiàn)源語言到目標語言的結(jié)構(gòu)轉(zhuǎn)換和目標語言的句法生成;TRANSF可借助雙語詞典實現(xiàn)源語言到目標語言的詞匯轉(zhuǎn)換;SYGMOR是一個確定性的樹—鏈轉(zhuǎn)換器,它接收目標語言句法生成的結(jié)果作為輸入,并以字符鏈的形式提供出目標語言的譯文。
沃古瓦的思維敏捷,他每接受一個研究課題,都會提出一種新的概念和方法。1974年,他提出了“多層次描述程序”(法文:descripteurs de structures multiniveaux),試圖把自動翻譯的研究層次從短語層次單位提升到比短語更高的層次單位。他的這種思想成為格勒諾布爾大學GETA開發(fā)自動翻譯系統(tǒng)的理論基石。1982年至1983年間,在研究法國自動翻譯國家課題ESOPE的過程中,他又提出了“靜態(tài)語法”(法文:grammaire statique)這一創(chuàng)新性概念。
沃古瓦是計算語言學領(lǐng)域的知名學者。早在1963年,他就擔任了法國國家科研中心(法文:Centre National de la Recherche Scientifique,簡稱CNRS)的普通語言學、現(xiàn)代語言和比較文學(法文:Linguistique générale, langues moderne et littérature comparée)分部的委員,1969年,他又擔任CNRS的普通語言學、外國語言文學(法文:Linguistique générale,langues et littératures étrangères)分部的委員。1965年,他擔任語言自動處理學會(法文:Association pour le traitement automatique des langues,簡稱ATALA)的副主席,1966年至1971年間擔任ATALA的主席。1965年,沃古瓦主持成立了計算語言學國際委員會(International Committee on Computational Linguistics,簡稱ICCL),成為ICCL的創(chuàng)始人。他還組織召開國際計算語言學會議COLING,從1965年到1984年擔任COLING主席。沃古瓦主持召開的歷屆COLING會議如下:
·1965 紐約(New York)
·1967 格勒諾布爾(Grenoble)
·1969 斯德哥爾摩(Stockholm)
·1971 德布勒森(Debrecen)
·1973 比薩(Pisa)
·1976 渥太華(Ottawa)
·1978 卑爾根(Bergen)
·1980 東京(Tokyo)
·1982 布拉格(Prague)
·1984 斯坦福(Stanford)
至今COLING已經(jīng)召開了26屆,成為最具權(quán)威性的、頂級的國際計算語言學會議。沃古瓦對COLING有開創(chuàng)之功,他功不可沒。
在計算語言學研究中,沃古瓦與加拿大、美國、俄羅斯、捷克、日本、中國、馬來西亞、泰國等國家的學者都建立了密切的聯(lián)系,他經(jīng)常到這些國家講學和交流。
沃古瓦重視計算語言學跨學科人才的培養(yǎng),他先后培養(yǎng)了布瓦戴(Ch.Boitet,法國)、辻井潤一(Tsujii Junichi,日本)等兼通語言學和計算機科學的新一代計算語言學家。
1985年9月30日,沃古瓦病逝于法國,年僅56歲。
沃古瓦的主要著作有:《在機器翻譯中的識別轉(zhuǎn)換算法與形式語法概覽》(1968),《語言的自動翻譯》(1970),《自動翻譯的模型》(1971),《GETA的自動翻譯方法:與其他方法相比較》(1985),《格勒諾布爾大學的自動翻譯》(1985)。
沃古瓦是我的導師,是我研究計算語言學的引路人。
1978年我由文科改學理科,考入中國科學技術(shù)大學研究生院,接著被選送到法國格勒諾布爾理科醫(yī)科大學應(yīng)用數(shù)學研究所(法文:Institut Mathematique Appliquée de Grenoble,簡稱IMAG)自動翻譯中心(GETA)學習,師從沃古瓦教授,專門研究自動翻譯和數(shù)理語言學問題。沃古瓦教授是國際計算語言學委員會的創(chuàng)始人,是當時國際計算語言學的領(lǐng)軍人物,他領(lǐng)導的GETA在機器翻譯的理論和實踐上都做出了出色的成績,我在GETA良好的學習環(huán)境中,可以了解到機器翻譯發(fā)展的最新情況,可以學習到當代機器翻譯最前沿的技術(shù)。我本人喜歡數(shù)學,而沃古瓦教授是數(shù)學家,我們都深知自然語言的形式理論對于構(gòu)建機器翻譯系統(tǒng)的重要性。
在法國留學期間,我的主要工作是進行漢語與不同外語的機器翻譯研究。開始時,我使用的自然語言形式理論是喬姆斯基(Chomsky)的短語結(jié)構(gòu)語法,我試圖使用短語結(jié)構(gòu)語法來進行漢語的自動分析。早在1957年,我就接觸到喬姆斯基的形式語言理論,對于喬姆斯基的理論,特別是對于這種理論的數(shù)學原理,我是有深入了解的。喬姆斯基根據(jù)形式語法的原理,提出了短語結(jié)構(gòu)語法作為自然語言形式描述的一種手段,這種語法在自然語言處理中得到了廣泛的應(yīng)用。國內(nèi)外的許多機器翻譯系統(tǒng)都采用喬姆斯基的短語結(jié)構(gòu)語法作為系統(tǒng)設(shè)計的基本理論依據(jù)。根據(jù)喬姆斯基的短語結(jié)構(gòu)語法,表示句子結(jié)構(gòu)的樹形圖中的每一個結(jié)點只有一個相應(yīng)的標記,結(jié)點與標記之間的這種關(guān)系是一種單值標記函數(shù)的關(guān)系。這種單值標記函數(shù)表示的語言特征是十分有限的,因而在機器翻譯中進行漢語的自動分析時,會出現(xiàn)大量的歧義問題,難以區(qū)分句法結(jié)構(gòu)相同而語義結(jié)構(gòu)不同的漢語句子,這種分析法是短語結(jié)構(gòu)語法在分析漢語時的一個致命的缺點。
當時我在法國研制開發(fā)機器翻譯系統(tǒng)的實踐中,就敏銳地認識到短語結(jié)構(gòu)語法的這種致命缺點。我試圖根據(jù)短語結(jié)構(gòu)語法來編寫漢語分析程序,但是困難重重,步履維艱,屢遭失敗。
1980年夏天的一個早上,沃古瓦教授與我討論漢語自動分析的問題。我坦率地向沃古瓦教授說:“喬姆斯基的短語結(jié)構(gòu)語法對于法語和英語的分析可能沒有多大問題,可是,用這種語法來分析漢語,幾乎寸步難行?!?/p>
沃古瓦教授用好奇的目光看著我,他希望我進一步闡述自己的看法。
我舉例對沃古瓦教授作了如下的說明:
在漢語中可以說“點心吃了”,實際上是“點心被吃了”,但漢語中一般不用“被”字;漢語中還可以說“張三吃了”,實際上是“張三把點心吃了”?!皬埲笔莻€名詞短語NP(Noun Phrase),“點心”也是個“NP”,“吃了”是個動詞短語VP(Verb Phrase)。這兩個句子的規(guī)則都是:“S→NP+VP”,其中,S(Sentence)表示句子,它們的層次相同,詞序相同,詞性也相同,但它們卻有截然不同的含義,一個是被動句,一個是主動句。我們怎么來解釋這樣的差異呢?如果我們使用喬姆斯基的短語結(jié)構(gòu)語法,用計算機來分析這兩個不同的句子,計算機最后做出來的肯定是一樣的樹形圖,它們的差別只是在葉子結(jié)點上的詞不一樣,整個樹形圖的上層都是同樣的“S→NP+VP”,這樣在結(jié)構(gòu)上相同的句子為什么會有不同的語義解釋,從而產(chǎn)生不同的含義呢?使用短語結(jié)構(gòu)語法顯然是解釋不了的,而中文里到處都是這樣的句子,因為中文里的被動關(guān)系有不同的表示方法,有時主動和被動在形式上沒有明顯的區(qū)別,可以從句子的上下文和意念上來加以區(qū)分。在這種進退兩難的局面下,唯一的出路就是根據(jù)漢語語法的特點改進喬姆斯基的短語結(jié)構(gòu)語法,使用一種新的方法來描述漢語。
沃古瓦教授耐心地聽完了我的說明,他從沙發(fā)上站起來驚嘆地說:“漢語真是一種langue terrible(法語:糟糕的語言)。”他說:“哪種語言能夠不分主動和被動,人吃了和被人吃了怎么能是一樣?怎么這么亂?”
我笑著向沃古瓦教授解釋道:其實中國人一點兒也不感覺到亂,我們中國人在說話時是分辨得很清楚的,因為我們知道在一般情況下,人是不能被吃的。所以“小王吃了”的語義不會是“小王被吃了”,而“點心”不吃東西,所以“點心吃了”必定是“點心被吃了”。漢語是靠詞匯的固有語義來解決語法問題的,但是對于你們法國人來講,并不存在這樣的問題。所以,我們不能按照法語的思考方法來處理漢語的問題,我們必須另辟蹊徑!
沃古瓦教授是一個知識廣博、眼界開闊的學者,他鼓勵我沿著這個思路繼續(xù)探索。他對我說:“喬姆斯基的短語結(jié)構(gòu)語法也不一定永遠正確嘛!”
在告別時,沃古瓦教授興奮地對我說:“我相信,你一定能找出一種漢語自動分析的新方法?!?/p>
這次和沃古瓦教授的談話使我深刻地認識到,喬姆斯基的短語結(jié)構(gòu)語法在漢語自動分析中確實出現(xiàn)了極大的困難。這種困難甚至連沃古瓦教授這樣世界第一流的計算語言學家也承認了。作為中國的科學工作者,我必須想出一種新的辦法,來克服短語結(jié)構(gòu)語法的缺點。不然,我正在進行的漢語自動分析就很難搞下去了。
這一天夜里我很不平靜,翻來覆去總在思考這個問題。第二天清早,我走進沃古瓦教授的辦公室,明確地向沃古瓦教授提出:我們正面臨一個新的挑戰(zhàn),我們必須要思考一種新的語法理論來解決這個問題。沃古瓦教授完全同意我的意見,他進一步鼓勵我探索新的理論和方法來解決漢語自動分析中出現(xiàn)的這個問題。
在沃古瓦教授的鼓勵下,我對這個問題反復進行了思考。我觀察到:“小王吃了”和“點心吃了”這兩個貌似相同的句子在詞匯的語義上有很大的不同,“小王”在語義上是一個“人”,在一般情況下,“人”是“吃了”這個行為的主動者,而“點心”在語義上是“食品”,在一般情況下,“食品”是“吃了”的被動者,是“吃了”的對象。在短語結(jié)構(gòu)規(guī)則“S→NP+VP”中,或許可以不把“NP”看成一個不可分割的單元,而把“NP”進一步加以分割,使用若干個特征來代替“NP”這個單一的特征。例如:在“小王吃了”中,我們把“NP”分解為“NP|人”兩個特征,在“點心吃了”中,我們把“NP”分解為“NP|食品”兩個特征,這樣一來,就有可能在計算機上把它們分解開來了。在計算機處理語言時,特征也就是“標記”,我認為,如果我們使用“多標記”來代替短語結(jié)構(gòu)語法中的“單標記”,就有可能大大地提高短語結(jié)構(gòu)語法描述語言的能力,我們就可以使用改進后的這種語法來描述漢語,實現(xiàn)漢語的自動分析。這就是我提出的關(guān)于“多標記”(multiple-label)的最初設(shè)想。
我對于短語結(jié)構(gòu)語法的另一個改進是使用多叉樹代替短語結(jié)構(gòu)語法的二叉樹。喬姆斯基曾經(jīng)提出“喬姆斯基范式”,他認為自然語言的結(jié)構(gòu)具有二分的特性,因此他主張在自然語言處理中使用“二叉樹”(binary-tree)。我則認為,在漢語中存在著“兼語式”和“連動式”等特殊句式,它們都不具備二分的特性,因此,我主張使用“多叉樹”(multiple-branched tree)來代替“二叉樹”,從而提高短語結(jié)構(gòu)語法描述漢語的能力。例如:“請小王吃飯”是一個兼語式的句子,其中的“小王”作前一個動詞“請”的賓語,又作后一個動詞“吃飯”的主語,在計算機處理時,究竟是分析為“請/小王吃飯”,還是“請小王/吃飯”,我們將處于進退維谷的境地。如果我們采取三分,把這個句子分析為“請/小王/吃飯”,可以避免分析樹的交叉,得到唯一的分析結(jié)果。沃古瓦教授對我的多叉樹設(shè)想也給予鼓勵,表示贊同。
經(jīng)過在計算機上編寫程序進行潛心的鉆研和反復的試驗,在沃古瓦教授的指導下,我提出了“多叉多標記樹模型”(Multiple-labeled and Multiple-branched Tree Model,簡稱MMT模型)。在MMT模型中,采用多值標記函數(shù)來代替短語結(jié)構(gòu)語法的單值標記函數(shù),使得樹形圖中的一個結(jié)點,不再僅僅對應(yīng)于一個標記,而是對應(yīng)于若干個標記。我還使用多叉樹來代替二叉樹,這樣便大大地提高了樹形圖的標記能力,使得樹形圖的各個結(jié)點上,都能記錄足夠多的語法語義信息,把句子中所蘊含的豐富多彩的信息充分地表示出來。這種多值標記函數(shù)的理論實質(zhì)上是一種復雜特征(complex features)的理論,它從根本上克服了喬姆斯基的短語結(jié)構(gòu)語法在描述自然語言時的嚴重缺陷,提高了其有限的分析能力,限制了其過強的生成能力。顯而易見,MMT模型是對喬姆斯基短語結(jié)構(gòu)語法的一個帶有實質(zhì)意義的重要改進[3]。
根據(jù)MMT模型,我設(shè)計了漢—法、英、日、俄、德多語言機器翻譯系統(tǒng),這個系統(tǒng)叫作FAJRA。F-A-J-R-A這5個字母分別表示法語(法語為Francais)、英語(法語為Anglais)、日語(法語為Japonais)、俄語(法語為Russe)和德語(法語為Allmand)的法語首字母,這是一個基于規(guī)則的機器翻譯系統(tǒng)(rule-based MT System),基于規(guī)則的機器翻譯系統(tǒng)把翻譯看成符號的轉(zhuǎn)換過程。
這是世界上第一個用計算機自動地把漢語翻譯為多種外語的機器翻譯系統(tǒng),這個系統(tǒng)是我于1981年在GETA使用IBM-4331大型計算機研制并試驗成功的。計算機寬行打印機上輸出多語言機器翻譯結(jié)果的日期是“1981年11月4日”。沃古瓦教授高興地對我說:“這是值得你記住的一個日子。”
根據(jù)獨立分析、獨立生成的原則,F(xiàn)AJRA的總體結(jié)構(gòu)如下圖所示:
FAJRA多語言自動翻譯系統(tǒng)
從圖中可以看出,在FAJRA系統(tǒng)中,漢語的形態(tài)分析和句法分析是獨立于法、英、日、俄、德等5種語言的,而法、英、日、俄、德等5種語言的句法生成和形態(tài)生成是各自獨立的,只有詞匯轉(zhuǎn)換和結(jié)構(gòu)轉(zhuǎn)換是與漢語相關(guān)的,所以,這是一個“獨立分析-獨立生成-相關(guān)轉(zhuǎn)換”的機器翻譯系統(tǒng)。
就在我提出MMT模型的同時,國外一些計算語言學家也看到了短語結(jié)構(gòu)語法的局限性,分別提出了各種方法來改進它。例如1983年卡普蘭(R.M.Kaplan,美國)和布列斯南(J.Bresnan,美國)提出的“詞匯功能語法”,1983年馬丁·凱依(Martin Kay,美國)提出的“功能合一語法”,1985年蓋茲達(G.Gazdar,英國)等提出的“廣義短語結(jié)構(gòu)語法”,1985年珀拉德(C.Pollard,美國)提出的“中心語驅(qū)動的短語結(jié)構(gòu)語法”等,都采用了復雜特征來描述自然語言。他們所謂的“復雜特征”實際上也就是我提出的“多值標記”,名異而實同。所以,MMT模型是世界計算語言學者對喬姆斯基的短語結(jié)構(gòu)語法進行改進的一個重要方面和不可分割的組成部分,MMT模型是20世紀80年代較早提出的一個旨在改進短語結(jié)構(gòu)語法的形式化模型,當時我國學者對于這方面的研究在國際上是處于前沿地位的。
沃古瓦教授去世已經(jīng)31年了,但是他的音容笑貌仍然留在我的心中,回首往事,歷歷在目,就像在昨天一樣,令人難以忘卻。
我今年已經(jīng)77歲了,早已年逾古稀,并且還在一天天地變老。是沃古瓦把我引進了計算語言學這個新興的學科,盡管沃古瓦教授已經(jīng)英年早逝,盡管我已經(jīng)白發(fā)蒼蒼,但是我們畢生鐘愛著的這個學科還非常年青,仍然充滿了青春的活力。我們個人的生命是有限的,而科學知識的探討和研究卻是無限的。我們個人渺小的生命與科學事業(yè)這棵常青的參天大樹相比較,顯得多么微不足道,有如滄海之一粟。想到這些,怎不令我們感慨萬千!
我雖已年老,還應(yīng)當自強不息,努力創(chuàng)新,繼承沃古瓦的未竟之業(yè),以此來紀念我的恩師沃古瓦教授。
[1]Bernard Vauquois,Christian Boitet.Automated Translation at Grenoble University[J].Computational Linguistics,1985,(1):28-36.
[2]John W.Backus,F(xiàn)riedrich L.Bauer,Julien Green,C.Katz,John McCarthy,Alan J.Perlis,Heinz Rutishauser,Klaus Samelson,Bernard Vauquois,Joseph Henry Wegstein,Adriaan van Wijngaarden,Michael Woodger,Peter Naur. Revised Report on the Algorithm Language ALGOL60. Commun[J].ACM,1963,(1):1-17.
[3]馮志偉.漢語句子的多叉多標記樹形圖分析法[J].人工智能學報,1983,(2).
(馮志偉 浙江杭州 杭州師范大學外國語學院 311121)