亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        韓禮德談機器翻譯

        2023-04-01 11:50:40胡壯麟
        天津外國語大學學報 2023年1期
        關(guān)鍵詞:意義語言系統(tǒng)

        胡壯麟

        (北京大學 外國語學院)

        1 引言

        系統(tǒng)功能語言學的創(chuàng)始人韓禮德1955 年在劍橋大學獲得博士學位后曾在劍橋語言研究中心工作,任劍橋大學助理講師,從事有關(guān)機器翻譯的研究。隨著計算語言學的發(fā)展,20 世紀60 年代他先在美國伯克利大學,后在耶魯大學與Sydney Lamb合作研究。80 年代在南加州大學信息科學院與Willian Mann 及其團隊合作,從事計算語言學與機器翻譯結(jié)合的研究。到20 世紀末,他開始關(guān)注智能機器翻譯。本文主要介紹韓禮德在上述不同時期對機器翻譯所持的一些觀點①。

        2 機械翻譯(1956)

        韓禮德最早接觸的是機械翻譯(mechanical translation)。1956 年10 月他參加美國麻省理工學院召開的“國際機械翻譯大會”,并宣讀了論文《機械翻譯的語言學基礎(chǔ)》②。會議的中心議題為機械翻譯,涉及三個過程:(1)翻譯對等;(2)決定性特征的對等;(3)某一決定性特征在目標語中的操作(Halliday,1957)。

        20 世紀50 年代的翻譯對等著眼語法和詞法的對比。前者在當時稱為轉(zhuǎn)移語法(transfer grammar),內(nèi)容是對兩個語言的語法進行對比,但不太成功。因為在研究中發(fā)現(xiàn)語法不能決定詞法,研究工作還停留在對每一種語法進行描寫分析,并尋找源語和譯語對比的最佳點,同時詞法不能依靠音系學和正字法,比較關(guān)注語言語境的研究,這包括詞語搭配,一些詞與另一些詞同時出現(xiàn),特別是在特定語境下出現(xiàn),在語境中不能搭配的一些特征不應(yīng)該出現(xiàn)在篇章中。

        相較于語法,從詞法進行翻譯研究有兩個優(yōu)勢:(1)詞匯能更直接反映語言語境;(2)即使沒有對等詞,至少有相同的系統(tǒng)或排列。這是翻譯對等研究的第一步。每個系統(tǒng)有若干關(guān)鍵詞,一對一的翻譯對等有高度可能性,特別是科學詞匯。所謂同義詞典(thesaurus)便是根據(jù)語言語境編出來的。例如,英語的railway station 在漢語中可根據(jù)不同的語境翻譯成“火車站”“車站”或“站”。漢語中的“火車站”可翻譯成英語的railway station 或station。盡管如此,同義詞典所收詞語以實義詞或中性詞為主,沒有數(shù)和語法的區(qū)別,因為英語和漢語的動詞是不對等的。因此,所有機械翻譯都應(yīng)考慮包括一些非詞語的范疇,如詞的曲折變化。

        對上述情況韓禮德曾作過如下總結(jié),始于1950 年的機器翻譯,即機械翻譯,是采用數(shù)學的方法,用計算機將一種語言翻譯成另一種語言,從一系列的形式對等物尋找可能的對等形式,是一個工程項目(Halliday,1995)。

        3 邏輯學引導的機器翻譯(1960-1970 年代)

        1960 年之后,學術(shù)界更多地使用“機器翻譯”(machine translation)這一術(shù)語,從普通語言學的視角描述不同語言的對比和翻譯。對于各種語言范疇的具體要求是能為機器所識別(Delawanay,1960)。韓禮德(Halliday,1960)則從邏輯學的視角提出以下三個階段:(1)語言X 內(nèi)每一個單位項目(語素、詞等)在語言Y 中都有一個最接近的對等詞,在一定條件下其他對等詞也有可能出現(xiàn),因此,譯者在大腦中具有概率的概念,即語言Y 中哪一個詞更為對等;(2)參照語言環(huán)境進行對等單位的選擇;(3)應(yīng)當深入考慮語言Y 內(nèi)在的語法和詞匯特征,如性和數(shù)的語法和諧、動詞時態(tài)對等、固定的詞語搭配、成語等。機器翻譯是這三個階段的最后成果,是對不同語言的共同點和不同點進行對比的結(jié)果,但它不關(guān)注不同語言的歷史關(guān)系,也無需為相似點和不同點尋找理據(jù),因此,機器翻譯的對比研究不同于語言類型學。

        韓禮德認為,當時的研究主要關(guān)注兩種不同的依據(jù):翻譯對等與形式對比。翻譯對等實際上與語法單位的范疇有關(guān),因而我們可以將語法Y 的某個項目或單位與語法X 的項目或單位進行比較。值得注意的是,研究者對語境有進一步的認識,即語境不僅包括語言內(nèi)的語境,也包括語言外的情景語境。形式對比指譯者在兩種語言的形式結(jié)構(gòu)中進行同樣操作,具有同樣的形式意義和語言學意義。這就需要在單位、結(jié)構(gòu)、詞類和系統(tǒng)的語法范疇中比較。當然,兩種語言的比較要以語境對等為前提,同時有效的比較也決定著對語言的描述。

        兩年后韓禮德(Halliday,1962)對機器翻譯有了進一步的認識。第一個觀點為語言學是語言的科學,不同于哲學、邏輯學、心理學、人類學、數(shù)學或交際理論。這就是說語言學家的視角應(yīng)當是通過科學研究了解語言的本質(zhì)和特征,而不是通過語言研究解決其他學科的問題。例如,心理學和哲學領(lǐng)域?qū)σ饬x的研究只是把語言視為代碼。這無助于機器翻譯研究,因為這種看法誤解了語言的功能、內(nèi)在關(guān)系以及與非語言的外部關(guān)系。而信息和編碼之間的關(guān)系是兩種不同的實體,信息獨立存在于代碼之外,不能決定代碼的類型??梢?,語言不存在這種二分法,不存在兩個實體之間的關(guān)系。他認為這只能強行稱之為類比(analogy)。韓禮德認為,其他學科的理論觀點只是研究代碼和信息的范疇,而語言學研究的是內(nèi)容或概念的范疇。概念不是獨立于物質(zhì)之外的,它需要通過語言形式才能具象化,如語言學家需要處理的篇章。

        韓禮德的第二個觀點是語言模式是否按二分法對立運作。雖然語法系統(tǒng)如同所有封閉系統(tǒng)可規(guī)定二分操作,便于進行統(tǒng)計語言學和電子語言學操作,但這不是語言的一般真理。語言學系統(tǒng)更為復雜,要達到嚴格的定義和應(yīng)用的要求,應(yīng)當更嚴格地區(qū)分。二分法是邏輯學的概念,不完全適合語言學。從韓禮德下面所舉實例不難看出未標記的漢語“學生”在實際應(yīng)用時既可以是單數(shù),也可以是復數(shù),并不是所有系統(tǒng)都具有標記性。

        韓禮德贊同描寫一種語言不可能沒有理論,但有的描寫方法難以適用于計算機。就語言學而言,翻譯涉及多個方面。例如,語言范疇的概念通常涉及層次(level)、單位(unit)、形式(form)、級別(rank)。情況的復雜性在于我們需要同時解決一些問題,如兩個層次的形式:語法和詞法,一些詞與另一些詞同時出現(xiàn);兩個層次的物質(zhì):語音的和書面的;兩個層次將物質(zhì)以形式體現(xiàn)的模式:語音學和字音學,這兩者可以用二分法處理。

        計算科學和語言學對機器翻譯的問題都有各自的看法。機器翻譯工作者否定語言的統(tǒng)計理論,認為除非基于合理的、科學的理論,從定性描寫到定量描寫便毫無意義。語言學者認為機器翻譯沒有理論意義而加以拒絕。有些機器翻譯并非“要么全部,要么一無所有”的活動。因此,韓禮德建議可以把語音學和字音學暫時擱置一邊,因為它們僅僅涉及語言的口語和文字的形式。翻譯主要關(guān)注語法、詞匯與語境。

        韓禮德還認為,統(tǒng)計描寫有助于推動語言理論和方法的研究,也有助于應(yīng)用,如語言教學中常見的短語動詞。翻譯畢竟是更像/不太像的關(guān)系。計算機不能完全靠非此即彼的操作。兩個語言之間的語法對等能更好地顯示語義。翻譯與級別有關(guān),詞不僅僅是具體的詞,而且是抽象的語法范疇,如詞類與結(jié)構(gòu)和范疇的關(guān)系。詞項是對這些范疇的說明。總的來說,為了對比,我們首先要弄清兩種語言的單位在翻譯對等上的概率。

        由于上述不同認識,至20 世紀60 年代中期,學術(shù)界普遍認為語言翻譯是自成一格的特殊轉(zhuǎn)換,以語言學理論代替邏輯學。這導致在北美和歐洲產(chǎn)生一場災難,那就是美國空軍宣布不再為機器翻譯提供經(jīng)費。美國研究者隨之改用“人工智能”的名稱,如配對、提要、問答、專家系統(tǒng)等(Winograd,1972)。

        系統(tǒng)功能語言學者Alick Henrici 在倫敦大學學院完成他的系統(tǒng)研究,采用形成范例(forming paradigms)、充實的體現(xiàn)(implementing realizations)等手段(Halliday& Martin,1981)。

        4 計算機與機器翻譯(1980-1995)

        韓禮德所說的機器翻譯的第三次轉(zhuǎn)折始于1980 年。由于新一代計算機的出現(xiàn),其系統(tǒng)能處理復雜的自然語言。計算語言學家能處理更為現(xiàn)實的目標。計算不僅是語言學研究的工具,也是發(fā)現(xiàn)有關(guān)語言特征的新方法,一方面測定語法描寫,另一方面建立大型語料庫(Halliday,1995)。

        在此期間系統(tǒng)功能語言學家提出了兩個闡述英語語篇生成的系統(tǒng)語法:一個是澳大利亞悉尼大學信息科學研究所William Manner 指導Christian Mathiessen 以日語和英語為語料所進行的語篇生成研究(Matthiessen & Bateman,1992),另一個是英國威爾斯大學的Robin Fawcett 所研究的社團語法(Communal Grammar)(Fawcet,Tucker & Lin,1993)。

        在1980-1995 年這段時間中是否有過轉(zhuǎn)折?韓禮德說有。最初學術(shù)界把語言看作信息交換,因而關(guān)注貨物和服務(wù)的本質(zhì)。此后,才深入認識到語言才是計算研究的中心對象,計算語言學應(yīng)當計算意義。

        總的來說,計算語言學采用描寫的方式。研究者試圖發(fā)展整體的形式,指出對計算的需要。這就需要發(fā)展既有細節(jié)又復雜的語法。措辭的價值首次稱為系源關(guān)系(agnation),它的軌跡存在于語言的整個意義潛勢中。計算語言學的操作應(yīng)當是對意義的操作。這在學術(shù)界已被認為是正確的觀點。

        5 智能計算與機器翻譯(1995-)

        進入新世紀前夕,學術(shù)界普遍認為可通過智能計算(intelligent computing)來解決機器翻譯的矛盾,使計算成為計算意義的同義詞。韓禮德(Halliday,1995)認為,對此要分兩步重新表述:一是對詞語的表述需要結(jié)合措辭和語法結(jié)構(gòu),即任何范圍的詞匯語法背景;二是對措辭的表述,即任何范圍的語義序列。這說明計算操作要進行語義操作,但進入智能計算要解決兩個脫節(jié)之處:(1)知識基礎(chǔ)重新概念化為意義基礎(chǔ),應(yīng)該將兩個系統(tǒng)合二為一;(2)實例及其系統(tǒng)。自然語言的語法被認為是一系列的結(jié)構(gòu),或按照系統(tǒng)功能語法,選擇網(wǎng)絡(luò)或符號潛勢,即任何有意義的實例都存在于系統(tǒng)潛勢之中,但在計算推理過程中實例不一定與整個語言系統(tǒng)掛鉤,而是屬于話語(discourse),意味著它是過程,還不是系統(tǒng)。但如果把話語看作篇章,對任何底層系統(tǒng)的一個實例進行推理就較為容易了。

        韓禮德指出,上面提到的兩個脫節(jié)反映了西方思維中的二元化:(1)語言和思維的二分,如當代語言學和認知科學;(2)語言(langue)和言語(parole)的二分,如語言學和語用學(Ellis,1993;Matthiesssen,1993,1998)。上述成果供計算語言學參考時可考慮如下策略:(1)語言內(nèi)(語法)和語言外(概念的、認知的)可作為一個系統(tǒng)的兩個層次:(詞匯)語法學和語義學;(2)除語言和話語兩種現(xiàn)象外,語言和言語二者中可以只考慮語言這一個現(xiàn)象。實例化(instantiation)可以有兩個度:系統(tǒng)和語篇。從知識基礎(chǔ)(knowledge base)演變的意義基礎(chǔ)(meaning base)便可以采用語法描寫。反之,每一個措辭和意義的實例都可以用整個系統(tǒng)描寫。可見,語言和認知之間的邊界成為語法和語義學、措辭和意義之間的界限。語言和言語的界限是系統(tǒng)(語法或語義學)和實例(措辭或意義)之間的界限(Halliday,1995)。

        韓禮德還指出,智能計算對自然語言復雜性的所有方面提出嚴格的要求。它要求語法學把語法作為底層語言的邏輯,而不僅僅是Zadek(1995)曾經(jīng)批評的數(shù)字計算。人類文明正在從硬計算(hard computing)進入軟計算(soft computing)時代。新時代中人類思維被視為“一組具有模糊界限的顆粒”。換言之,智能計算是智能系統(tǒng)的分析和設(shè)計,像人類那樣大致推理。在信息革命時期,機器智能進一步擴展,改變了人的大腦力量。Terano(1995)也觀察到同樣語境下微小的信息處理不再是數(shù)學模式。韓禮德指出應(yīng)該換之以語法。語言不僅僅是計算的對象,也是計算的工具。智能的基礎(chǔ)從數(shù)學邏輯改變?yōu)檎Z法邏輯。數(shù)學和語法都是符號系統(tǒng),構(gòu)建不同,但互補,數(shù)字的邏輯對比與措辭和意義的邏輯(語言學邏輯)互補(Sugeno,1993)。

        韓禮德(1995)指出,語法學(grammatics)能幫我們解決語言的復雜性。過去人們只談數(shù)學的美感,很少談?wù)Z法的美感,即對各個工作系統(tǒng)語言的理論化,如數(shù)據(jù)融合(data fusion)和語境模擬(contextual simulation)。我們不僅找到它們的復雜性,也能找到它們的排序和操作方法。

        韓禮德同時指出,語言的復雜性常體現(xiàn)在以下七個方面:(1)詞,能進入措辭的成分,屬詞法;(2)措辭,能構(gòu)成語義或意義的類型;(3)意義,系統(tǒng)構(gòu)成語境的成分;(4)特定措辭/意義實例,它們在系統(tǒng)中所處位置的價值(在系統(tǒng)網(wǎng)絡(luò)內(nèi)部的歸屬關(guān)系);(5)次系統(tǒng)(sub-system),語域的變異;(6)系統(tǒng),由多個功能組成,進入語義空間時可決定語法形式和語境的關(guān)系;(7)意義,包括三個歷史維度:系統(tǒng)的演變(phylogenesis)、個別語篇的展開(logenesis)、自兒童至成人的語言發(fā)展(ontogenesis)。

        韓禮德在前六點的基礎(chǔ)上提出語言學模塊的構(gòu)建,可用于智能計算。詞匯語法有時簡稱為語法。這是抽象的符號構(gòu)建,成為內(nèi)容和表達之間的層次,獲得給定的、構(gòu)建語境的價值,是抽象的,而物質(zhì)現(xiàn)象沒有抽象界面。韓禮德還進一步解釋了層次有高低之分。低層次指口語和書面語的表達與人體為界面的結(jié)合點,高層次指語義學的結(jié)合點為人類經(jīng)驗和人類社會活動過程。不同于簡單的符號系統(tǒng)(具有給定的意義),一個分層次的系統(tǒng)(包括語法在內(nèi))具有特定的性質(zhì),能構(gòu)建分層次的系統(tǒng),創(chuàng)建意義,特別是在功能語境中創(chuàng)建意義。語言的功能語境分兩類,相應(yīng)的功能也分兩類:一方面語言被看作人類的經(jīng)驗,其功能是構(gòu)建,使我們周圍的世界有序化,另一方面語言被看作具有指定人際關(guān)系的功能。不同于簡單的具有給定意義的符號系統(tǒng),語法的元功能是將兩者合成,既寫也說,既看也聽。系統(tǒng)是從遠處把語言看作語義潛勢,而語篇是從近處看,是語言潛勢中出現(xiàn)的實例,也就是說只有一個現(xiàn)象,不是兩個。語言和言語只是不同視角的說法,但我們也可以在這個變體群中持中間立場,采用語域(register)的概念。它有助于我們處理語境變異,是相似語境的語篇類型。從系統(tǒng)的視角看,語域是次系統(tǒng)。層次是不同類的關(guān)系。語義學和語法的關(guān)系區(qū)分明確,有不同的層次。在自然語言的內(nèi)容方面,每個系源有不同的領(lǐng)域,同樣語法空間的組成不同于語義空間的組成(Martin & Matthiessen,1991)??梢詫⑼瑯拥母拍钌舷聰U展,稱為體現(xiàn),如情景語境,將語境作為符號系統(tǒng)。

        上述觀點如何和智能計算聯(lián)系?這就要求將自然語言作為計算機語言,但人們有時忘記每種語言的拼寫系統(tǒng)涉及大量有關(guān)意義的復雜問題,有些意義需要辨認或識別,如you can go 與can you go。又如,韻律和語調(diào)可表示不同的強調(diào),這里情態(tài)(modality)計算過程很重要。因此,智能計算對自然語言復雜性的所有方面提出嚴格要求,要求把語法作為底層語言的邏輯。

        對任何知識的知曉在于把有關(guān)知識轉(zhuǎn)換成意義,因而所謂理解便是這個符號轉(zhuǎn)換過程,這兩者構(gòu)成語篇元功能。意義的流動在于對有關(guān)成分的激活,其成品就是話語。

        語言的語法系統(tǒng)是對矩陣中每個成分在聚合體中的選擇,如肯定/否定、過去/現(xiàn)在/將來、敘述/命令等在聚合體中的最后體現(xiàn)。因此,概括地說,語法是資源。意義便是在不同矩陣中進行選擇,知道越多,掌握越深入、越細致。

        韓禮德認為,計算機如能像幼兒學語言那樣工作才能使操作有效。到目前為止,計算機是通過各種系統(tǒng)的中介和根據(jù)語言派生的邏輯進行操作的,在此過程中要丟失好多信息,因此,提出語言本身將成為主要的計算資源。這能保持信息水平,也能探索自然語言的正面特征、功能的多元性、系統(tǒng)的轉(zhuǎn)換等。韓禮德認為,這與Sugeno(1993)的研究有關(guān),如數(shù)據(jù)的融合(將來自語言的信息與數(shù)字、符號、圖像和非語言聲響進行整合)。結(jié)合篇章對情景語境進行構(gòu)建,即使從自然語言直接獲取這些元語言觀點,還要解決各種不同的體現(xiàn)范式。使用語言計算意味著使用意義計算,因此某些語義表達形式至關(guān)重要。

        6 結(jié)語

        韓禮德在有生之年除倡導系統(tǒng)功能語言學外,也關(guān)心與語言有關(guān)的其他學科的研究和發(fā)展,如比較語言學和翻譯學。由于篇幅所限,本文重點介紹韓禮德在不同時期對機器翻譯所持理論的演變過程,試圖說明人類對任何事物本質(zhì)的認知和探索過程是在實踐中不斷發(fā)現(xiàn)問題、解決問題的過程。即使機器翻譯在本世紀已經(jīng)進入智能計算的高水平時期,許多問題仍有待我們進一步發(fā)現(xiàn)、討論和解決。我們要讓機器翻譯在構(gòu)建人類語言共同體和人類命運共同體方面發(fā)揮更多的作用。

        注釋:

        ① 本文為2022 年10 月22-23 日國際韓禮德語言學研究會上的發(fā)言稿。

        ② 本文有關(guān)韓禮德的論著均引自J. J. Webster 編《韓禮德文集》,請參見參考文獻的有關(guān)條目。

        猜你喜歡
        意義語言系統(tǒng)
        一件有意義的事
        新少年(2022年9期)2022-09-17 07:10:54
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無人機系統(tǒng)
        ZC系列無人機遙感系統(tǒng)
        北京測繪(2020年12期)2020-12-29 01:33:58
        有意義的一天
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        讓語言描寫搖曳多姿
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        累積動態(tài)分析下的同聲傳譯語言壓縮
        我有我語言
        国内露脸中年夫妇交换| 日本黑人亚洲一区二区 | 国产av一区二区精品凹凸| 伊人蕉久中文字幕无码专区| 国产色婷婷久久又粗又爽| 巨大巨粗巨长 黑人长吊| 国产人妻黑人一区二区三区| 久久国产精品超级碰碰热| 中文字幕在线亚洲精品一区| 加勒比hezyo黑人专区| 超碰97人人做人人爱少妇| 欧美日韩综合在线视频免费看 | 亚洲av成人噜噜无码网站| 无码视频一区二区三区在线观看| 国产成人av综合色| 玖玖资源站亚洲最大的网站| 亚洲色大成网站www永久网站| 区二区欧美性插b在线视频网站| 成在线人免费无码高潮喷水| 亚洲中文字幕日韩综合| 中文字幕久久熟女蜜桃| 正在播放亚洲一区| 久久国产劲爆内射日本| 日韩女优av一区二区| 国产成人综合久久亚洲精品| 亚洲国产成人AⅤ片在线观看| 国产精品人成在线观看不卡| 成人免费a级毛片无码片2022| 久久久久亚洲av无码a片软件 | 欧美疯狂性xxxxxbbbbb| 久久久亚洲欧洲日产国码是AV| 二区视频在线免费观看| 日本中文字幕一区二区高清在线| 国产精品青草视频免费播放| 精品国产一区二区三区九一色 | 女人喷潮完整视频| 91人妻无码成人精品一区91 | 日本女优在线一区二区三区| 国产高颜值大学生情侣酒店| 免费一级欧美大片久久网| 国产一级一区二区三区在线播放|