亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        布拉格學(xué)派的功能生成描述理論

        2019-11-07 09:50:16馮志偉周建
        現(xiàn)代語文 2019年7期

        馮志偉 周建

        摘? 要:功能生成描述理論不但是布拉格學(xué)派在信息時代的繼續(xù)和發(fā)展,而且是少有的將理論和實踐完美地結(jié)合起來的語言學(xué)理論。通過著重介紹布拉格依存樹庫(PDT)和捷克語動詞配價詞表(Vallex),來探討功能生成描述理論在自然語言處理中的應(yīng)用價值。布拉格依存樹庫采用三級標(biāo)注體系,由詞匯層、形態(tài)層、句法層和語義層四個層級構(gòu)成。捷克語動詞配價詞表內(nèi)容豐富,信息量大,便于使用。布拉格依存樹庫和捷克語動詞配價詞表有助于驗證功能生成描述的理論主張,對自然語言處理也是大有用處的。

        關(guān)鍵詞:功能生成描述;布拉格樹庫;動詞配價詞表

        “功能生成描述”(Functional Generative Description,簡稱FGD)理論是由捷克語言學(xué)家斯加爾(Petr Sgall)等人創(chuàng)立的一種形式化的語言理論,它是布拉格功能主義語言觀在信息時代的反映。這種理論的目標(biāo),是從功能主義和語言生成的角度出發(fā),使用形式化的方法來描述語言,具有強(qiáng)烈的方法論色彩,因此叫做“功能生成描述”。

        這一理論的代表作是捷克布拉格查理士大學(xué)的斯加爾、哈吉科娃(Hajicová)和帕內(nèi)沃娃(Jarmila Panevová)合著的The Meaning of the Sentence in Its Semantic and Pragmatic Aspects(《句子意義的語義及語用研究》,1986)以及斯加爾和哈吉科娃共同撰寫的論文Dependency Syntax in Functional Generative Descriptions(《功能生成描述中的依存句法》,2003)。限于篇幅,本文僅介紹了功能生成描述理論的部分內(nèi)容,建議感興趣的讀者閱讀原文。

        一、功能生成描述理論

        功能生成描述理論是一種分層次、基于依存原則的語言學(xué)理論,同時也是一種源于自然語言處理(Natural Language Processing,簡稱NLP)實踐的語言學(xué)理論。因此,功能生成描述理論非常注重語言的形式化描述和計算機(jī)實現(xiàn)。

        功能生成描述理論認(rèn)為語言是一種層次性的功能結(jié)構(gòu),在語言意義和語音表達(dá)之間存在著如下五個層次:

        ·語義層

        ·表層句法層

        ·形位層

        ·音位層

        ·語音層

        在功能生成描述理論中,語義層占有重要的地位。在語義層表示中,最重要的概念是基本依存結(jié)構(gòu)(Basic Dependency Structure,簡稱BDS)?;疽来娼Y(jié)構(gòu)是在詞表和表示依存關(guān)系種類的特征結(jié)構(gòu)時所形成的字母表上的字符串。

        功能生成理論的這種形式化描述是現(xiàn)代語言學(xué)理論所必要的。這樣的形式化描述,一方面發(fā)展了布拉格傳統(tǒng)的語言學(xué)理論,另一方面,也有助于該理論在自然語言處理領(lǐng)域的應(yīng)用。

        可以說,圍繞功能生成描述理論,布拉格的學(xué)者們不但構(gòu)造了一系列的自然語言處理應(yīng)用系統(tǒng),也在像捷克語這樣的自由詞序語言的依存語法的形式化理論和計算機(jī)實現(xiàn)方面作了許多開拓性的工作。

        白雪(2016)曾對功能生成理論作了較為系統(tǒng)地評介,并在配價的組織模式、層次上,將其與喬姆斯基(N.Chomsky)的最簡方案進(jìn)行了比較。本文從自然語言處理的角度,著重對布拉格依存樹庫(PDT)和動詞配價詞表(Vallex)作進(jìn)一步的補(bǔ)充,以饗讀者。

        二、布拉格依存樹庫

        布拉格依存樹庫(Prague Dependency Treebank①,簡稱PDT)是在功能生成描述理論基礎(chǔ)之上建立的,它是目前世界上規(guī)模最大的依存樹庫。布拉格依存樹庫是一個含有豐富的語言學(xué)信息的手工標(biāo)注捷克語樹庫。它還有配套的樹庫查詢、標(biāo)注和分析軟件,供使用者選用。

        布拉格依存樹庫采用三級標(biāo)注體系,除了形態(tài)層(morphological layer,簡稱m-layer)之外,其他的兩個層次分別為表層句法(analytical layer,簡稱a-layer)和深層句法(tectogrammatical layer,簡稱t-layer)。表層句法層相當(dāng)于我們一般所說的句法層,深層句法相當(dāng)于我們一般所說的語義層。除了這三個標(biāo)注層之外,布拉格依存樹庫還將那些沒有標(biāo)注的文本視為一個獨(dú)立的層級,叫做“詞匯層”(word layer,簡稱w-layer)。這樣,一個句子在依存樹庫中的標(biāo)注就有了四個層級:即詞匯層、形態(tài)層、句法層和語義層。

        布拉格依存樹庫中句子的標(biāo)注及四個層級之間的聯(lián)系,如圖2所示:

        圖2說明了捷克語句子“Byl by ?el dolesa”的標(biāo)注情況?!癇yl by ?el dolesa”對應(yīng)的逐詞英譯為:“He-was would went to forest(他想到森林中去)”。

        在圖2中,從下至上的四個層級是:詞匯層(w-layer)、形態(tài)層(m-layer)、句法層(a-layer)和語義層(t-layer)。值得注意的是,原句詞匯層中所含的輸入錯誤“dolesa (to forest)”,在形態(tài)層得以恢復(fù)為正常的“do lesa”。

        在形態(tài)層(m-layer)中,每一個詞的下面有兩行附加信息,其中的第一行為該詞的詞典形式(詞目),第二行標(biāo)明了該詞在句中的形態(tài)特征。

        除增加了一個全句的支配結(jié)點(diǎn)外,句法層(a-layer)中的結(jié)點(diǎn)和形態(tài)層中所出現(xiàn)的詞是對應(yīng)的。在每個結(jié)點(diǎn)下面,標(biāo)注該結(jié)點(diǎn)與其支配詞之間的依存關(guān)系類型。依存樹庫中的句法層與其他依存句法理論得到的分析樹基本相似,盡管這里沒有采用箭頭來標(biāo)記詞間支配關(guān)系,我們還是可以很方便地從一個詞在句法結(jié)構(gòu)樹中的上下位置來判斷該詞的地位。

        語義層(t-layer)中的結(jié)點(diǎn)和輸入句子中的詞不是一一對應(yīng)的,而且結(jié)點(diǎn)上的詞還使用了配價詞典中的形式標(biāo)記。結(jié)點(diǎn)下面的標(biāo)記表示該詞與其支配詞之間的語義關(guān)系,如:“ACT”表示“行動者”,“PRED”表示“謂詞”,“DIR3”表示“趨向”,等等。在語義層中,全部的單詞都是實詞,不再有介詞或其他虛詞的位置。從這個角度來說,可以把語義層視為句子中心詞的配價實例化之后的一種結(jié)果。由此可見,為了進(jìn)行語義層的標(biāo)注,配價詞典是必不可少的。

        總的來說,功能生成描述理論實質(zhì)上是一種多層級的依存語法理論,配價在這種理論中占有重要的地位。按照功能生成描述理論的創(chuàng)立者哈吉科娃和斯加爾(2003)的說法:“如果將依存視為一種基本關(guān)系,那么詞匯單元的句法特性就可以依據(jù)其可有或必有的從屬成分來進(jìn)行描述,這種描述可包括詞匯組合的限制,它們與句子表層結(jié)構(gòu)的關(guān)系等?!瓘V義的配價框架包含了所有的補(bǔ)足語和說明語,狹義的配價框架只考慮補(bǔ)足語和那些必有的說明語。”因此,在功能生成描述理論的初創(chuàng)時期,另一位創(chuàng)立者帕內(nèi)沃娃(Jarmila Panevová)就在Prague Bulletin of Mathematical Linguistics(《布拉格數(shù)理語言學(xué)通訊》)發(fā)表了題為On verbal frames in functional generative description(《功能生成描述中的動詞框架》,1975)的長文,專門討論配價框架的問題。

        三、捷克語動詞配價詞表

        2008年發(fā)布的捷克語動詞配價詞表(The Valency Lexicon of Czech Verbs,簡稱Vallex),共收有6460個詞項,可能是目前最大的面向應(yīng)用的配價詞表。

        除了語言研究的一般用途外,在自然語言處理中,捷克語動詞配價詞表(Vallex)還有以下用途:

        1.可以保證語料庫和布拉格依存樹庫(PDT)中配價結(jié)構(gòu)的一致性;

        2.可以幫助進(jìn)行自動句法分析;

        3.可以幫助生成輸入句子的語義結(jié)構(gòu)表示;

        4.可以幫助通過自動的方式來構(gòu)造動詞配價詞典。

        我們不妨以捷克語動詞配價詞表中的具體詞條“z?ídit”(建立)及其構(gòu)成為例①,來直觀感受一下Vallex配價詞典的格式,具體如圖3所示:

        圖3中的詞項(word entry)為含有某一動詞所有義項的抽象單位。詞項由一系列非空的框架項(frame entries)構(gòu)成,其中每一項對應(yīng)一個義項??蚣茼棸鋬r框架本身的描述、意義的解釋及其他附加信息。配價框架是由一些框架槽(frame slots)構(gòu)成的,每一個槽表示該動詞要求的補(bǔ)足語。每一個槽是由其函子(functor,即句法語義關(guān)系的名稱)和可能的形態(tài)形式來表現(xiàn)的。

        在捷克語動詞配價詞表中,每一詞條(entry)的內(nèi)容非常豐富,主要包括:Headword lemma(中心詞的詞目)、aspect(體)、gloss(詞條說明)、frame slot(框架槽)、functor(配價功能)、type of complementation(補(bǔ)足語類型)、morphemic forms(形態(tài)形式)、mark for idiomatic frame(成語框架的標(biāo)示)、frame entry(框架條目)、valency frame(配價條目)、aspectual counterpart(體成分)等。

        值得一提的是,捷克語動詞配價詞表不但提供了傳統(tǒng)的印刷版,也構(gòu)建了xml格式和html格式的電子版本,這對詞表的共享、交流和使用,都是很有意義的。特別是建立在html格式之上的交互界面,非常便于人們使用,具體如圖4所示:

        通過這個交互界面,用戶可以按照不同的指標(biāo)來瀏覽配價詞表的內(nèi)容,對各類動詞的配價結(jié)構(gòu)進(jìn)行定量和定性的研究分析。例如,如果用戶要查詢單詞“brát”的配價功能,可以點(diǎn)擊functors,交互界面就會顯示出它的各種配價功能,如ACT,ADDR,PAT,LOC,DIR等。

        總的來說,功能生成描述理論不但是布拉格學(xué)派在信息時代的繼續(xù)和發(fā)展,而且是少有的將理論和實踐完美地結(jié)合起來的語言學(xué)理論。本文著重介紹的布拉格依存樹庫(PDT)和捷克語動詞配價詞表(Vallex),不僅有助于驗證功能生成描述的理論主張,而且對自然語言處理也是大有用處的。目前已有數(shù)種歐洲語言采用PDT的標(biāo)注體系來構(gòu)造相應(yīng)的樹庫,這對功能生成描述理論的傳播和進(jìn)一步應(yīng)用無疑是大有裨益的。

        參考文獻(xiàn):

        [1]Jarmila Panevová.On verbal frames in functional generative description II[J]. Prague Bulletin of Mathematical Linguistics,1975,(23).

        [2]Petr Sgall,Eva Hajicová,and Jarmila Panevová.The Meaning of the Sentence in Its Semantic and Pragmatic Aspects[M].Dordrecht:D.Reidel,1986.

        [3]Eva Hajicová,Petr Sgall.Dependency Syntax in Functional Generative Descriptions[A].In ?gel,Vilmos;Eichinger,Ludwig;Eroms,Hans-Werner;Hellwig,Peter;Heringer,Hans-Jürgen;Lobin,Henning (eds.).Dependenz und Valenz: Ein? Internationales Handbuch Der Zeitgen?sischen Forschung[C].Berlin:De Gruyter,2003.

        [4]白雪.功能生成理論評介[J].現(xiàn)代語文(語言研究版),2016,(2).

        亚洲美腿丝袜 欧美另类| 亚洲综合久久中文字幕专区一区| 一区二区三区四区草逼福利视频| 亚洲av午夜福利精品一区| 欧美黑人又粗又硬xxxxx喷水| 亚洲午夜成人片| 韩国女主播一区二区三区在线观看 | 熟女肥臀白浆一区二区| 乱子伦在线观看| 亚洲精品夜夜夜| 视频二区 无码中出| 婷婷丁香开心五月综合| 亚洲色成人网站www永久| 久久无码人妻一区二区三区午夜| 亚洲av福利无码无一区二区| 国产精品无需播放器| 久久综合激激的五月天| 国产91传媒一区二区三区| 久久久久亚洲精品中文字幕| 精品无码av不卡一区二区三区| 久久国产精品懂色av| 未满十八18禁止免费无码网站| 欧美人与动牲猛交xxxxbbbb| 精品国产一区二区三区亚洲人| 麻豆成人久久精品二区三区免费| 国产精品videossex久久发布| 播放灌醉水嫩大学生国内精品 | 大屁股流白浆一区二区三区| 7m精品福利视频导航| 欧美巨大精品欧美一区二区| 国内专区一区二区三区| 巨爆中文字幕巨爆区爆乳| 国产香蕉尹人在线观看视频| 国产高潮流白浆免费观看不卡 | 亚洲乱码中文字幕第一页| 无码av中文一区二区三区桃花岛| 内射后入在线观看一区| 国产精品一区二区三区色| 久久久极品少妇刺激呻吟网站| 香蕉久久福利院| 亚洲无码视频一区:|