亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        《面向自然語言處理的100個語言學要點II:語義、語用篇》評介

        2021-03-07 18:20:57上海外國語大學項奇軍蔣世玉
        外文研究 2021年4期
        關(guān)鍵詞:語義學詞義語言學

        上海外國語大學 項奇軍 蔣世玉

        《面向自然語言處理的100個語言學要點II:語義、語用篇》(LinguisticFundamentalsforNaturalLanguageProcessingII:100EssentialsfromSemanticsandPragmatics)是華盛頓大學Emily M. Bender教授和愛丁堡大學Alex Lescardes教授的合力新作。這兩位教授投身自然語言處理(NLP)和語言學的跨學科研究,有著豐富的教學和科研經(jīng)驗。其中Bender教授是中心驅(qū)動短語結(jié)構(gòu)語法的領(lǐng)頭人,也是該書系中一部廣受好評的《形態(tài)句法篇》(Bender 2013)的唯一負責人;而Lescardes教授則專攻計算語義學/語用學,是分段式語篇表述理論的核心創(chuàng)始人。

        李穎、馮志偉(2015)認為目前主流的基于統(tǒng)計的NLP系統(tǒng)存在不足,必須引入語言學知識來彌補?;诮y(tǒng)計的方法雖然在字、句的分析上取得了明顯的成果,然而面對篇章處理則明顯存在困難。提升NLP系統(tǒng)對篇章的理解和生成效果需要增加語義、語用的考量。該書作為一本手冊類書籍,正是為了填補NLP研究者對語義和語用學知識點的缺位,以求提升現(xiàn)行算法的準確率。就該書的主要觀點而言,兩位作者也都認為語言學知識在NLP中起到不可忽視的基礎(chǔ)性作用,理解相關(guān)的語言學知識有助于建立新一代的NLP系統(tǒng)。

        1. 主要內(nèi)容

        該書共14個章節(jié),涵蓋100個語言學要點,由引介、語義篇、語用篇和資源4個部分組成。其中,第一部分包括第1章,第二部分包括2—8章,第三部分包括9—13章,最后一部分包括第14章。

        在第1章“引言”中,作者指出當今語義學的研究流派眾多,雖然認知語義學、框架語義學等語義學分支近年來風頭正盛,但NLP研究應(yīng)對其保持謹慎的態(tài)度,認為以形式化的語義學和語用學為中介是向NLP研究者介紹語言學的正確路徑,也是向語言學研究者介紹NLP的不二之選。接著作者簡單介紹了語義學和語用學的概念,并在此基礎(chǔ)上引導讀者了解語義學和語用學與NLP是如何互動的,并說明了形式化的語義和語用是如何幫助構(gòu)建更好的自然語言理解和自然語言生成系統(tǒng)的。

        第2章“什么是意義”是語義學部分的開篇。該章所提及的概念貫穿全書的語義學部分,是理解NLP與語義學關(guān)系的基礎(chǔ)。作者首先介紹了如何用形式語義學的基本工具對 “意義”進行形式化。接著,作者剖析了“意義”的3個層次,并從形式語義學的角度,闡釋了“意義”的3個層次,而且提醒NLP研究者,認識到“意義”的多層次性是能夠正確處理它的前提。之后,作者進而運用言語行為理論對“意義”進行闡釋,并對言語行為理論的3個階段與“意義”的3個層次的異同做了回答。在該章的后半部分,作者認為,對于NLP研究而言,前面提到的三層“意義”的理解和生成并不是NLP最難克服的一關(guān),語言的“意義”還包括情感和社會意義,譬如姿態(tài)、語氣等非言語的認知與語言意義之間的復雜互動將會是NLP勢必要攻破的最后一道門檻。另外,在社會意義方面,作者指出NLP在禮貌和敬語方面仍有很大的進步空間。倘若NLP在識別社會意義上取得突破,會對追溯品牌評價、偵察仇恨言論等有著廣闊的用武之地。

        第3章“詞匯語義概覽”涉及的是有關(guān)NLP的詞匯語義學領(lǐng)域。作為4、5、6章的統(tǒng)領(lǐng)部分,作者簡要梳理了詞匯語義學的子領(lǐng)域——詞義、語義角色以及搭配等。作者特別指出,在形式化語義中,單詞通常被表示為不透明的謂語符號,這導致了有關(guān)單詞意義的重要信息會被丟失。另外,作者也談到詞嵌入的問題,認為基于語境的詞嵌入的一個缺點是不能夠?qū)⒊WR推理納入其中。

        第4章“詞義”對詞義及其相互作用的各種方式進行了整體描述,除了討論如多義詞、近義詞、同義詞等傳統(tǒng)語言學的話題之外,該章也展示了詞義研究面臨的一系列挑戰(zhàn),如歷時的詞義變化、隱喻造成的詞義延伸、高頻詞對可預測變化的阻斷等。該章還進一步介紹了兩個對NLP研究可能起到啟發(fā)作用的語言現(xiàn)象:一是論元關(guān)系導致的詞義轉(zhuǎn)移;二是論元詞義的初始化問題。前者如“Ringo squeezed himself into a narrow space.”中squeeze的非標準用法,后者如“I drank all night.”中drank的另一個論元被初始化為alcohol。這些現(xiàn)象可以應(yīng)用于自然語言理解中的錯誤分析。

        第5章“語義角色”比較簡短,主要介紹了語義角色及其相關(guān)內(nèi)容。首先作者對比了以不同細粒度定義語義角色的方案,如VerbNet、FrameNet和PropBank,然后討論了語義角色的實現(xiàn),如軟約束(soft constraints)和隱性實現(xiàn)(implicit realization)等。最后作者點明NLP需要“語義角色”這一概念,區(qū)分句子中的語義角色能有效幫助計算機理解自然語言。

        第6章“搭配和多詞表達”。該章介紹了搭配和多詞表達(multiword expressions,MWEs)的定義及其屬性。作者認為MWEs的語義是單詞語義與組合語義的橋梁。MWEs繼承了單詞語義的許多屬性,MWEs如同單詞語義一樣,主要屬性有:多重意義、語義模糊、意義轉(zhuǎn)移等。而使MWEs區(qū)別于單詞的重要特性是,依附于MWEs的詞形比單個詞形更少歧義。最后,作者也提到,在MWEs中,慣用語是其重要組成部分,并且認為,表達一個慣用語的語義與其各部分語義之間的關(guān)系是NLP研究很有挑戰(zhàn)性的任務(wù)。

        第7章“組合語義學”。該章的前半部分圍繞謂語論元結(jié)構(gòu)及其派生機制給出了“組合語義”的定義,并且例證了形式化的語義能夠幫助解決一些句法上的歧義現(xiàn)象。然后作者在簡要介紹了比較表達、復數(shù)表達之后,較為詳細地探討了量詞和其他運算符(如否定或副詞)帶來的挑戰(zhàn),其中一個難題是如何解決它們在不同語言中的各種編碼方式。最后一小節(jié)作者專門介紹了基于分布的詞向量研究,作者重申,形式語義表示是根據(jù)真值和指稱定義的,它們被設(shè)計用來預測邏輯關(guān)系;但語義表示中的離散符號及其集合論解釋并不特別適合定量地進行語義相似度的推理。因此作者預測詞嵌入提供的不同視角在今后的NLP研究中會大有可為。

        第8章“組合語義學:超越謂詞-論元結(jié)構(gòu)”進一步向讀者呈現(xiàn)時、體、言據(jù)性(evidentiality)以及禮貌等語言概念。該章中作者引用了豐富的語料,充分地將自然語言中有關(guān)上述概念的紛繁復雜的語法化方式展示給讀者,例如,英語中過去/非過去時有語法化表現(xiàn),而其他很多語言卻沒有;英語中體和言據(jù)性的語法標記不明顯,但萬巴亞語(Wambaya)、雅基語(Yaqui)卻有豐富的言據(jù)性語法標記。而在要點的設(shè)置上,作者著重強調(diào)了禮貌標記在不同語言層次中的體現(xiàn)和其在指代消解上的作用。例如,日語中的敬詞通常用來指代他人而非言者自己。

        第9章“超越句子”將對意義的討論提升到了語篇層面,介紹了計算機理解語篇意義的基礎(chǔ)方法(如語篇更新函數(shù)、構(gòu)建語篇的模型)以及改善語篇理解的方法。作者重點闡釋了語篇意義的構(gòu)建需要建立在語篇組成部分之間的連貫關(guān)系上,并列、從屬兩種連貫關(guān)系將組成部分連接起來,從而構(gòu)建語篇表達結(jié)構(gòu);作者還強調(diào)語篇的釋義必須在動態(tài)之中進行,例如在兩個句子中,第一句話中的語義轄域(如量詞轄域)必須發(fā)生動態(tài)改變以將下一句的內(nèi)容囊括在內(nèi)。

        第10章“指代消解”的主題是NLP中信息抽取的核心概念之一。作者首先介紹了指代消解的定義及其面臨的挑戰(zhàn),隨后詳細解釋了4個決定消解的語言學因素,即語法因素、邏輯表達式、模態(tài)邏輯、語篇結(jié)構(gòu)。作者重點討論了連貫關(guān)系對于消解起到的作用,比如:改變語篇片段間的連貫關(guān)系,一般也會引起指代(通常是代詞)意義的改變;作者進一步指出目前的統(tǒng)計模型普遍忽視連貫關(guān)系的作用,引導讀者思考如何能在計算模型中應(yīng)用連貫以提高消解效果。

        第11章“預設(shè)”以介紹預設(shè)與蘊含的區(qū)別為基礎(chǔ),依次探討了預設(shè)觸發(fā)項以及預設(shè)投射等問題。例如,作者引用Karttunen (1973)內(nèi)嵌謂詞的分類,指出并非所有的內(nèi)嵌小句都能夠發(fā)生預設(shè)投射。該章中最為核心的部分是預設(shè)順應(yīng)的介紹以及其限制條件的提出。作者總結(jié)認為,預設(shè)順應(yīng)的發(fā)生主要取決于預設(shè)轄域與語篇中其他內(nèi)容之間的關(guān)系,并用豐富的例子詳細闡釋預設(shè)順應(yīng)的這些限制條件。該章對預設(shè)的介紹頗具理論深度,不過缺乏對于NLP與預設(shè),特別是與預設(shè)順應(yīng)之間聯(lián)系的說明。

        第12章 “信息狀態(tài)與信息結(jié)構(gòu)” 首先討論了信息狀態(tài)(主要是有定性這一特性)以及不同語言中對其的形態(tài)句法標記。例如,一些語言(如英語、日語等)可以通過名詞詞組的形式來標記信息狀態(tài),另一些語言(如土耳其語)則可以利用格來標記。作為該章的重點,作者討論了信息結(jié)構(gòu)的概念及其語言標記,例如重音和聲調(diào)能夠反映信息的新與舊和語句的話題與焦點。此外,作者還討論了信息結(jié)構(gòu)對于消歧所能起到的作用。自然語言中充滿了歧義,由韻律所表現(xiàn)的語句信息結(jié)構(gòu)能對意義選擇提供幫助。

        第13章“含義與對話”圍繞含義這個核心,從含義類別、NLP技術(shù)以及會話策略3個方面進行了討論。首先,作者區(qū)分了會話含義和規(guī)約含義,并指出對含義的模擬必須兼顧這兩種含義。作者接著著重探討了含義與NLP的接口,例如,目前基于格萊斯會話原則、關(guān)聯(lián)理論的NLP計算系統(tǒng)都會關(guān)注言者和聽者的認知狀態(tài),這些系統(tǒng)能夠很好地表達出句子的語義,卻很難判斷出其真值等等。最后,作者還舉例說明了一些會話策略,如部分肯定、沉默、音調(diào)變化,提出要讓會話系統(tǒng)捕捉這些細節(jié),今后還需要做很多工作。

        第14章“資源”推介了4種實用的語義、話語處理分析資源(詞匯語義關(guān)系的檢索工具、標有句子語義信息的各類語義銀行、可呈現(xiàn)語義信息的句法分析器和標有話語信息的語料庫)及其獲取的方法和途徑。

        2. 評價

        該書對語義學和語用學研究領(lǐng)域的基本情況、相關(guān)問題進行了較為全面的介紹和分析,不僅突出地體現(xiàn)了手冊類著作承擔的語言凝練、舉例易懂、便于查閱等特點,也展示了作者獨特的見解。具體特點呈現(xiàn)如下:

        該書語言凝練,信息密度極大,主題明確且層次分明。每個要點的介紹基本都在兩頁之內(nèi)完成,在每個章節(jié)中的安排也都經(jīng)過深思熟慮。在第二部分語義篇中,作者選擇話題詳略得當,提出的問題也極具代表性。作者盡可能地只選取與NLP有關(guān)或是可能為解決NLP難題提供思路、方法和路徑的語言學現(xiàn)象和理論,可以說對NLP研究者而言,文中提到的每個話題都值得仔細揣摩。而且,文章中不僅只是簡單介紹理論,更為研究者拋出了許多有價值的問題,其中不僅有NLP一直在研究的經(jīng)典問題,也包括NLP將來可能涉及的新挑戰(zhàn)。第三部分語用篇中作者對要點各章節(jié)中的分布比較均勻,章節(jié)與章節(jié)相互平行,這些章節(jié)的內(nèi)容均不可小覷。細讀文章可以發(fā)現(xiàn),篇章的連貫關(guān)系這一知識點貫穿了該部分始終,是整個部分的核心。這與Jurafsky & Martin(2008)著作的語用部分對語篇連貫的強調(diào)不謀而合。

        該書的另一個特色是語種豐富,且舉例易懂;知識點的講解,特別是難點,均以典型的語言例子來做具體說明。文中所選語言例子本身,克服了英語為主的傳統(tǒng)模式,共用了45種語言的例子。在講到語言意義的社會層面時,作者選用日語舉例,只用4個句子就讓讀者感受到了日語里的敬語體系的繁雜。在詞義部分,作者更是同時選用多種語言的例子來證明詞義的歷時變化和模糊性的特點。例句的選取上,作者也力求簡短,翻閱全書,幾乎找不出長度超過一行的句子。并且非英語例句的英語標注詳盡,盡可能地還原了語言原貌。

        作為一本手冊類書籍,該書還具有編排精美、索引方便、資源豐富的特點。在書的最后,作者貼心地羅列了介紹過的語言學知識點及其在文中出現(xiàn)的具體位置。這樣的安排一方面能夠讓讀者在整體上測試知識掌握的程度,一方面便于讀者復習遺忘部分的內(nèi)容。雖說該書主要面向的是NLP研究者,但這絕不是說語言學家就不值得一讀了。書中提供豐富的語義、語用計算分析處理資源,能為語言學家提供語言研究的新工具和新視角。而且,如若相關(guān)領(lǐng)域的語言學家要做跨學科的研究,也能從這該書中受到啟發(fā)。

        該書的另一特點是作者基于對該領(lǐng)域的敏銳觀察,提出了許多獨創(chuàng)的見解,對讀者頗具啟發(fā)意義。作者全局審視了當前面向指代消解的統(tǒng)計系統(tǒng),指出這些系統(tǒng)只利用了論元結(jié)構(gòu)和分布詞匯語義而忽視了連貫關(guān)系所引起的語篇結(jié)構(gòu)。而連貫關(guān)系在跨句的篇章層面,有著至關(guān)重要的作用。這就引發(fā)讀者思考如何能夠在先行算法中加入這個元素,從而提高消解正確率。作者還指出當前對于沉默意義的研究非常缺乏。一言不發(fā)并非不能傳情達意,相反可能蘊含了豐富的意義。那么如何來判斷哪些沉默有意義,哪些沒有意義,有意義的沉默究竟反映的是何種意義,都是值得讀者進行進一步探討的話題。這里只是列舉了兩個比較典型的啟發(fā)之處,而書中還有眾多啟發(fā)點。

        任何一本書都可能有其局限性,該書也不例外,主要存在兩個問題。書中有幾處并沒有具體闡明NLP與語言學要點如何銜接。例如,作者對預設(shè)順應(yīng)花了許多筆墨,但是未能將其與NLP聯(lián)系起來,可能對讀者產(chǎn)生一些困擾。此外,對于一些頗具深度的語言理論的介紹,囿于篇幅限制,不可能面面俱到,如果在每個主題的篇末提供一些基礎(chǔ)性的參考書目或者章節(jié),那么會有助于NLP研究者,特別是非母語為英語的研究者,得到更深入的理解和拓展。

        總而言之,該書是一本不可多得的語言學知識手冊。作者以精致的筆觸,介紹了語義學、語用學中與NLP密切關(guān)聯(lián)的要點,在語言學知識與NLP之間架起了一座橋梁。更可貴的是,該書秉持的是語言學知識和統(tǒng)計方法并重的理念,認為語言學在NLP中扮演了不可或缺的角色,這為將來的NLP發(fā)展指明了道路。

        猜你喜歡
        語義學詞義語言學
        條約演化解釋:合法性、語義學分析及近似概念
        法律方法(2021年3期)2021-03-16 05:57:16
        西夏語“頭項”詞義考
        西夏研究(2020年1期)2020-04-01 11:54:26
        詞義辨別小妙招——看圖辨詞
        哈特的語義學
        認知語言學與對外漢語教學
        字意與詞義
        語言與翻譯(2014年3期)2014-07-12 10:31:59
        財產(chǎn)權(quán)概念的語義學考察
        《詩經(jīng)》詞義考辨二則
        語言學與修辭學:關(guān)聯(lián)與互動
        當代修辭學(2011年2期)2011-01-23 06:39:12
        西方語言哲學與俄羅斯當代語義學
        外語學刊(2011年5期)2011-01-22 05:54:01
        精品久久中文字幕一区| 国产大片内射1区2区| 国产边摸边吃奶叫床视频| 色一乱一伦一图一区二区精品| 最新日韩av在线不卡| 中国精品久久久久国产| 熟女免费观看一区二区| 色欲欲www成人网站| 亚洲av无码一区二区三区四区| 国产高清精品自在线看| 色婷婷久色国产成人免费| 国产日产欧产精品精品蜜芽| 麻麻张开腿让我爽了一夜| 亚洲—本道中文字幕久久66| 国产一区二区三区特黄| 国产午夜激无码av毛片不卡| 亚洲精品久久久久久久久av无码| 国产成人精品日本亚洲专区6 | 亚洲高清国产拍精品熟女| 久久精品av在线观看| 挺进朋友人妻雪白的身体韩国电影| 爱我久久国产精品| 亚洲午夜精品国产一区二区三区| 中文字幕高清视频婷婷| 国产精品国产三级国产专播| 久久天天躁狠狠躁夜夜爽| 日本视频精品一区二区| 亚洲乱码av乱码国产精品| √天堂中文官网在线| 人妻被黑人粗大的猛烈进出| 久久亚洲精品成人综合| 久久av不卡人妻出轨一区二区| 女人下边被添全过视频| 亚洲中久无码永久在线观看同| 无码av永久免费大全| 日本a级免费大片网站| 曰本无码人妻丰满熟妇啪啪| 亚洲AV一二三四区四色婷婷| 国产精品一级av一区二区| 少妇一区二区三区久久| 久久综合狠狠综合久久|