張瑞瑞
摘? ? 要: 幽默作為言語交際的一種,越來越多地被引入到人工智能語音技術中來,給人們帶來了智能化的體驗。本文通過梳理幽默的理論研究,分析了幽默在人工智能語音系統(tǒng)中遵循的規(guī)則、理解的過程與生成的方式,得出言語幽默在人工智能語音技術中跨越了語義層面的檢驗,這是一種適合于現(xiàn)階段人工智能自然語言理解的代償機制,并有可能成為未來人工智能語言識別的新途徑。此外,言語幽默在人工智能語音技術中的運用中還起到了廣泛的傳播作用。
關鍵詞: 言語幽默? ? 合作原則? ? 人工智能? ? 語音技術
一、引文
在交際過程中,幽默作為一種特別的言語交際方式,能引人發(fā)笑、帶來愉悅,因此越來越多地被人們關注與使用,儼然成為現(xiàn)代人格的重要標記。伴隨著人工智能技術的發(fā)展,市場上涌現(xiàn)出了一大批搭載語音技術的對話機器人,而且大部分語音系統(tǒng)都加入了幽默語言。長久以來,對幽默的理論研究,研究者們從社會行為、心理分析、心理認知、修辭、語用等多角度做了較多的探討,但最近幾年計算科學才有所涉及。許多相關研究都集中于言語幽默,而且強調基于“乖訛”的幽默模式,并試圖將言語幽默運用到人工智能中來,其中最關鍵的問題,就是如何讓人工智能識別并生成幽默,實現(xiàn)自然語言與機器語言之間的轉換。當前研究普遍認為,人工智能在現(xiàn)有技術層面上,仍停留于句法、語義層面的問題,無法進行有效的深度學習機制,不能滿足人機對話需求。本文從研究現(xiàn)狀出發(fā),分析言語幽默在人工智能系統(tǒng)中的生成方式,探索人工智能運算機制中言語幽默與句法、語義、語用層面的關系,進而總結言語幽默大量運用在人工智能語音技術中的原因,希望能為人工智能自然語言理解提供一定的參考。
二、幽默的理論研究
根據(jù)與語言的關系,幽默可以分為言語幽默和非言語幽默。言語幽默是指需要借助語言工具來建構和表達的幽默,如笑話、譏諷等。非言語幽默是不借助語言作為媒介的,本身就可以傳遞滑稽信息,如漫畫、滑稽造型、啞劇表演等。在人工智能語音技術中,非言語幽默運用較少,言語幽默占主導地位,因此本文以言語幽默為研究對象,進行幽默理論研究的梳理。
幽默理論的研究,在西方是一個古老的課題,最早可以追溯到古希臘的柏拉圖和亞里士多德時代,隨著人們對幽默的認識加深,逐漸發(fā)展出三大理論:優(yōu)越/蔑視論、釋放論、乖訛論。
優(yōu)越/蔑視論起源于古希臘和羅馬的古典修辭學理論,主要包括基于怨恨、敵視、嘲笑、蔑視和優(yōu)越的幽默理論。柏拉圖認為,幽默是人們對相對無能者表現(xiàn)出來的惡意。亞里士多德則認為喜劇是對遜于一般人的群體的模仿。
釋放論是從生理角度出發(fā),將幽默看作是情感壓抑的宣泄。代表人物是弗洛伊德。在弗洛伊德看來,幽默是心理宣泄的一種形式,可以避免讓我們的心理變得過度壓抑。
乖訛論是從認知角度出發(fā),在幽默理論研究中占據(jù)主導地位。18世紀的哲學家康德指出,幽默來自于“從期待到期待落空的突然轉換”。
以上是對西方幽默理論的簡要梳理,從根本上講,幽默是一種言語交際,幽默的實現(xiàn)特別依賴于語境,依賴于言語的蘊涵意義,因此幽默可以利用語用理論來解釋。分析幽默生成機制的最有效的語言學理論是由美國語言學家Grice(1975)提出的會話合作原則。Grice認為,交際中會話者若要有效地完成交際任務,需要遵循某些規(guī)則進行相互合作,否則會話者無法達到交際目的。在交際中,會話者所遵守的這一套相互合作的基本規(guī)則被稱為“合作原則”。合作原則具體分為四個準則:(1)數(shù)量準則,即會話內容應提供必要的交際信息,但不應包含過多無用信息;(2)質量準則,會話者不應提供虛假信息;(3)關聯(lián)準則,會話內容要有關聯(lián);(4)方式準則,要求語言簡練、避免歧義出現(xiàn)。在交際中,如果會話參與者都能夠遵守這四條準則,那么他們就可以有效地完成交際任務。而言語幽默總是有意或無意違反會話合作原則,以達到乖訛論中“從期待到期待落空的突然轉換”,進而傳遞滑稽信息,引人發(fā)笑。之前網(wǎng)絡流行的“土味情話”,很多都是違反了合作原則。比如:
例1? ? “幫我洗個東西。”
“洗什么?”
“喜歡我?!?/p>
例1就是違反了會話合作原則中的關聯(lián)準則。通過同音字“洗”和“喜”之間的替換,提供了非切題信息“喜歡我”,而不是說話人期待的需要“洗”的物體,會話內容間缺乏關聯(lián)性,形成期待落空,隨后聽話人在理解語義后發(fā)笑,言語幽默產(chǎn)生。
三、言語幽默與人工智能語音
(一)人工智能語音技術中的自然語言理解
2011年,蘋果公司在推出最新一代手機iphone4s時,搭載了名為“Siri”的智能語音助手,一時引發(fā)廣泛關注。人工智能是否擁有語音對話技術,也成為“智能”與否的重要評判標準。不僅是語音系統(tǒng),自然語言理解一直是人工智能研究中的關鍵領域。語言是人類智能的獨特表現(xiàn),如何實現(xiàn)人工智能對自然語言的理解,是當今研究的熱點話題。
自然語言理解系統(tǒng)的研究主要經(jīng)歷了三個階段。第一階段(1960—1972)主要是以關鍵字匹配為主流技術,系統(tǒng)建立在對詞語切分和詞序分析的基礎上,進行關鍵字搜索匹配。第二階段(1972—1982)主要以句法--語義分析為主流技術,考慮部分語用和語境因素,讓機器通過自然語言中的固有規(guī)則進行語義理解,達到初級語句分析層次。第三階段(1982年至今)主要是以處理大規(guī)模真實文本組建的大型語料庫為主流技術,通過統(tǒng)計模型來提升識別的準確率。
這三個階段是互補共存的,并非歷時交接?,F(xiàn)有自然語言識別研究分為兩個方向,第一種是基于語言規(guī)則的研究,包括第一、第二階段對語言因素的研究。按照自然語言分析方式,語言的識別需要經(jīng)歷句法--語義--語用的過程,但是自然語言規(guī)則具有無窮性、不確定性與變化性的特點,機器不能獲得自然語言的各類知識,現(xiàn)有人工智能語言研究也一直停滯在語義理解層面。
第二種是基于統(tǒng)計模型的研究,主要依靠引入自然語言語料庫,讓機器處理大規(guī)模真實文本來獲取語言經(jīng)驗,以求對自然語言更精確的理解。根據(jù)喬姆斯基的觀點,語料庫研究是受限研究,無論多大規(guī)模的語料庫都不能展現(xiàn)自然語言全貌,機器無法通過語料庫學習到自然語言經(jīng)驗。此外,機器學習受到統(tǒng)計模型的影響,不同模型的選取會對結果產(chǎn)生影響。如在漢語中羨余否定類結構“好不+AP”結構中,去除否定詞“不”時,語義并不發(fā)生改變,“好不熱鬧”與“好熱鬧”、“好不壯觀”與“好壯觀”的語義是相同的,但是這個結構不可逆,如“好漂亮”,不能通過添加否定詞“不”生成“好不漂亮”,這是不符合語義的。這種結構是無法讓機器通過語料庫習得的。
(二)言語幽默在人工智能語音技術中的識別與生成
在現(xiàn)有自然語言理解研究背景下,人工智能系統(tǒng)的發(fā)展陷入了瓶頸期,想要得到能完全進行深度學習、自主產(chǎn)出的語音系統(tǒng)還有賴于自然語言到機器語言的轉變研究。但是針對市場化產(chǎn)品來說,人工智能語音技術還是可以通過很多層面進行改善的,如對語義層面的跨越。
目前言語幽默的識別仍依賴于關鍵字匹配技術。以Siri為例進行測試。分別輸入語料1.“給我講冷笑話?!?.“給冷講我笑話?!?.“給我冷講笑話?!?.“給講冷我笑話。”由于語料的句法結構被破壞,實驗預期結果為Siri無法識別2、3、4語料,但實驗結果表明,Siri都輸出了笑話,見表1。
表1
這表明Siri的言語幽默識別是依靠關鍵詞匹配技術,采用了“詞語切分--選取關鍵字--搜索匹配”的模式。本實驗中,識別到關鍵詞為“笑話”,就會給出“笑話”相關的預設對話,而完全忽視了代詞、謂詞的變化破壞了句法結構。
人工智能語音中的幽默生成主要分為兩類。第一類是構建幽默語句語料庫,如Siri的語料庫。將幽默語句建立語料庫,再將每一個語句與問題相互匹配,當對話系統(tǒng)輸入問題后,通過檢索數(shù)據(jù)庫就能很快給出幽默語句的回答。這種方法的優(yōu)點是相對簡易、成本低,而且人工設計的語料庫符合自然語言規(guī)則,往往能達到幽默效果,缺點是產(chǎn)出語句相對單一、重復率高。
第二類是幽默語句的框架式生成。該類型主要運用于固定模式的幽默,不需要進行語義檢測,完全由機器生成幽默語句。馮洪海等[2018]提出一種利用詞匯替換生成幽默的算法。具體是建立語用群,同一個語用群中的詞匯不限于特定語境,只需要滿足相同的詞匯上位概念或用途即可。將輸入的語料進行切分,確定目標詞匯后,在語用群中尋找替換詞匯,進行替換,替換后檢索詞語搭配是否存在,最后輸出替換語句,通??梢援a(chǎn)生幽默效果。比如:
例2? ? ?“來,大家互相鼓勵一下?!?/p>
“來,大家互相嘲笑一下?!?/p>
例2中,“鼓勵”與“嘲笑”屬于相同語用群,詞匯替換后,產(chǎn)生了與預期不同的語義,進而引起注意,這個錯誤會產(chǎn)生幽默的效果。
這種利用固定模式進行框架式生成的方法,從計算機層面上避免了語義層面的檢測,按算法生成幽默語句后,直接輸出,可以達到較好的幽默效果,適合現(xiàn)階段發(fā)展的人工智能語音技術,是在機器無法理解語義階段的一種代償機制。缺點是只能生成固定模式的幽默語句,在完整還原言語幽默時還有欠缺。另外,機械的詞匯替換會產(chǎn)生不符合自然語言規(guī)則的語料,還需要進一步完善。
四、結論
言語幽默越來越多地運用到人工智能語音技術中來,一是因為幽默作為情感表達的重要載體,會顯著賦予計算機更深層次的認知能力,讓人工智能更具吸引力與親和力,使人們改變對人工智能固有的刻板與機械形象,更容易從心理層面上接受人工智能技術,起到了很好的傳播作用。
二是言語幽默具有較好的產(chǎn)出性。從語用學角度分析,幽默是對會話合作原則的違背,那么人工智能系統(tǒng)在生成言語幽默時,需要遵守這一原則。雖然目前自然語言理解尚未突破語義理解層面,但是可以通過算法設計完成對語義層面的跨越,形成對現(xiàn)階段技術的代償機制?,F(xiàn)有研究發(fā)現(xiàn),可以通過詞匯替換這種固定框架,對言語幽默進行識別與生成,之后還可以進行相同語音替換等方面的嘗試。這種跨越自然語言理解過程的方式,可能是解決人工智能語言識別的一種新途徑。未來人工智能的研究包括對情感的實現(xiàn),通過完善言語幽默在人工智能系統(tǒng)中運用的研究,使幽默作為情感載體幫助機器進行情感表達,可以幫助人工智能語音技術更好發(fā)展。
參考文獻:
[1]何文忠.論話語交際中的幽默原則[J].外語教學,2003(04):11-16.
[2]蔡輝,尹星.西方幽默理論研究綜述[J].外語研究,2005(01):5-8,15.
[3]王勇.由關聯(lián)理論看幽默言語[J].外語教學,2001(01):23-27.
[4]林鴻飛,張冬瑜,楊亮,徐博.幽默計算及其應用研究[J].山東大學學報(理學版),2016,51(07):1-10.
[5]馮洪海,李利敏,宋舒晗,彭鵬.詞匯替換:一種計算機輔助幽默創(chuàng)作方法[J].軟件導刊,2018,17(10):41-43.