肖燁晗
摘 要 本文首先對人工智能、自然語言生成技術進行了簡要的介紹,從而對自然語言生成技術在“微軟小冰”中的應用、自然語言生成技術在漢語言幽默自動生成中的應用展開分析,并根據人工智能與自然語言技術結合的實例,總結了人工智能和自然語言技術的結合對生活的改變。
關鍵詞 自然語言生成;人工智能;微軟小冰;漢語言幽默
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2019)232-0155-02
自然語言生成技術對人工智能的發(fā)展有多方面的影響,如可以改善人機關系、方便人機互動等,將人工智能推向另一個更高的層面。本文主要從人工智能概述、自然語言生成技術概述、自然語言生成技術在“微軟小冰”中的應用和自然語言生成技術在漢語言幽默自動生成中的應用出發(fā),淺析自然語言生成技術在人工智能領域的應用。
1 人工智能概述
人工智能是一門研究、開發(fā)用于模擬、延伸和擴展人類智能的理論、方法、技術及應用系統(tǒng)的新興科學技術。它誕生于20世紀50至60年代,經過了幾十年的發(fā)展,已經逐漸成為了計算機學科的一個重要分支[ 1 ]。下文將對人工智能發(fā)展史、人工智能的分類、人工智能的主要應用領域3個方面來介紹人工智能。
1.1 人工智能的發(fā)展史
在1936年,英國數學家圖靈(A.M.Turing)提出了著名的圖靈機模型,而之后他又在1950年所發(fā)布的《計算機能思維嗎》一文中,提到了機器能夠思維的論述,為人工智能技術的發(fā)展方向和模式打下了基礎。1956年,達特茅斯會議(Dartmouth)中第一次提出了“人工智能”這一概念,成為人工智能的起點。60年代,自然語言通訊成為當時的研究熱點,這標志著人工智能技術掀開了嶄新的一頁。70年代,經過不懈的研究,一批具有專家水平的程序系統(tǒng)相繼問世,知識專家系統(tǒng)飛速發(fā)展。80年代以后,更多的科學家圍繞人工智能的知識表示、推理、學習進行新的研究。現今,人工智能的應用得到了新的推廣,開始向更多更大的方面進行推進。
1.2 人工智能的分類
人工智能可分為強人工智能和弱人工智能兩大類,而“強人工智能”又可分為類人人工智能和非類人的人工智能?!叭跞斯ぶ悄堋敝傅氖遣痪邆渥晕宜伎?、自我推理、解決問題能力的人工智能。而“強人工智能”具備了自主感知、自主思維和自主行動的能力。類人的人工智能,機器完全按照人類的思維和行動方式來執(zhí)行;非類人的人工智能則是有特殊的思維和行動方式,不會按照人類的模式來活動。目前,人類所研究的人工智能還處于弱人工智能階段[ 2 ]。
1.3 人工智能的重要領域
經過半個多世紀的發(fā)展,人工智能目前有很多的研究和應用領域。智能檢索、模式識別、專家系統(tǒng)和神經網絡是其中最重要的4個領域,以下將分別介紹這些領域。智能檢索是結合了人工智能技術的新一代檢索技術,可以從現今信息爆炸的時代中準確的找出我們所需要的信息。智能識別是計算機實現對環(huán)境和個體的自動判讀和處理。目前在文字、語音、指紋的識別,醫(yī)學診斷的方面有很大的應用。專家系統(tǒng)可利用某一領域的專門知識求解專門問題。人工神經網絡(Artificial Neural Network)是由大量神經處理單元互聯(lián)而成的網絡,是對人腦的抽象和模擬。人工神經網絡是為了獲得一個問題的結果,而有針對性的解決技術。人工神經網絡具有很強的學習能力,可以很好代替人工來完成一些復雜工作。
2 自然語言生成技術概述
自然語言生成(Natural Language Generation)是人工智能和計算機語言學的一門分支,而語言生成系統(tǒng)就是基于語言信息處理的計算機模型。自然語言生成的工作過程是從抽象的概念開始,逐步通過系統(tǒng)的語法規(guī)則來生成文本。開發(fā)運用自然語言生成技術有兩個主要目的:一是利用語言知識來生成文本、分析報告、幫助消息等;二是作為鑒定特殊語言的一種手段,從理論和描述上,工作過程與研究自然語言有著密切的聯(lián)系[ 3 ]。這充分說明了自然語言生成技術的重要性。
2.1 自然語言系統(tǒng)結構
自然語言系統(tǒng)體系結構包括內容規(guī)劃、句子規(guī)劃、和表層生成3個基本功能模塊。內容規(guī)劃確定內容并完成結構規(guī)劃,句子規(guī)劃則是進一步明確規(guī)劃文本的細節(jié),而表層生成則是將句子規(guī)劃后的文本描述映射到文字、標點等方面,形成表層文本。也就是說,前兩者決定輸出的內容,而第三者決定輸出的方法[ 4 ]。
2.2 自然語言生成發(fā)展與現狀
自然語言生成技術已誕生近半個世紀,科學家們一直致力于使這項技術能夠更加成熟。首先是在特殊語言狀況下廣泛深入處理;另一方面是在同一環(huán)境下使用多種語言進行生成。一般情況下,人工智能系統(tǒng)并不關心輸出數據(即句子)的細節(jié)。人工智能目前對人類語言的理解上存在局限性,不能完全代替人類[ 5 ]。目前自然語言生成技術存在著數據集缺乏;生成文本短,數據簡單;評價方法不獨立;無法滿足商業(yè)應用等問題[ 6 ]。這說明,現在的自然語言生成技術還需要進一步研究和發(fā)展。
3 在“微軟小冰”中的應用
微軟小冰已經升級到了第六代。在4年前微軟小冰剛剛出現的時候,很多人對它的看法只是一個單純的聊天工具。在第三代的時候,小冰平均每次和用戶進行16組對話,這是一個十分驚人的數字,是當時同類產品的8倍[7]。而到了第六代的時候,小冰得到了全面的提升,甚至有了自己的全息影像。小冰的EQ和IQ得到了充分的升級,現在的小冰已經支持全雙工使用共感模型,而同時創(chuàng)作等能力也得到了升級。微軟中國通過使用自然語言生成技術,創(chuàng)造出了一個超前的產品。第六代的微軟小冰已經是一個完整的情感計算框架[8]。小冰取得這么大的成就,得益于自然語言生成技術的不斷完善。這短短四年,已經可以看出自然語言生成技術的發(fā)展速度是十分快的。
在微博上,有網友問小冰:“照片里的人是誰?”,而小冰回答“咳咳,就是最美麗可愛的美少女我啊?!笔紫?,小冰通過文字識別和分析提取出了問題是在詢問人,而之后,小冰通過圖像分析識別出了照片里的人是自己,再經過系統(tǒng),得出回答的關鍵詞,并進行加工,最后回答了這個問題。由此可以看出,小冰現在已經具有了更加完善的系統(tǒng),可以輕易做到很多其他人工智能做不到的事情了。
目前,類似小冰的聊天機器人正在逐步發(fā)展,為可以在使其具有更加完備的處理系統(tǒng),更加像人一樣思考上做出努力。
4 在漢語言幽默自動生成中的應用
幽默是人類所特有的復雜認知行為,分為語言型幽默和非語言型幽默。語言型幽默是在語言文字表現上的幽默,而非語言型幽默則是在語言之外的方面表現的幽默。目前的自然語言生成技術不具備生成高質量故事的能力,所以在漢語言幽默上自然語言生成技術還需要進一步的發(fā)展[ 9 ]。
如果計算機具備了類似于人類的幽默感, 就可以認為計算機本身具有了一定特點,且這些特點極具創(chuàng)造性與個性。計算機在完成復雜任務的同時,也可以借助這種幽默提升用戶的體驗。同時,如果人工智能具有了幽默感,將會為我們的日常生活增添許多樂趣。
5 總結與展望
目前自然語言生成技術已得到了廣泛的應用,和很多的系統(tǒng)進行了有機的結合。自然語言生成技術具有很多的用途,未來一定能和更多的方面進行結合。但其本身作為系統(tǒng),并沒有辦法像人一樣進行處理,還比較死板。而人工智能目前處于弱人工智能的階段,人工智能還無法具有情感,但可以根據所獲得的知識,在某些方面勝過人類。
這兩項技術目前仍處于萌芽的階段,需要不斷進行研究。就自然語言生成來說,如果能使自然語言生成更加類似于人類的表達應該是接下來一個十分重點的研究科課題。而對于人工智能來說,使人工智能更加聰明,更加多變,更好適應人類社會生活則是十分重要的研究。相信在將來,這兩項技術間的融合能夠更加完美地進入人類的社會生活。
參考文獻
[1]鄒蕾,張先鋒.人工智能及其發(fā)展應用[J].信息網絡安全,2012(2):11-13.
[2]本刊編輯部.人工智能概述[J].保密科學技術,2017(11):8-9.
[3]張建華,陳家駿.自然語言生成綜述[J].計算機應用研究,2006(8):1-3,13.
[4]于振龍.基于LSTM的自然語言生成技術研究與實現[D].北京:北京郵電大學,2018.
[5]蔣茜謙.人工智能已經掌握人類語言了嗎[J].計算機與網絡,2018,44(24):16-17.
[6]曹娟,龔雋鵬,張鵬洲.數據到文本生成研究綜述[J].計算機技術與發(fā)展,2019(1):1-6.
[7]張文彬.微軟小冰進化第三代 擁有圖像識別能力[J].計算機與網絡,2015,41(15):14-15.
[8]陸飛.第六代微軟“小冰”正式發(fā)布[J].計算機與網絡,2018,44(15):73.
[9]譚紅葉,閆真,李茹,等.邁向創(chuàng)造性語言生成:漢語幽默自動生成的探索[J].中國科學:信息科學,2018,48(11):1497-1509.