劉朝暉
1989年12月4日,日本工業(yè)技術(shù)院電子技術(shù)綜合研究所宣布,研制出兩個具有高技能和智能的工業(yè)用機器人,其中一個被稱之為“與人對話型機器人”,這個機器人可使用火柴、酒精燈、乳缽、乳棒等代替人來完成火焰反應(yīng)試驗,最大的特點是可與人進行對話,協(xié)調(diào)作業(yè)。當它遇到不能處理的復雜情況時,可用聲音向人請教。
這種“與人對話型機器人”,其實就是聊天機器人。機器與人進行對話的技術(shù),最早可以追溯到1950年的圖靈測試,已經(jīng)走過了 70多年的時間。聊天機器人自從1966年問世也已經(jīng)發(fā)展了很長的時間,但是真正引起全球的關(guān)注和期待,還是2022年底出現(xiàn)的ChatGTP。
回顧對話機器人的發(fā)展歷史,首先要提及的就是著名的圖靈測試。1950年,計算機科學之父艾倫·圖靈(Alan Turing)發(fā)表了具有里程碑意義的論文《電腦能思考嗎?》,第一次提出“機器思維”的概念,即圖靈測試。他說,如果一臺機器能夠與人類展開對話,而不被辨別出其機器身份,那么可以說這臺機器具有智能。
雖然說用圖靈測試來評測對話系統(tǒng)目前存在很多的爭議,但不妨礙圖靈測試的思路引領(lǐng)了幾十年間對話系統(tǒng)的發(fā)展。
在 1964 年至 1966 年間,麻省理工學院人工智能實驗室的德裔美國計算機科學家約瑟夫·維森鮑姆(Joseph Weizenbaum)開發(fā)了歷史上第一個聊天機器人—— ELIZA,實現(xiàn)了計算機與人通過文本的交流。用戶可以使用打字機輸入人類的自然語言,獲得來自機器的響應(yīng)。
事實上,維森鮑姆僅用 200 行代碼就實現(xiàn)了這一過程,使 ELIZA能夠讓人產(chǎn)生被機器聆聽、理解的錯覺。ELIZA主要是用在臨床治療中,模仿心理醫(yī)生對患者提供咨詢服務(wù)。當時只是用一些關(guān)鍵字的識別,但反響很大。
2013年,日本可對話的Kirobo機器人隨同日本首位進駐國際空間站的宇航員一同前往太空。
在隨后的幾十年里,眾多的聊天機器人開發(fā)者在維森鮑姆的模型的基礎(chǔ)上進行構(gòu)建,力求實現(xiàn)更像人類的交互。通過圖靈測試已經(jīng)成為一個共同的目標,即測試新機器人與人類評委的對話能力。
1981 年,日本開展第五代計算機項目,旨在制造出能夠與人對話、翻譯語言、解釋圖像,并且能像人一樣推理的機器。隨后,英國、美國也紛紛響應(yīng),人工智能迎來又一次大發(fā)展時期。本文開頭所述的日本“與人對話型機器人”正是在這一段時期內(nèi)誕生的。
1988 年誕生的一款名為Jabberwacky的聊天機器人,旨在以有趣的方式模擬自然的人類對話,被認為使用了一種稱為“上下文模式匹配”的人工智能技術(shù)。1992年誕生的Dr. Sbaitso聊天機器人是將 AI 融入聊天機器人的最早嘗試之一,并以其全語音操作的聊天程序而聞名。
時間跨越到 1995 年,業(yè)界誕生了一個非常聰明的,而且很有知名度的對話機器人 Alice。這款機器人三次獲得了羅伯納獎,與當年同類產(chǎn)品相比具有很大的競爭優(yōu)勢。
這個機器人是一種自然語言處理聊天機器人,日常對話都可以應(yīng)付,不過本質(zhì)上它的原理是基于模式匹配。這類對話機器人的功能,基本都是基于關(guān)鍵字的識別或者是模式匹配來構(gòu)建對話系統(tǒng)。
從20世紀80年代中期開始,機器學習成為人工智能的新方向。機器學習將人工智能的重心從“制造”智能轉(zhuǎn)移到“習得”智能。相應(yīng)地,模式識別理論方法也取得了巨大進步,相關(guān)技術(shù)廣泛應(yīng)用于搜索引擎、機器翻譯、語音識別、人臉識別等領(lǐng)域。
這一時期,基于機器學習自然語言理解方法百花齊放,出現(xiàn)了很多經(jīng)典的機器學習模型。但是,傳統(tǒng)的機器學習也很快遇到了瓶頸,特別是在語音識別和圖像分類方面,準確率無法得到很大的提升,所以這些系統(tǒng)基本上轉(zhuǎn)向了基于大數(shù)據(jù)和深度學習的技術(shù),比如現(xiàn)在大家熟知的Google Home、Siri 等助手類機器人。
最近幾年隨著人工智能研究再度興起,人機對話的研究也越來越火熱?;谏疃葘W習技術(shù),使得端到端的對話系統(tǒng)變得可行。對話相關(guān)技術(shù)的逐步成熟也引發(fā)了工業(yè)界研發(fā)對話產(chǎn)品的熱潮,產(chǎn)品類型主要包括語音助手、智能音箱和閑聊軟件。2017 年開始,對話系統(tǒng)大規(guī)模在行業(yè)落地應(yīng)用,也有人稱 2017 年是對話機器人的元年。
2018年,OpenAI發(fā)表了一篇論文,介紹了一個名為“生成式預訓練變換器”的新型語言學習模型,簡稱GPT。之前的語言學習模型,基本都需要人為去監(jiān)督,或者人為設(shè)定一些標簽,但GPT不需要了,只要把一堆數(shù)據(jù)放進去,它就可以自我學習。
ChatGPT于2022年11月推出,在兩個月時間內(nèi)月活量突破了1億人。
其后一年推出的GPT-2,在文本內(nèi)容生成方面表現(xiàn)出了強大的天賦:閱讀摘要、聊天、續(xù)寫、編故事,甚至生成假新聞、釣魚郵件或在網(wǎng)上進行角色扮演等,通通不在話下。在“變得更大”之后,GPT-2 的確展現(xiàn)出了普適而強大的能力,并在多個特定的語言建模任務(wù)上實現(xiàn)了那時的最佳性能。GPT-3幾乎可以完成自然語言處理的絕大部分任務(wù),例如面向問題的搜索、閱讀理解、語義推斷、機器翻譯、文章生成和自動問答等等。其后的GPT-3.5還加入了一個人工反饋的機制,就是聊天時告訴你聊得是好還是不好。
在此基礎(chǔ)上,ChatGPT于2022年11月推出,在兩個月時間內(nèi)月活量突破了1億人,擴張速度史上最快,成為了聊天機器人新一代頂流。
我們相信,隨著人工智能技術(shù)的發(fā)展,我們未來一定能與更聰明的對話機器人交流,享受到人機交互的更多樂趣,讓對話機器人更好地為我們服務(wù)。