汪子堯,賈 娟
(1. 北京市朝陽外國語學校,北京 100012;2. 北京郵電大學電子工程學院,北京 100876)
人工智能(Artificial Intelligence,AI)是計算機科學的一個重要分支,它試圖通過計算機來模擬人的思維過程和行為,該領域的研究包括智能機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,它的出現和發(fā)展已經滲透到了我們生活的方方面面。
尤其是2016年3月AlphaGo大敗李世石,讓人工智能在全球范圍內產生了石破天驚式的巨大影響力。隨后,進一步演化之后的AlphaGo Master逐一打敗人類當前活躍著的所有圍棋高手。
不久之前的2017年10月,DeepMind團隊重磅發(fā)布的新版AlphaGo Zero,再次打破人類對人工智能的認知和想象,它實現了AI發(fā)展中非常有意義的一步,那就是“無師自通”,它實現了從零開始,不需要任何棋譜的指引,也不需要參考任何人類的先驗知識,完全靠自己通過增強學習(Reinforcement Learning)達到百戰(zhàn)百勝。
今天的人類不得不敬畏人工智能的成果,并對最新的成果褒貶不一,甚至分裂成針鋒相對的多個陣營,我們有必要立足于深度學習和增強學習的最新進展,來回顧、反思和展望一下人工智能的前生、今世和未來。
人工智能發(fā)展至今,已經有六十余年的歷史,其發(fā)展過程可大致概括為跌宕起伏的四個階段,一些重要的里程碑事件如表1所示。
1950年,偉大的計算機科學家艾倫·圖靈(Alan Turing)發(fā)表了一篇劃時代的論文,預言了創(chuàng)造具有真正智能的機器的可能性??紤]到“智能”不易衡量,他提出了著名的圖靈測試,通過機器偽裝人類對話的能力來衡量機器的智能水平[1]。
表1 人工智能發(fā)展重要里程碑事件Tab.1 Milestone of Artificial Intelligence Development
1956年達特茅斯會議舉行,約翰·麥卡錫、馬文·閔斯基、克勞德·香農、艾倫·紐厄爾、赫伯特·西蒙等頂尖科學家匯聚一堂,共同確定了人工智能的名稱和任務,標志著人工智能這門學科的正式誕生。與會的每一位科學家都在人工智能發(fā)展的第一個十年中做出了重要貢獻[2]。
達特茅斯會議推動了全球第一次人工智能浪潮的出現,從1956年到1974年,樂觀的氣氛彌漫在整個學術界和工業(yè)界,在算法方面出現了很多世界級的發(fā)明,其中包括增強學習的雛形(即貝爾曼公式)以及深度學習的雛形(感知機)[3]。這些算法的提出無疑推動了人工智能的發(fā)展,而增強學習的算法也正是谷歌AlphaGo算法的核心思想[4]。
除了算法和方法論方面的新進展外,在第一次浪潮中,科學家們1964年發(fā)明的名為STUDENT的人工智能系統(tǒng)在那時候就能實現應用題的證明,更值得一提的是1966年研制的ELIZA已可以實現簡單人機對話[5]。人們認為,按照這樣的發(fā)展速度,人工智能早晚能夠取代人類!
然而,人工智能卻在接下來的1974年到1980年間陷入了寒冬,這是因為人們逐漸發(fā)現邏輯證明器、感知器、增強學習等等只能做一些很窄的特定領域的簡單任務,稍微超出些范圍就無法應對。這里面存在兩方面局限:一方面,人工智能所基于的數學模型和數學手段被發(fā)現有一定的缺陷,例如連最簡單和常用的異或(XOR)映射都難以處理;另一方面,有很多算法的計算復雜度以指數程度增加,所以成為了不可能完成的計算任務。于是人工智能跌入了谷底。
與利用推理等簡單規(guī)則的第一次人工智能浪潮不同,第二次人工智能開始走向專業(yè)化,側重于借用領域專家的知識來武裝自己。20世紀 80年代,卡耐基·梅隆大學為DEC公司制造出了專家系統(tǒng),這個專家系統(tǒng)能夠幫助DEC公司每年節(jié)約4000萬美元左右的費用,特別是在決策支持方面能提供有價值的內容。受此鼓勵,包括日本、美國在內的很多國家都再次投入巨資開發(fā)所謂第5代計算機,亦稱為人工智能計算機[6]。
這一時期,人工智能數學模型方面有了新的突破,其中包括著名的多層神經網絡和 BP反向傳播算法等,這些算法都突破了之前的瓶頸,可以解決一些實際問題,再一次喚起了人們研究的熱情,于是,人工智能迎來了第二次熱潮。
但從80年代末到90年代初,專家系統(tǒng)所存在的應用領域狹窄、知識獲取困難、維護費用居高不下等問題逐漸暴露出來,日本人宏偉的第五代計算機計劃也宣告失敗。AI遭遇了一系列財政問題,進入第二次低谷[7]。
從90年代中期至今,隨著計算機性能的高速發(fā)展、海量數據的不斷積累以及 AI研究者的不懈努力,人工智能在許多領域不斷取得突破性成果,掀起新一輪高潮[8]。1997年,IBM的國際象棋機器人深藍(Deep Blue)戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫,引起世界范圍內轟動。2006年,Geoffrey Hinton提出深度學習[9]。在接下來的若干年,借助深度學習技術,包括語音識別、計算機視覺等在內的諸多領域都取得了突破性的進展。2016年3月,Google的圍棋人工智能系統(tǒng)AlphaGo與圍棋世界冠軍李世石進行人機大戰(zhàn),并以4:1的總比分獲勝。2017年5月AlphaGo Master對陣當今世界圍旗第一人柯潔連勝三局,這一系列的事件都使人工智能成為當下炙手可熱的研究領域。
人工智能之所以能在近年來掀起新一輪高潮,主要歸功于三大驅動要素:算法、大數據、計算力。
首先,機器學習算法一直是人工智能發(fā)展的核心推動力。尤其是深度學習首先在語音識別、圖像識別領域取得了突破性進展,隨后在自然語言理解的諸多領域都取得了可喜成果,直接推動了本輪人工智能高潮。
其次,深度學習的多層神經網絡結構復雜、參數眾多,需要大規(guī)模的數據才能訓練生成有效的模型。得益于互聯網、社交媒體的發(fā)展,全世界的數據規(guī)模呈現爆發(fā)式增長,人類進入大數據時代。如此海量的數據,為人工智能的發(fā)展提供了源源不斷的訓練和測試樣本。
此外,深度學習使用海量數據訓練復雜的多層神經網絡模型,需要強大的計算能力支撐。之前業(yè)界采用傳統(tǒng)的 CPU進行模型訓練,花費的時間漫長。GPU的應用,將深度學習的效率提高了數十乃至上百倍。緊接著FPGA以及TPU等各種定制芯片紛紛被用于加速深度學習。再加上分布式并行計算技術的進步,使大量芯片可以同時用于模型訓練。由此形成的強大計算能力,強有力地推動著人工智能向前高速發(fā)展。
人工智能雖然取得了輝煌成就,但是仍然有許多問題值得我們去冷靜思考和回答。
關于人工智能,長期存在兩種不同的目標或者理念。一種被稱為“弱人工智能”,類似于“高級仿生學”,即希望借鑒人類的智能行為,研制出更好的工具以減輕人類智力勞動。另一種被稱為“強人工智能”,實則可謂“人造智能”,是希望研制出達到甚至超越人類智慧水平的人造物,具有心智和意識,能根據自己的意圖開展行動。
人類與動物之間的差別,在于人類有發(fā)現問題、定義問題、解決問題的能力。發(fā)現問題和定義問題,稱為隱性智慧,解決問題被稱為顯性智慧。隱性智慧,例如意識、靈感、想象力、審美等等能力支撐,比較隱形。顯性智慧是指獲取信息、生成知識、實踐能力等等,是看得見摸得著的能力。
弱人工智能,就是人類的顯性智慧,是在工作的框架內,在目標的引導下,去解決問題。弱人工智能本身不能發(fā)現問題,也不能定義問題,而是由人來做這兩件事,并由人教人工智能去解決問題,人告訴人工智能問題是什么,還要給人工智能提供必要的知識。所以人工智能沒有可能超越人類,機器沒有意識沒有靈感,沒有想象力沒有審美,缺乏這些基本的隱性知識。
AlphaGo能打敗李世石,是因為有明確的規(guī)則,狀態(tài)也有限,但它可以利用人給他定義的規(guī)則、知識,然后利用大量的案例,和超強的計算能力打敗人類。凡是基于確定的算法規(guī)則的東西,擁有超級計算能力的人工智能打敗人類是遲早的事情,但是如果沒有明確的算法,或者規(guī)則掌握在人類手中的話,那人仍然處于有優(yōu)勢的一方。
強人工智能,便是互聯網上流傳甚廣、完全智能化的有自我意識的人工智能,是對腦科學、神經科學的研究,通過對人腦的高級神經活動規(guī)律的研究,去分析創(chuàng)意、靈感、想象力、情感這些東西到底從何而來。物理學家霍金也發(fā)表言論稱“必須警惕人工智能”[10]。但大多數業(yè)界專家認為,這項全民關注的技術目前還處于初級階段[11],尚未形成體系化的理論科學[12],仍有很多難以理論化解決的難題[13],因此強人工智能在幾百年以內不會發(fā)生。人工智能技術現在所取得的進展和成功,是緣于“弱人工智能”而不是“強人工智能”的研究。強人工智能這一技術路線在過去幾十年里投入很大,但是突破十分有限,未來的演進路線仍然十分漫長。
人工智能的應用領域十分廣泛,主要有計算機視覺、自然語言處理和機器人科學、專家咨詢系統(tǒng)、語音識別和機器翻譯等等[14]。
計算機視覺從 2010年之后由于深度學習的興起及運用,已經取得了一系列突破,經過大量數據訓練之后,在辨識物體方面,一部分的機器算法甚至已經可以超過人類的辨識度[15,16]。而在語音識別方面,從語音到文字的相互轉化也已經在多種語言中得到了成功運用。相比于計算機視覺和語音處理問題,當前的機器翻譯盡管已經取得了很大進展,但仍然會錯漏許多語言中的細節(jié)[17]。當前機器人科學發(fā)展迅速,不過生產出的只是能完成特定任務的專用工業(yè)機器人,與人工智能最終目標——有完全智能的機器人仍有較大差距。
現在的人工智能盡管在各個領域都取得了重大成果,但對現在的人工智能和機器人而言,關鍵問題是缺乏物理的常識和社會的常識[18]。一張圖片中的信息,只有百分之五可以直接獲得,而其余的百分之九十五,要靠推理才能夠獲得,這部分推理信息對于人類來說極易獲得,而機器獲取起來就極為復雜,目前的計算機視覺也只能簡單地分辨一些圖片,而不能真正理解圖片。而在自然語言處理方面,人類將一種語言翻譯成另一種語言建立在對語言內容的理解上,然后用另一種語言去表達理解的內容,而機器則用了截然不同的方法,大多是取決于語料庫的豐富程度,將語句分塊進行轉換,所以經常出現很低級的語法錯誤。對于人類來說,我們在從小到大的學習過程中學會了如何辨別這些復雜的語境,但計算機目前還遠不能做到這一點。
人工智能在專業(yè)應用領域發(fā)展迅速,許多技術盡管現在距離實用差距很大,但在未來十到十五年極有可能實現。例如未來十到十五年,自動駕駛汽車甚至無人駕駛的空中出租車都有可能實現[19],業(yè)界有許多公司和機構正在從事這些方面的研究,以期最終推出合適的解決方案。期許這些前沿技術盡快為人們所用[20]。
預期在未來的十到十五年,人工智能仍將會是弱人工智能,只能夠在某一專一領域發(fā)揮作用,還不能像人類一樣有很高的創(chuàng)造性和理解能力。要想創(chuàng)造出可以和人類進行人機互動的具有真正智能的AI系統(tǒng),讓機器人具備自我學習能力,并且發(fā)展出自我意識,或許將要花上幾十年甚至數百年的時間。
[1] 袁為. 人工智能之父: ·阿蘭圖靈[J]. 中國青年科技, 2003,(11).
[2] 張體德, 郭燕, 呂國娜, 劉樹俊, 楊濤. 人工智能的發(fā)展和現狀綜述[J]. 福建質量管理, 2017, (4).
[3] 夏之初. 人工智能技術發(fā)展及應用現狀綜述[J]. 數字化用戶, 2017, (20).
[4] D. Silver, A. Huang, C. J. Maddison, A. Guez, L. Sifre, G.Van Den Driessche, J. Schrittwieser, I. Antonoglou, V. Panneershelvam, M. Lanctot et al., "Mastering the game of Go with deep neural networks and tree search", Nature 529, vol.7587, pp. 484-489, 2016.
[5] 胡勤.人工智能概述[J]. 電腦知識與技術: 學術交流, 2010,(13).
[6] 田金萍. 人工智能發(fā)展綜述[J]. 科技廣場, 2007, (1).
[7] 林堯瑞, 馬少平編著. 人工智能導論. 北京: 清華大學出版社, 1989. 05.
[8] 李紅霞. 人工智能的發(fā)展綜述[J]. 甘肅科技縱橫, 2007,(5).
[9] Hinton, G. E., Osindero, S. and Teh, Y., A fast learning algorithm for deep belief nets. Neural Computation 18:1527-1554, 2006.
[10] 殷越銘, 樊小萌, 邢貝貝. 人工智能概述及展望[J]. 科技與創(chuàng)新, 2017, (20).
[11] 鐘義信. 從“機械還原方法論”到“信息生態(tài)方法論”——人工智能理論源頭創(chuàng)新的成功路[J]. 哲學分析, 2017,(5).
[12] 鐘義信. 高等人工智能:人工智能理論的新階段[J]. 計算機教育, 2012, (18).
[13] 鐘義信. 人工智能理論:從分立到統(tǒng)一的奧秘[J]. 北京郵電大學學報, 2006, (3).
[14] 劉蕊.人工智能的軟件基礎層及應用綜述[J]. 通訊世界,2017, (23).
[15] 李彥冬, 基于卷積神經網絡的計算機視覺關鍵技術研究[D], 電子科技大學, 2017.
[16] 艾瑞咨詢系列研究報告[R]. 2017 (12).
[17] 張國英, 何元嬌. 人工智能知識體系及學科綜述[J]. 計算機教育, 2010, (8).
[18] 肖斌, 薛麗敏, 李照順. 對人工智能發(fā)展新方向的思考[J].信息技術, 2009, (2).
[19] (美)凱 瑟琳 · 赫利克著, 鄒慧君, 梁慶華譯. 人工智能. 上海: 上??茖W技術出版社, 2017.08.
[20] 冉夢琦. 人工智能技術發(fā)展及應用研究綜述[J]. 青春歲月,2016, (6).