吳軍
在同世界著名選手李世石的對局中,阿爾法狗以4:1取勝,成為第一個戰(zhàn)勝圍棋世界冠軍的機器人,這是繼1997年IBM深藍戰(zhàn)勝卡斯帕羅夫后,人類在機器智能領域取得的又一個里程碑式勝利。
從計算機發(fā)展的角度看,智能機器在所有棋類戰(zhàn)勝人類其實只是一個時間問題,因為機器運算能力的提升是指數(shù)增長的,而人類智力能線性增長就不錯了。因此一定存在一個時間點——智能機器戰(zhàn)勝人類智力,只是這個時間點比預期中早了10年。
計算機之所以能戰(zhàn)勝人類,是因為機器獲得智能的方式和人類不同,它不是靠邏輯推理,而是靠計算。這里面有兩個關鍵的技術,首先是一整套把棋盤上當前的狀態(tài)變成一個獲勝概率的數(shù)學模型,當然,這件事沒有大數(shù)據(jù)是做不到的。阿爾法狗在短短的時間里學習了幾十萬盤人類對弈,才訓練出非常有效的數(shù)學模型。我的一位同事打開下棋的程序,想看看能否通過研究那些程序提高棋藝,完全沒可能,里面是一堆莫名其妙的、被仔細調整的參數(shù)。
第二個關鍵技術是啟發(fā)式搜索算法Beam Search(集束搜索),它能精準搜索最佳走法。國際象棋在每種狀態(tài)下有5到10種合理走法,如果計算機往前考慮10步,這個搜索空間是100億,因此計算機不能窮舉所有的可能性,而要根據(jù)從以往對弈中學來的知識,比較準確地聚焦在一個寬度有限的空間,這就像光束一樣,因此叫做Beam Search。圍棋的走法每一步都多出大約一個數(shù)量級,如果往后看個十幾步,那將是指數(shù)爆炸式增長。盡管今天的計算機比20年前能力提升了上萬倍,而且谷歌數(shù)據(jù)中心的服務器數(shù)量遠比當年IBM深藍里的處理器多得多,但是如果沒有好的搜索算法,根本無法在很短的時間里算出最佳行棋步驟。因此,下圍棋既可以說是一個機器智能的問題,也可以說是一個大數(shù)據(jù)和算法的問題。
按照阿爾法狗在過去幾個月里的進步速度,只要谷歌愿意繼續(xù)投入,估計一年內任何人類的圍棋高手都無法和它過招了——計算機在一個新的領域全面超越人類。在這個過程中,很多計算機科學家和工程師為此做出了巨大的貢獻,他們是我們文明的締造者。因此阿爾法狗的勝利,實際上是計算機科學家的勝利,也是人類的勝利。
阿爾法狗無論是在訓練模型時,還是在下棋事所采用的算法,都是幾十年前大家就已經(jīng)知道的機器學習和博弈樹搜索算法。谷歌所做的工作是讓這些算法能夠在上萬臺甚至上百萬臺服務器上并行運行,這就使得計算機解決智能問題的能力有了本質的提高。這些算法并非是專門針對下棋而設計的,很多已經(jīng)在其他智能應用的領域(比如語音識別、機器翻譯、圖像識別和大數(shù)據(jù)醫(yī)療)獲得了成功。阿爾法狗成功的意義不僅在于它標志著機器智能的水平達到了一個新的臺階,還在于計算機可以解決更多的智能問題。
今天,計算機已經(jīng)開始完成很多過去必須用人的智力才能夠完成的任務,比如醫(yī)療診斷,閱讀和處理文件,自動回答問題,書寫新聞稿和駕駛汽車等等。
阿爾法狗的獲勝讓一些不了解機器智能的人開始杞人憂天,擔心機器在未來能夠控制人類。這種擔心是不必要的,因為阿爾法狗的靈魂是計算機科學家為它編寫的程序。
機器不會控制人類,但是制造智能機器的人可以。而科技在人類進步中總是扮演著最活躍最革命的角色,它的發(fā)展是無法阻止的,我們能做的是面對現(xiàn)實,抓住智能革命的機遇,而不是回避它、否定它和阻止它。未來的社會,屬于那些具有創(chuàng)意的人,包括計算機科學家,而不屬于掌握某種技能做重復性工作的人。
(作者為著名語言處理和搜索專家,硅谷風險投資人,著有《數(shù)學之美》《浪潮之巔》《文明之光》《大學之路》。)