周潔
對于人工智能來說,1997 年5月11日是歷史性的一天。
IBM的超級計(jì)算機(jī)“深藍(lán)”(Deep Blue)以2勝1負(fù)3平的成績戰(zhàn)勝了當(dāng)時(shí)世界排名第一的國際象棋大師加里·卡斯帕羅夫,一時(shí)間全球轟動。
“深藍(lán)”的設(shè)計(jì)者們在當(dāng)時(shí)就想到了下一個(gè)小目標(biāo):“何時(shí)計(jì)算機(jī)也能下圍棋呢?”
2016年3月15日,谷歌圍棋人工智能“阿爾法狗”(Alpha Go)與韓國棋手李世石對弈并以4:1的成績獲勝,這場“人機(jī)大戰(zhàn)”成為人工智能史上一座新的里程碑,也再次為人工智能技術(shù)做了科普——
從“深藍(lán)”到“阿爾法狗”,這二十多年的發(fā)展似乎也在預(yù)示著,人工智能終將改變?nèi)祟惖纳睢?h3>計(jì)算機(jī)的勝利
超越人類的思維限制,創(chuàng)造出一種能夠自我學(xué)習(xí)、自我進(jìn)步的超級大腦,一直是人類的終極夢想。
IBM的“深藍(lán)”最早可以追溯到1985年,當(dāng)時(shí)卡內(nèi)基梅隆大學(xué)的博士生許峰雄開始開發(fā)一種名為“芯片測試”的國際象棋電腦“深思”(Deep Thought)(來源于科幻小說《銀河系漫游指南》中的一臺機(jī)器)。后來,許峰雄和他的同事被IBM聘用,繼續(xù)從事國際象棋的研究工作。
卡斯帕羅夫是國際象棋史上最偉大的棋手之一,他不僅精通國際象棋,還是一位數(shù)學(xué)家、計(jì)算機(jī)專家,并且精通15國語言。他的棋風(fēng)活潑,有異常敏銳的感知判斷力,對弈時(shí)常常能以出人意料的策略贏得比賽。
卡斯帕羅夫曾在1989年的兩場比賽中輕松擊敗“深思”,于是IBM團(tuán)隊(duì)繼續(xù)改進(jìn)他們的超級計(jì)算機(jī),1993年將其重新命名為“深藍(lán)”,這是Deep Thought和IBM藍(lán)色LOGO的組合。
1996年2月17日,卡斯帕羅夫?qū)﹃嘔BM“深藍(lán)”計(jì)算機(jī),最終,卡斯帕羅夫以4:2戰(zhàn)勝“深藍(lán)”,一舉奪得40萬美元獎(jiǎng)金。
這場比賽給許峰雄團(tuán)隊(duì)帶來了信心,因?yàn)槌龊跛麄兊囊饬?,世界象棋冠軍在第一場比賽中輸給了“深藍(lán)”。比賽結(jié)束后,許峰雄團(tuán)隊(duì)一直在為“深藍(lán)”做升級,升級后,“深藍(lán)”每秒可以檢測2億個(gè)不同的國際象棋位置。
1997年5月3日,又一場人機(jī)大戰(zhàn)開始了??ㄋ古亮_夫贏了第一場,深藍(lán)贏了第二場。第三、第四和第五局以平局告終。5月11日,深藍(lán)以3.5比2.5的比分贏得了第六場比賽。
對于這場勝利,“深藍(lán)”設(shè)計(jì)者許峰雄認(rèn)為,這主要是依靠“深藍(lán)”強(qiáng)大的計(jì)算能力窮舉所有路數(shù)來選擇最佳策略:“深藍(lán)”靠硬算可以預(yù)判12步,卡斯帕羅夫可以預(yù)判10步。
如今“深藍(lán)”的性能已經(jīng)不再值得一提,就CPU來說,早在2006年,英特爾推出的第一代酷睿2就已經(jīng)超過了“深藍(lán)”,我們國家超級計(jì)算機(jī)天河二號的浮點(diǎn)運(yùn)算能力,則是“深藍(lán)”的30萬倍。
但計(jì)算機(jī)戰(zhàn)勝人類的開端,則為人工智能的從業(yè)者帶來了更大的想象空間。
從今人的角度來看,“深藍(lán)”還算不上足夠智能,它的算法核心是暴力搜索:生成盡可能多的走法,執(zhí)行盡可能深的搜索,換言之,它每走一步,幾乎都是在遍歷后續(xù)所有可能的情況下作出的決策。
因此,很多人認(rèn)為這是計(jì)算機(jī)的勝利,而不是人工智能的勝利。
但2016年一戰(zhàn)成名的Alpha Go不同。圍棋和國際象棋在復(fù)雜程度上不可同日而語,圍棋變數(shù)極多,一回合有250種可能,而一盤棋可以長達(dá)150回合。顯然“深藍(lán)”式的硬算在圍棋上行不通。
Alpha Go勝利的秘訣不僅僅是計(jì)算機(jī)強(qiáng)大的計(jì)算能力,更依賴其精妙的算法。Alpha Go的算法的核心則依靠強(qiáng)化學(xué)習(xí)、深度學(xué)習(xí)和蒙特卡洛樹搜索?!皬?qiáng)化學(xué)習(xí)讓Alpha Go有了自學(xué)能力,深度學(xué)習(xí)讓Alpha Go通過數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)有了估值量化能力,蒙特卡洛樹則是一個(gè)連接所有技術(shù)和動作的框架。”
“感覺就像一個(gè)有血有肉的人在下棋一樣,該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個(gè)棋風(fēng),真是看不出出自程序之手?!笨聺嵲@樣評價(jià)Alpha Go。
2017年,Alpha Go進(jìn)一步升級為新版程序 Alpha Go Zero:從空白狀態(tài)學(xué)起,在不利用人類任何圍棋比賽數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)的條件下,它能夠迅速通過2900萬次自我博弈、自學(xué)圍棋,并以 89比11 的戰(zhàn)績擊敗“前輩”。
有專家形容Alpha Go Zero在某種程度上部分突破了人類認(rèn)知學(xué)習(xí)的能力,原理上可以習(xí)得包括圍棋在內(nèi)的其他觀測信息是完備的、狀態(tài)動作空間是可數(shù)的各種人類技藝,甚至展現(xiàn)出“直覺”判斷能力。
人工智能的應(yīng)用當(dāng)然不會只是用來下棋,智能搜索、無人駕駛汽車、智能機(jī)器人……人工智能已經(jīng)在試探著進(jìn)入人類實(shí)際生活之中,許多人說,未來人類的大部分工作或許都將被人工智能取代。
對于這一點(diǎn),卡斯帕羅夫或許有更深的感受。
作為第一個(gè)工作受到機(jī)器威脅的知識工作者,23年后2020年,卡斯帕羅夫再次回到了被“深藍(lán)”打敗的紐約一個(gè)酒店的宴會廳參加活動,他說自己已經(jīng)與人工智能和平相處。
“這場比賽不是詛咒,而是福氣,因?yàn)槲页蔀榱艘患浅V匾虑榈囊徊糠帧?22年前,我的想法可能不同?!笨ㄋ古亮_夫表示,每種技術(shù)都會在創(chuàng)造就業(yè)機(jī)會之前就破壞就業(yè)機(jī)會。也許在未來,人類角色將會是牧羊人。人類只需輕輕推動智能算法,將正確的機(jī)器放在正確的空間中執(zhí)行正確的任務(wù),那么剩下的事就可以交給機(jī)器來完成。
而當(dāng)下,幾乎所有人都認(rèn)為,目前人工智能發(fā)展水平還處在初級階段。“目前人工智能算法大多依賴高質(zhì)量的海量數(shù)據(jù),需要的功率也遠(yuǎn)高于人類大腦的能耗水平,同時(shí)也很難應(yīng)用于多種場景。一個(gè)明顯的例子就是,Alpha Go的實(shí)現(xiàn)方法在明確定義的環(huán)境下效果明顯,而在開放環(huán)境下,結(jié)果往往不盡如人意?!?/p>
但從“深藍(lán)”到“阿爾法狗”,人工智能已經(jīng)走上了正確方向,一切才剛剛開始。
1951年5月12日,第一顆氫彈爆炸試驗(yàn)成功。
1968年5月13日,法國五月風(fēng)暴興起。
1948年5月14日,以色列正式宣布獨(dú)立。
1991年5月15日,法國第一位女總理克勒松夫人就任。
1929年5月16日,第一屆電影“學(xué)院獎(jiǎng)”(后來的奧斯卡)在好萊塢頒獎(jiǎng)。
1973年5月17日,美參議院專門小組開始水門事件聽證會。