文_李 駿 鄭劍瑾
李 駿
浙江工商大學網(wǎng)絡與新媒體系主任、教授
鄭劍瑾
杭州海康威視數(shù)字技術股份有限公司
【美】歐內斯特·戴維斯、蓋瑞·馬庫斯著 龍志勇譯 浙江教育出版社2020年5月第一版
美國OpenAI2022 年11 月推出ChatGPT 一石激起千層浪,僅兩個月時間,活躍用戶已突破1億人次,成為史上用戶增長速度最快的媒體社交平臺。在中外新聞傳播界,此輪ChatGPT 帶來的影響遠遠超過了2016年的AlphaGo帶來的震撼,因為它的出現(xiàn)不是局限在某個領域,而是人工智能應用在多領域突破,引發(fā)全球公眾對人工智能領域的高度關注。
關于人工智能的討論總是甚囂塵上,超級智能的時代漸行漸近,筆者不由想起一部著作:2020 年浙江教育出版社翻譯出版的《如何創(chuàng)造可信的AI》。
作者蓋瑞·馬庫斯(Gary Marcus)是新硅谷機器人創(chuàng)業(yè)公司AI 首席執(zhí)行官兼創(chuàng)始人,心理學和神經(jīng)科學教授,在神經(jīng)科學、語言學、心理學、人工智能、計算機科學等多個領域都有深厚的學術功底;另一位歐內斯特·戴維斯(Ernest Davis)是紐約大學柯朗數(shù)學科學研究院計算機科學教授、人工智能領域科學家。他們用流暢的文筆和敏銳的洞察力解釋了人工智能發(fā)展中的問題,清晰而深刻地審視了這一對社會秩序和知識文化產生重大影響的人工智能技術。
本書對人工智能的現(xiàn)狀進行了清晰的闡述和客觀的評估,分析了AI技術的設想與現(xiàn)實技術的差距,AI技術科學家的研究和工程師的應用之間的間隙,提出當前AI 技術的9 大風險,著重討論了當前階段深度學習技術的應用情況,指出AI研究領域中“常識引入”的重要性,描繪人工智能發(fā)展的藍圖。作者在人工智能高歌猛進、業(yè)界和學術界都高度樂觀之時,對人工智能開發(fā)大潮進行深一度反思。他們合力揭示當前人工智能領域的諸多問題,冷靜指出以深度開發(fā)為代表的主流人工智能技術的弊端和局限性,目前看來依然是很有遠見的。針對這些局限性,作者充分發(fā)揮他們對自然語言處理、機器人和計算機視覺等領域的科研經(jīng)驗和深刻理解,對當前AI的場景應用和研究范式中的問題進行了分析,通過生動易懂的案例把問題和原因說清楚。對于一些學術界的主流觀點提出了新的看法,從宏觀角度探討了真正獲得可信任人工智能技術的長期發(fā)展思路。作者指出,要得到真正可信的人工智能,不是簡單的統(tǒng)計分析數(shù)據(jù),而是需要讓系統(tǒng)能夠掌握常識,常識才是深度理解的關鍵,才能提升人工智能分析問題的準確性。
機器深度學習并不同于人類日常說說的深度學習,其中的“深度”指的是神經(jīng)網(wǎng)絡中分層的數(shù)量,尚且存在若干明顯的缺陷:首先,深度學習需要天量的數(shù)據(jù)。人工智能的準確性取決于其訓練數(shù)據(jù)的質量,如果深度學習的數(shù)據(jù)不足,人工智能的水平就會急轉直下,系統(tǒng)的可靠性降低,表現(xiàn)也就不如人意。必須確保數(shù)據(jù)集具有足夠的樣本量和代表性,數(shù)據(jù)是準確的、一致的,并且不受偏見和歧視的影響,數(shù)據(jù)質量足夠好,才能保證人工智能系統(tǒng)的準確性和可靠性,掌控神經(jīng)網(wǎng)絡中的所有連接和變化。AlphaGo 下了3000多萬盤棋,遠遠超過任何一個人終其一生所下的數(shù)量,存儲了遠超世界冠軍的棋局變化,加上高速的計算能力,終于戰(zhàn)勝了人類的世界冠軍。
其次,深度學習存在過程不可控性。深度學習在某個場景中可能表現(xiàn)得很好,但在另一個場景中卻可能出現(xiàn)非常低級的錯誤。人工智能系統(tǒng)的透明度還不夠,影響了可解釋性,無法追溯一些決策和行為的原因,用戶和監(jiān)管機構無法完全控制其運作方式和風險。學習某一個特定任務的神經(jīng)網(wǎng)絡,在某些測試中可能有90%的準確率,但很難找到10%出錯的原因。因為目前神經(jīng)網(wǎng)絡在程序員看來如同“黑箱”,看不到推演過程,只顯示結果,很難查找錯誤原因。
由此,作者指出人工智能中廣泛采用的深度學習技術,只能在能夠掌控所有變化的環(huán)境中進行。比如圍棋,其規(guī)則是固定的,棋局看似變幻無窮,其實還是可以算出變化的總數(shù),只要有足夠大的存儲空間和計算量極大的運算器,就可以存儲所有的棋局變化,從而找出最優(yōu)的步驟,在對局中獲勝。但現(xiàn)實世界的許多場景會復雜得多,變化是不可測的,無窮無盡的,需要的技術遠高于圍棋。
沒有深入探討人工智能技術的局限性,就不能充分認識到這項技術可能帶來的風險,盲目地開發(fā)人工智能應用是不明智的。為了幫助讀者更方便地理解和判斷這些風險,作者把這些風險詳細分成了9 個類別,包括魯棒性(指一個系統(tǒng)或算法對于輸入數(shù)據(jù)或環(huán)境變化的變化或干擾能夠保持穩(wěn)定的能力)的缺失等。他們用了一系列具體案例和推理對深度學習技術提出疑問,指出深度學習并非機器學習唯一的方法,強調必須在此基礎上探索新的技術突破,否則很難建立起具有人類認知能力的智能系統(tǒng)。以通用人工智能為發(fā)展目標,作者從認知科學中提煉出了11條對人工智能發(fā)展的啟示,指出其發(fā)展方向和愿景。
理想很豐滿,現(xiàn)實很骨感。人工智能的發(fā)展也經(jīng)歷了一段不平凡的歷程。作者考察認為,基于深度學習的人工智能技術在過去十多年有了長足的進步,為一系列商業(yè)化應用作出了重要貢獻。當人工智能的應用場景從面向用戶(To Consumer)走向面向業(yè)務(TO Business)的時候,就意味著要離開用戶對錯誤容忍度較高的領域如內容推薦、語言識別等,走入自動駕駛、醫(yī)療診斷、金融決策等涉及人類切身利益的“深水區(qū)”。
不管今天的智能機器有多聰明、多有用,它們都不知道什么才是真正重要的。作者將基于深度學習、狹隘而脆弱的人工智能與永遠難以捉摸的通用人工智能區(qū)分開來。要得到真正可信的人工智能,遠比想象的要復雜得多。超級智能時代還遠沒有到來,因為人類固有的常識和信任成為這一領域的重大挑戰(zhàn)。質疑當前主流的人工智能技術,是為了給學界和業(yè)界提醒,共同克服人工智能技術的局限性,探索新技術上的突破??尚诺娜斯ぶ悄懿粌H要具備高效、準確、快速等優(yōu)點,還要能夠提供可追溯決策的過程,明確每個決策的依據(jù),驗證決策的正確性和合理性,保證其可靠性、安全性和透明度。
回望2012年,人們開始關注“自動駕駛汽車”,認為很快就能來到現(xiàn)實生活中。實驗室里的無人駕駛汽車很快出現(xiàn)了,在可控制的環(huán)境中它游刃有余,但在變化萬千的現(xiàn)實環(huán)境中,或者遇到惡劣天氣就意外頻發(fā),實驗中“自動駕駛”模式下的車輛三番五次地出現(xiàn)追尾和各種事故。如今十多年過去了,自動駕駛汽車還沒有完全商業(yè)化。
2015年,F(xiàn)acebook啟動“M計劃”,希望打造人工智能驅動虛擬助手Messenger,一個能比蘋果Siri 更優(yōu)秀的機器人,具有自動聊天、新聞提醒、為手機游戲提供動力,甚至幫用戶叫車、訂餐廳,但僅僅3 年就被叫停了。
現(xiàn)實生活中,機器人醫(yī)生也是人們追求的重要目標。沃森(Watson)是IBM 旗下開發(fā)的人工智能系統(tǒng),曾在猜謎游戲中擊敗人類,還能幫助醫(yī)生診斷病人,向人們推薦金融產品。2016 年,IBM 宣稱沃森將在醫(yī)療行業(yè)掀起革命,解決從藥理學、放射學到癌癥診斷與治療中存在的諸多問題,如今依然沒能實現(xiàn)當初的設想。而ChatGPT的橫空出現(xiàn),恰恰印證了書中某些觀點。ChatGPT 是由人工智能驅動的自然語言處理工具,擁有語言理解和文本生成能力,它通過海量數(shù)據(jù)訓練模型,使其幾乎無所不知。令人們驚訝和著迷的是,ChatGPT 還能根據(jù)聊天的上下文,模擬類似真實人類的聊天過程,完成撰寫郵件、文案、翻譯、代碼等任務。ChatGPT正在開啟人工智能的新時代,其對經(jīng)濟、政治、日常生活,乃至人類的自我理解、哲學思考、基本的價值信念、社會法則等方面都將帶來深刻的挑戰(zhàn)。ChatGPT還預設了某種道德準則,一旦判定用戶的話語中包含惡意或犯罪意圖,就會拒絕提供答案。ChatGPT 的橫空出世標志著人工智能領域的重大發(fā)展,而隨著用戶積極地發(fā)現(xiàn)它越來越多的用途,它改變甚至顛覆既有生活方式、社會常規(guī)和政治經(jīng)濟秩序的可能性也在漸漸浮現(xiàn)。在解釋人工智能決策時,還需要模糊化某些敏感信息,以保護用戶的隱私和安全。
ChatGPT 深度學習的成功實踐,激勵了資本、學者、媒體、產業(yè)人士對人工智能的擁抱,有的不明其就,也有的一葉障目。在可預見的未來,機器會取代人類嗎?馬庫斯和戴維斯用堅定的理念和優(yōu)美的文筆闡述了他們的答案,以通俗易懂的方式講解了人工智能必須解決的關鍵問題,將今天基于深度學習、狹隘而脆弱的人工智能與永遠難以捉摸的通用人工智能區(qū)分開來。人類固有的常識和信任成為這一領域的重大挑戰(zhàn)。如果你打算讀一本書來跟上人工智能發(fā)展的步伐,擁抱人工智能,本書是一個不錯的選擇。細細閱讀文本,本書為讀者提供了一個了解人工智能技術當前狀況及未來發(fā)展方向的窗口,作者提出了有價值的建議與愿景,指出了通往更少“人工”、更多“智能”的選擇。