陳小平
推理在人工智能的創(chuàng)立中扮演了關鍵角色。哥德爾在他的不完全性定理證明中,建立了一個對AI發(fā)端具有重大意義的中間結果:KN可表示的推理可以通過遞歸函數(shù)的計算實現(xiàn)。根據(jù)車赤-圖靈論題,遞歸函數(shù)是圖靈機可計算的。于是上述中間結果隱含著一個猜想:任何推理都是圖靈機可計算的。在此基礎上,1950年圖靈提出了圖靈假說:推理、決策、學習、理解和創(chuàng)造都可以用圖靈機實現(xiàn)。圖靈測試是圖靈假說的一種檢驗手段,不是人工智能的定義。
在人工智能前三次浪潮中,AI推理的基本原理是可靠性條件:如果一個知識庫中的所有知識在一個應用場景中都是真的,并且用AI推理機從該知識庫可自動推出一個結論,那么該結論在該場景中也是真的??煽啃詶l件體現(xiàn)了下列設計思想:為了用AI推理得到一個應用場景中的每一個結論(結果),只需給出該場景的知識庫(只包含該場景的基礎知識,用它們可推出大量其他知識),并用推理機對可能的結論進行自動推理。
AI推理有不同程度的弱形式,均在不同程度上遵守可靠性條件。如在搜索法中,起知識庫作用的是搜索空間,起推理機作用的是搜索算法;在訓練法中,起知識庫作用的是用帶標注數(shù)據(jù)訓練得到的模型,起推理機作用的是在模型上由輸入計算輸出的算法。
依據(jù)可靠性條件,在第一、二次浪潮中研發(fā)出各種強大的推理機和基于知識的系統(tǒng),開展了多種實際場景的示范應用,取得了重大進展。近年分析表明:對于非封閉場景,可靠性條件不保證應用成功;而實際場景通常不是封閉的。這是AI推理進入30年沉寂的根本原因。
場景封閉化是將非封閉場景轉化為封閉場景,這為AI推理及現(xiàn)有AI技術的成功應用提供了一條可行路徑。封閉性準則的主要要求是:應用場景被一組確定的變元完全描述,這些變元所遵守的定律被一個模型或一個確定的代表性數(shù)據(jù)集完全表達。我發(fā)現(xiàn),AI推理的三種主要數(shù)學工具 ——邏輯學、概率論和決策論規(guī)則,以及Pearl的因果理論,都隱含著封閉性假設;而AlphaGo Zero通過圍棋問題封閉化取得了巨大成功。因此,研究、構建封閉化工程學(對應于軟件工程學),對當前人工智能應用具有重大意義。
然而,并非任何應用場景都能夠或適合封閉化。CAAI名譽理事長李德毅院士指出:“我們現(xiàn)在遇到一個基本問題就是開放性跟封閉性的矛盾,可以無限接近真理,但永遠不可能相同?!边@對AI推理提出了新挑戰(zhàn),也為新一代人工智能提供了研究背景。
Yann LeCun、Yoshua Bengio和Geoffrey Hinton在深度學習總結文章中指出其主要局限是缺乏復雜推理能力。在2020中國人工智能大會報告中,Yoshua Bengio提出了深度學習2.0的研究綱領: 用深度學習實現(xiàn)推理、規(guī)劃、決策、語言等功能,并能表達顯式知識(現(xiàn)有神經網絡只能表達隱式知識)。同時,他的團隊已發(fā)表多篇相關論文。早在20世紀70年代,就出現(xiàn)了基于規(guī)則的推理與神經網絡相結合的研究。在深度學習基礎上探索新一代AI推理,將推動人工智能向縱深發(fā)展。
傳統(tǒng)AI推理試圖用封閉的本地知識庫完成開放性任務,而人類個體不僅知識量遠超想象,還能隨時從外界獲得新知識。1990年以來持續(xù)發(fā)展的知識技術(Knowledge technologies)為新一代AI推理構建了堅實的“大知識”基礎,基于大知識的新一代AI推理也于10年前出現(xiàn)了,如“開放知識”。這一新方向在遵守可靠性條件的基礎上,探索非封閉化場景AI推理的可行路徑,并深化AI數(shù)學基礎問題的研究。
相關的工作、課題還有很多,AI推理正在重新引起學術界和產業(yè)界的高度關注,重回人工智能研究的舞臺中央;但不是回歸原狀,而是獲得新生。