人工智能從1956年第一次提出來,已經(jīng)發(fā)展了63年多,最初的第一代人工智能是用計算機來解決問題,第二代是以AlphaGo為標志的深度學習,但是深度學習是基于真正的大數(shù)據(jù),在目前似乎也遇到了瓶頸,于是,科學家們提出了第三代人工智能,但是目前來看,還沒有人真正明確第三代人工智能是什么,但是其趨勢是清晰的。
人工智能的四大基礎(chǔ)是:知識、數(shù)據(jù)、算法和算力,回顧歷史,這四個因素都在不斷地發(fā)揮作用。第一代人工智能也叫符號人工智能,比較強調(diào)知識對智能的作用,因為那時算法和算力都還沒有跟上。
進入新世紀后,深度學習把大家的目標凝聚到了數(shù)據(jù)上,這時大數(shù)據(jù)的出現(xiàn),再加上很好的算法,就形成了基于概念的深度學習,再加上云計算等手段,使以數(shù)據(jù)為基礎(chǔ)的連接主義模型得到了極大推廣和應用。
數(shù)據(jù)主義喊了許多口號,按照大數(shù)據(jù)建起來的人工智能系統(tǒng)似乎不可信、不可靠、不安全、不易推廣,這都是目前用深度學習進行人工智能研究帶來的問題。唯一的辦法,就是重新引入知識,把數(shù)據(jù)驅(qū)動和知識驅(qū)動結(jié)合起來,達成可信安全的第三代人工智能。
自然語言理解是人工智能領(lǐng)域最核心的問題。不管做機器翻譯也好,做自然語言應用也好,都試圖通過分析符號序列來理解相關(guān)內(nèi)容,這是第一代人工智能所謂符號主義的核心做法。到了第二代人工智能,又走上深度學習的道路,這條路充滿希望,但又非常危險,因為解決不了可信安全的問題。
比如機器翻譯現(xiàn)在只能翻譯不重要的東西,因為翻錯了也沒有關(guān)系,真正重要的場合還需要人力同聲翻譯。機器最大的問題,就在于它缺乏常識,根本不知道自己不知道,這是一個很大的問題。
所以常識是必要的,簡單翻譯幾句話也需要大量常識積淀,“說你行,不行也行”,機器沒有常識,就很難理解這句話,人反而覺得很簡單,這就是常識的重要性。但常識庫的建立非常之難,現(xiàn)在沒法從數(shù)據(jù)中去建立常識庫,因為常識往往不表示在數(shù)據(jù)之中。
建立常識,必須下功夫去做,只有這個問題解決了,自然語言的理解才能達到目標。而自然語言理解,則是第三代人工智能的終極目標,這是一個艱巨的任務。如果這個問題解決了,人工智能的其他問題將會迎刃而解。