Sora
2016年3月13日,AlphaGo與李世石(右一)對弈
最近,一份有關(guān)企業(yè)濫用人工智能進行宣傳的報告出爐。報告稱,在歐洲,40%聲稱使用了AI的初創(chuàng)公司并沒有使用該技術(shù)。
去年,還有研究機構(gòu)偶然發(fā)現(xiàn)了一些公司侵犯用戶權(quán)益的行為。它們聲稱使用了機器學習和高級人工智能,來收集和檢查數(shù)千個用戶的個人數(shù)據(jù),以增強其產(chǎn)品服務(wù)用戶的體驗。
不幸的是,公眾和媒體仍然對真正的“人工智能”,以及確切的“機器學習”定義感到困惑。通常,這些術(shù)語被當作同義詞使用;在另一些情況下,這兩樣技術(shù)是意思不同的。別有用心的人則利用公眾的知識盲區(qū)來炒作噱頭,以牟取利益。
什么是機器學習?引用卡內(nèi)基·梅隆大學計算機學院臨時院長、機器學習系教授湯姆·米歇爾的話:一個科學領(lǐng)域最好由其研究的中心問題來定義。而機器學習領(lǐng)域試圖解答以下問題:“我們?nèi)绾螛?gòu)建隨經(jīng)驗而自動改進的計算機系統(tǒng),以及所有學習過程的基本法則是什么?”
╱ 人工智能包括大量我們已經(jīng)熟知的技術(shù)進步,機器學習只是其中之一。 ╱
機器學習是人工智能的一個分支。正如米歇爾教授所定義的:“機器學習是對計算機算法的研究。這些算法允許計算機程序通過運行經(jīng)歷,自動進行改進。”機器學習是我們期望實現(xiàn)人工智能的方法之一。機器學習依賴于通過檢查和比較數(shù)據(jù)以找到常見的模式,并探索細微差別來處理不同規(guī)模的數(shù)據(jù)集。
常見的一類機器學習是監(jiān)督學習。其算法會試圖對目標預測輸出和輸入特征之間的關(guān)系,并在建立關(guān)系的基礎(chǔ)上進行建模,以便基于這些數(shù)據(jù)的關(guān)系來預測新數(shù)據(jù)的輸出值。而這些用來預測的公式,是它從原始數(shù)據(jù)集中獲得的。
無監(jiān)督學習是機器學習的另一種類型。在機器學習算法家族中,它主要用于模式檢測和描述性建模。強化學習是機器學習的第三種主流類型,旨在利用從與其環(huán)境的交互中收集到的觀察結(jié)果來采取行動,以使收益最大化或風險最小化。強化學習的一個典型例子是,讓計算機的智商超過人類,并在電腦游戲中擊敗真正的人。
機器學習的繁多類型,可能會令人眼花繚亂。特別是其高級子分支,比如深度學習和各種類型的神經(jīng)網(wǎng)絡(luò)。盡管有些人傾向于將深度學習、神經(jīng)網(wǎng)絡(luò)與人腦的工作方式進行比較,但兩者之間存在本質(zhì)區(qū)別。
而人工智能涵蓋的范圍很廣。根據(jù)卡內(nèi)基·梅隆大學計算機科學學院前院長安德魯·摩爾的說法,“人工智能是使計算機應(yīng)用人類的智慧來運行的科學和工程學”。
用這樣一句話定義人工智能非常貼切。但是,它表明該領(lǐng)域有多寬泛與模糊。50年前,下國際象棋的程序曾被認為是人工智能的一種形式。因為博弈論和游戲策略是只有人腦才能發(fā)揮的功能。如今,國際象棋已經(jīng)幾乎成為每臺計算機操作系統(tǒng)自帶的小游戲。
人工智能包括大量我們已經(jīng)熟知的技術(shù)進步,機器學習只是其中之一。過往的人工智能工作成果,使用了不同的技術(shù)。例如,1997年擊敗人類國際象棋冠軍的人工智能“深藍”,使用了一種名為“樹形搜索算法”的方法,來評估每一回合可能發(fā)生的數(shù)百萬步棋。
2019年3月,三位從事深度學習研究的科學家獲得了圖靈獎。左起:Yann LeCun、Geoffrey Hinton、Yoshua Bengio
眾所周知,人工智能隨著Google Home、蘋果Siri和亞馬遜Alexa的出現(xiàn),成為人機交互工具的象征,而機器學習支持的視頻預測推薦系統(tǒng),則為網(wǎng)飛、亞馬遜和YouTube提供動力。這些技術(shù)進步,正逐漸成為我們?nèi)粘I钪斜夭豢缮俚囊徊糠帧?/p>
與機器學習相反,人工智能的目標不斷發(fā)生改進,其定義隨著相關(guān)技術(shù)的進步而不斷發(fā)展??赡茉趲资旰?,今天的創(chuàng)新性人工智能進步,會被認為與翻蓋手機一樣乏味。
人工智能行業(yè)經(jīng)歷了許多波折。在最初的幾十年中,整個行業(yè)被大肆宣傳。許多科學家認為,人類級人工智能的出現(xiàn)指日可待。但是未兌現(xiàn)的斷言,使整個行業(yè)以及公眾對人工智能失望,并導致了行業(yè)寒冬。外界對該領(lǐng)域的資金支持和興趣,大大減少了。
在當時,人工智能已成為炒作的代名詞。一些公司希望將自己與“人工智能”一詞保持距離,并使用不同的名稱來指代其工作。IBM就將深藍描述為一臺超級計算機,并在其確實使用了人工智能的情況下,仍然表示否認。
在此期間,各種其他術(shù)語,例如大數(shù)據(jù)、預測分析和機器學習,開始受到關(guān)注和普及。2012年,機器學習、深度學習和神經(jīng)網(wǎng)絡(luò)取得了長足的進步,并在越來越多的領(lǐng)域中得到應(yīng)用。許多科技公司也就跟著開始使用“機器學習”和“深度學習”這兩個術(shù)語,來宣傳其產(chǎn)品。
深度學習主要應(yīng)用于語音和面部識別、圖像分類以及自然語言處理等領(lǐng)域。原本,這些領(lǐng)域處于早期階段,卻在深度學習出現(xiàn)后突然有了跨越式發(fā)展。在2019年3月,三位從事深度學習研究的科學家獲得了圖靈獎。這些成就使深度神經(jīng)網(wǎng)絡(luò)成為當今計算功能的關(guān)鍵組成部分。
因此,伴隨著其他技術(shù)的迅猛發(fā)展,人工智能也迎來新的春天。如今,即使在非營利組織,機器學習和深度學習工程師也能賺到高薪。這充分說明了該領(lǐng)域有多熱門。
可悲的是,一些外界宣傳對這股科技熱潮進行了過度炒作和失實報道,甚至經(jīng)常在有關(guān)人工智能的文章中配上帶有水晶球的圖片,或其他超自然現(xiàn)象的圖片。這種愚昧行為,只會有助于濫用人工智能進行宣傳的公司炒高其產(chǎn)品熱度。
然而,在技術(shù)發(fā)展前進的道路上,由于無法滿足公眾期望,這些公司不得不雇人力來彌補所謂的人工智能。最后,它們可能再次導致公眾對該領(lǐng)域的不信任,并因為短期利益而使得又一次人工智能寒冬到來。