GPU驅動的深度學習是一種新的計算模型,其引發(fā)了現(xiàn)代人工智能大爆炸。NVIDIA聯(lián)合創(chuàng)始人兼CEO黃仁勛先生在本文中討論了人工智能不久的將來、人工智能對產(chǎn)業(yè)的影響,以及企業(yè)如何抓住人工智能的商業(yè)機會。
過去6周,我們一直在世界各地接連召開NVIDIA開發(fā)者大會。GPU技術大會(GTC)始辦于2009年,旨在探索使用大規(guī)模并行處理GPU實現(xiàn)高性能計算的新方法。GTC逐漸成為GPU深度學習的中心——引發(fā)現(xiàn)代人工智能大爆炸的新計算模式。
顯而易見,人工智能正在呈現(xiàn)出星火燎原之勢。僅在過去2年間,GPU深度學習開發(fā)者數(shù)量即激增25倍之多。約1,500家人工智能初創(chuàng)公司順勢而起,這種爆炸性增長帶動了全球對于GTC的需求。
迄今,我們已經(jīng)在北京、臺北、阿姆斯特丹、東京、首爾以及墨爾本舉辦了一系列相關活動。我參加了其中4場GTC大會。隨著人工智能進入一個又一個行業(yè),我希望將所見所聞與大家分享。
新的計算時代
由人工智能計算機支持且能夠學習、推理并與人互動的智能機器不再是科學幻想。今天,基于人工智能的自動駕駛汽車能夠自主導航,在夜間自由穿行于鄉(xiāng)村道路之上。人工智能機器人能夠通過試錯習得動作技能。這真是一個杰出的時代。在我長達30年的計算機行業(yè)生涯中,沒有哪種技術比這更有潛力,或者更有趣。人工智能時代已經(jīng)開啟。
我們的行業(yè)推動著大規(guī)模工業(yè)與社會變革。隨著計算的發(fā)展,新企業(yè)不斷出現(xiàn),新產(chǎn)品接連面世,我們的生活也因之發(fā)生變化。回顧過去幾波計算,每一次均由革命性的計算模式、拓展計算能力與范圍的新架構所支撐。
1995年,低成本微處理器(CPU)、標準操作系統(tǒng)(Windows 95)以及信息世界新門戶(Yahoo?。┑慕Y合催生出了PC互聯(lián)網(wǎng)時代。PC互聯(lián)網(wǎng)時代讓大約10億人獲得了計算能力,并實現(xiàn)了微軟“讓每臺辦公桌和每個家庭都有一臺電腦”的愿景。10年后,iPhone讓“互聯(lián)網(wǎng)通信”設備放入我們的口袋。伴隨著Amazon AWS的推出,誕生了移動云時代。大量應用進入我們的日常生活,約30億人享受著移動計算帶來的自由。
今天,我們正站在由GPU深度學習等新計算模式引發(fā)的人工智能計算時代的開端。事實證明,深度神經(jīng)網(wǎng)絡經(jīng)過訓練后,能夠從海量數(shù)據(jù)中識別各種模式,能夠“超乎尋?!庇行Ы鉀Q計算機科學領域內(nèi)的一些最復雜的問題。在新時代,軟件能夠自主編程,機器也具備學習能力。不久,數(shù)以千億計的設備將被嵌入智能,人工智能將變革每一個行業(yè)。
GPU深度學習“大爆炸”
為什么是現(xiàn)在?就像我在此前一篇文章《利用GPU加速人工智能是一種新型計算模式》中所寫的那樣,2012年是人工智能標志性的一年。多倫多大學Alex Krizhevsky創(chuàng)建了能夠從100萬樣本中自動學習識別圖像的深度神經(jīng)網(wǎng)絡。僅在兩塊NVIDIA GTX 580 GPU上訓練幾天,“AlexNet”就贏得了當年的ImageNet競賽,擊敗了磨練幾十年的所有人類專家算法。同年,認識到網(wǎng)絡規(guī)模越大、或者大腦越大,其學習能力就越強的規(guī)律之后,斯坦福的Andrew Ng與NVIDIA研究室合作開發(fā)了一種使用大規(guī)模GPU計算系統(tǒng)訓練網(wǎng)絡的方法。
這引起了全球關注。世界各地的人工智能研究人員轉向GPU深度學習。百度、谷歌、Facebook與微軟是首批將其用于模式識別的公司。2015年,人工智能在圖像識別方面實現(xiàn)了“超越人類”的水準。在語音識別領域,微軟研究院使用GPU深度學習實現(xiàn)了里程碑式的目標,在對話語音領域獲得“媲美人類”水平。
圖像識別與語音識別——GPU深度學習已經(jīng)為機器學習、認知、推理與解決問題奠定了基礎。GPU開始成為模擬人類想象力的引擎,打造出了視頻游戲與好萊塢影片的驚人虛擬世界?,F(xiàn)在,NVIDIA的GPU運行深度學習算法,模擬人類智能,并用作能夠認知與理解世界的計算機、機器人與自動駕駛汽車的大腦。就像人類想象力與智能密不可分一樣,計算機圖形與人工智能也在我們的架構內(nèi)結合在一起。人類大腦擁有兩種模式,GPU也擁有兩種模式。這可能是NVIDIA GPU之所以被廣泛用于深度學習的原因,因此NVIDIA日益被稱作“人工智能計算公司”。
面向全新計算模式的端到端平臺
作為一種全新的計算模式,GPU深度學習正改變著軟件的開發(fā)與運行方式。過去,軟件工程師構思程序與細致編碼的算法?,F(xiàn)在,算法從無數(shù)真實世界示例中自我學習軟件自我編寫。編程指的是編寫指令代碼。深度學習指的是構建與訓練神經(jīng)網(wǎng)絡。然后,該網(wǎng)絡可部署于數(shù)據(jù)中心,對新數(shù)據(jù)進行推斷、預測與分類。該網(wǎng)絡也可部署于攝像機、汽車與機器人等智能設備中,以了解世界。根據(jù)新經(jīng)驗收集新數(shù)據(jù),進一步訓練與改進神經(jīng)網(wǎng)絡。通過從數(shù)十億設備中學習,網(wǎng)絡中的所有設備變得更加智能。神經(jīng)網(wǎng)絡將獲得GPU處理能力指數(shù)級進步與大規(guī)模網(wǎng)絡效應的雙重優(yōu)勢也就是說,它們將以快于摩爾定律的速度變得更加智能。
不同于“指令處理”密集型的老式計算模型,這種全新計算模型需要海量“數(shù)據(jù)處理”。為了在各方面推進人工智能,我們正在建立一個端到端人工智能計算平臺——即一個跨越訓練、推理和數(shù)十億正在使用的智能設備的架構。
GPU在四年時間里提速65倍
我們先從訓練開始。全新Pascal GPU的項目投資約20億美元,是數(shù)千名工程師花費三年多時間的工作成果。作為首款經(jīng)深度學習優(yōu)化的圖形處理器,Pascal的網(wǎng)絡處理速度比Alex Krizhevsky在其論文中使用的Kepler圖形處理器快65倍。如果一臺計算機配備八臺通過NVIDIA NVLink連接的Pascal圖形處理器,即可創(chuàng)建有史以來最高吞吐量的互連結構,其網(wǎng)絡處理速度比250臺傳統(tǒng)服務器還要快。
每天數(shù)百億次互聯(lián)網(wǎng)查詢很快將需要人工智能,這意味著每次查詢將需要進行數(shù)十億次的數(shù)學運算。云服務的總負載將很龐大,以確保實時響應。為了得到更快速的數(shù)據(jù)中心推理性能,我們公布了Tesla P40和P4 GPU。P40使數(shù)據(jù)中心推理吞吐量加速40倍。P4僅需要50瓦功率,旨在加快1U OCP服務的速度,這是超大規(guī)模數(shù)據(jù)中心的典型。軟件是NVIDIA深度學習平臺的重要組成部分。在訓練方面,我們有CUDA和cuDNN。在推理方面,我們公布了一款優(yōu)化推理引擎TensorRT。TensorRT通過融合一個層級和多個層級內(nèi)的操作,簡化低貢獻權重,將精確度降至FP16或INT8,以及采用許多其他技術,從而改善性能,同時不損害準確度。
將來,數(shù)十億個智能設備將利用深度學習來執(zhí)行智能的任務。無人機將自主導航通過一個倉庫,找到相關物品并撿取。便攜式醫(yī)療儀器將利用人工智能,現(xiàn)場診斷血液樣本。智能攝像機將學會只向我們警告我們關心的情況。我們已經(jīng)針對此類智能物聯(lián)網(wǎng)設備創(chuàng)建了一臺高效能人工智能超級計算機。Jetson TX1是一個信用卡大小的模塊,只用10瓦功率就可以達到1 TeraFLOP FP16性能。其架構與我們最強大的GPU相同,可以運行所有相同軟件。
簡而言之,我們提供一個端到端人工智能計算平臺——從GPU到深度學習軟件和算法,從訓練系統(tǒng)到車載人工智能計算機,從云到數(shù)據(jù)中心到個人電腦到機器人。NVIDIA的人工智能計算平臺無處不在。
針對每個行業(yè)的人工智能計算
我們的端到端平臺是確保每個行業(yè)接入人工智能的第一步。NVIDIA GPU深度學習全球生態(tài)系統(tǒng)一直擴展迅速。突破性的成果引發(fā)了為消費者互聯(lián)網(wǎng)服務采用人工智能的競賽——搜索、識別、推薦、翻譯等等。從阿里巴巴和亞馬遜到IBM和微軟的云服務提供商向大小型公司提供NVIDIAGPU深度學習平臺。全球最大的企業(yè)技術公司已經(jīng)基于NVIDIA GPU對服務器進行配置。我們很高興在GTC之旅中發(fā)布改造各大行業(yè)的戰(zhàn)略部署。
1.人工智能交通
交通是人工智能可以改造的10萬億美元大型行業(yè)。自主汽車可以減少事故,提高貨車和出租車服務的生產(chǎn)力,以及實現(xiàn)新的移動服務。我們宣布,百度和TomTom均選擇在自動駕駛汽車內(nèi)采用NVIDIA DRIVE PX 2。我們正分別與兩家公司一起建立一個包含高清地圖、人工智能算法和人工智能超級計算機的開放式云端到汽車的自動駕駛平臺。
駕駛是一種我們作為第二天性進行的習得行動,但這不可能通過電腦編程來完成。自主駕駛需要利用人工智能的方方面面——感知環(huán)境,推斷確定環(huán)境條件,規(guī)劃最佳行動方案,以及不斷學習以提高對廣闊多元化世界的理解。廣泛的自主駕駛范圍需要一個開放式可擴展架構——從高速公路的自主巡航到駛向目的地的自主駕駛,到?jīng)]有駕駛員的完全自主駕駛。
NVIDIA DRIVE PX 2是一個可跨越整個自主駕駛人工智能范圍的可擴展架構。我們在GTC大會上推出針對高速公路自主駕駛而設計且具備連續(xù)定位和繪圖功能的DRIVE PX 2 AutoCruise。我們還發(fā)布了覆蓋自主駕駛各個方面——檢測、定位、規(guī)劃和行動——的自動駕駛汽車操作系統(tǒng)DriveWorks Alpha 1。
我們將所有功能集中到自動駕駛汽車NVIDIA BB8內(nèi)。
NVIDIA致力于在視覺處理、人工智能和高性能計算的交叉點——處于智能和自主機器核心的獨特組合——方面進行創(chuàng)新。我們首次創(chuàng)造出可以使自動駕駛汽車和自主機器人成為可能的人工智能算法。然而,它們需要一個具成本效益的實時計算平臺。
我們在GTC大會上推出迄今最具野心的單芯片計算機Xavier——全球首個人工智能超級計算機芯片。Xavier擁有70億個晶體管——比最先進的服務器級CPU更復雜。Xavier與今年初在CES上推出的DRIVE PX 2具有同等功率,在20瓦功率的條件下,具備每秒進行20萬億次運算的性能。正如《福布斯》所言,通過Xavier,NVIDIA在自動駕駛汽車上加倍投入。
2.人工智能企業(yè)
在認知計算領域發(fā)現(xiàn)2萬億美元商機的IBM宣布推出旨在為企業(yè)帶來人工智能的配置有NVIDIA Tesla P100的全新POWER8服務器。在軟件方面,SAP宣布其已經(jīng)收到首批NVIDIA DGX 1超級計算機中兩臺,正積極為其遍布190個國家的32萬個客戶制定機器學習企業(yè)解決方案。
3.人工智能城市
2020年,全球將有10億臺攝像機。全球監(jiān)視系統(tǒng)領導者??低曊萌斯ぶ悄軒椭鷮崿F(xiàn)更安全的城市。它利用DGX 1進行網(wǎng)絡訓練,并基于16個Jetson TXI處理器,建立了一個名為“刀鋒”的突破性服務器。相比于配置了21塊CPU的同等性能服務器來說,刀鋒需要占用的空間僅為其1/20,所消耗的功率也僅有其1/10。
4.人工智能工廠
全球有20億臺工業(yè)機器人。日本是機器人創(chuàng)新的中心。我們在GTC大會上宣布,總部位于日本的工業(yè)機器人巨頭FANUC將在NVIDIA人工智能平臺上構建完整的未來工廠。其深層神經(jīng)網(wǎng)絡將采用NVIDIA GPU進行訓練,裝有GPU的FANUC Fog單元將驅動一組機器人,讓它們一起學習,而且每臺機器人將配備一個嵌入式GPU來執(zhí)行實時人工智能。《麻省理工學院科技評論雜志》在其文章《日本機器人大亨將智能嵌入機械手臂》中有相關描述。
5.各行業(yè)的下一階段
GPU深度學習正激發(fā)全球新一波初創(chuàng)公司成立——1500多間醫(yī)療保健、汽車及消費網(wǎng)絡應用程序等行業(yè)的初創(chuàng)公司。最近被授權在加利福尼亞州公路上測試的Drive.ai正通過深度學習全駕駛堆棧來應對各種自動駕駛挑戰(zhàn)??偛课挥谌毡镜腃hainer框架開發(fā)商Preferred Networks正開發(fā)針對物聯(lián)網(wǎng)的深度學習解決方案??偛课挥趥惗厍覟槭着鶧GX 1接收者之一的Benevolent.ai正利用深度學習,研發(fā)藥物來治療帕金森病、阿爾茨海默病和罕見癌癥等疾病。根據(jù)CB Insights,在第二季度,人工智能初創(chuàng)公司的資金超過10億美元,創(chuàng)下歷史新高。
初創(chuàng)公司的爆炸性增長是人工智能跨行業(yè)發(fā)展的另一個指標。正如《財富》所言,深度學習將引領美國企業(yè)轉型。
針對每一個人的人工智能
人工智能可以解決我們在幾年前似乎難以解決的問題。從現(xiàn)實世界的數(shù)據(jù)來看,計算機可以學習識別人類編制的軟件,甚至識別對人類而言過于復雜、龐大或精細的模式。有了GPU深度學習,該計算模型如今是可行的,可以用于應對世界上最大規(guī)模行業(yè)的各種挑戰(zhàn)。自動駕駛汽車將改造價值lO萬億美元的運輸業(yè)。在醫(yī)療保健方面,醫(yī)生將利用人工智能盡早檢測疾病,了解人類基因組,治療癌癥,或者從大量醫(yī)療數(shù)據(jù)和研究中學習,提供最佳治療建議。而且人工智能將迎來第四次工業(yè)革命——在蒸汽、大規(guī)模生產(chǎn)和自動化革命之后——智能機器人將推動新一波生產(chǎn)力提高的浪潮,實現(xiàn)大規(guī)模消費者定制。人工智能將觸及每一個人。