作為人工智能的基礎(chǔ)技術(shù)和通用技術(shù),基礎(chǔ)軟硬件平臺被眾多尋求智能化發(fā)展的行業(yè)高度依賴,同時,它也是人工智能時代國家在世界科技的戰(zhàn)略制高點(diǎn)。在2020世界計算機(jī)大會上,華為昇騰計算業(yè)務(wù)總裁許映童結(jié)合自身行業(yè)經(jīng)驗(yàn),分享了在當(dāng)前時代,華為全棧全場景AI解決方案是如何助力AI朝著更好的方向發(fā)展的。
當(dāng)前,國產(chǎn)芯片、操作系統(tǒng),包括通用計算、人工智能等領(lǐng)域百花齊放,取得了非常好的發(fā)展成果。未來,人工智能發(fā)展的目的不是取代人,而是增強(qiáng)人的能力,最終實(shí)現(xiàn)安全、可信,但可控還是由人來控制的。
人工智能帶動宏觀經(jīng)濟(jì)蓬勃發(fā)展
首先,人工智能作為通用目的技術(shù),對宏觀經(jīng)濟(jì)帶動效應(yīng)增幅明顯。之所以稱人工智能技術(shù)為通用目的技術(shù),是因?yàn)樗皇菍iT為某一個技術(shù)領(lǐng)域發(fā)明的,它可以賦能千行百業(yè),帶來效率的提升,甚至是指數(shù)級的提升。此外,人工智能的出現(xiàn)不僅僅帶來了技術(shù)的變革,還會帶來管理的變革、組織結(jié)構(gòu)的變革??梢愿鶕?jù)兩個數(shù)據(jù)來說明這一點(diǎn)。首先是對整個GDP的推動,AI將帶動GDP快速增長。以蒸汽機(jī)為例,蒸汽機(jī)帶動全球GDP增長0.3%,而根據(jù)麥肯錫全球研究所(McKinsey Global Institute)測算,人工智能可在至少未來十年使全球GDP增長1.2個百分點(diǎn)。實(shí)際上,人工智能的潛力遠(yuǎn)遠(yuǎn)不止于此,這也是為什么全球50多個國家發(fā)布了人工智能的相關(guān)戰(zhàn)略,許多地方政府,以及企業(yè)等無法忍受在人工智能時代落后于這個產(chǎn)業(yè)的發(fā)展,大家都在積極擁抱人工智能。
人工智能的最終目的并不是取代人類,人工智能可以帶動就業(yè)快速增長。在各種行業(yè)中,無論是在服務(wù)業(yè),還是建筑、工業(yè)中,都會有一些簡單、危險的重復(fù)性勞動,這些工種可能會消失,但與此同時也會帶來新的工作崗位,數(shù)據(jù)分析師、算法工程師等,人工智能對中國就業(yè)的凈影響可能將創(chuàng)造約12%的凈增崗位,年增長率約為0.6%。因此,這些都是從宏觀層面看到的人工智能對社會帶來的影響。
從“AI+”到“+AI”還有很遠(yuǎn)的距離
從技術(shù)角度來看,當(dāng)前大家在談?wù)撊斯ぶ悄軙r,更多地是在談?wù)撋疃葘W(xué)習(xí)。2012年,Hinton課題組為了證明深度學(xué)習(xí)的潛力,首次參加ImageNet圖像識別比賽,其通過構(gòu)建的CNN網(wǎng)絡(luò)AlexNet一舉奪得冠軍,且以近30%的領(lǐng)先優(yōu)勢碾壓第二名,把深度學(xué)習(xí)推到了歷史舞臺。在深度學(xué)習(xí)領(lǐng)域,無論圖像識別、語音識別、閱讀理解等方面,還是所謂的感知智能,都已在單項(xiàng)領(lǐng)域超過了人類。目前,有關(guān)人工智能的應(yīng)用,更多的是一些AI算法公司在某一個技術(shù)領(lǐng)域取得突破,然后把這些技術(shù)找一個合適的應(yīng)用場景進(jìn)行落地,這就是“AI+”。人工智能是一個工具,就類似于一個錘子,滿世界找哪里有合適的釘子可以敲一下,這將帶來非常大的應(yīng)用前景。未來,人工智能想要進(jìn)一步發(fā)展,進(jìn)入一個新的階段,即所謂的“+AI”的階段,各行各業(yè)融合AI,走向場景化應(yīng)用,面對千行百業(yè)面臨的挑戰(zhàn),思考如何用人工智能技術(shù)、人工智能方法來解決。但這會帶來一個新的挑戰(zhàn),企業(yè)的問題、社會的問題,千變?nèi)f化,單一的某一種技術(shù)無法滿足客戶的需要,這就是為什么人工智能領(lǐng)域需要更多的合作伙伴,需要強(qiáng)調(diào)生態(tài),強(qiáng)調(diào)多種技術(shù)的融合。從“AI+”到“+AI”,意味著人工智能有更大的一個發(fā)展空間。
人工智能具有廣闊的應(yīng)用前景,這一點(diǎn)毋庸置疑,但從華為與千行百業(yè)中大量的客戶合作過程中發(fā)現(xiàn),AI從算法到深度學(xué)習(xí)模型、網(wǎng)絡(luò),再到最終實(shí)際生產(chǎn)環(huán)節(jié)中發(fā)生作用還有很遠(yuǎn)的距離,面臨著八大鴻溝、三大挑戰(zhàn)。八大鴻溝分別是模型獲取、數(shù)據(jù)準(zhǔn)備、訓(xùn)練、準(zhǔn)確度驗(yàn)證、應(yīng)用開發(fā)、NPU性能調(diào)優(yōu)、業(yè)務(wù)流程監(jiān)控、適配開發(fā)。三大挑戰(zhàn)分別是算法開發(fā)難、應(yīng)用開發(fā)難、業(yè)務(wù)部署難。從事人工智能行業(yè)的工作者都知道,在模型獲取時,隨著模型不斷創(chuàng)新、新的網(wǎng)絡(luò)不斷出現(xiàn),無論是精度還是規(guī)模,相對于以往的網(wǎng)絡(luò)都更為復(fù)雜,實(shí)現(xiàn)效果也更好。但對于大量的企業(yè)來說,由于沒有專業(yè)的知識經(jīng)驗(yàn),沒有辦法跟蹤這種變化,對于在選擇什么網(wǎng)絡(luò)的問題時,不能像專業(yè)公司那樣做出很好的選擇,這對大量公司來說是一個很大的挑戰(zhàn)。對于數(shù)據(jù)準(zhǔn)備環(huán)節(jié)也是如此,大量的高質(zhì)量數(shù)據(jù)該如何獲得?尤其是中小企業(yè),既沒有高質(zhì)量數(shù)據(jù)也沒有高精度模型。此外,還存在算力的問題。很多算法公司將算法打造出來,但是很多企業(yè)在應(yīng)用的時候,會遇到很多問題,一些算法工程師,甚至是從美國回來的最頂尖的算法工程師,在應(yīng)用這些算法的時候也會遇到難題,如何把這個模型部署到生產(chǎn)系統(tǒng)里面?即使是最后的從屏幕上將結(jié)果顯示出來可能也難倒了很多公司,因?yàn)樗麄兏嗟氖侵欢畱?yīng)用而不懂算法,背后還需要有很多行業(yè)的支持。沒有邊緣推理就沒有辦法真正產(chǎn)生價值,軟件如何升級,算法如何升級,數(shù)據(jù)迭代之后如何進(jìn)行操作??梢哉f,整個過程中所有的架構(gòu)和體系是分裂的,該如何通過統(tǒng)一的架構(gòu)解決這些問題呢?
華為從兩個角度提出了解決方案。第一個是技術(shù)解決方案,所有的問題首先依靠整個技術(shù)體系,華為昇騰團(tuán)隊(duì)的專家們一直在研究用自身的基礎(chǔ)軟硬件架構(gòu)來解決這一問題。有兩個核心,第一個是解決算力貴的問題,如何才能夠讓大家用得起AI算力,如何把AI算力充分釋放出來。第二個核心問題在于,AI是一個非常大的、復(fù)雜的難題,如果讓所有公司都從算法工程師開始培養(yǎng)的話,很不現(xiàn)實(shí),而華為昇騰所提供的技術(shù)解決方案,可以說是極致性的極致應(yīng)用,甚至不用代碼也能寫出和一流算法公司一樣高質(zhì)量的AI業(yè)務(wù),這就是華為昇騰的初衷。另外,僅僅只是解決AI的技術(shù)性問題還遠(yuǎn)遠(yuǎn)不夠,生態(tài)型意味著終端用戶,包括政府、政策制定者等都要發(fā)揮作用。
首先,從技術(shù)解決方案角度來說,當(dāng)前中國的人工智能產(chǎn)業(yè)可以分成四層,第一層是硬件基礎(chǔ)設(shè)施,以芯片為中心,包括板塊、模組、集群,在這一層中,有很多企業(yè)做得很好,可以說是百花齊放。但是從全球來看,在AI芯片的研發(fā)上,尤其在數(shù)據(jù)中心的訓(xùn)練側(cè),目前還是英偉達(dá)的GPU,占據(jù)主流性的領(lǐng)導(dǎo)地位。第二層是軟件基礎(chǔ)設(shè)施,在AI領(lǐng)域中最核心的AI框架搭建上,目前占領(lǐng)先地位是谷歌的TensorFlow、Facebook的Pytorch等,其他的一些企業(yè)的框架產(chǎn)品與之相比還有很大的差距。第三層是技術(shù)層,包括算法等。在技術(shù)層中,中國有大量領(lǐng)先的算法公司,包括阿里巴巴、百度等,其實(shí)在這一層可以說中國之所以具有很多領(lǐng)先的企業(yè),主要是得益于過去移動互聯(lián)網(wǎng)的發(fā)展,大量的數(shù)據(jù)、數(shù)據(jù)的連接、應(yīng)用等,隨之催生出優(yōu)秀的算法,從而使得在這一方面處于領(lǐng)先地位,呈現(xiàn)出整個生態(tài)在應(yīng)用層、技術(shù)層擁有大量的世界級的領(lǐng)先公司。因此可以說,當(dāng)前中國的人工智能聚焦于應(yīng)用層與技術(shù)層,基礎(chǔ)層相對薄弱。市場上有很多基礎(chǔ)公司主要致力于芯片、AI操作系統(tǒng)和AI框架的研發(fā)上,但在這個層面其實(shí)是非常薄弱的。
全?;A(chǔ)軟硬件平臺助力AI發(fā)展
人工智能無論應(yīng)用多么豐富,如果沒有一個堅實(shí)的基礎(chǔ)設(shè)施,沒有一個可持續(xù)的保證,它的未來便不可持續(xù),它的發(fā)展也不可能走得非常遠(yuǎn)。因此,考慮到這一點(diǎn),華為推出了一個全棧的、全場景的解決方案。2019年,在科技部19個人工智能專項(xiàng)領(lǐng)域中,華為作為唯一合作平臺,承接國家新一代人工智能開放創(chuàng)新平臺。目前華為昇騰團(tuán)隊(duì)在不斷努力進(jìn)行研發(fā),主要從四個層面進(jìn)行,包括AI系列硬件、AI算子開發(fā)、AI模型開發(fā)、AI應(yīng)用開發(fā)。在AI系列硬件層,從手機(jī)、終端,以及邊緣側(cè)攝像頭里面的AI核,包括500個小站,覆蓋全部形態(tài),里面是一個統(tǒng)一的架構(gòu)——端-邊-云統(tǒng)一架構(gòu),現(xiàn)在終端運(yùn)行和服務(wù)器集成運(yùn)行的AI核是統(tǒng)一的。AI算子開發(fā)層,具有異構(gòu)計算架構(gòu),核心的作用就是把芯片強(qiáng)大的算力釋放出來。
可以這么理解,華為堅持硬件開放、軟件開源、使能合作伙伴。在硬件上,提供標(biāo)準(zhǔn)的模組、板卡等部件,使能伙伴開發(fā)基于昇騰部件的硬件解決方案。AI的應(yīng)用是面向千行百業(yè)的,具有幾千種、幾萬種落地應(yīng)用方法。而華為也在不斷尋求與業(yè)界伙伴的合作,未來打造出這樣一個開放的硬件形態(tài)。軟件方面,提供昇騰應(yīng)用使能MindX,開放包括深度學(xué)習(xí)平臺參考設(shè)計、智能邊緣組件、優(yōu)選模型庫,以及行業(yè)SDK;開源AI框架MindSpore,幫助AI開發(fā)者更簡單、更高效地開發(fā)和使用AI技術(shù),兼容支持主流框架如TensorFlow、PyTorch等;開放統(tǒng)一編程接口AscendCL,支持伙伴構(gòu)建基于昇騰的AI應(yīng)用和業(yè)務(wù)。在應(yīng)用方面,華為不做應(yīng)用,不通過應(yīng)用變現(xiàn),所有應(yīng)用的算法都是由合作伙伴來做,這就是生態(tài)在整體上的一個合作策略。
首先,在硬件層,ATlas系列硬件將構(gòu)筑最強(qiáng)AI算力平臺。從Atlas 200、Atlas 500、Atlas 500 Pro,到Atlas 800,在推理方面,相對于目前全球最主流的推理卡,業(yè)界推理卡分析路數(shù)最高可達(dá)40路,而華為的產(chǎn)品可以做到80路,視頻分析2倍領(lǐng)先于業(yè)界。這些主要得益于芯片的性能,此外還有華為整個全棧軟件優(yōu)化的優(yōu)勢。目前,在硬件這方面,華為已經(jīng)有幾家全國性的合作伙伴,未來還會繼續(xù)發(fā)展更多的合作伙伴,展開深度合作。
CANN3.0使能全場景AI開發(fā),通過這一層,能夠讓上層的應(yīng)用調(diào)用。這其中有一個核心的設(shè)計理念,首先是端-邊-云全覆蓋,對于企業(yè)來說,在開發(fā)應(yīng)用時,不需要考慮是部署在手機(jī)中還是其他哪些地方,支持TensorFlow、Caffe、PyTorch等多種框架,還支持多種操作系統(tǒng)、硬件系統(tǒng)。通常情況下,在網(wǎng)上看不到形態(tài)系統(tǒng),在部署的時候便可以使用端-邊-云的協(xié)同。接下來就是極簡開發(fā),對上提供統(tǒng)一的API接口,下面包含很多庫,在開發(fā)時最大限度地利用計算性能,直接調(diào)用接口,在這個過程中可以直接使用系統(tǒng)中已經(jīng)寫好的算子庫,也可以根據(jù)自身情況使用自身的算子庫??梢哉f,CANN是真正的算法專家、算法工程師,用戶在使用時可以提出自己原創(chuàng)性的算子,優(yōu)化整個CANN。目前,該產(chǎn)品中已經(jīng)有超過一千多種的高性能算子,還可以創(chuàng)造自己新的網(wǎng)絡(luò),在不久的未來將會產(chǎn)生非常大的影響力,這種開放的架構(gòu)是可以實(shí)現(xiàn)的。此外,它還具有使能極致性能的特點(diǎn),軟件和硬件可以一體化設(shè)計,這就是為什么蘋果的IOS系統(tǒng)可以和它的CPU配合得很好,其本身可以持續(xù)優(yōu)化。同樣一個理念,目前華為的產(chǎn)品中已經(jīng)內(nèi)置了昇騰的圖編譯技術(shù),包括高性能算子,基本性能已經(jīng)很優(yōu)秀,同時提供可擴(kuò)展的工具以便繼續(xù)優(yōu)化。
在研發(fā)這個產(chǎn)品的過程中,我們累計投入超過3000張人臉,1000多人的軟件團(tuán)隊(duì),遠(yuǎn)遠(yuǎn)超過了芯片的開發(fā)工作量,這就是做一個平臺和做一款產(chǎn)品的差別,平臺要考慮到各種形態(tài),考慮到兼容,這不是一個簡單的軟件架構(gòu),涵蓋了一套編程體系,包括CANN、編程語言等,以及配套CANN支撐整個全流程開發(fā)的工具鏈,而一套工具鏈中又包含了各種工具,包括算子開發(fā)、模型推理、應(yīng)用開發(fā)、應(yīng)用部署,這一全流程的工具鏈。如果只是做某一個平臺,沒有考慮到可以應(yīng)用到全行業(yè)中變成一個通用平臺的話,其實(shí)不需要打造這個工具。華為的目的就是希望一開始可以真正成為和全球最優(yōu)秀的競爭對手去抗衡的一個體系。
接下來介紹一下MindSpore 1.0,就是目前自主可控的主流框架。MindSpore 1.0,可以將其稱之為全場景AI計算框架,三大創(chuàng)新助力全場景AI應(yīng)用。
全流程極簡,無論是小白還是專家都可以快速基于MindSpore 1.0上手,打造簡單易用的AI開發(fā)套件。在具體場景下使用這種模型,對精度進(jìn)行了大量的訓(xùn)練,模型開發(fā)套件“即開即用”;模型調(diào)優(yōu)套件“所見即所得”,動靜結(jié)合,既可以靜態(tài)執(zhí)行,也可以動態(tài)執(zhí)行,在線靈活切換;第三方支持套件“一鍵轉(zhuǎn)換”,與很多生態(tài)實(shí)現(xiàn)了共享和兼容。
全周期的編程,達(dá)到全場景協(xié)同,整個體系圍繞極致性能、極致應(yīng)用,自適應(yīng)部署多樣化設(shè)備,模型“私人訂制”,這是一個后發(fā)優(yōu)勢,綜合目前整個人工智能領(lǐng)域的發(fā)展,可以對上文提到的八個鴻溝、三大挑戰(zhàn)進(jìn)行優(yōu)化。在數(shù)據(jù)中心訓(xùn)練的模型,可以一鍵式推送到邊緣側(cè),無論大小,全程不需要人工干預(yù)。
全自動并行,模型、算子自動切分,多核自動擴(kuò)展到集群。不僅能夠把圖、計算圖進(jìn)行拆分,還可以從算子選擇不同的執(zhí)行單元,AI算力非常耗時,如何通過充分的應(yīng)用來實(shí)現(xiàn)這一點(diǎn)是值得考慮的問題,如今集群越來越大,如何把一次計算分布在不同的機(jī)柜、不同的結(jié)果單元中非常重要,8卡、32卡,目前全球的競爭對手典型場景下也只能做到75%和80%的并行度,而這也是全棧優(yōu)化的一個結(jié)果。
目前,在華為手機(jī)或其他一些高端手機(jī)中的人臉識別、在線翻譯等,很多都已經(jīng)使用了MindSpore,據(jù)統(tǒng)計,每天的調(diào)用次數(shù)超過1.6億次,已經(jīng)在端側(cè)大規(guī)模使用??梢哉f,MindSpore是一個大規(guī)模生態(tài),僅靠華為一家沒法繁榮發(fā)展,為此,華為在這一方面也在不斷想辦法,舉行了大量活動,包括開發(fā)者賦能等,已經(jīng)發(fā)展了全球5.5萬個開發(fā)者,每個月都會有一些線上、線下活動,目前已經(jīng)在70所高校進(jìn)行了MindSpore相關(guān)合作,包括科研、教學(xué)等。此外,團(tuán)隊(duì)研發(fā)的模型也已聯(lián)合20多所高校來開發(fā)、完善,所以目前MindSpore生態(tài)的進(jìn)展可謂突飛猛進(jìn)。
此外,MindSpore上面還有一層MindX,使能伙伴AI應(yīng)用創(chuàng)新。它不需要上文所講的算子、網(wǎng)絡(luò),直接把AI當(dāng)成服務(wù),還提供技術(shù)支持,包括組件2+1+X,即“深度學(xué)習(xí)使能、智能邊緣使能+優(yōu)選模型庫+行業(yè)SDK”。目前,團(tuán)隊(duì)重點(diǎn)是面向制造推進(jìn),傳統(tǒng)制造通過AI來轉(zhuǎn)型升級是一個大課題,這個場景應(yīng)用將具有非常大的發(fā)展前景。
另外一個就是面向視覺領(lǐng)域、面向頭像、面向視頻領(lǐng)域,目前這一塊已經(jīng)有所成果。SDK應(yīng)用的場景,除了算力、算法之外,很重要的就是內(nèi)耗。在制造業(yè)領(lǐng)域,團(tuán)隊(duì)將30年的制造業(yè)經(jīng)驗(yàn)與人工智能發(fā)展結(jié)合在一起,在華為松山湖工廠中的80多個生產(chǎn)線應(yīng)用,覆蓋服務(wù)器、無線、終端等產(chǎn)品,將傳統(tǒng)設(shè)備的95%左右的準(zhǔn)確率提高到目前智能化設(shè)備的99.9%以上的準(zhǔn)確率,這意味著機(jī)器真正可以代替人工質(zhì)檢,將整個質(zhì)檢工作量降低了60%。目前,這些產(chǎn)品已經(jīng)在規(guī)模上線了。
助力AI計算中心建設(shè),推動AI產(chǎn)業(yè)發(fā)展
可以說,人工智能技術(shù)真正的未來,一定是應(yīng)用,但這一未來的實(shí)現(xiàn)僅僅依靠單一企業(yè)是很難做到的。上文已經(jīng)提到了人工智能發(fā)展所面臨的算力、算力貴等問題。AI基礎(chǔ)設(shè)施建設(shè)成為撬動產(chǎn)業(yè)發(fā)展的核心抓手,而華為昇騰AI在不斷助力人工智能計算中心建設(shè),推動AI產(chǎn)業(yè)發(fā)展,里面含有軟件基礎(chǔ)設(shè)施、硬件基礎(chǔ)設(shè)施、基建基礎(chǔ)設(shè)施,具有專業(yè)團(tuán)隊(duì)進(jìn)行維護(hù)。預(yù)制模塊化數(shù)據(jù)中心,超短建設(shè)周期,快速使能產(chǎn)業(yè);AI集群具有超強(qiáng)算力,滿足AI海量算力需求;全棧AI軟件平臺,使能各層級開發(fā)者。最終將達(dá)到什么樣的效果?第一是公共算力服務(wù),通過政府政策,為當(dāng)?shù)仄髽I(yè)提供普惠的公共算力服務(wù);第二是應(yīng)用創(chuàng)新孵化平臺,結(jié)合地方產(chǎn)業(yè)特點(diǎn),打造AI應(yīng)用示范標(biāo)桿;第三是產(chǎn)業(yè)聚合發(fā)展平臺,建設(shè)生態(tài)創(chuàng)新中心,帶動AI產(chǎn)業(yè)集中集約化發(fā)展;第四是科研創(chuàng)新和人才培養(yǎng)平臺,支撐科研創(chuàng)新和AI人才培養(yǎng),實(shí)現(xiàn)人工智能共性技術(shù)突破。
以算力集群賦能產(chǎn)業(yè)集群,帶動產(chǎn)業(yè)發(fā)展,華為一直在努力,希望借助人工智能計算中心,協(xié)同城市、教育、交通、金融、能源等所有的千行百業(yè),讓人工智能融合到這些場合里面,真正讓人工智能解決生產(chǎn)問題、效率問題,從而實(shí)現(xiàn)人工智能的愿景,讓人類變得更美好,讓我們生活變得更美好。
(本文根據(jù)華為昇騰計算業(yè)務(wù)總裁許映童在“2020世界計算機(jī)大會”上的演講整理而成,未經(jīng)演講人審閱)