施然
第三方研究機構OpenAI近期發(fā)布的研究顯示,僅2012年以來,人們對于算力的需求增長六年就超過30萬倍,平均每年增長10倍,遠超摩爾定律的發(fā)展速度。
面對AI算力需求的爆發(fā)式增長,華為作為AI的后入局者,大膽提出要為業(yè)界提供“易獲取、用得起、方便用”的算力。如今,距離AI戰(zhàn)略提出一年,華為是否已經(jīng)找到算力破局的入口?
這也是今年9月舉行的2019華為全聯(lián)接大會備受矚目的重要原因。
17世紀后期,英國采礦業(yè),特別是煤礦,已發(fā)展到相當?shù)囊?guī)模,單靠人力、畜力已難以滿足排除礦井地下水的要求,現(xiàn)場又有豐富而廉價的煤作為燃料。現(xiàn)實的需要促使人們致力于“以火力排水”的探索。1769年英國人詹姆斯·瓦特制造了蒸汽機,引起了18世紀的第一次工業(yè)革命。
100年后,美國人發(fā)明和實現(xiàn)了電力的廣泛使用,引領了19世紀的第二次工業(yè)革命。1946年,世界第一臺二進制計算機的發(fā)明,人類在20世紀進入了第三次工業(yè)革命,信息技術的發(fā)展尤其是移動互聯(lián)網(wǎng)的普及極大地改變了人類的生活。
進入21世紀,人類正在迎來以智能技術為代表的第四次工業(yè)革命,人工智能、物聯(lián)網(wǎng)、5G以及生物工程等新技術融入到人類社會方方面面;驅動全球宏觀趨勢的變化,如社會可持續(xù)發(fā)展、經(jīng)濟增長的新動能、智慧城市、產(chǎn)業(yè)數(shù)字化轉型、消費體驗等。
人工智能是一系列新的通用目的技術(GPT),包括自然語言處理、圖片識別、視頻分析等。人工智能是信息化進程的新高度,信息技術帶來了效率的提升,人工智能則帶來生產(chǎn)成本的變化。行業(yè)+AI,人工智能將會改變每個行業(yè)、職業(yè)、組織、家庭和個人。
搭載了麒麟990芯片的華為Mate30手機
時代又仿佛回到了對采礦行業(yè)非生物動力需求極大的17世紀。進入21世紀,人工智能也對算力提出了強勁的增長需求,按照OpenAI最新的分析,從2012年到2018年,最大的人工智能訓練運行中使用的算力增長了30多萬倍,每3.5個月就會翻倍,遠超摩爾定律的增長速度(每18個月芯片的性能翻一倍)。AI算力需求的急劇增長與傳統(tǒng)CPU算力緩慢提升(每年10%)之間存在巨大矛盾,全球掀起造芯運動,加速算力成本降低和AI應用普及。
人工智能是時代潮流,潮流不可逆。但從2018年開始,全球包括中國在內(nèi),人工智能研究和產(chǎn)業(yè)的發(fā)展短暫地束了高速奔跑的節(jié)奏,進入一個相對平穩(wěn)的周期。算力的稀缺和昂貴在一定程度上制約了當前的人工智能發(fā)展,易獲取、用得起、方便用的算力,是AI產(chǎn)業(yè)發(fā)展的關鍵。
此時回顧過去的5年到10年間人工智能產(chǎn)業(yè)化的經(jīng)驗可以得知,技術快速商業(yè)化的一個重要原因來自芯片處理能力提升、云服務普及以及硬件價格下降的并行使得計算力大幅提升。
過去5年到10年間,算力投資最大的行業(yè)集中在互聯(lián)網(wǎng)、政府、金融制造業(yè)和電信業(yè)。更多的行業(yè)受制于算力提升而難以使用上人工智能為代表的新技術。
只有解決了這個問題,才能推動人工智能產(chǎn)業(yè)進入下一個快速發(fā)展周期。
在中國,基于人口規(guī)模和經(jīng)濟的發(fā)展程度,在數(shù)據(jù)和行業(yè)應用都在全球處于領先地位。但AI算力資源卻稀缺且昂貴,快速發(fā)展的應用和不斷增多的數(shù)據(jù)量,需要越來越強勁的AI算力。但算力價格貴、使用難和資源難獲取,已經(jīng)形成了人工智能發(fā)展的三大瓶頸。
其一是價格貴:目前人工智能整個訓練的過程,譬如訓練人臉識別、交通綜合治理、自動駕駛,模型的訓練成本非常高昂。
其二是使用難:缺乏一個統(tǒng)一的開發(fā)框架,無法適配從訓練到推理,從公有云到私有云、邊緣、終端的多種應用場景,開發(fā)、調(diào)優(yōu)、部署的工作量巨大。
其三是難獲取:業(yè)界用于AI計算的GPU供貨周期長、限量供應等,導致硬件資源不易獲取。
為了解決這一問題,行業(yè)巨頭目前都在著力開發(fā)大規(guī)模AI訓練芯片,英偉達、Google和華為都推出了自己的AI訓練芯片。英偉達Tesla V100 GPU最高提供125 TeraFLOPS深度學習性能,最大功耗為300瓦特。Google I/O 2018開發(fā)者大會上,Google推出了第三代TPU 3.0,最高提供90 TeraFLOPS深度學習性能。華為在2018年10月的全聯(lián)接大會上發(fā)布了針對AI訓練場景的華為昇騰910AI處理器。昇騰910 AI處理器,是當前計算密度最大的單芯片,適用于AI訓練,可提供256 TeraFLOPS的算力,最大功耗為310瓦特。
華為數(shù)十年長期聚焦在ICT基礎設施研發(fā)和建設領域,這也令華為可以深刻理解運營商和企業(yè)用戶的使用場景,以此為基因,華為的打法是以“高起點”和“全棧全場景”入局AI領域,真正提供普惠的、強大的算力。
芯片領域,需要強調(diào)的是華為昇騰系列AI處理器,采用了面向張量計算的達芬奇3DCube架構,該架構面向AI的全新突破性設計,為昇騰AI處理器提供了超強的AI算力,使得芯片具有高算力、高能效、可擴展的優(yōu)點。
基于統(tǒng)一的達芬奇架構,華為可以支持Ascend-Nano、Ascend-Tiny、Ascend-Lite、Ascend-Mini、Ascend-Max等芯片規(guī)格,具備從幾十毫IP到幾百瓦芯片的平滑擴展,天然覆蓋了端、邊、云的全場景部署的能力。
華為輪值董事長徐直軍認為,“達芬奇架構可大可小,從Nano一直到Max、從穿戴設備一直到云,可以全場景覆蓋;我們推出MindSpore的目的就是協(xié)同達芬奇架構來面向全場景的。也就是說,在端、邊緣、云都可以訓練和推理,還可以進行相互協(xié)同,這是現(xiàn)在其他計算框架所做不到的?!?/p>
AI訓練的耗時跟模型的復雜度、數(shù)據(jù)集和硬件資源的配置是強相關的,在天文研究、自動駕駛訓練、氣象預測、石油勘探等大規(guī)模訓練時,硬件資源顯得尤其重要,人工智能的快速發(fā)展,得益于硬件和云計算技術的提升,更得益于各個行業(yè)數(shù)字化帶來的大量的數(shù)據(jù)來訓練模型。開發(fā)平臺要求從原始數(shù)據(jù)到標注數(shù)據(jù)、訓練數(shù)據(jù)、算法、模型、推理服務,實現(xiàn)千萬級模型、數(shù)據(jù)集以及服務對象的全生命周期管理。
云端計算領域,無智能不成云,全棧發(fā)展走向縱深,AI已經(jīng)成為云的基礎業(yè)務,實現(xiàn)云端訓練和推理。在云上部署,支持在線和批量的推理,滿足大規(guī)模并發(fā)的復雜場景需求。
云、AI、IoT協(xié)調(diào)使能藍海市場,在智慧家庭、物聯(lián)網(wǎng)和車聯(lián)網(wǎng)等場景,構建云+AI+IoT的綜合解決方案,開新的人工智能市場。
華為的AI戰(zhàn)略包括投入基礎研究,在計算視覺、自然語言處理、決策推理等領域構筑數(shù)據(jù)高效(更少的數(shù)據(jù)需求)、能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力;打造全棧方案,面向云、邊緣和端等全場景的、獨立的以及協(xié)同的、全棧解決方案,提供充裕的、經(jīng)濟的算力資源,簡單易用、高效率、全流程的AI平臺。
華為全球產(chǎn)業(yè)展望(GIV)報告顯示,全球數(shù)據(jù)量將從2018年32.5ZB快速增長到2025年的180ZB。對于企業(yè),AI算力需求每三個月增長一倍,AI應用率到2025年將達80%。
此時,華為在算力領域已取得突破,站在了時代風口之上。