李飛云
阿爾法狗戰(zhàn)勝李世乭用了1920個(gè)CPU,256個(gè)GPU,它的運(yùn)算效率約3千萬億次,能耗約500千瓦左右,而李世乭只消耗了約0.1千瓦。
“阿爾法狗戰(zhàn)勝李世乭后,很多人都希望有一個(gè)象阿爾法狗這樣的大腦。大家有所不知,阿爾法狗用了1920個(gè)CPU,256個(gè)GPU,它的運(yùn)算效率約3千萬億次,能耗約500千瓦左右,而李世乭只消耗了約0.1千瓦,我們可以想像未來在能耗方面是一個(gè)多么大的挑戰(zhàn)!”王恩東如此說道。
云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、以大數(shù)據(jù)為依托的人工智能時(shí)代的來臨,給人類帶來莫大的興奮和激動(dòng),中國工程院院士、中國大數(shù)據(jù)專家委員會(huì)副主任委員、中國電子學(xué)會(huì)云計(jì)算專家委員會(huì)副主任委員王恩東日前在第八屆中國云計(jì)算峰會(huì)上給這些炙手可炎的熱潮澆上了一桶冷水:在智慧計(jì)算時(shí)代,能耗面臨巨大挑戰(zhàn)。
他預(yù)測(cè),到了2020年之后,計(jì)算可分為三類,一類是面向解決重大科學(xué)問題的科學(xué)計(jì)算;另一類就是如金融、通信應(yīng)用里一些關(guān)鍵應(yīng)用計(jì)算;更大的一類可以歸納為智慧計(jì)算。
高能耗的數(shù)據(jù)中心
不久前,麥肯錫曾經(jīng)對(duì)影響世界的22項(xiàng)技術(shù)做了一次調(diào)查和分析,排在前5位的是移動(dòng)互聯(lián)網(wǎng)、自動(dòng)化、物聯(lián)網(wǎng)、云計(jì)算、機(jī)器人。由此可見,計(jì)算機(jī)技術(shù)對(duì)人類生活、社會(huì)發(fā)展將產(chǎn)生越來越大的影響和作用,包括現(xiàn)在炒得很熱的人工智能,更被視為是未來的發(fā)展趨勢(shì)。然而,王恩東院士在此時(shí)潑了一股冷水,他舉例說,谷歌人工智能,用了十天的時(shí)間,通過識(shí)別一千萬張圖片,教會(huì)了計(jì)算機(jī)能夠認(rèn)識(shí)貓的圖片,這項(xiàng)人類只需3毫秒就能認(rèn)識(shí)一只貓,作為擁有強(qiáng)大系統(tǒng)的計(jì)算機(jī),需這么長時(shí)間,它的能耗是“非常非常大的”。
王恩東院士舉例說,目前全球數(shù)據(jù)中心的能耗,每年是3千億千瓦時(shí),中國的數(shù)據(jù)中心大概是1千億千瓦時(shí),相當(dāng)于一個(gè)三峽大壩的總發(fā)電量。現(xiàn)在都在考慮如何降低能耗,而數(shù)據(jù)中心實(shí)際用在IT設(shè)備里,PUE值(是評(píng)價(jià)數(shù)據(jù)中心能源效率的指標(biāo),基準(zhǔn)是2,越接近1表明能效水平越好)都比較低,美國用自然風(fēng)制冷,大概能做到1.1和1.1以下,而國內(nèi)包括大規(guī)模的數(shù)據(jù)中心,基本上都是在1.5和2.0之間;現(xiàn)在傳統(tǒng)的PUE值都超過了3,甚至超過4, 就是說大量的能耗并非全用在IT設(shè)備上,今天人工智能的發(fā)展,對(duì)能耗會(huì)提出更大的挑戰(zhàn)。
“阿爾法狗戰(zhàn)勝李世乭后,很多人都希望有一個(gè)象阿爾法狗這樣的大腦。大家有所不知,阿爾法狗用了1920個(gè)CPU,256個(gè)GPU,它的運(yùn)算效率約3千萬億次,能耗約500千瓦左右,而李世乭只消耗了約0.1千瓦,我們可以想像未來在能耗方面是一個(gè)多么大的挑戰(zhàn)!”王恩東院士如此說道。
數(shù)據(jù)中心集中規(guī)?;瘞淼奶魬?zhàn)
隨著智慧計(jì)算時(shí)代的到來,數(shù)據(jù)量的爆發(fā),使得計(jì)算重心向后轉(zhuǎn)移,通過物聯(lián)網(wǎng),前端設(shè)備可以將各種數(shù)據(jù)持續(xù)向后端傳輸,同時(shí)數(shù)據(jù)來源多樣性、格式的復(fù)雜性和語義的不確定性,使得前端設(shè)備愈來愈趨向輕量發(fā)展,而數(shù)據(jù)中心正朝著集中化、規(guī)模化發(fā)展。
目前,國內(nèi)互聯(lián)網(wǎng)企業(yè)進(jìn)入全球互聯(lián)網(wǎng)前十強(qiáng)的,有阿里、百度、騰訊和京東,與全球前3家的谷歌、亞馬遜和Facebook,可看到全球大規(guī)模數(shù)據(jù)中心服務(wù)器都非常大:騰訊百度都有50萬臺(tái)左右的服務(wù)器,阿里約60萬臺(tái),最多如美國的亞馬遜約有300臺(tái)。王恩東說:“在2012年有5萬臺(tái)就是最大的數(shù)據(jù)中心,而今天20萬臺(tái)、十幾萬臺(tái)的數(shù)據(jù)中心已經(jīng)不少了。預(yù)計(jì)到2020年單個(gè)數(shù)據(jù)中心50萬臺(tái)就會(huì)出現(xiàn),所以數(shù)據(jù)中心的規(guī)?;且粋€(gè)很明顯的趨勢(shì)?!?/p>
王恩東院士認(rèn)為,數(shù)據(jù)中心的集中化和規(guī)?;?,也必然會(huì)帶來很多的問題和挑戰(zhàn)。
首先是性能。尤其是來自于CPU半導(dǎo)體性能的技術(shù)支撐。從2005年之后CPU的頻率就由于能耗、工藝等各方面的限制,基本上就停留在3G赫茲以下。隨著工藝越來越接近于極限,現(xiàn)在是14納米,接下來是7納米,再往下可能就變成幾個(gè)原子這樣一個(gè)寬度。所以半導(dǎo)體的工藝越來越挑戰(zhàn)極限。在過去三、四十年間,摩爾定律是半導(dǎo)體技術(shù)快速發(fā)展、性能提升的主要依據(jù),2014年ITTRS(半導(dǎo)體技術(shù)發(fā)展的組織)發(fā)布未來的半導(dǎo)體技術(shù)不再遵循摩爾定律。所以半導(dǎo)體發(fā)展在性能上會(huì)遇到一個(gè)大挑戰(zhàn)。
還有儲(chǔ)存和網(wǎng)絡(luò)的性能。因?yàn)榧軜?gòu)將計(jì)算和儲(chǔ)存做了分離,從CPU與內(nèi)存訪問的延遲,訪問中硬盤外存的延遲,延遲比例變化非常大,因此就形成了這種內(nèi)存強(qiáng)I/O(輸入/輸出)強(qiáng),影響計(jì)算機(jī)系統(tǒng)性能的提升。而設(shè)備內(nèi)版間的網(wǎng)絡(luò)速度,和設(shè)備間的網(wǎng)絡(luò)速度是一個(gè)逐次遞減的過程,設(shè)備間要通過交換機(jī)分配到各個(gè)端口上去,交換的模式、交換機(jī)的背板限制了端口速度和帶寬。
第二個(gè)挑戰(zhàn)是效率的問題。一方面服務(wù)器、儲(chǔ)存的需求在快速增長,與此同時(shí),它們的利用效率卻并不高?,F(xiàn)在80%的服務(wù)器,利用效率在25%以下,全球數(shù)據(jù)中心的平均利用率約為15%。現(xiàn)在開始采用虛擬化的技術(shù),希望能夠提高效率,通過虛擬化,使資源能夠在不同的計(jì)算設(shè)備之間進(jìn)行平衡。虛擬化在一定程度上提升了計(jì)算設(shè)備的總效率,然而還有很多制約效率的問題,到目前還沒有完全解決,如計(jì)算設(shè)備、儲(chǔ)存設(shè)備和網(wǎng)絡(luò)設(shè)備,事實(shí)上每一個(gè)設(shè)備里面,都有大量的計(jì)算、儲(chǔ)存和網(wǎng)絡(luò)的資源,但這些資源都是隔離的,它們之間并沒有得到共享。
此外,就是通用的CPU在效率上不如專用芯片要快。如何來解決這問題?就是能耗。數(shù)據(jù)中心要綠色、要節(jié)能,關(guān)鍵在于能耗的問題。
融合架構(gòu)過度瓶頸
計(jì)算能力出路在何方?王恩東院士認(rèn)為盡管“融合”一詞并不是一個(gè)很好的詞,這只是更多地把現(xiàn)有技術(shù)給整合到一起,來滿足某種需要,“但既然今天計(jì)算技術(shù)在很多方面遇到了瓶頸,還沒有革命性解決方案出現(xiàn),在未來十年甚至更長的時(shí)期內(nèi),也許用融合技術(shù)來提升數(shù)據(jù)中心性能是一條路徑。”他推測(cè),未來的數(shù)據(jù)中心是融合架構(gòu)的數(shù)據(jù)中心。
王恩東院士提出融合架構(gòu)分成三步走,第一步就是首先要把一些非計(jì)算的資源進(jìn)行整合,滿足數(shù)據(jù)中心在能耗、密度方面的要求;第二步把一些儲(chǔ)存同計(jì)算、網(wǎng)絡(luò)進(jìn)行整合;第三步要成為完全可重構(gòu)的數(shù)據(jù)中心,完全用軟件定義的數(shù)據(jù)中心。
什么是融合架構(gòu)?他解釋,即硬件網(wǎng)絡(luò)設(shè)備中的同類資源整合成一個(gè)資源池,不同的設(shè)備能夠任意的整合,在軟件的動(dòng)態(tài)感知業(yè)務(wù)的資源需求,利用硬件重組的能力來滿足各類應(yīng)用的需要。這過程需要一些演進(jìn)性技術(shù)支撐,像高速互聯(lián)技術(shù)的發(fā)展、新興內(nèi)存技術(shù)的發(fā)展、可重構(gòu)芯片的發(fā)展、軟件定義等,“尤其是高速的互聯(lián)技術(shù),使硅光互聯(lián)進(jìn)入到芯片間的互聯(lián)成為一種可能,因?yàn)楣鈧鬏斉c電傳輸相比有很多優(yōu)點(diǎn);現(xiàn)在隨著半導(dǎo)體技術(shù)演進(jìn),使資源結(jié)構(gòu)由原來對(duì)結(jié)點(diǎn)的結(jié)構(gòu)、對(duì)芯片的結(jié)構(gòu),進(jìn)入細(xì)密度的結(jié)構(gòu)?!?/p>
按照這樣的整合理念來做的計(jì)算儲(chǔ)存設(shè)備,比傳統(tǒng)設(shè)備表現(xiàn)出更強(qiáng)的優(yōu)勢(shì)。百度、阿里的數(shù)據(jù)中心,融合架構(gòu)的產(chǎn)品,在部署密度上提高了14%,功耗降低了15%。
另外就是新型儲(chǔ)存材料的出現(xiàn),會(huì)改變?cè)瓉韨鹘y(tǒng)計(jì)算機(jī)傳統(tǒng)層次,出現(xiàn)更大內(nèi)存的計(jì)算機(jī),會(huì)縮減訪問慢速儲(chǔ)存所帶來的延遲或者效率資源的消耗。還有一種支撐技術(shù)就是半導(dǎo)體的3D技術(shù)發(fā)展,使處理器內(nèi)部增加速度,使可編程的芯片成為可能。